DeepSeek-R1的“天賦異稟”
為各行各業注入了全新變量
中國電信政企信息服務事業群
迅速組建DeepSeek攻堅隊
深度融合行業數據
憑借“強化學習”與“知識蒸餾”
兩大核心技術
成功完成了41個行業大模型的升級
為產業智能化進程按下加速鍵
強化學習,小模型撬動大效能
此次升級以“輕量化部署、場景精準適配、推理效率提升”為目標,通過技術創新推動大模型從通用能力向行業縱深拓展,為千行百業提供低成本、高效率的智能化解決方案。以下將通過行業大模型的13個典型代表,展示本次攻堅成果。
此次升級將強化學習(RL)與行業知識深度融合,在保證專業性的同時大幅降低算力門檻。通過強化學習訓練,在教育、衛健、能源、政法公安、交通等多個領域取得了顯著成果。
教育行業
通過純強化學習訓練,讓1.5B小模型在數學解題準確率上超越傳統7B模型,響應速度提升40%。這種“小模型、大智慧”的技術路徑,使得基層教育機構也能享受AI紅利。
衛健行業
其打造的1.5B輕量化導診模型,以85.1的綜合得分反超大參數模型基線,僅需500條脫敏數據即完成訓練,為基層醫療機構提供了高效的智能導診解決方案。
能源行業
在能源行業問答領域,通過對9700條蒸餾數據集的訓練,7B模型的準確率提升12.2%。升級后的模型能夠快速解答復雜的能源行業問題,顯著提升了能源行業的智能化應用水平。
政法公安行業
通過強化學習,Qwen-7B模型在法律領域的準確率提升9%,顯著增強了模型在法律知識理解和復雜案件推理中的表現。
交通行業
在交通政策法規問答場景中,強化學習顯著提升了模型的效果,證明了思維鏈和獎勵強化對模型進行微調是提升交通行業大模型行之有效的方法。
知識蒸餾,數據煉金術賦能行業智能
面對行業高質量數據稀缺難題,此次升級采用“大模型反哺小模型”的數據生態,通過知識蒸餾技術,顯著提升了各行業大模型的性能,其中在政務、車企、工業、文宣、農業、住建、要客、應急等領域的效果尤為突出。
政務行業
通過DeepSeek-V3生成高質量思維鏈數據,僅用200條標注數據即讓14B模型意圖識別準確率增加15%,為政務熱線領域的多輪對話意圖識別提供了高效解決方案。
車企行業
其借助DeepSeek-V3補全的行業推理數據,使14B小模型在智能座艙分類任務中以92.7的綜合得分超越未微調的千億級大模型,精準識別智能座艙用戶提出的導航、娛樂等問題分類。
工業行業
通過SFT訓練,模型在工業領域的專業性顯著提升,輸出的內容更加貼近實際應用場景的需求,邏輯嚴密且重點突出。
文宣行業
通過行業數據蒸餾后的模型,在文旅問答和路徑規劃任務中表現優異,問答評分達到87.1的綜合得分,路徑規劃評分接近DeepSeek-V3-671B和GLM-4-PLUS的水平。
農業行業
通過對4408條農業數據的訓練,14B模型的綜合得分從83.7提升至87.2,升級后的模型能夠快速解答復雜的農業問題,為農業領域的智能化轉型提供了有力支撐。
住建行業
通過使用高質量行業數據,在工地施工規范告警中達到高質量實時預警,微調后的模型在深度推理上效果提升明顯,能夠運用在住建領域的工地施工規范告警中,達到高質量實時預警目的。
要客行業
在國防動員、資源分配方案生成與選擇任務中,使用蒸餾數據進行SFT微調顯著提升了模型的思考、推理與回答能力,SFT后的模型在方案生成任務中表現優異。
應急行業
通過DeepSeek-R1蒸餾得到的推理數據,顯著提升了模型在應急行業數據中的準確率,SFT后的模型準確率提高13%,在14B的模型上效果遠超未微調的DeepSeek-V3模型。
基于中國電信
“數據安全可控、模型快速迭代、
服務靈活擴展”的一體化能力
政企信息服務事業群將繼續深耕行業場景
加速行業大模型規模化落地
全面賦能“新質生產力”高質量發展