智東西(公眾號:zhidxcom)
作者 | 王涵
編輯 | 漠影

智東西9月9日報道,今天上午,在百度Wave Summit深度學習開發者大會上,百度正式發布深度思考模型文心大模型X1.1、大模型開發框架飛槳框架V3.2、智能代碼助手文心快碼3.5S以及一系(xi)列開發(fa)組件(jian)更新。

相比于深度思考模型文心X1,文心大模型X1.1的事實性能力提升34.8%,指令遵循能力提升12.5%,智能體能力提升9.6%,在多項基準測試中超越DeepSeek-R1-0528

百度最強深度思考模型來了!性能追平GPT-5

目前,用(yong)戶(hu)可以在文心一言(yan)官(guan)網(wang)、文小(xiao)言(yan)APP使用(yong)文心大模型X1.1。文心大模型X1.1已(yi)正式上(shang)線(xian)百度(du)智能云千帆平臺,對企業客戶(hu)及開發者全面開放使用(yong)。

一、超越DeepSeek,對標GPT-5!百度文心大模型X1.1多項基準測試獲SOTA

會上,百(bai)度首席技術官、深度學習技術及(ji)應用(yong)國家工程研究中心(xin)主任王(wang)海峰正式發布了(le)文心(xin)大模型X1.1深度思(si)考(kao)模型。

據王海峰分享,文心大模型X1是基于文心大模型4.5訓練而來的深度思考模型,相比文心X1,文心大模型X1.1的事實性提升34.8%,指令遵循能力提升12.5%,智能體能力提升9.6%

在權威基準評測中,文心大模型X1.1在多個任務上超越DeepSeek-R1-0528,取得第一名的成績。同時,與國際頂(ding)尖模型GPT-5和Gemini 2.5 Pro相比,效果(guo)基(ji)本持平。

百度最強深度思考模型來了!性能追平GPT-5

文心(xin)大(da)模型X1.1主(zhu)要(yao)采用了迭代(dai)式(shi)混合強化學習訓(xun)練(lian)框(kuang)架,一方(fang)面通(tong)過混合強化學習,同時提升(sheng)通(tong)用任(ren)務(wu)和智能體(ti)任(ren)務(wu)的效果;另一方(fang)面通(tong)過自蒸(zheng)餾數據的迭代(dai)式(shi)生(sheng)產(chan)及訓(xun)練(lian),不斷提升(sheng)模型整體(ti)效果。

在客服場景,文心大模型X1.1可(ke)以識別(bie)用戶(hu)客訴(su)的情緒和需求,通過思考和調用后臺多個工具,自動完成(cheng)客訴(su)處理的服務流程。

基于文心大模型X1.1的基礎,百度開發劇本驅動多模協同的數字人技術,可(ke)以(yi)通過大語言(yan)模型生成劇本,驅動語音語調和數字人的(de)形(xing)象,最終(zhong)形(xing)成完善的(de)數字人。

百度最強深度思考模型來了!性能追平GPT-5

百(bai)度集(ji)團副總裁(cai)、深度學習技術應用及國家工程(cheng)研究中心副主(zhu)任吳甜透露,今年6月15日,在百(bai)度電商平臺(tai),羅永(yong)浩數(shu)字(zi)人直(zhi)播(bo)的GMV已(yi)經超過(guo)其(qi)本(ben)人直(zhi)播(bo)的GMV表現。

數字人主播的問答轉化率問答接待率都可以超越真人,其超長待機能力在70分鐘以上的場直播中優勢明顯。

百度最強深度思考模型來了!性能追平GPT-5

二、飛槳文心生態開發者超2千萬,百度內部45%新代碼由AI生成

文(wen)心(xin)大模型的能力拓(tuo)展和效率提(ti)升,得益于飛槳文(wen)心(xin)的聯合優化。

大會現場,百度發布了飛槳核心框架3.2版本,該(gai)版本在大模型訓練、硬件適配和生態支持上全面升級(ji)。

百度最強深度思考模型來了!性能追平GPT-5

百度飛槳同步升級了大模型開發套件ERNIEKit高效部署套件FastDeploy,還發布了AI科學套件,包括智能流體力學開發套件和智能材料科學開發套件,以及大規模計算圖數據集GraphNet

據最新數據披露,飛槳文心生態開發者達到2333萬位,服務企業達到76萬家

百度最強深度思考模型來了!性能追平GPT-5

AI編程方面,百度還發布了文心快碼3.5S,新版本的代碼生成準確率提升26%,其中復雜場景提升38%。可以駕(jia)馭更復(fu)雜的(de)任務(wu)。

據悉,目前,百度中有45%的新增代碼是AI生成的,文心快碼已累計服務超過1000萬位開發者上千家企業。

結語:飛槳文心聯合優化,降低開發與技術落地門檻

飛槳與(yu)文(wen)(wen)心的(de)(de)深(shen)度聯合優化,持(chi)續推動著文(wen)(wen)心大模型能力的(de)(de)拓展與(yu)效率的(de)(de)提(ti)高(gao)。文(wen)(wen)心快(kuai)碼(ma)3.5S的(de)(de)發(fa)布進一步降低了AI編程的(de)(de)門檻,為(wei)開發(fa)者與(yu)企業帶來了高(gao)效且(qie)強大的(de)(de)工具。

在(zai)產業落(luo)地層面,無論是(shi)數字人(ren)直播還(huan)是(shi)文(wen)心快碼的落(luo)地,這些(xie)實(shi)(shi)(shi)踐為AI與實(shi)(shi)(shi)體(ti)經濟融合提供(gong)了具體(ti)參考(kao)路徑,在(zai)電商、編程開發等(deng)領(ling)域(yu)對行業智能化轉(zhuan)型產生了實(shi)(shi)(shi)際影響(xiang)。