智東西(公眾號:zhidxcom)
作者 | 李水青
編輯 | 心緣

智東西9月29日消息,據“ 互聯網八卦小喇叭”等媒體爆料,全球頂尖AI科學家、IEEE Fellow許主洪(Steven Hoi)已加盟阿里通義,轉向通義大模型的相關研發工作。

許主洪擁有超20年AI產業和學術經驗,是新加坡管理大學終身教授、曾任新加坡南洋理工大學終身副教授,在AI領域發表了300多篇頂級學術論文,論文被引用超過5萬次,曾被斯坦福大學評為全球頂尖1%的AI科學家之一

作為多模態大模型領域的領軍人物,許主洪曾擔任全球最大的企業軟件公司Salesforce的副總裁,從零開始構建了Salesforce在亞洲的AI研究生態系統;他還于2023年創立了一家多模態AI創企HyperAGI,可以說是業內少有的產學研多棲AI大牛

曝頂級AI大牛,加入阿里通義!事關下一代大模型

▲許主洪

2025年2月,許主洪加入阿里并擔任阿里集團副總裁、智能信息事業群首席科學家,向智能信息事業群總裁吳嘉匯報,負責AI To C業務的多模態基礎模型及智能體(Agents)研究與應用

按原本的定位,許主洪的核心任務大概是組建頂級AI算法團隊,整合通義(應用)、夸克、天貓精靈等內部資源,促進多模態交互產品迭代,加速AI To C商業化。

在今年6月的2025上海世界移動通信大會上,許主洪發表題為《多模態大模型發展與演進》的演講,在演講中他以夸克App的AI超級框、AI相機等功能為例講解了多模態大模型的應用場景。

曝頂級AI大牛,加入阿里通義!事關下一代大模型

▲許主洪以夸克為例講解多模態大模型應用場景

然而,在加入阿里7個多月后,許主洪傳出加入通義實驗室團隊,這意味著他可能將從面向AI To C商業化研發轉向更基礎前沿的大模型研發。

如果消息屬實,這意味著阿里完成了一次重大的人才重配,也標志阿里在多模態大模型研發領域再投重碼。

當下,阿里通義大模型正處于“拼迭代速度”、“多模態發展”的關鍵階段,十分需要許主洪這樣對口的頂尖產學研多棲且有分量的AI大牛坐鎮。

在9月底舉辦的2025云棲大會期間,阿里云智能集團首席技術官、通義實驗室負責人周靖人透露,連續發布數十款模型背后有戰略考量:全球AI模型進展都在加速,整個通義家族一直在跟全球AI領域的領先者進行你追我趕,AI今天已進入加速期,比拼的是模型迭代效;同時模型從單模態到多模態的演進是必然趨勢,阿里期待接下來在多模態方面還有進一步的創新和突破。

許主洪或是目前阿里最適合牽頭做這件事情的人。他曾在在今年5月螞蟻技術開放日上的演講中提到,當下,用統一的框架做理解和生成,發展多模態大模型的一大演進趨勢。但這一領域發展尚處于的初級階段,需要實踐驗證。

曝頂級AI大牛,加入阿里通義!事關下一代大模型

▲許主洪在講解統一多模態模型產業發展脈絡

許主洪指出,統一理解與生成的多模態大模型面臨眾多技術挑戰在全模態交互挑戰方面,當下支持音、視、圖、文全模態交互的公開單模型非常少見;在理解與生成統一方面,圖像和語意的理解生成統一模型鮮有出現,且理解和生成效果難以平衡。

而在6月的演講中,許主洪也提到:“多模態Agent AI時代才剛剛開始,未來要真正達到AGI,我們還需要解決很多技術難題,包括多模態大模型的基礎能力、Agent智能體的核心功能模塊、數據世界的連接與操作、物理世界的交互與控制等等,都有很多的挑戰,但是這也是未來多模態大模型行業的機會。”

截至目前,阿里及許主洪方未對此進行置評。