智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影

智東西11月27日報道,11月22日,夸克大模型公布了其面向搜索、生產力工具和資產管理助手的大模型技術布局。夸克技術負責人蔣冠軍告訴智東西等媒體,夸克大模型是面向搜索、生產力工具和資產管理助手的應用型大模型,在搜索應用中將通過圖文多模理解、專業知識生成、交互方式創新進一步拓寬應用場景,提升用戶體驗。

日前,阿里巴巴智能信息事業群發布全棧自研、千億級參數的夸克大模型,將應用于通用搜索、醫療健康、教育學習、職場辦公等眾多場景。夸克千億級參數大模型已登頂C-Eval和CMMLU兩大權威榜單,夸克百億級參數大模型亦在法律、醫療、問答等領域的性能評測中奪冠。

對話夸克技術負責人:夸克大模型拿下雙榜背后,四大優勢、四項能力推進搜索革新

據介紹,憑借在搜索業務和智能技術上的長期積累,利用數據、平臺、知識增強等優勢,夸克大模型可以大幅提升知識正確性。在醫療健康領域,夸克大模型已經可以將問答內容的幻覺率降低至5%,處在行業領先水平。

一、拆解夸克大模型四大優勢,知識正確性是落地關鍵

蔣冠軍分享說,夸克是一個集合搜、用、存的智能信息產品,夸克現有客戶中,25歲以下的年輕用戶占比達到一半。而夸克大模型將是持續推動夸克App產品體驗創新和邁向新一代搜索的技術底座。

在搜索方面,夸克已經準備上線一些具體產品,包括推出大量AIGC內容,并在搜索的后鏈路正籌劃新的智能技術產品創新和改造;在云盤方面,夸克網盤相冊可以用自然語言完成檢索;在工具方面,掃描、資料生成都將用上夸克大模型的能力。

基于搜索業務基礎與智能技術積累,蔣冠軍認為夸克大模型有四大優勢

1、最全面的通用知識數據和行業知識數據,以及知識理解和評估體系;

2、得益于搜索技術體系的積累,擁有千億級參數平臺的模型訓練能力;

3、擁有長期智能化產品經驗的智能技術產運團隊;

4、擁有全行業的知識增強技術體系及能力。

對話夸克技術負責人:夸克大模型拿下雙榜背后,四大優勢、四項能力推進搜索革新▲夸克技術負責人蔣冠軍

蔣冠軍談道,在千億級別的網頁里篩選出幾億個質量特別高的網頁,不僅獲取如此多中文數據和知識的難度大,而且網頁中垃圾數據非常多、大部分網頁質量都非常低,成本和代價很高。

在他看來,面向未來,要解決大模型的應用問題,關鍵要解決知識正確性問題。通過模型預訓練、人類對齊、模型改進、知識增強等多種技術手段的組合,夸克大模型持續提升知識正確性,將通用知識錯誤率降到15%以下。在醫療健康領域,夸克已經可以將問答內容的幻覺率降低至5%,處在行業領先水平。

在教育領域,夸克優先關注教育優質內容的生產,圍繞生產內容、針對用戶具體場景,做對話和交互的產品創新。

二、千億級大模型多項性能超過GPT-4,四大能力提升用戶效率

夸克大模型基本上完成了當前階段的整體迭代,現有一個千億參數級別的大模型,具備在一部分夸克端場景里提供服務的能力。

據介紹,夸克大模型的整體水平超越GPT-3.5,在多語言翻譯、寫代碼、安全合規、內容創作等方面處在國內行業頭部水平,具備較好的語義理解、知識掌握與應用、邏輯推理能力。其千億級大模型接連登頂C-Eval和CMMLU兩大權威評測榜單,多項性能優于GPT-4。在最新的百億參數測試集中,夸克在法律、醫療、問答等多個領域中排名第一

在多模態方面,夸克大模型支持相冊搜索、AI相機場景下的文搜圖、圖生圖、圖生文等。在教育、醫療等垂直領域中,夸克在對話、解題上的能力取得了新的突破。

從落地來看,蔣冠軍總結了夸克大模型有四大能力:知識、對話、創作、安全

對話夸克技術負責人:夸克大模型拿下雙榜背后,四大優勢、四項能力推進搜索革新

1、知識能力:擁有廣泛的知識覆蓋、信息搜集和多語言支持等,支持外接專業知識增強,提升跨領域的知識和語言理解能力;

2、對話能力:具備較強的上下文理解、語境推理、關鍵信息保持和記憶能力,更好地適應不斷變化的語境,理解用戶的意圖和需求,確保對話回復準確、合理、連貫;

3、創作能力:能夠根據主題或關鍵詞,生成連貫、有邏輯、有深度的文本內容,支持續寫、潤色、仿寫、批改等多種不同寫作需求;

4、安全能力:具備較好的世界觀、價值觀,對于明顯的虛假信息,均能做到準確識別、正確回答或者給出合理指引,這得益于夸克在搜索場景下長期考驗中累積了非常豐富的經驗和能力。

其中,知識和創作對應的能力和夸克產品強關聯,比如搜索引擎,是知識能力;工作學習中的文檔書寫或寫作文,是典型創作能力的延伸;對話能力主要是補齊知識和創作能力在實際應用中的體現。

此外,夸克大模型也很擅長英語能力,例如做英語解題時,不僅能給出精準答案,還會告訴用戶該題目考查的是哪個英語知識點,最終怎么得到這個答案的,這對提高教育類產品的體驗很有幫助。

三、搜索引擎跟大模型天然契合,夸克大模型中文能力領先

針對AIGC技術與搜索產品在大模型領域的協同發展,清華大學新聞學院教授、博士生導師沈陽的團隊針對所有大模型做了人文社科類評測,并看到夸克大模型在4個方面的能力:1)隨聊能力;2)組合創新;3)持續多輪對話;4)以不同風格進行內容創作

在他看來,依托搜索平臺,夸克大模型擁有高質量的各類數據,在中文語境下,模型能力處在行業領先水平。

沈陽教授認為,搜索引擎跟大模型的結合是天然之配,有3點主要邏輯:1、數據量大,天然具有各種網絡公開數據;2、在內容安全上經歷了長時間的考驗;3、搜索引擎用戶提供了大量的查詢需求,這些查詢需求和用戶的點擊、返回的結果本身就是一種交互,大模型可以對這些交互做改造,將搜到的結果做聚合和整合。

據沈陽教授判斷,5到10年后將沒有搜索引擎的概念,只會有大模型的概念。用戶有任何問題會習慣于問大模型,不再用搜索引擎

最后,他總結了國產大模型有待提升的三點:

第一,將文本、圖片、視頻融會貫通,實現多模態,從識圖到生圖完全打通;

第二,繼續擴大在交互速度上的優勢;

第三,實現搜索引擎與大模型的深度融合,特別是把做搜索引擎的優勢充分內化到大模型研發中,走出中國自己的大模型發展道路。

結語:好用的大模型產品,應該把知識和創意結合起來

用基于大模型的AIGC技術推動搜索革新,已經成為搜索產品進化的行業共識。根據介紹,夸克大模型將全面升級夸克在搜、用、存上的智能化體驗,幫助用戶進一步提升效率。

談到搜索產品的演變,蔣冠軍認為,理論上,只要大模型足夠強,打字或語音交互都很方便,不需要搜索或電商,但大模型本身的技術能力還沒到這樣的程度,所以會與搜索引擎共存;再進一步,搜索功能會慢慢被大模型的功能替代,先是由大模型輔助搜索,逐漸變成以大模型為核心,用搜索幫助完成產品創新。

在他看來,好用的大模型產品和創新產品應該把知識和創意結合起來,這樣才有更大的空間;擁有一定規模和生命力的大模型產品和應用階段,還沒有到來。