智東西(公眾號:zhidxcom)
作者 |? 陳駿達
編輯 |? 漠影

什么,通義App現在長這樣了?

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

近日,阿里旗下的通義App迎來升級,UI、交互體驗到背后接入的模型都全面重塑,整體外觀大做減法,而內置模型、工具的能力則進一步升級。

進入新版通義App首頁,主智能體引入“鄰家女孩”這一富有親和力的新形象,能勝任大部分應用場景中的需求。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

右滑則是豐富的智能體生態,將原版通義App的工具、角色、頻道等頁面整合,呈現更為直觀。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

左滑后,用戶的對話記錄、創作的圖像、視頻與創建的智能體都一覽無余。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

值得一提的是,新版通義App還接入阿里最新推理模型千問QwQ-32B,這款模型以32B的參數量,在數學推理、編程能力上與671B的DeepSeek-R1 旗鼓相當。此外,在多項通用能力測評中,QwQ-32B的得分超越DeepSeek-R1。一經發布,便獲得全球開發者的關注與贊賞。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

已經有不少網友體驗了升級后的通義App,其更快的響應速度、更豐富的交互體驗獲得好評,還有網友感嘆,新版通義讓“最強AI飛入尋常百姓家”。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

通義App迎來升級后,智東西第一時間全面體驗了其在交互、模型、工具等方面的新變化,在阿里加碼AI to C的大背景下,新版通義有望成為更實用、更貼心的個人AI助手。

一、拍照找bug、解答無厘頭問題,還能給會議畫腦圖

新版通義App以超級智能體作為交互中樞,用戶在通義首頁能問、能聊,還能讓智能體進行圖片理解、圖片生成,翻譯、寫作等任務。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

此外,通義首頁還會推薦基于其他模型或者具備其他不同功能的智能體。目前,基于Qwen-QwQ-32B的被放在了首頁的推薦欄中。用戶只需點擊,就能與這款新模型進行對話。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

數學、代碼類問題一直是通義模型家族的強項,實測中,搭載QwQ-32B智能體的通義App回答了從高考壓軸題到AIME真題等不同難度的數學問題,還編寫了一個簡單的游戲。同時,為了避免大模型上網找答案,測試時聯網搜索能力均已關閉。

下方是2024年高考全國甲卷理科數學的壓軸題,在先前的測試中,智東西曾讓DeepSeek-R1解答,R1用時80余秒,給出了正確答案,但解題流程不符合評分標準中的規范。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

測試中,QwQ-32B在解答這道題目的用時略長于R1,這主要是因為它在思考過程中進行了更多的反思、驗算等流程,還嘗試了不同的解題思路。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

▲QwQ-32B的部分思考過程

最終,QwQ-32B兩個小題的答案都完全正確,解題格式較為規范,不過,它漏掉了一個踩分點,無法拿到滿分。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

智東西又讓QwQ-32B嘗試了一道2024年的AIME真題。在面對英文題目時,Qwen-32B也毫不露怯,會自動用英文思考,不到一分鐘,QwQ-32B便給出了正確答案,這一次它的證明過程沒有破綻。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

測試完新版通義App中QwQ-32B智能體的數學能力,我們再來看看其編程方面的實力究竟如何。智東西讓QwQ-32B編寫了一個基于HTML的五子棋小程序,并加入了“三三禁手”、“長連禁手”等限制黑棋的規則。

幾分鐘后,QwQ-32B用不到200行代碼完成了這一任務,還解釋了禁手檢測的實現邏輯。細讀它的思考過程,還能發現它自我迭代了幾版實現方法。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

不過,作為一款手機App,通義在代碼場景中更常見的應用或許是拍照解釋代碼。智東西在先前的程序中埋入了一個bug,導致游戲無法判斷勝者,無法結束。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

由于QwQ-32B智能體目前暫時不支持圖片上傳,我們將這一挑戰交給了通義App中的主智能體。據了解,在代碼類問題上,主智能體會調用通義千問的Qwen-MAX模型。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

簡單分析后,通義給出了幾個可能的原因與修復的代碼,復制粘貼后再進行微調,游戲程序便能夠正常運行。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

如果說數學、代碼等能力更偏向理科,那接下來的幾道測試題則更側重于文字推理、百科知識的考查。

目前,有許多大模型都在歷史類問題上表現不佳,尤其是在涉及資料較少的國家和民族時。智東西讓QwQ-32B智能體分析了“南非有沒有鎖甲”這一問題。觀察它的思考過程,我們可以發現,QwQ-32B從不同年代、不同民族的角度條分縷析地回答了這一問題,答案也符合史實。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

至于下方這類無厘頭的問題,通義則采取了“用魔法打敗魔法”的策略。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

通義App中的QwQ-32B智能體引經據典,從經濟學視角、生物學視角邏輯學視角等5個不同角度給出了理由,讓人無可辯駁。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

通義App的一大特色是其專業能力,如實時記錄、拍照講題、健康問答等領域。新版通義App中,實時記錄功能新上線了腦圖功能,錄音后不僅能生成會議紀要,還可以將會議內容生成腦圖,可謂是打工人福音了;拍照講題功能現在不光能給出答案解析,還能持續追問,允許用戶“打破砂鍋問到底”。

二、高情商有溫度,產品交互全面重塑

接入新模型、功能升級等調整進一步提升了新版通義App的實用性,而產品界面、交互體驗的變化則是從設計層面,讓通義App更加易用,也更具溫度。

過去的通義App同樣具備不俗的實力,但在用戶友好度上仍有優化空間,未能向用戶充分表達、溝通其實力

以原版通義的主頁面(下圖右2)為例,可以看到界面以文字為主,并集合了不少其他功能。這種設計雖然可以幫助用戶快速跳轉,但也可能導致用戶在剛開始使用時摸不著頭腦,需要一定的學習成本。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

新版通義App通過做減法,讓產品設計更加簡潔清爽,突出了核心功能,也擁有了更具親和力的交互體驗。

現在,打開通義App后,映入眼簾的是更具親和力的人物形象,通義官方將其稱之為“鄰家女孩”。這一形象可以視作是整個通義智能體生態的代言人,給人以親切、溫暖的感受。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

對大多數用戶而言,首頁主智能體是他們與App交互的核心入口,這一形象的變化能夠迅速拉近用戶與產品之間的距離,降低使用時的陌生感和距離感。“鄰家女孩”下方的文字還會不斷變化,詢問用戶的心情,或是用表情符號讓文字更為活潑。

在使用通義App的過程中,我們也能感受到與這一形象相符合的貼心體驗。通義App在QwQ-32B智能體中推薦了這樣一個問題:“如果你是人類,如何過幸福的一生?”模型給出的回答不僅包括實操建議,還撰寫了鼓勵的話語,既貼心又實用。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

新版通義App在其他方面的設計和調整,也進一步降低了用戶使用的門檻。例如,保存用戶過去聊天記錄的板塊原本被分為助手、工具和角色,這一頁面還融合了與通義進行語音交互的功能。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

而在新版通義中,左滑后進入的對話記錄、個人資產頁面劃分更加易懂,被分為對話記錄、我創建的、我聊過的智能體,用戶能通過這些名稱更直觀地找到自己所需的信息。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

使用頻率很高的拍照講題、實時記錄等功能,被調整到主頁輸入框上方,用戶可以一鍵切換。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

右滑后,通義App將代碼、紀要等生產力工具和視頻生成、繪圖、角色扮演整合到一個統一的智能體生態中,在中心位置呈現用戶最新使用的智能體與其他熱門應用,讓用戶無需過多點擊就能直達目標。

通義App迎重磅升級!接入阿里最新推理模型,實測觀感大不同

一些趣味的AI玩法能讓用戶使用App的體驗更加輕松,不過,并不是所有用戶都會高頻使用此類應用。在新版通義App中,這些智能體的位置被放在實用工具之后,用戶可以下滑點擊,或是通過搜索直接訪問。

談及這些升級,通義產品負責人認為,他們不僅要通過強大的AI技術能力幫助用戶解決實際問題,還要讓用戶在使用中感到更方便、更懂我。AI應用的未來不僅僅是簡單的提效工具,更是一個能夠理解、陪伴并提升用戶生活質量的貼心AI助手。

三、Agent賽道爆火,通義積極布局

新版通義App的發布,正值AI Agent應用的爆發期。2024年底,Anthropic發布了MCP(模型上下文協議),以統一標準規范了大模型應用程序與外部數據源和工具的集成。

進入2025年,OpenAI發布了Operator預覽版本,支持購物、訂票等服務;而Deep Research這類深度研究工具,也體現了Agentic AI的思想。

在過去,通義已經在基礎模型領域有深厚積累,涵蓋文本、圖像、語音、視頻,開源模型廣受全球開發者認可。此外,通義App中積累了大量專業領域智能體,已經擁有一定的用戶認可,但尚未完全破圈。

新版通義App主頁面引入的超級智能體,有望憑借新的形象,成為加強用戶與智能體連接的紐帶。

通義App的C端化轉向,也符合這段時間以來阿里的AI To C戰略。去年年底,通義App團隊從阿里云分拆,并入阿里智能信息事業群,而原有基礎模型團隊則仍然保留在阿里云體系內。

產品與研究的相對獨立,讓通義App與一線用戶離得更近,也能更準確地把握用戶的需求,響應市場變化。

未來,通義App會持續上線更多千問大模型新能力,還會把阿里多個先進模型能力融入到產品應用中,為用戶提供更加豐富的智能體驗。

作為潛在的發展方向,現有的主智能體或許能在未來成為智能體分發入口,根據用戶需求智能調用相關智能體,進一步提升用戶體驗。

結語:通義產品理念重塑,阿里AI To C進行時

本次通義App的全新升級,不僅僅是技術層面的進化,更是產品理念和用戶體驗的全面煥新。

要真正做好一款To C產品,技術硬實力僅僅是基礎。如何挖掘、創造用戶的需求,找到用戶的高頻使用場景,創造與用戶的情感連接,是任何一款想要獲得To C成功的產品的必答題。在“Agent元年”推出的新版通義,正探索這些挑戰的最新解題思路。