智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影
“我們不認為這是價格戰。”被問到國內大模型持續降價的趨勢時,阿里云智能集團CTO周靖人談道,“今天的價格不存在說已經足夠低了,相對未來龐大的應用來說,還是太貴了。”
他打了個比方:“你今天覺得便宜了,今天上網多少錢一個月?手機上網費,我的手機套餐不到200元,但是今天200元能用幾十個G的流量,你能在二十年前想象這個事兒嗎?今天的流量,你要是在二十年前估計得用破產。”
2024云棲大會主論壇開幕首日,周靖人代表阿里云公布了通義大模型的一系列年度重磅發布,其中阿里云通義千問三款主力模型再度大幅降價,最高降幅85%,百萬tokens價格低至0.3元。()
在會后媒體問答環節,周靖人與阿里云副總裁、公共與客戶溝通部的總經理張啟就大模型持續降價、開源與閉源路徑選擇、對OpenAI o1模型的看法、對AI算力趨勢的預判等業界關注話題逐一作答。
周靖人認為,OpenAI新模型o1是一個非常具有代表性、革命性的方向,讓模型自動分析、策劃、試錯等,這一系列能力在各種各樣場景里都能完成比較魯棒性的表現,指明了一條今天可行的道路;今后模型預訓練和推理都會大量使用算力,也會把這部分通過強化學習方式有效拓展開來。
一、全線降價主要通過技術優化,將紅利讓渡給企業級用戶與開發者
據周靖人分享,通義千問此次全線降價主要是借勢規模效應,通過技術的優化、資源的調度,從云基礎設施提升到模型優化,都能夠將模型推理成本進一步降下來,阿里云希望將這樣的技術紅利給到企業級用戶及開發者,從而帶動整個產業的發展。
“今天模型的運用,包括模型各種各樣的創新,現在還在早期的階段。”周靖人談道,很多新模型的迭代、Agent的使用都會大量并發、被模型調用,如果模型推理很昂貴,開發者難以有效大規模使用,因此阿里云會堅定不移推動社區及行業的發展,以激發更多產業級創新。
這與阿里云做開源的邏輯殊途同歸。他補充說,從去年開始,阿里云非常堅定不移地做開源,希望有更多人能夠利用開源能力,推動生態發展。同時,針對一些閉源的、企業級的客戶,阿里云希望為這些有特殊要求的客戶提供一個極致的能力。
“我們把選擇權給到企業,同時即使我們開源,我們希望在云平臺上提供服務時,也提供極致的性價比。一方面,我們希望生態的發展。另一方面,我們還是希望能更有效服務到企業。”周靖人透露道,阿里云不僅希望通過開源使大家能將模型能力用起來,同時也要降低模型使用的成本,每一次降價是一個非常嚴肅的過程,會從整個產業的發展及開發者、企業用戶的反饋等各方面進行權衡。
張啟補充道,國內外大方向都是不斷降價,基礎設施只有把資費降到足夠的低,才有可能未來更好的發展,不能現在簡單算一個投資回報率。
他提到一個說法,現在的AI相當于1996年左右的互聯網,也就是BBS時代,當時上網資費很貴,后來互聯網和移動互聯網發展,運營商大興基建,現在我們也在瘋狂地推進AI大基建,把資費降下來,才有可能去談未來應用的爆發。
“所以這個長遠的目標,才是我們考慮更多的事情。而不是說今天一定要算一個賬,馬上就能夠賺多少錢,或者馬上又到什么樣的一個目標。”張啟說。
二、開源模型做到全球第二,獲得海內外開發者認可
阿里云一直將大模型生態繁榮作為首要目標,目前其魔搭社區已成為中國最大的模型社區,擁有超過690萬個開發者用戶,與行業合作伙伴合作貢獻了超10000款模型。
周靖人談道,阿里云是一家以技術為主的公司,在各方面都有前瞻性的一些布局和思考,阿里云的技術體系經過長期演進,通義千問的前身通義系列預訓練大模型便是這一波AI浪潮到來前阿里云前瞻性布局的一個代表。
在業務層方面,阿里云從去年開始宣稱“要成為AI時代最開放的云”。周靖人說,這是非常具有事實依載的一句話,今天通義模型生態已經發展到全球第二,僅次于美國Llama,開源社區蓬勃發展。
其中“全球第二”來自于Hugging Face全球模型的分析,當前Llama衍生模型數量是全球第一;短短一年內得到全球開發者認可的通義模型排名全球第二,正在高速發展過程中。
通義開源模型累計下載量已經突破4000萬,通義原生模型和衍生模型總數超過5萬,成為僅次于美國Llama的世界級模型群。
另外在模型能力方面,阿里云最新推出的Qwen2.5系列開源模型,一些具體指標已經超過Llama 3.1 405B。阿里云希望也能夠把相關一系列技術創新能力更好讓開發者使用起來。
阿里云此次共開源,創大模型開源史上之最。周靖人談道,阿里云推出不同規格的模型,以便將把更多選擇權留給開發者,使開發者可以根據自己的業務場景去做選擇。
此外,他補充說像Qwen這樣的模型系列受到了海內外廣泛開發者的喜愛,認知度非常高,這也有助于阿里云出海業務的開展。
三、算力市場飛速轉向AI計算,AI基建升級托載大模型創新
在開幕式年度技術發布環節,周靖人提到云廠商擁有全棧技術儲備,并通過基礎設施的全面升級,讓AI訓練、推理、部署和應用整個生命周期變得更高效。
阿里云正在圍繞AI時代,樹立一個AI基礎設施的新標準,全面升級從服務器到計算、存儲、網絡、數據處理、模型訓練和推理平臺的技術架構體系,讓數據中心成為一臺超級計算機,為每個AI和應用提供高性能、高效的算力服務。
周靖人在會后接受采訪時進一步強調說,模型更新離不開基礎設施,AI技術變革是一個系統化的技術變革,如果沒有底層的相關能力的支持,今天模型的研發、迭代等方方面面則沒有承載的地方,這是一個相輔相成、承上啟下的關系。阿里云最新分享的一系列基礎設施進展,也在引領行業的發展。
在他看來,“AI的基礎設施”中間有很多細微且重要的創新,正是因為這些重要的創新,才讓今天大模型的訓練與創新變成了可能。
張啟補充道,阿里云在云棲大會上的所有發布,都是圍繞著“一張遍布全球的理想的AI云計算網絡”去打造。
他提到整個算力市場上新增的算力需求中,AI算力需求已經超過了50%。這個速度非常之快,意味著整個算力市場正在飛速的從原來的CPU轉向AI計算。
談及對算力趨勢的預測,周靖人認為模型仍在創新、不斷迭代,還沒有一個固定的范式,所謂算力的分布到底是預訓練居多還是推理的居多,或者說中間的比例有什么樣的變化,大家都有各種各樣的嘗試,還沒有一個完全的定論。
在他看來,如何有效把算力利用好,仍是整個行業所需要去解決的一個問題。要把好鋼用在刀刃上,哪一部分持續去做Scaling Law能夠達到更好的return?還是通過強化學習方式,能夠進一步提升模型對于人類問題的解答?這些當前都沒有定論。他相信每個技術團隊都在做各個方面的探索。
結語:技術創新不能閉門造車,需與商業邏輯有機結合
周靖人認為,今天整個AI產業帶來的變化是深遠的。他非常歡迎創業公司的創新,因為這個時代需要更多優秀人才在各個領域進行探索、突破;科技創新不是只有一條路,希望大家通過各種的渠道、思考,不斷推進科技發展浪潮。今天各種各樣創業公司已經在基于通義模型生態做創新,阿里云樂意與更多創業公司合作,為他們提供很好的支持。
在他看來,現在企業CTO要保持技術優勢,關注前瞻性的技術布局,還要理解整個技術如何被利用好,不能閉門造車,而更多是希望造出來的技術能夠有效被市場、被企業客戶所用。周靖人說,阿里云在聆聽開發者的需求方面做得非常突出,能夠容納大家各種各樣的需求,并將大家的反饋作為技術創新重要的輸入,這些都是與其整個商業邏輯、技術體系有機的結合,是“雙輪驅動”。
