芯東西(公眾號:aichip001)
編譯 | ?程茜
編輯 |? Panken

芯東西9月18日消息,今天,美國AI芯片獨角獸Groq宣布獲得7.5億美元(折合人民幣約53億元)新融資,投后估值達69億美元(折合人民幣約490億元),本輪融(rong)資由Disruptive領投(tou),三星、思科等參投(tou)。

Groq創始人、CEO喬納森·羅斯(Jonathan Ross)透露,Groq將利用這筆資金擴大數據中心容量,今(jin)年和(he)明年將建設新數(shu)據中心,計劃(hua)在今(jin)年年內宣布(bu)首(shou)個亞太地區數(shu)據中心的選址。

Groq成立于2016年,創始人羅斯曾在谷歌TPU核心團隊任職,之后離開谷歌創業。該公司官網顯示,其LPU是專門針對大模型優化的推理芯片,能效(xiao)比(bi)其(qi)他系(xi)統高(gao)出10倍

2024年8月這家獨角獸拿下6.4億美元(折合人民幣約45億元)融資,估值達到28億美元(折合人民幣約199億元),至今一年時間已實現估值翻倍。據PitchBook估計,Groq迄今為止已籌集了超過30億(yi)美(mei)元(折合人民幣約213億(yi)元)

今年6月,羅斯在(zai)接(jie)受外媒CNBC采訪(fang)時提(ti)到,他(ta)們(men)計劃(hua)在(zai)多個方(fang)面與包括(kuo)英(ying)偉達在(zai)內的(de)競爭(zheng)對手形成差異化(hua)優勢(shi)。

值得一提的是,此前受數據中心容量不足影響,Groq今年下半年多次大幅下調向投資者提供的業績預期,將其預計的2025年營收從超過20億美元(約合人民幣144億元)降至5億美元(約合人民幣36億元),下調(diao)超過15億(yi)美元(約合人民幣108億(yi)元)。據(ju)The Information報道,該公(gong)司透(tou)露,5億美元為今年的最終業績預期。

一、谷歌TPU核心團隊成員創辦,比競品能效高10倍

羅(luo)斯曾在谷歌參與TPU研發,2016年(nian)離開團隊,并與同樣出自谷歌的道(dao)格拉斯·懷特曼(Douglas Wightman)聯手(shou),在美國創立(li)Groq。

Groq將(jiang)其產品稱(cheng)為LPU,也就是(shi)專門(men)針對(dui)大模型優(you)化的推理(li)芯片,能效比其他(ta)系統(tong)高出10倍。

羅斯透露,LPU的效率優勢是研究人員多項優化的成果,通過減少開銷為推理留下更多的處理能力,可以運行參數規(gui)模達到萬(wan)億(yi)的(de)模型

具體來看,LPU減少了(le)與使用自定義編(bian)譯器(qi)進(jin)行(xing)電路協調任務相關(guan)的開銷,編(bian)譯器(qi)在(zai)推理工作負載啟動之(zhi)前優先計算哪個電路應該執行(xing)什么任務,這樣就無需在(zai)運(yun)行(xing)時在(zai)進(jin)行(xing)計算。

此外,其編譯器還使用(yong)了一(yi)種名為RealScale的改進(jin)版本技術,可以僅(jin)壓縮神(shen)經網絡在量(liang)化時輸(shu)出(chu)質量(liang)不會顯著下降的部(bu)分。

53億!“英偉達平替”獲新融資

二、云平臺已適配主流開源模型,加速全球數據中心落地

Groq的產品是面向開發人員和企業的,可作為云服(fu)務或本地硬件集(ji)群使用。

其中本地硬件(jian)是服務(wu)器機架GroqRack,配備了硬件(jian)、軟(ruan)件(jian)節(jie)點(dian)堆棧(zhan)。該公司將LPU作為GroqRack系統(tong)的(de)一部分進行(xing)銷售。

該系統包括(kuo)9臺(tai)服務器(qi),每臺(tai)服務器(qi)可容納多個(ge)LPU。Groq官網(wang)提到,與同類設(she)備(bei)相(xiang)比,GroqRack僅需要更少的(de)外部網(wang)絡硬件,可以(yi)降低成本且無需進行重大設(she)施升級即可安裝在數據中心。

云服務和本(ben)地硬件支持運行Meta、DeepSeek、Qwen、Mistral、谷歌、OpenAI等開(kai)源主(zhu)流模型,9月5日,Groq在(zai)云服務平臺GroqCloud上線(xian)了月之(zhi)暗面的(de)Kimi-K2-Instruct-0905模型。

值(zhi)得一提的是,其云平臺可以(yi)托管LPU驅(qu)動的AI模型(xing)(xing),開發人員(yuan)通過應用程序編程接口就能將這些(xie)模型(xing)(xing)集(ji)成到他(ta)們的軟件(jian)中。

Groq的博客透露,該公司已經為超過(guo)200萬名開發人員打造的AI應(ying)用(yong)提供支持(chi)。

同(tong)時,Groq正加速在全球(qiu)業務(wu)布局。

今年(nian)4月,Groq宣(xuan)布與Meta合作(zuo)提供AI基(ji)(ji)礎(chu)設(she)施(shi)以加速Llama 4推(tui)理(li)速度(du);今年(nian)5月,Groq宣(xuan)布與加拿大電信(xin)公司(si)(si)貝爾(er)建立(li)獨家合作(zuo)伙(huo)伴關系,為這家電信(xin)公司(si)(si)的大型(xing)AI基(ji)(ji)礎(chu)設(she)施(shi)項(xiang)目提供支持(chi);在數據中(zhong)心層(ceng)面(mian),今年(nian)7月,Groq啟用了位(wei)于(yu)芬蘭赫爾(er)辛(xin)基(ji)(ji)的首個歐洲數據中(zhong)心。

此外,Groq還成為(wei)沙特(te)阿拉(la)伯AI創企(qi)Humain的(de)(de)主要基礎設施合(he)作(zuo)伙伴,并支持OpenAI在該地(di)區(qu)的(de)(de)gpt-oss模型部署。

目前,基于已(yi)在美國、加拿大和沙特構(gou)建的額外算力基礎設(she)施,Groq全球網絡每(mei)秒可處理超2000萬個Token。

結語:尋求足夠數據中心容量或面臨困境

今年(nian)年(nian)初(chu),據The Information報道,Groq向投資(zi)者(zhe)透露有望在2025年(nian)實現超20億(yi)美(mei)元營(ying)收,而如今這一營(ying)收預期(qi)已經降至5億(yi)美(mei)元以上(shang)。該(gai)公司透露,這是因為其原計劃部署數據中心的地區(qu)缺乏足(zu)夠(gou)運力,部分營(ying)收預期(qi)被調(diao)至2026年(nian)。

這表明,Groq在試圖贏得大客(ke)戶訂單時,可能會(hui)在尋求足夠數據中(zhong)心容量方面遇到困難。