智東西(公眾號:zhidxcom)
編譯 | 云鵬
編輯 | 漠影
智東西2月6日消息,今日,美國AI創企Anthropic的CEO Dario Amodei“”受邀做客美國知名中國研究播客“中國說(ChinaTalk)”,對其前不久發表的關于DeepSeek的萬字檄文做出了更詳細的解釋和回應。
在最新中國說43分鐘的訪談中,主持人和Amodei主要討論了以下幾個主要話題:
1、中美之間的AI創新競賽是否不可避免
2、鑒于DeepSeek發布了R1,美國應如何更新出口管制
3、Amodei想給中國工程師和DeepSeek傳達的信息
4、針對模型蒸餾與AI安全技術防范措施
5、出口管制與相信AI將廣泛促進人類繁榮之間的矛盾

在訪談中,Amodei明確提及了自己對這些問題的看法,探討了以DeepSeek為代表的中國AI帶來的挑戰、美國及其自己的Anthropic要如何應對,并站在美國立場分析了美國進行出口管制的重要性。
Amodei的觀點較為偏激,也將美國一些對華措施的底層邏輯真實扒開呈現了出來,美國AI野心昭然若揭。
以下是Amodei的一些代表性言論:
超級強大的AI就好比一個1000萬人口的國家人人都是各個領域都諾貝爾獎得主。
DeepSeek能否繼續開發前沿模型,取決于他們能獲得多少芯片,以及能否獲得比現在規模大得多的芯片。
既能保持領先,又能確保安全性的最佳方式是實施類似出口管制這樣的措施,我們可以在中美之間制造差距。
出口管制從來不是為了阻止DeepSeek或其他任何中國公司獲得幾萬數量級的芯片,而是阻止更大規模采購——DeepSeek不可能擁有100萬個芯片。
保持領先有兩種方式:你可以大幅加速,或者設法拖住對手。
在10到15年的時間跨度內,中國芯片可能會趕上……真正的競爭關鍵時期會在2026年、2027年,10到15年就像“永恒”那么漫長,幾乎無關緊要。
我感覺華為芯片短期內不太可能與美國芯片相媲美。
當我們談及中國時,這并非是中國人與美國人之間的對立……我們歡迎來自世界各地的人才。
我最希望DeepSeek能來美國,為我們公司或其他公司工作。
Dario Amodei曾在百度、谷歌工作,于2016年加入了OpenAI,曾經主導GPT-2和GPT-3開發。2021年,Amodei創立了Anthropic,其開發的Claude也是當前的明星通用大語言模型之一。
在此前Amodei發布的長文中,他認為DeepSeek對美國AI領導地位的威脅被夸大了,此外他還通過AI發展的三個特點來分析DeepSeek模型并非具有獨特的突破性。
以下是對Amodei本次訪談的完整編譯(為提高可讀性,智東西在不違背原意的前提下進行了一定的增刪修改):
Jordan Schneider(主持人):我們先簡要探討一下,AI的快速發展在國家實力方面可能會如何體現?
Dario Amodei:幾個月前,我寫了一篇名為《充滿慈愛之機器(Machines of Loving Grace)》的文章,重點闡述了超強大AI的諸多積極應用。
我對超強大AI的模樣有這樣一個定義。我用“數據中心里的天才之國(country of geniuses in a datacenter)”這個表述,來描述所有公司都在努力打造的東西。這個表述對于理解其影響很有啟發性。
這就好比突然出現一個擁有1000萬人口的國家,而且所有人都是在各個領域博學多才的諾貝爾獎得主。這對國家實力意味著什么呢?想必,這會在很多方面提升國家實力。它會極大地加速經濟發展能力,極大地推動科學進步。
或許很不幸,它可能在情報和國防方面也會產生影響,無論是在控制無人機群,還是分析情報信息方面。一般來說,擁有大量極其聰明、能以虛擬方式操控一切的實體,將從諸多方面成為強大實力的來源。
Jordan Schneider:為什么要寫一篇關于出口管制的文章呢?
Dario Amodei:看到大家對DeepSeek的反應,而且我身處這個行業,又是這項技術的開發者之一,我發現很多觀點并不正確。
這些觀點來自那些沒有密切關注技術實際發展脈絡的人,他們原本不關注,直到出現了一家中國公司開發出模型這一新鮮事,才開始留意。他們錯過了之前的許多進展,也誤解了這個領域的動態。他們說:“天啊,這太便宜了。”也許他們對中國生產的東西有便宜的刻板印象,然后就按這個刻板印象來理解了。
正如我在文章里說的,現實情況是,這個領域一直存在成本下降的趨勢,與此同時,我們在訓練模型上投入的資金越來越多。這些模型非常強大,在經濟上也非常有用,以至于為打造更好、更智能的模型而增加投入的反向趨勢,已經超過了降低成本的趨勢。
時機就是這樣,DeepSeek能夠發布一些確實包含重要創新的成果,而且符合我們過去看到的AI成本下降曲線。這并非是用600萬美元做出了其他公司要花數十億美元才能做出來的東西。更像是我們看到,與半年到一年前訓練的模型相比,成本每年大約降低75%左右。
我們會看到,很多參與者現在都能以很低的成本生產出那種質量的模型,而包括DeepSeek在內的多個參與者,會投入更多資金去訓練更強大的模型。
現在的情況是出現了一個新的競爭者:DeepSeek也可能會被歸入Anthropic、OpenAI、谷歌、Meta和xAI這些能夠訓練AI的大公司中。也許中國還會有其他這樣的公司,這是一個里程碑,這是以前沒有發生過的事情,這讓我有些擔憂,但人們的反應有些過度。
Jordan Schneider:你提到的重大變化是有一家中國公司,或許還會有更多中國公司,在技術上取得進展。那么,就模型方面而言,人們具體應該重新評估哪些內容,以展望未來可能出現的差距呢?
Dario Amodei:我想明確一點,我們關注DeepSeek已經很久了。一年多來,我們一直認為DeepSeek很可能是中國最具實力的AI大模型參與者。這也影響了我們對事情發展態勢的判斷。
對于那些剛剛注意到DeepSeek的人來說,情況的變化在于,之前美國有三到五家公司能夠開發前沿或接近前沿的模型。現在,美國有三到五家公司,中國有一家公司。這家中國公司能否繼續開發接近前沿的模型,取決于他們能獲得多少芯片,以及能否獲得比目前規模大得多的芯片。
Jordan Schneider:包括你在內的AI安全領域人士,多年來一直警告競賽動態(racing dynamics)帶來的風險。我很好奇,你是如何形成當前對出口管制的看法的呢?
Dario Amodei:這兩者其實并不矛盾。我擔心的是,如果中美在這項技術上勢均力敵,每個階段都不相上下,那么基本上就沒有什么能阻止雙方大力開發這一技術了。
由于這項技術具有巨大的經濟價值和軍事價值,雙方繼續推動技術進步在理性層面上是完全說得通的。
在沒有確鑿危險證據的情況下,各方會有相當大的動力繼續開發這項技術。我特別擔心的是美國的立法情況。比如那些旨在衡量,甚至在某些時候限制AI系統風險的法律。
在過去一年左右的時間里,美國出臺了各種相關立法。有人反對這些立法的一個理由是:“嘿,如果我們放慢腳步,中國就會直接超越并打敗我們。”這個理由完全正確。
對我們來說,最佳方式是實施類似出口管制這樣的措施,我們可以在中美之間制造差距。
假設我們領先兩年。也許我們可以在這兩年中拿出六個月來確保我們自己開發的東西是安全的。換句話說,我們既能保持領先,又能確保安全性。
很長時間以來,我一直覺得讓美國領先中國非常重要。這與我們在開發技術時想要謹慎行事的想法存在矛盾。保持領先有兩種方式:你可以大幅加速,或者設法拖住對手。
我認為我們需要在一定程度上加速,但這一舉措存在權衡取舍,因為加速越多,我們謹慎行事的時間就越少。但我認為在一定程度上解決這種權衡問題的一種方法是實施這些出口管制措施,因為它們擴大了差距,給我們提供了更大的緩沖空間,我們可以利用這個空間來管控自己的技術。不過這很難,很難兩者兼顧。
Jordan Schneider:美國應該和不應該向中國出售哪些芯片呢?
Dario Amodei:首先,出口管制從來不是為了阻止DeepSeek或其他任何中國公司獲得幾萬數量級的芯片。DeepSeek可能擁有大約5萬個不同種類的芯片。出口管制在阻止大規模采購方面可能會更成功——DeepSeek不可能擁有100萬個芯片,因為這很容易涉及數百億美元的經濟活動,甚至接近1000億美元。
Jordan Schneider:英偉達的觀點是,我們向中國出售的芯片越少,對華為芯片的需求就越大,他們的客戶也就越多。有消息稱DeepSeek在華為910B等芯片上運行效率極高。你對中國國內生產芯片的能力有何看法?這對出口管制中的半導體制造設備方面有什么影響?
Dario Amodei:在10到15年的時間跨度內,這種說法可能是對的,他們可能會趕上。但那里的供應鏈非常復雜,而且正如你提到的,我們也對半導體制造設備及設備維修實施了出口管制。
實際上,要制造出能與英偉達新的B100芯片,或者我們正在使用的Trainium和TPU芯片相競爭的芯片會很困難,軟件生態系統也不夠完善。
我感覺華為芯片短期內不太可能與美國芯片相媲美。正如我在《充滿慈愛之機器》和關于出口管制的文章中所寫的,真正會出現競爭,或者說實現力量平衡很重要的關鍵時期,將發生在2026年、2027年,最晚到2030年。
政策應該針對這個時間段。AI領域發展非常迅速,10到15年就像永恒那么漫長。幾乎無關緊要。
Jordan Schneider:你怎么看待DeepSeek將其模型開源這件事?
Dario Amodei:DeepSeek發布模型有幾個不同特點。一是發布了模型的權重。二是該模型在成本降低曲線上是一個高效且強大的模型,而且這是中國公司首次在成本降低曲線上達到這樣的水平。
其中第二點比第一點重要得多。大部分影響都源于DeepSeek的模型是強大的模型。
在商業方面,我們發現我們的主要競爭對手是那些發布強大模型的公司,無論這些模型的權重是否開源。在與其他模型競爭時,一個模型的強大程度重要性占比約為80%到90%。
模型權重開源與開源軟件不同,這里沒有源代碼,只有一堆數字。通常開源軟件的一些優勢和差異在這里并不那么明顯。
那些有從開源模型權重起步歷史的公司,在某個時候需要實現盈利,需要賺錢。他們往往會停止這種做法。這里更重要的因素是一家中國公司正在開發強大的模型。
僅從市場角度看,我們沒有看到任何證據表明人們會在不考慮模型性能的情況下,因為模型權重開源就更喜歡某個模型。
Jordan Schneider:但你們每次通過API調用都會收取一定費用,對吧?
Dario Amodei:有趣的是,任何一種模型,無論在哪里,都必須在云端提供服務,這最終都會涉及費用。不管怎樣都會有這種情況。同時,推理效率和模型訓練存在巨大差異,模型訓練發展非常迅速。
有時候我們在幾周內就能將推理效率提高20%左右。各家公司都在相互競爭,以實現最高效的推理效率。大部分情況下,誰的推理效率最高、誰訓練出最好的模型,這些因素更為關鍵。

▲大模型成本和性能點狀分布圖,來源:Latent Space
如果中國的一家公司很擅長以低成本提供模型服務,那么這將是競爭的一個領域。模型權重是否可用在很大程度上是一個干擾因素。
Jordan Schneider:與此相關的一個問題,你認為政府會在什么時候開始對模型開源感到不安呢?
Dario Amodei:從商業角度來看,開源和閉源之間的差異有點被夸大了。從安全角度而言,開源模型和閉源模型之間的差異也被夸大了。
最重要的是模型的強大程度。如果一個模型非常強大,那我既不希望它被泄露給中國,也不希望它通過開源的方式被提供給中國。如果一個模型沒那么強大,那么不管是開源還是閉源,都沒什么可擔憂的。
Jordan Schneider:關于模型蒸餾,你有什么想說的嗎?
Dario Amodei:就像我在博客文章里提到的,有一些報道稱DeepSeek可能從OpenAI的模型中進行了模型蒸餾,他們聲稱有證據。實際上我還沒有仔細研究過,所以無法判斷這些報道是否準確。模型蒸餾確實是可以對模型進行的操作,所以這種情況有可能發生。
有幾點很重要。其一,要開發出檢測模型蒸餾的方法。或許可以通過觀察一個模型,以及另一個據稱是由它蒸餾而來的模型,將二者放在一起比較,從而判斷后者是否由前者蒸餾得到。
我會從一個模型生成大量輸出,再從另一個模型生成大量輸出,然后嘗試判斷一個模型是否源于另一個模型的蒸餾。
這其實已經能在一定程度上看出來,因為它們會有相似的特點,表述方式也相似。要是能把這個轉化為某種可測量的統計測試就好了。此外,還有預防模型蒸餾的監測技術。
人們正在研究應對模型破解的方法。我們今天剛剛發布了一些成果,能讓破解模型變得困難得多。

▲模型破解成功率對比,來源:Anthropic
Jordan Schneider:對于在西方學習、聽到這些內容并心想“我為什么要為這家伙工作?”的中國留學生,你有什么想說的?
Dario Amodei:我想把一件事說得非常清楚,當我們談及中國時,這并非是中國人與美國人之間的對立。就我們公司而言,我猜其他美國公司也會這么說,我們歡迎來自世界各地的人才。我們對有才華的研究人員和工程師沒有任何成見,無論他們在哪里工作。
我們和他們屬于同一個群體。如果這里存在某種合作可能,很可能是通過這種民間層面的研究者對研究者的交流方式。我們絕對盡可能地歡迎這些人。
Jordan Schneider:你有什么想對DeepSeek說的嗎?
Dario Amodei:他們看起來是很有才華的工程師。我想對他們說的主要是,要認真對待AI系統自主性方面的擔憂。
美國大多數AI公司都表示,AI自主性以及AI濫用等問題都是潛在的嚴重且真實的問題。我最希望的是他們能來美國,為我們公司或其他公司工作。
Jordan Schneider:你能想象AI,尤其是開源AI,實際上是一種民主化力量嗎?
Dario Amodei:我并不認為這與開源或閉源有很大關系。正如我在《充滿慈愛之機器》中所寫,AI可能有機會建立一個更統一、更公平的司法系統。
司法系統常常涉及做出主觀判斷,這些通常需要人來完成。人們擔心如果由算法來做,會不太公平。但如果我們正確應用,AI系統可以創造一個更公平的社會,在這個社會中,人們更有可能在法律面前獲得平等的正義。
Jordan Schneider:你寫了兩篇博客文章,從某種程度上說,它們之間似乎存在矛盾。全球六分之一的人口生活在中國,在你所設想的AI助力人類實現更大福祉的愿景下,你如何看待這一點呢?
Dario Amodei:實際上我認為這兩者屬于同一世界觀的不同部分。
首先,我認為完全有可能將AI的益處惠及全球,包括中國。你可以采用通過API運行模型的方式,為中國提供藥物研發服務,助力研發下一款抗癌藥物。你還可以利用它幫助中國實現更高效的能源生產。
你可以將模型的大量運算時間租給中國的相關方,用于這些具有經濟效益的活動。我認為這是一種有益的貿易形式,這種情況應該發生。
通過這種方式,AI的所有益處都能得到共享。

▲控制模型輸出結果新方式示意圖,來源:Anthropic
從更宏觀的角度來看,從長遠角度來看,我們希望AI的所有應用能夠惠及所有人。我們必須制定出某種針對該技術的國際治理方案,達成某種穩定的平衡。
因為我說過美國最多領先兩年。我希望,如果是美國牽頭建立這種國際機制,事情會進展得更順利。如果我們能憑借優勢地位,為所有人爭取安全部署AI的方案,情況也會更好。但如果我們處于弱勢地位,就會擔心被其他國家主導。
我認為,如果美國占據領先地位,就能在此做出一些更為寬宏大量的決策。我們現在就應該開始思考該怎么做。計劃不應只是打敗對手,我覺得那樣甚至都行不通。計劃必須是基于優勢地位,去研究這項技術如何能讓全世界受益,以及如何減輕其負面影響。
來源:China Talk