智東西(公眾號:zhidxcom)
作者 | 程茜
編輯 | 云鵬

智東西2月14日報道,剛剛,DeepSeek在開源社區Hugging Face上的點贊數躍居第一,獲約8730次點贊,這一數字仍在持續上漲。

DeepSeek又得了個第一

這是繼DeepSeek應用力壓ChatGPT登頂美區App Store免費榜、模型在開源社區GitHub上Star數首次超越OpenAI之后,創下的又一個歷史時刻,DeepSeek在海外平臺再次登頂。

Hugging Face點贊榜單前十名的模型中,都曾在不同節點引爆整個大模型產業。

排名第二的是曾以AI生圖“新王”名號橫空出世的FLUX.1,由StableDiffusion原班人馬成立的新工作室黑森林工作室打造,點贊數約8710次。

排名第六的是全球1000名科學家組成BigScience打造的參數高達1760億個的超大NLP模型BLOOM,第八的是歐洲AI獨角獸Mistral AI基于MoE架構的模型Mixtral-8x7B,其余六席被Meta的Llama系列模型和StabilityAI家的模型包攬。

OpenAI的語音轉錄模型Whisper-large-v3被擠出前十名之列,排名第11,點贊數約3810次。

此外,DeepSeek-V3的排名在第19名,點贊約3810次,超越了微軟的Phi-2谷歌Gemma-7B模型。

Hugging Face點贊數排行榜前30的還有DeepSeek另一款開源的多模態模型Janus-Pro-7B,該模型在使用文本提示的圖像生成排行榜中優于OpenAI的 DALL-E 3和Stability AI的Stable Diffusion。

DeepSeek又得了個第一

▲開源社區Hugging Face點贊榜(圖源:Hugging Face)

DeepSeek V3、DeepSeek R1、Janus-Pro-7B分別于2024年12月26日和今年1月20日、1月28日發布。

DeepSeek V3為DeepSeek自研MoE模型,參數量達到671B,激活參數量37B,在14.8T token上進行了預訓練,該模型在多項評測成績超越了Qwen2.5-72B和Llama-3.1-405B等開源模型,并在性能上和閉源模型GPT-4o以及Claude-3.5-Sonnet比肩。

DeepSeek R1在數學、代碼、自然語言推理等任務上,性能比肩OpenAI o1正式版,在開源DeepSeek-R1-Zero和DeepSeek-R1兩個660B模型的同時,蒸餾了6個小模型,其中32B和70B模型在多項能力上實現了對標OpenAI o1-mini的效果。

多模態模型Janus-Pro是去年發布的Janus的高級版本,可顯著提高多模態理解和視覺生成。

當下,全球已經掀起了從芯片企業、云計算巨頭到各路基礎設施公司適配、接入DeepSeek的熱潮,DeepSeek所展現出的卓越性能與廣泛的應用潛力正在逐漸放大。