智東西AI前瞻(公眾號:zhidxcomAI)
作者 | ZeR0
編輯 | 漠影
智東西9月19日報道,北京多模態大模型創企生數科技今日宣布完成新一輪數億元A輪融資。
該(gai)輪(lun)融資(zi)(zi)(zi)由博華資(zi)(zi)(zi)本領(ling)投(tou),卓源亞(ya)洲、百度(du)戰投(tou)、北京(jing)市人工智能產業投(tou)資(zi)(zi)(zi)基金、啟明創投(tou)、達泰(tai)資(zi)(zi)(zi)本、BV百度(du)風投(tou)等老(lao)股東(dong)持續跟投(tou),建發新興投(tou)資(zi)(zi)(zi)等產業合(he)作方加碼跟投(tou)。
新(xin)一輪(lun)融(rong)資將用于模(mo)(mo)型(xing)研發和技術創新(xin),探索多模(mo)(mo)態大模(mo)(mo)型(xing)的智(zhi)能上(shang)限和應用廣度,同(tong)時將持續加強產品拓展(zhan)、用戶服務(wu)、產業合作和全(quan)球商(shang)業布局。
瑞萊智慧、百度、螞蟻集團、華為哈勃、智譜均曾投資生數科技。
生數科(ke)技成(cheng)立于2023年3月,核(he)心(xin)團(tuan)隊由(you)來自(zi)清華大學、北京大學、帝國理工學院(yuan)、卡耐基梅隆大學等全(quan)球頂尖高校(xiao)的(de)(de)(de)技術人才和(he)來自(zi)產業界的(de)(de)(de)產品研發(fa)、產業服務(wu)人才組成(cheng),具備深厚的(de)(de)(de)產業實踐(jian)經驗與(yu)出色的(de)(de)(de)全(quan)球化技術落地(di)能力。
該公司專注于多模(mo)態大模(mo)型(xing)及應(ying)用(yong)(yong)的自主研發。其核心產品Vidu具備AI圖(tu)像(xiang)生成(cheng)、視頻生成(cheng)、音(yin)頻生成(cheng)等能力,廣泛(fan)應(ying)用(yong)(yong)于互聯網、廣告、電商、動漫、文旅、廣電、教育、游戲(xi)及影視等行業領域。
2024年7月,Vidu在全球上線,全球首創「參考生」圖片/視頻概(gai)念(nian)。其在AI視(shi)頻生(sheng)成和(he)AI生(sheng)圖領域(yu)已覆蓋全(quan)球200多個國家和(he)地(di)區的超(chao)3000萬用(yong)戶和(he)6000家開(kai)發者及(ji)企業(ye)。
通過Vidu累計生成視頻數量超過4億,其核心功能參考生視頻和參考生圖的數量已超過1億,其中商業內容素材生成量占比超過50%。
今年9月9日,生數科技正式將其視頻大模型Vidu的Q1參考生圖功能向大眾用戶開放。其參考生圖功能同時支持7張參考圖(tu)輸入,可在多(duo)人(ren)(ren)、多(duo)場(chang)景、多(duo)次生成(cheng)下保持(chi)人(ren)(ren)物/主體的面貌與(yu)特征不跑偏,并(bing)支持(chi)“一張(zhang)圖(tu) + 一句提示詞(ci)”自由換裝、換背(bei)景、合成(cheng)。
例如,上(shang)傳人物(wu)、道(dao)具(ju)、服飾、配(pei)飾等多張參(can)考(kao)圖(tu),讓小(xiao)李子(zi)坐在霍格沃茨學院的教室里練習魔法。Vidu Q1參(can)考(kao)生(sheng)圖(tu)能(neng)把它們自然得拼到一(yi)張圖(tu)里。
由Vidu Q1參考生圖功能生成的(de)圖像,能夠保持人物發型(xing)、五官(guan)、書(shu)本插圖等(deng)與原(yuan)圖一致,每個物品(pin)位(wei)置擺放正確,且(qie)比例合(he)理。
該功能可(ke)以被(bei)用來快速制作時尚雜(za)志(zhi)封(feng)面。
也可以用它來設計(ji)中秋禮品營銷樣稿(gao)。
讓林黛(dai)玉代言川貝枇杷膏,看起來同樣(yang)有(you)(you)模(mo)有(you)(you)樣(yang)。
Vidu Q1參(can)考生圖還能(neng)實現“合(he)(he)影自(zi)由”,上傳場(chang)景照(zhao)片、多(duo)個(ge)單人照(zhao),即可生成合(he)(he)影。
換背景更是不(bu)在話(hua)下(xia)。
動漫(man)人物分(fen)分(fen)鐘就能加(jia)上特(te)效(xiao)。
把照片(pian)中的特定素材(cai)替換成(cheng)其他東西,也變得高效。
還可以讓圖(tu)中的南瓜變(bian)大1倍、1.5倍。
AI虛擬換裝、換場景都更加(jia)便(bian)利。
比如把裙(qun)子換上(shang)時髦(mao)的(de)碎花(hua)花(hua)紋。
再(zai)比如上傳人物照、裙子(zi)照、場景照,讓(rang)AI生成霉霉的(de)結(jie)婚現場圖(tu)。
或者讓模特在銀白色現代(dai)化的室內房間中,分別換上(shang)西服(fu)、晚(wan)禮服(fu)、緊身(shen)裝、休閑運動(dong)裝。
Vidu Q1參考(kao)生圖(tu)還可以用于一些(xie)有趣的P圖(tu)玩法。
比如把真人變手辦。
或是把線稿轉3D。
給指定建筑換成(cheng)木頭材質,然(ran)后上色:
把平面照(zhao)片變成冰箱貼(tie)。
生數科(ke)技(ji)CEO駱怡航博士(shi)認為,多模(mo)態生成技(ji)術(shu)在數字內容產業中(zhong)的商業化進(jin)程正(zheng)在加(jia)速,但(dan)目(mu)前仍處(chu)于早期階段。
他預計在未來三年內(nei),多模態生(sheng)成將重塑全(quan)(quan)球數字內(nei)容的(de)生(sheng)產方式(shi),全(quan)(quan)面滲(shen)透到各(ge)(ge)行各(ge)(ge)業的(de)內(nei)容生(sheng)產與消費環節,展現出(chu)巨大的(de)市場(chang)空間(jian)與全(quan)(quan)球性增長潛力。