智東西(公眾號:zhidxcom)
作者 | ZeR0
編輯 | 漠影
智東西7月30日報道,今日,火山引擎發布全新豆包·圖像(xiang)編(bian)輯模型3.0、豆包·同聲傳譯模型2.0,宣布扣子開源版正式上線,全新升級豆包大模型1.6系列,發布企業自有模型托管方案、Responses API等多個模型服務及工具產品,升級HiAgent 2.0、PromptPilot等工具,為企業和開發者構建Agent、落地AI夯實基礎設施。
在回顧了(le)近期豆(dou)包大模(mo)型取得的一系列成績后(hou),火(huo)(huo)山(shan)引(yin)(yin)擎總裁譚待強(qiang)調(diao),AI云原(yuan)生(sheng)是企(qi)業(ye)在AI時代構建好(hao)Agent的創新發展的關鍵。基于這樣的觀察和思考,火(huo)(huo)山(shan)引(yin)(yin)擎持續(xu)優化(hua)AI云原(yuan)生(sheng)全棧服務,支撐Agent開(kai)發與落地,幫助企(qi)業(ye)開(kai)發者在AI時代更好(hao)地發展。
一、圖像編輯模型3.0:動嘴P圖時代來了,一句話指哪改哪
火山引擎總裁譚(tan)待發布全新豆包·圖像編輯(ji)模型3.0和豆包·同聲傳譯(yi)模型2.0。
豆包·圖像編輯模型SeedEdit 3.0顯著(zhu)優(you)(you)化了指令(ling)遵(zun)循能(neng)力、圖像保持能(neng)力、圖像生成質量(liang),優(you)(you)化了“動嘴P圖”的效果和效率,可廣泛應用于影像創作、廣告營銷、游戲宣傳等領域。
無論(lun)是變成吉卜力(li)風格(ge)、調整光影、P掉路人、把線稿變彩圖、替(ti)換背景,該(gai)模型都能得(de)心應手。
用戶通過自然語言指令,即可完成消除多余內容、改變光影效果、替換文字等操作。該模型具備對風格、結構與語義的精準控制力,能夠像人類大腦一樣理解指令、深度思考,解鎖更多創新的修圖場景,例如圖像風格轉換、變換材質、變化人物姿勢、根據提示詞進行推理等P圖玩法。
豆包(bao)·圖(tu)像編(bian)輯(ji)(ji)模型SeedEdit 3.0基于文(wen)生圖(tu)模型 Seedream 3.0,疊(die)加多樣(yang)化的(de)數據融合方法與(yu)特定獎勵(li)模型,可支持(chi)1K以上高清圖(tu)像的(de)生成與(yu)處理,在對(dui)編(bian)輯(ji)(ji)區域進(jin)行精細自然(ran)調整的(de)同時,能高度(du)還原并保留圖(tu)像主體、背(bei)景及細節信(xin)息。
動動嘴(zui)就能精準P圖的時代,真的來了。
比如你(ni)可以要求人物(wu)(wu)長發變(bian)短發、改變(bian)姿勢坐(zuo)在椅(yi)子上(shang),P圖后(hou)背景、人物(wu)(wu)面部特征等細(xi)節無損。
你也(ye)可以精準(zhun)鎖定其他區域,比如要求(qiu)只(zhi)修改毛衣(yi)區域顏色和(he)紋理并添加(jia)項鏈。
豆(dou)包·圖像編輯(ji)模型3.0只瞄準(zhun)文(wen)字(zi)區域,字(zi)體(ti)、光影會自(zi)動匹配原圖風格,智能填充周(zhou)圍紋(wen)理;還能讓(rang)黑(hei)夜秒(miao)變陽(yang)光明媚的(de)白晝,光影自(zi)然過渡,建筑、樹木(mu)細節清晰銳(rui)利(li),毫無涂(tu)抹感(gan)或分辨率(lv)下降。
此外,該模型可以理解“發(fa)酵”過程(cheng),生成體積膨大、充滿氣泡的發(fa)酵面(mian)團(tuan)圖(tu)。并且基(ji)于(yu)面(mian)團(tuan)狀態(tai)進(jin)行推理,在保(bao)持(chi)面(mian)團(tuan)主(zhu)體關聯性的前(qian)提下,生成金黃酥脆、香(xiang)氣四溢的面(mian)包圖(tu)。
實用玩法(fa)很多,比如讓它“去掉(diao)所(suo)有(you)路人”、“消除文(wen)字”、“給黑白(bai)照(zhao)片上色”,或是給照(zhao)片、設計換個光影氛圍或風格。
企業用戶可在火(huo)山(shan)方(fang)舟平(ping)臺調(diao)用該模型API,個人用戶可使用即夢或豆包App的“豆包P圖”功能(neng)體(ti)驗(yan)。
二、同聲傳譯模型2.0:3秒超低延遲,0樣本聲音復刻
傳統翻譯系統通常依賴于“級(ji)聯模型(xing)”,即多個模塊相互(hu)串(chuan)聯,依次處理語音識別、翻譯、聲音復刻和語音合成(cheng)等任務,翻譯結果不夠連貫(guan)、處理速度慢。
豆包·同聲傳譯模型Seed-LiveInterpret 2.0做到“邊(bian)(bian)聽邊(bian)(bian)說”,支(zhi)持全雙工語音理解和生(sheng)成框架,將(jiang)傳統機器(qi)同傳的語音延(yan)遲從8-10秒(miao)降低到2-3秒(miao),實(shi)現(xian)(xian)文本與語音的同步生(sheng)成;無(wu)需提前錄制,一(yi)邊(bian)(bian)說話(hua)一(yi)邊(bian)(bian)采(cai)樣(yang),實(shi)現(xian)(xian)0樣(yang)本聲(sheng)音復刻,讓同一(yi)個(ge)人同音色(se)開口說外語,甚至匹配方(fang)言(yan)口音,大幅提升跨語言(yan)溝(gou)通沉浸感和效率。
三、豆包大模型1.6升級:極速版百萬token輸入僅0.15元
豆包大模(mo)型(xing)1.6系列模(mo)型(xing)能力升級。Doubao-Seed-1.6-thinking-0715深度思考模(mo)型(xing)增強代(dai)碼、推(tui)理(li)和(he)視覺理(li)解(jie)能力,Doubao-Seed-1.6-flash-0715模(mo)型(xing)能力更(geng)全、速度更(geng)快(kuai)、價格更(geng)低,Seed1.6-embedding模(mo)型(xing)可構(gou)建強大的多模(mo)態企業還是問(wen)答,實現全模(mo)態混合檢索和(he)自定(ding)義(yi)指令增強。
火(huo)山(shan)引擎智能算(suan)法負責人吳迪談道,構建AI應用(yong)有4大(da)挑戰:
- 模型:在業務落地中選擇更強的模型;
- 性能:高質量的吞吐和延遲體驗會變得越來越重要;
- 安全:重中之重是取得更多的客戶信任;
- 工具:多步驟復雜任務和工具使用的能力,會逐漸滲透到廣大企業的核心業務中,為額客戶創造價值。
應(ying)對這些挑戰,豆包大模型和火山方(fang)舟以更(geng)強的(de)模型、更(geng)低的(de)價格、更(geng)易落地的(de)方(fang)案,助力業績提升(sheng)。
極速版Doubao-Seed-1.6-flash模型服務于對延遲和成本敏感的客戶,具有能力(li)全(quan)、速度快、價格低的特點,在保持(chi)出色視覺理解能力(li)的同時(shi),升級了代碼、推理、數學等大語言模型(xing)能力(li),非常適(shi)合智(zhi)能巡檢、手機助(zhu)手、智(zhi)能硬(ying)件等對模型(xing)效果、速度和成本都有要求(qiu)的大規模商(shang)業(ye)化場景。
該模型具有業界領先的極低延遲,每token延遲(TPOT)僅10毫秒,在輸入文本長度0-32k的區間中(企業使用量最大),每百萬tokens輸入僅需0.15元,輸出僅1.5元,同時還具備出色的視覺理解能力。
在一個真實的家用安防客戶案例中,Doubao-Seed-1.6-flash幫助客戶將輸出延遲降低60%以上(shang)、端到端性能提升50%以上(shang),產品成本降低70%。
吳迪宣布,Doubao-Seed-Translation多語言文本翻譯大模型正式開源。
豆包最新翻譯(yi)模型(xing)支(zhi)持28種語(yu)言,打破溝通壁壘,針對法律條文、科技用語(yu)、文言文領域的專業術語(yu)或復(fu)雜文本都能精準(zhun)把握語(yu)境,提供高(gao)質(zhi)量的翻譯(yi)。
火山疫情全模態向量化模型Seed1.6-Embedding帶來三大突破:全面效果領先,首次實現“文本+圖像+視頻”混合模態的融合檢索,升級(ji)自定義指令能力,讓向量生成能更貼合各類業務需求。該模型在權(quan)威測評中(zhong)包攬多(duo)模態(tai)全面任務及(ji)中(zhong)文(wen)文(wen)本(ben)的最優成績(ji),可助(zhu)力企業構建更強大的多(duo)模態(tai)知識庫(ku)。
例(li)如在(zai)(zai)電商場景(jing),你(ni)可(ke)以強調(diao)價格與(yu)材質的(de)相(xiang)似性;在(zai)(zai)影視(shi)領域,你(ni)可(ke)以強調(diao)文(wen)字劇情與(yu)角(jiao)色的(de)精準匹(pi)配。這使得(de)模型更(geng)靈活,更(geng)容易被集成到企(qi)業現(xian)有業務流程(cheng)中,大(da)幅降(jiang)低(di)業務落地(di)門(men)檻。
目前Seed1.6-Embedding已全面上線火(huo)山方(fang)舟。
Viking DB是字節跳動自研(yan)的高(gao)性能向(xiang)量數據(ju)庫,面向(xiang)全模態進行(xing)多項升級。
一是全介質索引(yin)升級,從(cong)內存索引(yin)(適合高并(bing)發(fa)中等數(shu)據(ju)規(gui)模(mo),億(yi)級及(ji)以下)、磁(ci)盤索引(yin)(適合地(di)并(bing)發(fa)超大數(shu)據(ju)規(gui)模(mo)場(chang)景,十億(yi)及(ji)以上)到GPU索引(yin)(超過并(bing)發(fa)超大數(shu)據(ju)規(gui)模(mo)場(chang)景),打通了億(yi)級數(shu)據(ju)跨介質檢索能力。
二是(shi)更高的性價(jia)比,在數億索引數據規模下,相(xiang)比傳(chuan)統內存方案(an)可將成(cheng)本降低75%。
三是升級全模態表(biao)征能力,實(shi)現更易用(yong)的文本、圖像、視頻(pin)端到端一鍵向量(liang)(liang)化。用(yong)戶只需(xu)抓住(zhu)原始(shi)數據,系統就能自動完成向量(liang)(liang)化。
例如博查致力于提供AI時代的知識搜索創新,服務了4000多家企業和2萬多名開發者,承接著國內超過60%的AI應用所需的聯網搜索需求。火山引擎VikingDB協助博查改善(shan)了(le)客戶體(ti)驗。
以向量數據庫VikingDB為基礎,火山引擎還打造了方便易用的升級版知識庫,支持圖文(wen)視頻全模態處理(li)和混排輸出,在國內外諸(zhu)多評測中展現出了更好的效果。
對于很多希望使用火山知識庫的開發者,火山引擎進一步推出新的標準版,價格僅為旗艦版的1/10。
四、扣子核心能力開源,在火山引擎可自動化部署
7月26日,火山引擎做出一個重要決定:AI Agent開發平臺扣子將核心功能開源。
本次開源覆蓋扣子平臺最核心的兩個項目: 扣子開發平臺(Coze Studio)、 扣子羅盤(Coze Loop),并采(cai)用(yong)沒有任(ren)何(he)附加條件(jian)的Apache 2.0許可證開源,用(yong)戶可在(zai)GitHub下(xia)載。
扣子(zi)開發(fa)平(ping)臺是(shi)一個一站式AI Agent可視化(hua)開發(fa)工具,可快(kuai)速實現AI Agent的開發(fa)創建、調(diao)試和部(bu)署(shu);扣子(zi)羅盤是(shi)一個聚焦AI Agent的全(quan)(quan)流程管理系統,幫助開發(fa)者實現Agent從開發(fa)到運維的全(quan)(quan)鏈路管理。
扣子開源(yuan)版上(shang)線(xian)受廣受歡迎,開源(yuan)僅3天,扣子開發平臺(tai)在(zai)GitHub上(shang)星標過萬,扣子羅盤星標超過3000。
HiAgent為扣子開源版提(ti)供了全面支持(chi)。
企業AI平(ping)臺產品HiAgent可調用扣(kou)子(zi)開源版(ban)提供的智能(neng)體搭建和(he)運維能(neng)力,并通過(guo)共(gong)享Agent標準,支(zhi)持扣(kou)子(zi)開源版(ban)智能(neng)體的納管。
火山引(yin)擎(qing)的云基礎(chu)產品也將(jiang)為扣子開源版提供高效(xiao)、穩定(ding)、可靠的基礎(chu)設(she)施(shi)支(zhi)持。開發者可一鍵拉起資(zi)源,完成部(bu)署(shu)。
還有一系列優惠(hui)政策向新用戶提供。
火山(shan)引(yin)擎AI開源矩陣(zhen)越(yue)來越(yue)強大,幫助(zhu)企(qi)業做(zuo)好(hao)數據,幫助(zhu)開發者(zhe)更好(hao)地構(gou)建(jian)AI應用(yong),為(wei)AI開源生(sheng)態繁榮貢獻力量。
五、企業自有模型托管方案發布,通過火山方舟模型單元部署
針對有模型定制需求的企業客戶,火山引擎發布企業自有模型托管方案。
依托火山方舟模型單元,企業無需運維底層GPU資源,也不用進行復雜的網絡和調度配置,就能在火山方舟上實現自研模型的全托管,并在推理服務中享受火山方舟極致的彈性算力資源,大幅降本增效。
在算力成本上,企業可(ke)自主選擇部署方式、機型,并設置彈性規(gui)則,更精(jing)細地控(kong)制首Token時延、模型吐字(zi)延遲(chi),且(qie)無需為業務(wu)低谷期付費,最終(zhong)實現更高的資源利用效(xiao)率。
此外,全托管的企業自有模型,還能(neng)享受(shou)火山(shan)方(fang)舟上的全套(tao)(tao)開發工具(ju)、MCP服務等(deng)生態配套(tao)(tao)。
火山方舟模型單元已在火山方舟上開放邀測,可申請體驗。
六、Responses API上線,助攻多模態Agent高效開發
多(duo)(duo)模態模型統一(yi)、多(duo)(duo)模態模型API的統一(yi),是當前(qian)大模型發展的重要趨勢。
為此,火山方舟平臺升級了API體系,推出Responses API。
該API具備原生上下文管理能力,支持多輪對話的鏈式管理,可無縫銜接文本、圖像、混合模態數據,結合cache能力后能大幅降低延遲和成本,在很多典型應用里,整體成本下降幅度可達80%。
此外,Responses API支持自主選擇調用工具,用戶發起單次請(qing)求,即可(ke)聯動多(duo)個內(nei)置工具(ju)、自定義(yi)函數及多(duo)輪模型組(zu)合響應,解決復雜Agent任務,讓Agent開發更(geng)加省(sheng)時省(sheng)力。
例如(ru),搭建(jian)一個智能(neng)助(zhu)手Agent,傳(chuan)統構建(jian)方法要寫463行代碼,用(yong)Responses API僅需60行代碼,開發(fa)時間可以從1-2天縮短到1小時,大(da)幅(fu)提(ti)升效率。在(zai)學習陪伴場(chang)景(jing),對話式(shi)Agent需要兼(jian)顧情緒引(yin)導、英語陪練、百科問答(da)等(deng)多種能(neng)力,Responses API在(zai)幫(bang)助(zhu)客(ke)戶降低延遲的同(tong)時,將(jiang)成本進(jin)一步節(jie)約超(chao)50%,并(bing)讓(rang)開發(fa)更簡易。
七、PromptPilot升級:實現更高效提示詞調試,從“碰運氣”到“精準調控”
寫好提(ti)示詞(ci)(Prompt)是(shi)做好AI應用(yong)的(de)第(di)一(yi)個重要部分。
對提示(shi)詞工(gong)程有(you)幾個(ge)基本判斷:模(mo)型(xing)越強(qiang)大(da),問出好問題帶來的(de)正(zheng)向價(jia)值(zhi)越大(da)。很多(duo)高價(jia)值(zhi)問題沒(mei)有(you)標(biao)準答案,如何讓(rang)模(mo)型(xing)理(li)解(jie)需求(qiu)、服從產品要求(qiu)是一個(ge)長期存在的(de)重要實踐。提示(shi)詞工(gong)程本質(zhi)上是一個(ge)搜(sou)索問題,一切(qie)搜(sou)索問題長期都(dou)將(jiang)由算法來解(jie)決。
實際落地(di)過(guo)程中(zhong)也會遇到一些挑戰,比如如何(he)寫出(chu)一個高質量的Agent、如何(he)提升模型落地(di)效果、怎么定(ding)義(yi)目標、如何(he)快速實現模型+業務落地(di)的通(tong)路?……
PromptPilot通(tong)過(guo)(guo)引導(dao)交(jiao)互,幫助用(yong)戶(hu)明確(que)任務意圖和評估(gu)標準;實現(xian)高效(xiao)迭代,像積(ji)累數(shu)據一(yi)樣(yang)積(ji)累Case,通(tong)過(guo)(guo)SDK調用(yong),構(gou)建Case雷達;回顧整(zheng)個過(guo)(guo)程(cheng)(cheng)。深度優化(hua)(hua)(hua)器融合了(le)先進優化(hua)(hua)(hua)技術,模擬人(ren)類(lei)(lei)反思,類(lei)(lei)比錯(cuo)誤總結能力(li),實現(xian)提(ti)示詞的全(quan)(quan)自動優化(hua)(hua)(hua),全(quan)(quan)流(liu)程(cheng)(cheng)支持聯網(wang)AI搜索和自定義知識(shi)庫,確(que)保信息實時性(xing)(xing)和專業性(xing)(xing),最后給出可視化(hua)(hua)(hua)報告,通(tong)過(guo)(guo)圖表數(shu)據比對優化(hua)(hua)(hua)前后的效(xiao)果。
火山引擎宣布PromptPilot全新升級,將提供更廣泛的(de)模(mo)型(xing)(xing)優化能力,支持任意模(mo)型(xing)(xing)的(de)提示與優化,并(bing)與火山引(yin)擎(qing)知(zhi)識庫深度(du)融合,能精準(zhun)調用專業(ye)數據庫,幫助(zhu)模(mo)型(xing)(xing)在垂直領域實現(xian)更準(zhun)確(que)、更可靠的(de)理解(jie)和輸出。
多年來,火山引擎在算(suan)子、框架和調度層(ceng)面,也開展了很多深度優化工作。
全棧式(shi)大模型(xing)訓練(lian)加速引擎veOmni覆蓋(gai)了LLM、VLM等多(duo)類模型(xing),在測試中比(bi)諸多(duo)開源框架訓練(lian)效率提高50%左右(you)(you);基(ji)于全系自研bit推(tui)理框架veFuser,推(tui)理效率是行業平均水平的(de)4倍左右(you)(you)。
火山引(yin)擎的veTurbo解決方案,從模(mo)型訓練、推理(li)部署到強化學習的全生命周期,幫助客戶(hu)實現AI應用的高效開發。
八、HiAgent:讓數字員工“持證上崗”,混合開發、邊干邊學
火山引(yin)擎副總(zong)裁張鑫先分(fen)享了(le)企業員(yuan)工忙碌(liu)的一(yi)天會有(you)哪些場景,比(bi)如看(kan)待辦事(shi)項、開各種會、做(zuo)會議(yi)紀(ji)要、分(fen)配任務(wu)和掌握進展、審核(he)一(yi)堆低級錯誤浪費(fei)時間、安(an)排出差事(shi)項、寫報告、寫日報和明日工作計劃等。
這暴(bao)露(lu)了(le)(le)企業效(xiao)率的(de)3個瓶頸:大(da)量工時被規(gui)則性任務消耗,系統來回切換導致(zhi)上下文(wen)中斷,以及信息誤導。這些(xie)挑戰(zhan)制(zhi)約(yue)了(le)(le)決策的(de)效(xiao)率。
HiAgent作為一(yi)個(ge)一(yi)站式(shi)智能體(ti)工(gong)作臺(tai),希望幫(bang)助(zhu)企業(ye)源源不斷(duan)地派(pai)遣數(shu)字員工(gong),來(lai)拓展人類服務邊(bian)界和認(ren)知邊(bian)界,從而解決上述問(wen)題。
張鑫(xin)總結了生產級智(zhi)能(neng)(neng)體數字員工的6個(ge)要素:量(liang)體裁衣(yi),能(neng)(neng)調用企(qi)業內部系統,支(zhi)持低(di)代(dai)碼(ma)(ma)與高代(dai)碼(ma)(ma)混合開發,對智(zhi)能(neng)(neng)體全生命周期管理,通(tong)過(guo)數據支(zhi)撐與反饋來(lai)幫助數字員工邊(bian)干邊(bian)學(xue)變聰明,通(tong)過(guo)統一入口(kou)連接所有(you)數字員工和企(qi)業系統。
企(qi)業的(de)戰斗力,不在于單點聰明與否,而(er)是看系(xi)統性是否能打。
低(di)代碼開(kai)發(fa)在第一階段能幫(bang)助1-2人(ren)小團隊,通過(guo)提示詞(ci)、可(ke)視化拖拉拽,完成一個智(zhi)能體雛形(xing)的(de)搭建與上線。但當這些智(zhi)能體逐漸(jian)走向(xiang)生產的(de)深水區,弊端和局限(xian)性逐漸(jian)暴露出(chu)來,比(bi)如很(hen)難做深度復雜算子的(de)定制、復雜交互界面及意圖(tu)識(shi)別的(de)開(kai)發(fa),也很(hen)難支(zhi)持多人(ren)協同編輯,更(geng)不用說如何(he)深入架構層面去(qu)保證整個系(xi)統的(de)性能調優和高可(ke)用設計。
因為這些弊端,部(bu)分團隊開(kai)始步入第三階(jie)段,又回歸高代(dai)碼開(kai)發(fa)(fa),通過SDK和IDE插(cha)件結合高代(dai)碼開(kai)發(fa)(fa)平臺,直接進行模型調用、算法撰寫、整體架構設(she)計,這又拉高了(le)智能(neng)體開(kai)發(fa)(fa)的(de)技術門檻(jian),讓(rang)真正懂業(ye)務(wu)的(de)人員(yuan)無法直接參(can)與。
HiAgent給出的解決(jue)方案,就是混(hun)合開發。
一方面(mian),讓(rang)專業技術人員(yuan)可(ke)以通(tong)過全代碼的方式(shi),設計高可(ke)用(yong)、高性能的整體架(jia)構和定制化算子;另一方面(mian),業務人員(yuan)可(ke)在探索階段(duan)和后(hou)面(mian)的運(yun)營階段(duan),繼續通(tong)過低(di)代碼的方式(shi)去迭(die)代提示(shi)詞、公祖留、知識庫等,并將這(zhe)些能力通(tong)過組件嵌入(ru)到高代碼的抽象中。
通過(guo)這種混合開發模式,業務人員可以繼續進行(xing)快速的(de)(de)想(xiang)法驗(yan)證,并可以為數字員工打開自動(dong)迭代的(de)(de)按鈕,技術(shu)人員可以通過(guo)高代碼去解決(jue)復雜(za)的(de)(de)邏輯和深度的(de)(de)性能優化。
解決了開發問題,下一步就是養(yang)成(cheng)。
就像人類員工一樣,智(zhi)能體作(zuo)為數字員工的上(shang)崗過程(cheng),也覆蓋從(cong)招聘、試用期培(pei)訓(xun)到考(kao)核(he)、晉升的流程(cheng)。
HiAgent推出了Agent Devops,實現數(shu)字員工全(quan)生命周期(qi)管理,覆蓋(gai)策略規劃、能(neng)力開發、效果(guo)評(ping)測(ce)、品質優化、線上觀測(ce)、應用發布(bu)等環節。
HiAgent還發布了數據流轉模塊,把數(shu)(shu)字(zi)員(yuan)工產生的(de)數(shu)(shu)據(ju)自動記(ji)錄到一個學習庫(ku)中,再通過(guo)數(shu)(shu)據(ju)清洗(xi)分(fen)析和回(hui)流(liu)沉淀成后續的(de)評測集(ji)和模型的(de)訓練集(ji),變成數(shu)(shu)字(zi)員(yuan)工的(de)寶貴經驗。
通過Agent Devops和數(shu)據流轉模塊,越來越多(duo)的數(shu)字(zi)員工(gong)可以從實習生(sheng)轉正,開(kai)始持證上崗了。這時數(shu)字(zi)員工(gong)好(hao)不好(hao)用(yong),入口(kou)是關鍵。
HiAgent發布人機協同工作臺,打造真(zhen)人與數字員工的“統一交互入口(kou)”,讓用戶找(zhao)數字員工比找(zhao)真(zhen)人同(tong)事還方(fang)便。
HiAgent數字員(yuan)工(gong)交互入口根據不同員(yuan)工(gong)/智能(neng)角(jiao)色(se)的(de)需求,提供千人千面、可(ke)自定義的(de)工(gong)作(zuo)(zuo)畫布(bu)形態,在一(yi)個(ge)畫布(bu)中就(jiu)能(neng)連接所有業務系統(tong)完成日常工(gong)作(zuo)(zuo),并通過更靈活(huo)的(de)多(duo)人協作(zuo)(zuo)人機(ji)協作(zuo)(zuo)模式,提升團隊(dui)的(de)生產力。
從用戶旅(lv)程視角來(lai)看,HiAgent 2.0幫助企業構建自己的AI“數字(zi)員工派遣站”流程如下:
- 企業個性化需求:企業會梳理個性化需求,可從行業里預制的上百種應用樣板間和MCP市場里選擇適合的模版與工具;
- 數字員工養成:通過業務人員和技術人員的協同迭代整合開發,完成數字員工Agent搭建;
- 派遣上崗:在經過評測、調優、發布后,數字員工可以作為一個職場新人開始上崗;
- 人機協同:數字員工通過人機協同工作臺和真人員工在各種日常業務流程中做不同的協同;
- 實踐成長:再通過全鏈路的觀測、數據支撐、數據回流,讓數據員工在實踐中不斷成長,從一個職場新人進化成一個業務專家。
2025年(nian)是智(zhi)能體成為(wei)企業“數(shu)(shu)字(zi)(zi)同事”、“持證上(shang)崗(gang)”的元年(nian)。作為(wei)企業的AI“數(shu)(shu)字(zi)(zi)員(yuan)工派遣站”,HiAgent已幫助各式智(zhi)能體在千行(xing)百(bai)業里“持證上(shang)崗(gang)”,落地汽(qi)車維修、招生(sheng)咨(zi)詢(xun)、投研顧問、客服導(dao)購等領域。
結語:火山引擎的AI“朋友圈”愈發多元,加速Agent開發落地
今日的(de)一系(xi)列發(fa)布與升級,進一步(bu)完(wan)善了火山引擎(qing)AI生態(tai)布局。火山引擎(qing)已經為企業(ye)與開發(fa)者提供了從基礎模型到開發(fa)工具的(de)全鏈條支持,加速AI在各行業(ye)的(de)落(luo)地應(ying)用(yong)。
越來越多(duo)企(qi)業正(zheng)嘗試火山引(yin)擎AI原生的(de)各種產品。
例如(ru),金山(shan)辦(ban)公(gong)(gong)(gong)結合(he)豆包(bao)大模型1.6助力AI助手靈犀(xi)升級,打造一(yi)款原生的(de)Office辦(ban)公(gong)(gong)(gong)智能體,使(shi)其AI搜索(suo)、AI寫(xie)作等功能有(you)更好的(de)表現,綜合(he)成本還下降了63%,目前(qian)金山(shan)辦(ban)公(gong)(gong)(gong)WPS的(de)豆包(bao)1.6使(shi)用(yong)量已突破(po)日均100億的(de)客戶服務。
豆包(bao)大模型(xing)1.6 Flash擁有超低(di)延時(shi),適用(yong)(yong)于智能巡(xun)檢、手機助手、智能硬(ying)件等對模型(xing)效果(guo)、速度和成(cheng)本都要求非常高的(de)商(shang)業產品。螢石(shi)第一時(shi)間選擇接入豆包(bao)大模型(xing)1.6 Flash,實(shi)現降(jiang)本增效,相比之前實(shi)用(yong)(yong)的(de)模型(xing),延時(shi)縮(suo)短一半,使用(yong)(yong)成(cheng)本暴降(jiang)92.3%。
國內(nei)知名(ming)電商(shang)數(shu)字營銷服務商(shang)蟬媽(ma)媽(ma)利用豆(dou)包·視(shi)頻(pin)生(sheng)成模(mo)型(xing)(xing),打造了新一代(dai)數(shu)字視(shi)頻(pin)生(sheng)成平臺,用于企業(ye)營銷與創意(yi)內(nei)容(rong)生(sheng)產(chan),相比之(zhi)前的(de)視(shi)頻(pin)生(sheng)成模(mo)型(xing)(xing),在商(shang)品的(de)主(zhu)圖生(sheng)成效(xiao)果、真實感(gan)和(he)視(shi)頻(pin)可用性(xing)方(fang)面都帶來明顯提(ti)升,節省超過30%的(de)使(shi)用成本。強媽(ma)媽(ma)每天通過豆(dou)包大模(mo)型(xing)(xing)生(sheng)成的(de)視(shi)頻(pin)數(shu)量已(yi)經達到(dao)數(shu)千條(tiao),很快將突破(po)日均萬條(tiao)。
在(zai)智(zhi)能電視場景,酷(ku)開整合了豆包大模型能力,用一(yi)句臺(tai)詞或(huo)一(yi)段劇情準確鎖定心儀的影片(pian)片(pian)段,類似的能力還(huan)應(ying)用在(zai)教育健康產品中(zhong)。
在(zai)游(you)戲(xi)(xi)場(chang)景,巨(ju)人網絡將(jiang)豆(dou)包大模(mo)型(xing)(xing)應用(yong)在(zai)游(you)戲(xi)(xi)核心玩法(fa)中,依托(tuo)豆(dou)包模(mo)型(xing)(xing)的(de)角色扮演(yan)和(he)深度(du)思考(kao)能(neng)力(li),游(you)戲(xi)(xi)中的(de)AI角色既(ji)能(neng)與玩家對(dui)話,又具備極強的(de)邏(luo)輯推演(yan)能(neng)力(li),能(neng)夠制定(ding)出縝(zhen)密而有趣的(de)游(you)戲(xi)(xi)策略,打破傳(chuan)統(tong)人機交互死板(ban)與套(tao)路的(de)模(mo)式。未來巨(ju)人網絡和(he)火山引(yin)擎將(jiang)進一步深度(du)挖掘豆(dou)包大模(mo)型(xing)(xing)的(de)潛(qian)力(li),圍繞智能(neng)NPC的(de)創新展(zhan)開探索。
火(huo)山引擎還在(zai)不(bu)斷迭代模(mo)型能力(li)(li),為企業帶來能力(li)(li)更強、性(xing)價比更高的模(mo)型以及更加好用的服務與工具,加速(su)讓AI Agent走(zou)向生產與落地(di)。

























