去年12月,智東西公開課聯合達摩院自然語言智能實驗室全新策劃推出了「阿里達摩院大模型公開課」,并邀請到了阿里巴巴達摩院高級算法工程師李晨亮和NLP高級算法專家嚴明,分別就主題《達摩院通義 AliceMind 預訓練大模型在 AIGC 文本創作的探索》、《 達摩院通義 mPLUG 多模態預訓練技術演進及應用實踐》進行了深度講解。
5月18日,「阿里達摩院大模型公開課」第3講上線開講。阿里巴巴達摩院算法專家、ChatPLUG 核心貢獻者田俊峰和阿里巴巴達摩院算法工程師、mPLUG 核心貢獻者葉晴昊將參與主講。兩位主講人將對ChatPLUG 和 mPLUG-Owl 背后的技術細節進行深入剖析。
ChatPLUG 是基于 PLUG 的一個中文對話大模型,使用億級互聯網社交數據、百科數據預訓練和百萬級高質量對話數據,并采用 FID(Fuse-in-Decoder)架構進行 instruction 微調得到。該模型支持高效的輸入多段外部知識、人設信息等文本進行知識增強。
在與最新的開源中文對話大模型 BELLE-7M-2B 和 ChatGLM-6B 進行了多任務泛化性的人工對比評測后發現:
1)ChatPLUG-3.7B 取得了比 BELLE-7B-2M 更好的效果( Rating-A 更多,Rating-C 更少),同時對比 ChatGLM-6B 也取得了 comparable 的效果,表明了 ChatPLUG 具備良好的多任務泛化能力;
2)當將模型的 size 擴大到 13B,ChatPLUG-13B 在所有模型中取得了最優效果。
mPLUG-Owl是一款類似于 miniGPT-4 和 LLaVA 的多模態對話生成模型,由視覺基礎模型 、視覺抽象模塊以及預訓練語言模型組成,并且具備單模態和多模態多輪對話能力。
本次公開課,田俊峰將以《中文個性化對話大模型ChatPLUG》為主題首先帶來直播講解。他的講解將主要從個性化大模型研究、搜索增強指令微調對話大模型,以及對話大模型的評估和開源三方面展開。
之后,葉晴昊將圍繞《模塊化多模態大模型mPLUG-Owl》這一主題進行講解。他將介紹多模態大模型研究的變化趨勢,并對mPLUG模塊化多模態模型系列,以及mPLUG-Owl及訓練新范式進行深入解讀。
第3講
主題一
《中文個性化對話大模型ChatPLUG》
提 綱
1、個性化大模型研究概述
2、搜索增強指令微調對話大模型
3、對話大模型的評估和開源
主講人
田俊峰,阿里巴巴達摩院算法專家、ChatPLUG核心貢獻者;研究方向為對話大模型和多模態大模型,在國際頂級會議ACL、EMNLP、CVPR、AAAI等發表多篇文章。
主 題 二
《模塊化多模態大模型mPLUG-Owl》
提 綱
1、多模態大模型研究的變化趨勢
2、mPLUG模塊化多模態模型系列概述
3、mPLUG-Owl及訓練新范式解析
主講人
葉晴昊,阿里巴巴達摩院算法工程師、mPLUG核心貢獻者;研究方向為多模態模塊化大模型,在國際頂級會議ICCV、ICML、ACL等發表多篇文章。