智猩猩定位硬科技講解與服務平臺,提供公開課、在線研討會、講座、峰會等線上線下產品。
「AI新青年講座」由智猩猩出品,致力于邀請青年學者,主講他們在生成式AI、LLM、計算機視覺、機器學習等人工智能領域的最新重要研究成果。
AI新青年是加速人工智能前沿研究的新生力量。AI新青年的視頻講解和直播答疑,將可以幫助大家增進對人工智能前沿研究的理解,相應領域的專業知識也能夠得以積累加深。同時,通過與AI新青年的直接交流,大家在AI學習和應用AI的過程中遇到的問題,也能夠盡快解決。
「AI新青年講座」現已完結233講;有興趣分享學術成果的朋友,可以與智猩猩教研產品團隊進行郵件(class@jmfly.net)聯系。
大語言模型在自然語言處理領域的卓越表現已引起廣泛矚目,然而其對計算資源和硬件設施的高要求成為了廣泛應用的一大挑戰。

針對這一難題,來自莫納什大學、北航、商湯的研究者創新性地提出了一種名為 QLLM 的高效、精準的低比特量化方法。QLLM 通過引入自適應通道重組機制,巧妙地將離群值所攜帶的能量重新分布至其他通道,有效緩解了這些極端值對量化動態范圍的影響。
此外,為補償量化過程中的性能損失,研究者設計了一種僅涉及學習少量低秩權重的低成本微調方法。大量實驗表明,QLLM 不僅在性能上顯著優于現有量化方法,而且在訓練效率上實現了大幅提升。QLLM 現已被 ICLR 2024 收錄為 Poster。

2月26日晚7點,「AI新青年講座」第234講邀請到 QLLM 一作、莫納什大學 ZIP Lab 在讀博士劉璟參與,主講《大語言模型的高效低比特量化》。
講者
劉璟,莫納什大學ZIPLab在讀博士;師從莊博涵和蔡劍飛教授,主要研究方向為 Efficient AI,在 NeurIPS、ICLR、CVPR、ICCV、ECCV、AAAI、TPAMI 等頂級會議和期刊上發表多篇論文,Google Scholar 引用1200+。
第234講
主 題
《大語言模型的高效低比特量化》
提 綱
1、大語言模型低比特量化難點
2、精確且高效的后訓練量化方法 QLLM
3、低成本微調方法
4、在 LLaMA-1/2 上的量化性能評估
直 播 信 息
直播時間:2月26日19:00
直播地點:智東西公開課知識店鋪
成果
論文標題:《QLLM: Accurate and Efficient Low-Bitwidth Quantization for Large Language Models》
論文地址://arxiv.org/pdf/2310.08041.pdf
開源代碼://github.com/ModelTC/QLLM