騰訊混元開源“極小”模型,實(shí)際存儲(chǔ)僅占用600MB
2026-02-10 16:57   
來源: 云財(cái)經(jīng)   
影響力評(píng)估指數(shù):23.65  
云財(cái)經(jīng)訊,2月10日,騰訊混元開源面向消費(fèi)級(jí)硬件場景的“極小”模型HY-1.8B-2Bit,該模型基于1.8B參數(shù)的小尺寸模型,通過2Bit量化技術(shù),等效參數(shù)量約為0.3B,實(shí)際存儲(chǔ)占用僅約600MB,比常用的一些手機(jī)應(yīng)用還小,實(shí)現(xiàn)了端側(cè)部署的新突破。該模型基于混元團(tuán)隊(duì)首創(chuàng)的產(chǎn)業(yè)級(jí)2Bit端側(cè)量化方案,通過對(duì)HY-1.8B-Instruct模型進(jìn)行2比特量化感知訓(xùn)練(QAT)產(chǎn)出,模型大小減少至原始精度模型的1/6,同時(shí)在真實(shí)端側(cè)設(shè)備上生成速度提升2-3倍,可大幅提升使用體驗(yàn)。能力上,模型還保留了原版的思維鏈,可以為不同復(fù)雜度的任務(wù)提供相應(yīng)深度的推理過程。這是業(yè)界首個(gè)實(shí)現(xiàn)2bit產(chǎn)業(yè)級(jí)量化的端側(cè)模型實(shí)踐。隨著大語言模型普及,如何將模型在手機(jī)、耳機(jī)或智能家居等設(shè)備上應(yīng)用,成為業(yè)界難題,尤其是不少應(yīng)用對(duì)模型的離線部署、私密性等都有更高的需求,這就需要更多能夠在端側(cè)運(yùn)行的又小又強(qiáng)的模型。目前,模型已在開源模型社區(qū)Huggingface和Github上線。(新京報(bào))
| 新聞標(biāo)題 | 時(shí)間 | 消息來源 | 新聞熱度 |
|---|---|---|---|
| 天奇股份在江西成立貿(mào)易公司 | 今天 15:02 | 云財(cái)經(jīng) |
|
| 浙江省堅(jiān)決擁護(hù)黨中央決定 | 今天 14:07 | 云財(cái)經(jīng) |
|
| 中興通訊、順絡(luò)電子入股粵港澳大灣區(qū)創(chuàng)投引導(dǎo)基金 | 今天 13:33 | 云財(cái)經(jīng) |
|
| 三和管樁和廣州市設(shè)計(jì)院集團(tuán)巖土與地下空間院達(dá)成戰(zhàn)略合作 | 今天 11:08 | 云財(cái)經(jīng) |
|
| 美元走軟,市場為日本的財(cái)政刺激措施做準(zhǔn)備 | 02-09 22:32 | 云財(cái)經(jīng) |
|
| 以世界級(jí)標(biāo)準(zhǔn)定義卓越----國際龍獎(jiǎng)IDA引領(lǐng)世界金融保險(xiǎn)業(yè)專業(yè)成長與永續(xù)發(fā)展 | 02-09 13:58 | 商業(yè)新聞 |
|