首页 游戏 软件 资讯 排行榜 专题
首页
业界动态
腾讯混元推出0.3B端侧模型,国内首条2Bit量化产业路线获突破

腾讯混元推出0.3B端侧模型,国内首条2Bit量化产业路线获突破

热心网友
16
转载
2026-02-10

2月10日,腾讯混元团队推出了面向消费级硬件场景的“极小”模型HY-1.8B-2Bit。这款模型基于1.8B参数的小尺寸架构,通过创新的2Bit量化技术,实现了仅约0.3B的等效参数量,实际存储占用更是低至约600MB,甚至比一些常见的手机应用还要小巧,为端侧部署带来了新的突破。

首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型

该模型基于混元团队首创的产业级2Bit端侧量化方案,通过对HY-1.8B-Instruct模型进行2比特量化感知训练产出。模型体积被大幅压缩至原始精度模型的六分之一,同时在真实端侧设备上的生成速度提升了2-3倍,用户体验得到显著改善。在能力方面,模型完整保留了原版的思维链特性,能够为不同复杂度的任务提供相应深度的推理过程。这是业界首个实现2比特产业级量化的端侧模型实践。

首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型

左图为HY-1.8B原始精度模型,右图为HY-1.8B-2Bit模型,量化后的模型速度明显更快。

随着大语言模型日益普及,如何将它们高效地部署到手机、耳机或者智能家居等设备中,成为行业面临的一大挑战。尤其在许多对模型的离线部署、私密性有更高要求的场景下,我们需要更多能够在端侧运行且兼顾小巧体积与强性能的模型。端侧部署的展开,本质上是一条追求“小而精,快而准”的艰难探索之路,我们既需要模型足够聪明以应对千变万化的真实需求,又必须将其约束在极其有限的硬件资源内并实现快速推理,这就好比为模型进行了一场“减脂增肌、减重提质”的改造。

比特是计算机存储的最小单位,1比特能表示2种状态(0或1),2比特能表示4种状态,依此类推。通常模型的精度有2比特、4比特、8比特、32比特等多种表示方法,数值越大意味着模型的精度越高,但所占用的内存也越大。

虽然2比特量化会带来较大的精度损失,但通过量化感知训练和先进的量化策略,现已能够让2比特模型接近全精度模型的性能。在模型能力方面,对比4比特PTQ模型版本,它在数学、代码、科学等指标上表现相当,真正实现了“小而强”的设计目标。

技术层面,量化作为大模型部署上线不可或缺的一环,肩负着降低部署成本与保精度的双重使命。大部分情况下,对于Int4、Int8、FP8的压缩精度要求,采用PTQ量化策略即可实现几乎无损的压缩。但随着原始模型体积的缩小、压缩比特数的进一步降低,PTQ带来的量化损失是巨大的。因此,对于原始模型大小仅为1.8B、量化比特数只有2比特的HY-1.8B-2Bit,混元团队采用了量化感知训练策略,显著提升了量化后模型的性能。

腾讯混元还通过数据优化、弹性拉伸量化以及训练策略创新三种方法,最大限度地提升HY-1.8B-2Bit的全科能力。

部署方面,腾讯混元提供了HY-1.8B-2Bit的GGUF-Int2格式模型权重与BF16伪量化权重。对比原始精度模型,HY-1.8B-2Bit能够灵活用于端侧设备上。该模型也已在Arm等计算平台上完成适配,可部署于启用Arm SME2技术的移动设备上,并实现高效运行。

在MacBook M4芯片上,通过固定线程数为2,测试了不同窗口大小下的首字时延和生成速度。模型选择FP16、Q4、HY-1.8B-2Bit三种GGUF格式作为对比。在1024输入长度内,首字时延能够保持3-8倍的加速;生成速度上,在常用窗口大小下对比原始模型精度,HY-1.8B-2Bit能够实现至少2倍的稳定加速。

首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型

在天玑9500上同样进行了测试,对比HY-1.8B-Q4格式,首字时延能够加速1.5-2倍,生成速度加速约1.5倍。

首个产业级2Bit量化新突破,腾讯混元推出0.3B端侧模型

当前,HY-1.8B-2Bit的能力仍受限于监督微调的训练流程,以及基础模型本身的性能与抗压能力。针对这一问题,混元团队未来将重点转向强化学习与模型蒸馏等技术路径,以期进一步缩小低比特量化模型与全精度模型之间的能力差距,从而为边缘设备上的大语言模型部署开拓更广阔的应用前景。

项目页面已开源。

模型地址已公布。

技术报告已发布。


来源:https://www.leiphone.com/category/industrynews/l9jyZlcDsoDFMzjU.html
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

腾讯IEG最佳员工养成记IMA平台实战心得
AI
腾讯IEG最佳员工养成记IMA平台实战心得

在AI助手日益普及的今天,一个能真正“懂你”、并能伴随你知识库一同成长的智能伙伴,似乎正从概念走向现实。最近,腾讯旗下的智能知识管理工具ima,在历经超过500天的迭代后,正式推出了其知识Agent产品——copilot。这款产品不仅内置了个性化记忆系统,还具备全场景伴随感知能力,并支持技能生态扩展

热心网友
05.17
腾讯官方发布最新声明
科技数码
腾讯官方发布最新声明

5月12日晚间,腾讯集团通过其官方信息发布平台“鹅厂黑板报”正式对外发布声明。声明中,腾讯明确表态将严格遵循国家市场监督管理总局发布的《市场监管总局关于附加限制性条件批准腾讯控股有限公司收购喜马拉雅公司股权案反垄断审查决定的公告》中的各项要求。公司承诺将全面、认真地履行所有相关义务,确保本次对喜马拉

热心网友
05.16
腾讯机器人负责人郑宇离职加入优必选
AI
腾讯机器人负责人郑宇离职加入优必选

腾讯RoboticsX实验室控制负责人郑宇近日离职,加入优必选担任研究院副院长兼人形机器人科学家,将带领双足人形机器人团队。郑宇拥有27年机器人领域研究经验,此次人才流动正值腾讯发布新机器人、优必选推动工业机器人应用之际,引发行业关注。

热心网友
05.16
腾讯吐司即将上线全新Vibe Coding产品
AI
腾讯吐司即将上线全新Vibe Coding产品

腾讯内部孵化的vibecoding产品“吐司”即将上线。该平台定位为应用生成及灵感共创平台,用户无需代码基础,仅通过自然语言描述即可由AI完成从功能拆解到应用打包的全流程。安卓版已首发,iOS版预计将跟进推出。

热心网友
05.15
新基石研究员项目启动 十年百亿资助科学家潜心探索
AI
新基石研究员项目启动 十年百亿资助科学家潜心探索

新基石研究员项目”由腾讯出资、科学家主导,计划十年投入100亿元,支持数学与物质科学、生物与医学科学领域的自由探索。该项目为高风险基础研究提供长期稳定资助,实验类每年最高500万元,理论类300万元,连续支持五年。选拔重在“选人”而非“选项目”,关注科学家的原创潜力与研究雄心,不预设具体成。

热心网友
05.15

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

广东无人机飞行空域最新调整范围扩大详解
科技数码
广东无人机飞行空域最新调整范围扩大详解

广东无人机适飞空域扩大16%至10 24万平方公里,覆盖全省57%陆地面积,滨海、郊野、工业园区及非核心城区公园等区域开放,深圳市区新增连片适飞区。飞行需通过民航局UOM平台提前申请,严禁“黑飞”,违者将受处罚。平台已升级,实现全国规则统一与分钟级空域更新,支持低空物流与巡检等应用。

热心网友
05.18
iPhone 17 Pro杭州门店抢购火爆 七千元起售迅速售罄
科技数码
iPhone 17 Pro杭州门店抢购火爆 七千元起售迅速售罄

杭州Costco门店因iPhone17系列手机引发抢购热潮,数百人排队致迅速断货。抢购源于官方降价与地方补贴叠加:iPhone17Pro全系直降千元,同时当地青年消费补贴可再减10%,最高省千元。双重优惠下,256GB版iPhone17Pro到手价低至7172元,较电商平台便宜近千元,吸引本地及周边消费者。目前门店仍处缺货状态,补货时间未定。

热心网友
05.18
千帆星座第九批组网卫星成功发射升空
科技数码
千帆星座第九批组网卫星成功发射升空

5月17日晚,长征八号运载火箭在海南商业航天发射场点火升空,成功将千帆星座第九批组网卫星送入预定轨道。此次发射是该发射场启用以来的第15次成功发射,也是今年第5次发射,体现了我国商业航天发射能力的日益成熟和常态化运营的稳步推进。

热心网友
05.18
七彩虹iGame M15/M16 Origo游戏本2026款上市 首发11499元起
科技数码
七彩虹iGame M15/M16 Origo游戏本2026款上市 首发11499元起

七彩虹新款iGameM15 M16Origo2026款游戏本已发售,起售价11499元。M15为15 3英寸黑色机身,配备2 5K300Hz屏,最高可选Ultra9处理器与RTX5070显卡。M16为16英寸白色款,屏幕规格相同,处理器性能更强,电池容量更大。两款均提供多种配置,享受国家补贴后价格更具竞争力,面向中高端游戏玩家与创作者。

热心网友
05.18
联想ThinkPad T14 Gen 7发布 支持LPCAMM2可更换内存
科技数码
联想ThinkPad T14 Gen 7发布 支持LPCAMM2可更换内存

联想在北美市场推出新款ThinkPadT14Gen7商务笔记本,支持用户自行更换LPCAMM2内存。该机型提供多款英特尔酷睿Ultra处理器选项,内存可选16GB至64GB,电池与屏幕亦有多种配置,其中顶配版搭载OLED屏幕。产品起售价为1618美元,高配版本价格超过3700美元,主要面向商用及专业办公市场,兼顾性能、可升级性与不同预算需求。

热心网友
05.18