游乐游手机版
首页/科技数码/文章详情

腾讯混元0.3B小模型发布:端侧推理内存仅占600M

时间:2026-02-10 12:55
2月10日,腾讯混元宣布正式推出一款面向消费级硬件场景的“极小”模型HY-1 8B-2Bit,等效参数量仅有0 3B,内存占用仅600MB。据介绍,通过对此前混元的小尺寸语言模型——HY-1 8B-

2月10日,腾讯混元宣布正式推出一款面向消费级硬件场景的“极小”模型HY-1.8B-2Bit,其等效参数量仅为0.3B,内存占用低至600MB。

据介绍,该模型通过对腾讯混元此前的小尺寸语言模型——HY-1.8B-Instruct进行2比特量化感知训练(QAT)产出。对比原始精度模型,新模型的等效参数量降低了6倍,在继承原模型全思考能力的同时,于真实端侧设备上对比原始精度模型的生成速度提升了2到3倍,能够显著提升使用体验。此次腾讯混元推出的HY-1.8B-2Bit模型,可在边缘设备上实现无压力部署。这也是业内首个实现2bit产业化量级的端侧模型实践。

随着大语言模型日益普及,如何将模型在手机、耳机或智能家居等设备上有效应用,成为行业面临的实际挑战。尤其在许多应用场景中,对模型的离线部署能力、隐私保护性等都提出了更高要求,这就需要更多能够在端侧运行、既小巧又强大的模型来支撑。

腾讯混元表示,端侧部署的展开,本质上是一条追求“小而精,快而准”的艰难探索之路。我们既需要模型足够聪明,以应对千变万化的现实需求,又必须将其约束在极其有限的硬件资源内进行部署和快速推理,这就像是在为模型进行一场“减脂增肌、减重提质”的精益工程。

来源:https://www.163.com/dy/article/KLDFS02R0550WHYR.html
上一篇长安汽车全球炼金,极寒淬炼金钟罩电池 下一篇达摩院开源具身大脑RynnBrain,首创机器人时空记忆能力
本站内容用于信息整理与展示,如有侵权或内容问题请及时联系处理。

相关推荐

补充同频道和同主题内容,方便继续浏览更多相关内容。

同类最新

继续查看同栏目最近更新的文章。

更多
2026粤港澳车展仰望全矩阵亮相 极致技术赋能豪华新能源新体验
科技数码 · 2026-05-31

2026粤港澳车展仰望全矩阵亮相 极致技术赋能豪华新能源新体验

在2026粤港澳车展上,仰望全系车型亮相,搭载第二代刀片电池与闪充技术,实现5分钟快速补能、9分钟充满,低温下充电仅增3分钟。同时推出城市领航安全兜底服务,因智驾系统导致事故由品牌承担损失,展现技术自信与全场景高端出行布局。

上交团队利用湿气发电,划手势即可操控设备
科技数码 · 2026-05-31

上交团队利用湿气发电,划手势即可操控设备

上海交通大学团队利用湿气发电技术开发出非接触式人机交互界面,通过水凝胶薄膜吸收空气中水分子发电,手指在8厘米内移动产生湍流调控电压,实现手势识别。该技术无需电池和触摸,可应用于密码输入、VR控制和远程操作,识别准确率最高达99%。

外星人新电竞椅IGN 9分评测 同价位无敌
科技数码 · 2026-05-31

外星人新电竞椅IGN 9分评测 同价位无敌

外星人S5800电竞椅获IGN9分评价,售价479 99美元。其腰部支撑与坐感舒适度在同价位中显著领先,且具备双色外观、优质用料和简易组装等优点。主要短板是扶手偏硬,但整体表现非常出色,性价比高,值得游戏玩家推荐。

安凯微集微大会解码AI眼镜第一视角革命
科技数码 · 2026-05-31

安凯微集微大会解码AI眼镜第一视角革命

在第十届集微大会上,安凯微全面展示了人工智能眼镜全栈技术布局,涵盖KM系列视觉SoC芯片及AnyCloud39AV200解决方案,实现了低功耗、高集成度与量产能力,并提供完整的开发支持与多模态交互方案,助力终端厂商快速落地。

沃尔沃EX90与ES90正式上市发布
科技数码 · 2026-05-31

沃尔沃EX90与ES90正式上市发布

沃尔沃EX90与ES90在粤港澳大湾区车展上市,售价分别为45 99万元和38 99万元起。两款车搭载自研第三代电驱系统,百公里加速最快3 9秒。配备硼钢电池防护系统,每平方厘米可承受15吨压力,扭转刚度较XC90提升近50%,兼顾驾驶乐趣与安全。