Hugging Face创始人对话小红书面:开源AI与程序员成长新机遇
刚刚过去的 1024 程序员节,小红书 Red Academy 和小红书科技发起了一场直播,在这场直播里,小红书技术副总裁凯奇、小红书语音模型技术负责人风龙,携手 Hugging Face 联合创始人 Thomas Wolf,以最近流行的 AMA(Ask Me Anything)形式,进行了一场关于技术、AI 与未来的深度对谈。
这场对谈围绕三大核心观点展开:
AI Coding 正成为基础能力;
开源是技术加速发展的核心引擎;
实现有“活人感”的 AGI 路径清晰但仍需攻克诸多难题。
从这三个观点出发,三位嘉宾关于以下几个话题进行了讨论和分享:
开源与闭源:三位嘉宾一致认为开源是推动技术前进的强大引擎。小红书正投身其中,从文本模型、多模态模型到 FireRed 系列语音模型,初衷是为让更多开发者和中小企业能共享技术红利。
AGI 与未来:通用人工智能将会到来,但发展路径仍有挑战,例如在创造力、复杂环境感知和数据等方面仍有瓶颈。
如何让 AI 更有“人味”:凯奇分享了小红书引入“人文训练师”的实践,致力于让 AI 的交互更自然、更贴心,真正融入小红书这个充满“活人感”的社区。
AI 时代的个人能力:技术人的核心竞争力正转向“定义问题”和“框架性解决”的能力;AI 不仅是效率神器,也让非技术背景的人拥有了“指挥”计算机实现想法的能力。

以下是直播对话摘录:
Q: 怎么看大模型时代的开源和闭源?
Thomas Wolf:开源和闭源差距在缩小,中国在这方面比较领先。现在也发现,很多其他国家的人会开始从一个开源模型着手。开源能打造一个围绕模型的社群,让更多人使用,更高效地帮助他们。闭源就是需要更多的一些时间来去开发出一些好的模型。
风龙:整个的开源其实是推着技术往前走的,推着技术不断的往下发展。开源才是动用了大家的力量,众人众人拾柴火焰高。语音技术发展经历开源工具如 HTK、Kaldi、Wenet、FireRed 等,推动技术前进。闭源对商业公司无可厚非,但可能是暂时性选择。
凯奇:AI 开源与代码开源还挺不同的,更关注模型权重和制作过程公开。开源降低社会运用 AI 成本,互帮互助,整体上降低了整个社会去运用 AI 的成本。
Q: 小红书做了哪些开源?为什么这么选择?
凯奇:今年 6 月小红书开源了文本模型 1.0 版本,是 hi lab 第一个 MoE 模型。8 月开源多模态模型,性能对标 Gemini 和 Seed。开源 dots OCR 模型,在 hugging face 热门榜排第 4。
风龙:语音模型方面,我们开源了在 50 多个 benchmark 综合排名第一的大模型语音识别系统 FirRedASR;开源了面向对话及长播客生成的大模型语音合成系统 FireRedTTS 业务,在播客生成开源领域达到了 sota 的效果;也首次开源了一套完整的可私有化部署的大模型人感语音交互系统。这些模型都受到了很多好评。我们想让中小型公司和独立开发者,也能享受这种玩大模型的乐趣,所以我们会做一些大模型,打破相对的技术垄断。我们从社区里面汲取了营养。我们也觉得需要把技术公开出来,一方面是听取社区给模型的反馈,来知道模型到底做得怎么样。

Q: 怎么看 AGI 的实现和想象,通往 AGI 上有哪些瓶颈?
Thomas Wolf:AGI 不会立刻实现,会有多功能、全方位的提升。未来应用包括机器人、大语言模型、语音识别。AGI 也能够创建一些我们之前没概念的东西,比如新游戏、新体验。同时能够打造全新的科学发展,发明新科学。
AGI 的一个瓶颈是模型缺乏创造力。当你有一个问题时,它们非常擅长解决问题,但要求它们发明一个新问题时,例如想在科学上取得重大突破时,就需要找到正确的问题来提出,而 LLM 模型目前非常不擅长提出好问题的。
风龙:5-10 年内可能看到曙光,但路上还有种种曲折,但如果要真的实现电影《Her》里面的人工智能想象,还需要解决非常多的问题比如硬件、甚至一个简单的蓝牙数据传输稳定性都需要持续提升
凯奇:关键转折点是 AI 能否改进自己。如果可以做到,只要有算力,就可以不停的自我改进,智力增长会非常非常的快。障碍有 context bottleneck 和非智力因素瓶颈。
Q:你怎么看技术进展的速度?是在变慢吗?
Thomas Wolf:可能有一点。我想很多人对最近的模型有点失望。幸好有新一波的推理模型提供了新范式。但我们构建的 AI 仍然是非常听话的学生,它们按照我们的要求做,但对应该做什么几乎没有好想法,所以仍非常需要人类来指明方向。至少在当前,需要人来给出要解决的问题,我们需要给出前进方向,给出要做什么的创造性想法。所以我建议,要让知道自己该做什么的人使用这些模型,这样就能很好地理解它。

Q: 在技术产品中如何保持人情味?如何让 AI 保持人感?
凯奇:当前 AI 回答有时候会有点冷冰冰、缺乏同理心。小红书是大家称之为一个有“活人感”的社区,所以在小红书用 AI 的时候,我们也希望这个 AI 也是更有活人感的。会通过后训练和 RL 算法调整行为,用人文训练师教会 AI 更有人感回答。
Thomas Wolf:情感非常重要,需要更好数据来做情感输出,当前的瓶颈是数据量不够。可以做的是:看待 AI 答案要有批判性,同时也要评估 AI 的错误率。
风龙:语音模型中会加入情绪感知和环境音感知生成情感反馈语音。我们会分析目前这句话到底有没有表达出情绪,是开心的还是有一点悲伤的?还是说有一点愤怒?我们也有能主动感知对话中用户情绪的 TTS,如果用户当下很难过,那 AI 回复的语音就会带有安慰的情感。
Q:对于个人或团队,推荐哪些 AI 小项目方向,如何构建壁垒?
凯奇:发挥专业领域知识,解决 context bottleneck,挑选合适 context 喂给 AI。怎么挑选哪些 context 扔给它,这个是很重要的。
Thomas Wolf:这是一个高度数据驱动的世界和领域。所以第一步始终应该是:尝试为我们想要衡量的东西建立一个良好的评估标准。有了标准然后才能看清你想朝哪个方向发展,进入哪个领域,甚至决定是否应该使用 AI。
Q: 对于非技术同学,在 AI 浪潮下有什么建议?
风龙:AI 降低实现产品门槛,非技术同学也可以一个人做产品。人人都真的可以一个人做产品。
凯奇:产品同学多了一个强大武器,需学习 AI 技术边界,了解 prompt engineering、fine tune 等手段。
Q: 怎么使用 AI coding 提效,怎么看待 AI coding 的发展?
风龙:在语音研究工作中需要大量测试网页。之前的网页都由语音研究员手写,有了 AI coding 工具后,这种写前端的工作完全可以用现成工具完成,大大节省时间。
凯奇:写 demo 程序时,用 AI 做 refactor 或熟悉 API,可以直接扔文档让它写代码,非常提效。AI coding 让非程序员也能操纵计算机达成目的。AI coding 还处于早期阶段,现在还没那么好,但未来在程序架构迭代和运维方面会更强。

Q: AI 浪潮下,技术人的变与不变?
风龙:技术人还要找到核心竞争力,AI coding 只是工具箱中的一个工具。看到一个大的应用问题后,不变的是要想怎么去拆解,怎么用工具箱里面工具把它做好。
凯奇:未来世界上只有会用 AI 的人和不会用 AI 的人两种,技术同学在会用 AI 这块是很有优势的。技术人需提升通用问题解决能力和产品 sense,发现和定义问题比具体怎么做更重要。
Q: 学习新技术有什么好的方法和建议?
风龙:很多时候我们觉得可能要自己 ready 了再去做一件事,但是往往我们其实就是 learning by doing。跟踪最新论文、与同行交流、公司内部讨论。
凯奇:用 AI 陪看论文非常提效,能很快帮我推导公式和分析逻辑,就能很方便地理解公式。Notebook LM 可以听论文写概要。

Q: 最近两个月,小红书里刮起了 AMA 风,有什么体验和有趣发现?
Thomas wolf: 我是首次参加 AMA,很多人来问我应该学什么专业,应该从事什么样的工作,我觉得这个方式是非常好的一个方式,能让很多行业里非常优秀的人所聚集在一起,直接建立连接。
凯奇:在主页上刷到了很多 AMA 的笔记,过去小红书这个产品给大家的印象可能更多是偏生活向的,但这次 AMA,在科技领域的兴趣圈层也是有很好的爆发。我的一些朋友告诉我,他们现在都是在小红书看论文,我觉得小红书作为生活兴趣社区,的确正在变得越来越广大。
风龙:我发了第一篇 AMA 笔记后,收到 500 多条评论问语音相关的问题,其中有人问我为什么社区里有这么多 AMA 帖子。我回答的是:因为优秀的人总会和优秀的人相遇。
* 小红书科技薯在今年 9 月策划发起了 AMA(Ask me anything)活动,这一玩法在小红书上快速发酵 —— 许多知名 AI 产品创业者、大厂负责人、高校教授等科技大咖纷纷在小红书上发布“Ask me anything”的笔记,邀请用户向自己提问,并积极在评论区互动、对话。

Q:如果回到 30 岁,会给自己什么建议?
Thomas Wolf:十年前,2015 年那时我创办了 Hugging Face。我认为那是个好主意。所以我会说,去做你打算做的事,探索你所热爱的。
风龙:如果回到 30 岁的时候,我会选择在博士毕业后直接加入小红书,享受挑战和攀登珠峰的经历。
凯奇:要搞 AI。
相关攻略
一次品牌形象的全面焕新在通信行业日新月异的浪潮中,品牌标识的演变往往承载着企业战略转型与时代精神变迁的深刻印记。作为国内通信服务领域的核心企业,其视觉符号的每一次调整都备受瞩目。从早期极具辨识度的蓝色标识,到如今更为简约、现代的新形象,这一历程不仅是一次视觉设计的升级,更是企业从传统通信运营商向数字
火山引擎CDP:企业营销的“数据中枢”在数字化营销日益精细化的今天,企业面临的核心挑战之一是如何将分散在各个渠道、平台上的用户数据有效整合,并转化为可执行的营销洞察。客户数据平台(CDP)应运而生,成为解决这一难题的关键工具。火山引擎作为字节跳动旗下的云服务平台,其推出的CDP产品凭借深厚的数据处理
收购背景与系统整合的挑战在软件行业的发展历程中,大型企业间的并购往往标志着市场格局的深刻变化。当甲骨文公司宣布完成对BEA系统的收购时,这一举措不仅重塑了中间件市场的竞争态势,也为全球范围内大量使用BEA产品的企业用户带来了直接影响。收购的核心目的之一在于整合BEA领先的中间件技术,特别是其WebL
SocketEQ:腾讯云开发者社区的新兴技术专栏在技术社区中,一个高质量的专栏往往能成为开发者获取前沿知识、交流实践经验的重要窗口。腾讯云开发者社区近期出现的SocketEQ栏目,正逐渐吸引着众多开发者的目光。这个栏目并非官方产品发布渠道,而是由社区内活跃的技术专家或团队自发维护的内容集合,其核心聚
苹果与IBM的合作本质苹果与IBM的合作,并非指共同开发一个名为“苹果联手IBM”的独立平台或应用。这项始于2014年的战略联盟,核心是将苹果在消费级硬件与用户体验上的优势,与IBM在企业级市场、数据分析、行业解决方案及云服务方面的深厚积累相结合。其目标是共同为企业客户打造一套完整的移动解决方案,将
热门专题
热门推荐
根据Gartner最新市场报告,2025年全球PC出货量突破2 7亿台,同比增长9 1%。在人工智能技术浪潮与AI PC算力升级需求的双重驱动下,整个PC行业正迈入一个全新的增长周期。作为细分市场的重要力量,游戏笔记本电脑也迎来了关乎性能、体验与场景定义的关键换代节点。 回顾行业发展,英特尔于202
TUSD是一种与美元1:1锚定的合规稳定币,由TrustToken团队推出。它通过第三方机构定期审计和银行账户托管确保透明度,旨在提供可靠的数字美元解决方案。其用途涵盖交易、支付、DeFi及跨境结算,但用户仍需关注其中心化托管、监管变化及智能合约安全等潜在风险。
OpenClaw 生态中那个关键的“眼睛”和“手”——Peekaboo v3,正式回归了。这不仅是一次版本更新,更像是一次关键的“补完”。它让 AI 不再只是停留在聊天框里给出建议,而是真正获得了观察屏幕、点击按钮、操作真实桌面的能力。 过去几个月,OpenClaw 的热度经历了一个典型的周期:从概
微信小游戏《找个球》,玩的就是眼力。每张看似相同的图片里,都藏着好几处“破绽”——有的明显,有的则隐蔽得让人抓狂。从简单的卧室场景,到复杂的宴会、雨夜,关卡越往后,画面细节越多,挑战也越大。想通关?秘诀就一个:沉住气,从左到右,一寸一寸地对比。 为了方便大家攻克难关,这里整理了一份全关卡通关攻略图合
《找个球》第10关攻略详解:如何快速找出15处不同?本关场景围绕经典角色“嬛嬛”与“大胖橘”展开,挑战在于发现两幅图片间的细微差别。这些差异点主要隐藏在人物的发饰造型、衣领褶皱、服饰花纹等细节处。同时,背景中的花草形态、秋千绳索乃至庭院摆设也可能存在巧妙改动。想要高效通关,建议玩家采用分区对比法,先





