微软开源Fara-7B模型:专为电脑操作设计的智能体,支持Win11本地运行
11月25日消息,微软于当地时间11月24日正式发布全新的开源小型语言模型Fara-7B,该模型专为计算机操作场景设计,属于"Agentic"类型智能体,能够通过鼠标和键盘直接执行各类网页任务。
免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈
作为微软旗下首款面向个人电脑使用场景的小型语言模型(SLM),Fara-7B拥有70亿参数规模,在同体量模型中表现领先,支持在设备端本地运行,有效降低延迟并提升数据隐私保护能力。

据介绍,Fara-7B与传统聊天模型的交互方式截然不同,它通过视觉解析网页截图,直接在屏幕上执行点击、输入、滚动等操作,不需要依赖额外的可访问性树(Accessibility Tree)或多个大型模型协同工作。

微软为此专门构建了一套全新的合成数据生成流程,用于模拟复杂多步骤的网页任务,数据来源包括真实用户需求和实际网页环境。该流程依托Magentic-One框架,涵盖任务生成、任务求解及轨迹验证三个阶段,最终用于模型训练的数据集包含14.5万条任务轨迹、100万操作步骤,并包含定位、描述与视觉问答等辅助任务数据。

根据微软最新披露,该模型基于Qwen2.5-VL-7B底座构建,支持最长128k上下文。在执行任务时,Fara-7B会在预测动作前输出推理内容,并调用Playwright的标准操作(如click (x,y) 和 type ())及网页宏操作(如web_search ())。训练方式以监督微调为主,未使用强化学习。

在多项公开基准测试(WebVoyager、Online-Mind2Web、Deepshop)以及微软新公布的WebTailBench中,Fara-7B表现亮眼,在部分任务中领先同级模型UI-TARS-1.5-7B,并可媲美规模更大、通过复杂提示方式驱动的系统(如使用Set-Of-Marks的GPT-4o)。
此外,微软第三方合作机构Browserbase还采用了人工验证的方式对Fara-7B进行评测,最终发现该模型在WebVoyager上取得62%的通过率(包含重试)。

微软强调Fara-7B仍属于实验性发布版本,尤其是在复杂任务的准确性、指令遵循和降低幻觉方面仍存在局限,未来会持续改进。
鉴于电脑使用智能体模型的特殊风险,微软在模型中加入了多项安全措施,包括要求模型在涉及敏感操作(如提交个人数据或不可逆行为)时停在"关键点"并征得用户同意;所有操作均会被记录;模型需在沙盒环境中运行;并在训练中加入拒绝执行不当任务的示例。Fara-7B在WebTailBench-Refusals的111个红队测试任务中拒绝率达到82%。
目前,Fara-7B已在Microsoft Foundry与Hugging Face平台以MIT许可发布并开源,同时整合进Magentic-UI研究原型。
微软还宣布将提供量化版本及面向Copilot+PC的优化版本,可通过VSCode的AI Toolkit下载并在Windows 11本地运行,支持NPU加速。微软表示,未来更强大的端侧CUA模型仍有提升空间,包括依赖更优底座模型与在真实及沙盒环境中使用强化学习。
相关攻略
英伟达专为苹果Vision Pro优化云游戏画质,4K 90帧体验上线 云游戏领域的画质之争,又有新动态了。英伟达最近为自家的GeForce Now服务推送了2 0 83版本更新,而这次更新的一个重头戏,就是专门为苹果Vision Pro头显做了大幅度的画质提升。 简单来说,这次更新全面解锁了高帧率
风头正盛的AI新锐巨头Anthropic年化收入激增 AI领域的竞争格局,似乎又迎来了一个关键转折点。当地时间4月6日,Anthropic公布了一组引人注目的数字:由于旗下大模型Claude需求持续加速,公司的年化收入已经冲破了300亿美元大关。要知道,就在去年年底,这个数字还停留在90亿美元。更值
北京时间4月7日,美国股市传来动态,大型科技板块整体承压,表现偏弱。从截至发稿时的情况来看,科技巨头们大多没能挺住,苹果和特斯拉的股价下滑相对明显,双双跌超4%。与此同时,英伟达、亚马逊、微软的跌幅也超过了1%,市场情绪似乎转向了谨慎。
微软拼音输入法,真的能删除吗?手把手教你操作 用Windows系统,很多朋友都习惯了安装第三方输入法,毕竟更符合自己的打字节奏。但系统自带的微软拼音总在那里,切换时不小心误触,挺影响效率的。于是,一个经典问题就来了:这预装的输入法,到底能不能卸?怎么卸? 延伸阅读:如果你用的是Mac,想清理第三方输
微软开源Harrier嵌入模型:为AI智能体打造更精准的“记忆中枢” 4月9日消息,微软必应团队于4月7日发布了一项重磅开源成果——Harrier文本嵌入模型系列。此举旨在回应现代AI智能体系统对信息处理日益严苛的需求。该系列模型在权威的多语言MTEB-v2基准测试中拔得头筹,标志着嵌入技术领域的一
热门专题
热门推荐
“我们的代码,终将写入繁星”:追觅科技成立天文BU,构建从地面到太空的生态闭环 “我们的代码,终将写入繁星。”这句来自追觅科技的宣言,不只是一句诗意的口号,更是一份清晰的战略升级路线图。就在9月10日,这家中国科技企业正式宣告成立天文业务单元(BU),由此完成了一次至关重要的战略跃迁。这标志着其“全
Just Learn是什么 提起用AI为教育赋能,Just Learn这款工具是个绕不开的名字。它由Just Learn公司开发,核心目标非常明确:一手帮教师扩展专业能力,一手为学生打造个性化的学习旅程。说到底,它的价值在于通过AI驱动学习和24 7全天候辅导这两大核心,把教育资源重新“盘活”,让老
Vue 渲染机制深度解析:Patch 函数核心逻辑与优化策略 Vue js 的响应式系统实现了数据驱动视图的核心理念。然而,当数据发生变化时,视图是如何被高效且准确地更新的呢?这背后的核心引擎,正是虚拟 DOM 体系中的 Patch 函数。它并非直接操作真实 DOM,而是通过深度比对新旧虚拟节点(V
《空之轨迹SC》完全重制版《空之轨迹 the 2nd》正式定档2026年9月17日,登陆多平台 日本Falcom官方正式公布,经典日式角色扮演游戏《空之轨迹SC》的完全重制版——《空之轨迹 the 2nd》,将于2026年9月17日全球同步发售。本作将登陆任天堂Switch 2、Switch、Pla
AI艺术提示生成器是什么 简单来说,你可以把它理解为一个永不枯竭的创意火花塞。这个基于前沿AI技术的工具,专为破解创作瓶颈而生,无论你是专业画师还是灵感偶尔“罢工”的爱好者,它都能派上用场。它的工作原理并不复杂:依托当前顶级的OpenAI模型,将你的初步想法“催化”成一系列具体、新颖且富有启发性的艺





