首页 游戏 软件 资讯 排行榜 专题
首页
AI
微软开源Fara-7B模型:专为电脑操作设计的智能体,支持Win11本地运行

微软开源Fara-7B模型:专为电脑操作设计的智能体,支持Win11本地运行

热心网友
87
转载
2025-11-26

11月25日消息,微软于当地时间11月24日正式发布全新的开源小型语言模型Fara-7B,该模型专为计算机操作场景设计,属于"Agentic"类型智能体,能够通过鼠标和键盘直接执行各类网页任务。

免费影视、动漫、音乐、游戏、小说资源长期稳定更新! 👉 点此立即查看 👈

作为微软旗下首款面向个人电脑使用场景的小型语言模型(SLM),Fara-7B拥有70亿参数规模,在同体量模型中表现领先,支持在设备端本地运行,有效降低延迟并提升数据隐私保护能力。

微软首款专为电脑操作设计的开源智能体小模型 Fara-7B 发布:支持 Win11 端侧运行,性能达同级最强

据介绍,Fara-7B与传统聊天模型的交互方式截然不同,它通过视觉解析网页截图,直接在屏幕上执行点击、输入、滚动等操作,不需要依赖额外的可访问性树(Accessibility Tree)或多个大型模型协同工作。

微软首款专为电脑操作设计的开源智能体小模型 Fara-7B 发布:支持 Win11 端侧运行,性能达同级最强

微软为此专门构建了一套全新的合成数据生成流程,用于模拟复杂多步骤的网页任务,数据来源包括真实用户需求和实际网页环境。该流程依托Magentic-One框架,涵盖任务生成、任务求解及轨迹验证三个阶段,最终用于模型训练的数据集包含14.5万条任务轨迹、100万操作步骤,并包含定位、描述与视觉问答等辅助任务数据。

微软首款专为电脑操作设计的开源智能体小模型 Fara-7B 发布:支持 Win11 端侧运行,性能达同级最强

根据微软最新披露,该模型基于Qwen2.5-VL-7B底座构建,支持最长128k上下文。在执行任务时,Fara-7B会在预测动作前输出推理内容,并调用Playwright的标准操作(如click (x,y) 和 type ())及网页宏操作(如web_search ())。训练方式以监督微调为主,未使用强化学习。

微软首款专为电脑操作设计的开源智能体小模型 Fara-7B 发布:支持 Win11 端侧运行,性能达同级最强

在多项公开基准测试(WebVoyager、Online-Mind2Web、Deepshop)以及微软新公布的WebTailBench中,Fara-7B表现亮眼,在部分任务中领先同级模型UI-TARS-1.5-7B,并可媲美规模更大、通过复杂提示方式驱动的系统(如使用Set-Of-Marks的GPT-4o)。

此外,微软第三方合作机构Browserbase还采用了人工验证的方式对Fara-7B进行评测,最终发现该模型在WebVoyager上取得62%的通过率(包含重试)。

微软首款专为电脑操作设计的开源智能体小模型 Fara-7B 发布:支持 Win11 端侧运行,性能达同级最强

微软强调Fara-7B仍属于实验性发布版本,尤其是在复杂任务的准确性、指令遵循和降低幻觉方面仍存在局限,未来会持续改进。

鉴于电脑使用智能体模型的特殊风险,微软在模型中加入了多项安全措施,包括要求模型在涉及敏感操作(如提交个人数据或不可逆行为)时停在"关键点"并征得用户同意;所有操作均会被记录;模型需在沙盒环境中运行;并在训练中加入拒绝执行不当任务的示例。Fara-7B在WebTailBench-Refusals的111个红队测试任务中拒绝率达到82%。

目前,Fara-7B已在Microsoft Foundry与Hugging Face平台以MIT许可发布并开源,同时整合进Magentic-UI研究原型。

微软还宣布将提供量化版本及面向Copilot+PC的优化版本,可通过VSCode的AI Toolkit下载并在Windows 11本地运行,支持NPU加速。微软表示,未来更强大的端侧CUA模型仍有提升空间,包括依赖更优底座模型与在真实及沙盒环境中使用强化学习。

来源:https://www.ithome.com/0/899/916.htm
免责声明: 游乐网为非赢利性网站,所展示的游戏/软件/文章内容均来自于互联网或第三方用户上传分享,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系youleyoucom@outlook.com。

相关攻略

英伟达升级云游戏服务,苹果Vision Pro头显专享4K@90 FPS
科技数码
英伟达升级云游戏服务,苹果Vision Pro头显专享4K@90 FPS

英伟达专为苹果Vision Pro优化云游戏画质,4K 90帧体验上线 云游戏领域的画质之争,又有新动态了。英伟达最近为自家的GeForce Now服务推送了2 0 83版本更新,而这次更新的一个重头戏,就是专门为苹果Vision Pro头显做了大幅度的画质提升。 简单来说,这次更新全面解锁了高帧率

热心网友
04.17
年化收入300亿美元 Anthropic首超OpenAI
科技数码
年化收入300亿美元 Anthropic首超OpenAI

风头正盛的AI新锐巨头Anthropic年化收入激增 AI领域的竞争格局,似乎又迎来了一个关键转折点。当地时间4月6日,Anthropic公布了一组引人注目的数字:由于旗下大模型Claude需求持续加速,公司的年化收入已经冲破了300亿美元大关。要知道,就在去年年底,这个数字还停留在90亿美元。更值

热心网友
04.17
美股大型科技股多数走低 苹果、特斯拉跌超4%
科技数码
美股大型科技股多数走低 苹果、特斯拉跌超4%

北京时间4月7日,美国股市传来动态,大型科技板块整体承压,表现偏弱。从截至发稿时的情况来看,科技巨头们大多没能挺住,苹果和特斯拉的股价下滑相对明显,双双跌超4%。与此同时,英伟达、亚马逊、微软的跌幅也超过了1%,市场情绪似乎转向了谨慎。

热心网友
04.17
微软拼音输入法怎么卸载? Windows系统删除微软拼音输入法的教程
系统平台
微软拼音输入法怎么卸载? Windows系统删除微软拼音输入法的教程

微软拼音输入法,真的能删除吗?手把手教你操作 用Windows系统,很多朋友都习惯了安装第三方输入法,毕竟更符合自己的打字节奏。但系统自带的微软拼音总在那里,切换时不小心误触,挺影响效率的。于是,一个经典问题就来了:这预装的输入法,到底能不能卸?怎么卸? 延伸阅读:如果你用的是Mac,想清理第三方输

热心网友
04.15
微软发布 Harrier 系列嵌入 AI 模型,MTEB-v2 基准测试超越谷歌夺冠
AI
微软发布 Harrier 系列嵌入 AI 模型,MTEB-v2 基准测试超越谷歌夺冠

微软开源Harrier嵌入模型:为AI智能体打造更精准的“记忆中枢” 4月9日消息,微软必应团队于4月7日发布了一项重磅开源成果——Harrier文本嵌入模型系列。此举旨在回应现代AI智能体系统对信息处理日益严苛的需求。该系列模型在权威的多语言MTEB-v2基准测试中拔得头筹,标志着嵌入技术领域的一

热心网友
04.15

最新APP

宝宝过生日
宝宝过生日
应用辅助 04-07
台球世界
台球世界
体育竞技 04-07
解绳子
解绳子
休闲益智 04-07
骑兵冲突
骑兵冲突
棋牌策略 04-07
三国真龙传
三国真龙传
角色扮演 04-07

热门推荐

追觅宣布进军天文领域 构建“空天地一体化”生态
科技数码
追觅宣布进军天文领域 构建“空天地一体化”生态

“我们的代码,终将写入繁星”:追觅科技成立天文BU,构建从地面到太空的生态闭环 “我们的代码,终将写入繁星。”这句来自追觅科技的宣言,不只是一句诗意的口号,更是一份清晰的战略升级路线图。就在9月10日,这家中国科技企业正式宣告成立天文业务单元(BU),由此完成了一次至关重要的战略跃迁。这标志着其“全

热心网友
04.17
Just Learn
AI
Just Learn

Just Learn是什么 提起用AI为教育赋能,Just Learn这款工具是个绕不开的名字。它由Just Learn公司开发,核心目标非常明确:一手帮教师扩展专业能力,一手为学生打造个性化的学习旅程。说到底,它的价值在于通过AI驱动学习和24 7全天候辅导这两大核心,把教育资源重新“盘活”,让老

热心网友
04.17
Vue 渲染机制中的伪代码拆解:三分钟看懂 Patch 函数的核心逻辑
前端开发
Vue 渲染机制中的伪代码拆解:三分钟看懂 Patch 函数的核心逻辑

Vue 渲染机制深度解析:Patch 函数核心逻辑与优化策略 Vue js 的响应式系统实现了数据驱动视图的核心理念。然而,当数据发生变化时,视图是如何被高效且准确地更新的呢?这背后的核心引擎,正是虚拟 DOM 体系中的 Patch 函数。它并非直接操作真实 DOM,而是通过深度比对新旧虚拟节点(V

热心网友
04.17
JRPG神作《空之轨迹 the 2nd》发售日公布!首批特典送前作
游戏评测
JRPG神作《空之轨迹 the 2nd》发售日公布!首批特典送前作

《空之轨迹SC》完全重制版《空之轨迹 the 2nd》正式定档2026年9月17日,登陆多平台 日本Falcom官方正式公布,经典日式角色扮演游戏《空之轨迹SC》的完全重制版——《空之轨迹 the 2nd》,将于2026年9月17日全球同步发售。本作将登陆任天堂Switch 2、Switch、Pla

热心网友
04.17
AI Art Prompt Generator
AI
AI Art Prompt Generator

AI艺术提示生成器是什么 简单来说,你可以把它理解为一个永不枯竭的创意火花塞。这个基于前沿AI技术的工具,专为破解创作瓶颈而生,无论你是专业画师还是灵感偶尔“罢工”的爱好者,它都能派上用场。它的工作原理并不复杂:依托当前顶级的OpenAI模型,将你的初步想法“催化”成一系列具体、新颖且富有启发性的艺

热心网友
04.17