本周的GitHub趋势榜很有意思——AI Agent依然是绝对主角,但方向开始分化了:有人在做搜索引擎的碘伏者,有人给Agent塞上了更聪明的上下文压缩器,还有人专门盯着Agent的安全漏洞。当然,巨头也没闲着,苹果、微软、英伟达都带着新工具入场。来,咱们挨个儿看看。
#1 mvanhorn/last30days-skill
? Python · ⭐ 41k (+12k 本周) · ? 3.3k
这个AI Agent驱动的搜索引擎玩的是新路子。它不依赖传统搜索引擎那种关键词排序,而是并行搜索Reddit、X、YouTube等平台,根据真实的用户互动——点赞、投币、转发,甚至真金白银的押注——来给结果打分。最后,由一个AI法官合成精简答案,相当于用群体智慧重新定义了“什么内容值得看”。
#2 chopratejas/headroom
? Python · ⭐ 26k (+10k 本周) · ? 1.7k
专门为AI Agent打造的上下文压缩层,支持6种压缩算法,能减少60%到95%的Token消耗。这玩意儿提供了库、袋里、MCP三种接入方式,本地优先且可逆压缩,帮Agent在有限的上下文窗口里塞进更多有效信息。说白了,就是让Agent的“内存”更耐用。
#3 Leonxlnx/taste-skill
️ Shell · ⭐ 43k (+8.7k 本周) · ? 3.0k
给AI Agent准备的前端技能集,专门对抗模板化。它提供更优秀的布局、排版、动效和间距方案,让AI生成的UI告别那种千篇一律的样板感。还附带了图像生成技能,能配合图像生成工具做视觉参考板。说白了,就是让AI做出来的界面有点“设计感”。
#4 addyosmani/agent-skills
️ Shell · ⭐ 58k (+8.3k 本周) · ? 6.2k
由Addy Osmani创建的生产级AI编程Agent技能库。提供了7个开发生命周期命令——/spec、/plan、/build、/test、/review、/code-simplify、/ship——把高级工程实践打包成Agent可以一致执行的技能,覆盖从想法到上线的全流程。相当于给Agent装上了一套标准化的“工程师大脑”。
#5 apple/container
? Swift · ⭐ 36k (+7.8k 本周) · ? 1.0k
苹果官方开源的macOS Linux容器工具,能在Apple Silicon Mac上把OCI兼容的容器镜像以轻量级虚拟机的方式跑起来。用Swift编写,支持从标准容器仓库拉取和推送镜像,不过需要macOS 26。苹果终于对容器场景认真了。
#6 microsoft/markitdown
? Python · ⭐ 152k (+7.0k 本周) · ? 11k
微软出的轻量级文件转Markdown工具,支持PDF、Office文档、HTML、图片OCR、音视频转录、YouTube链接、EPub等十几种格式。专门为LLM文本分析场景优化,能保留标题、列表、表格这些文档结构。对需要大量喂数据的AI开发来说,这简直是标配。
#7 Panniantong/Agent-Reach
? Python · ⭐ 27k (+5.4k 本周) · ? 2.2k
给AI Agent一键装上互联网能力的工具。一句话安装之后,Agent就能读取YouTube、Twitter、Reddit、B站、小红书、GitHub等平台的内容。自动解决API付费、IP封锁、登录验证和数据清洗这些烦人问题,而且对国内用户特别友好。省去了自己折腾爬虫的功夫。
#8 phuryn/pm-skills
⭐ 17k (+4.8k 本周) · ? 1.8k
产品经理的技能市场。包含68个PM技能和42个编排工作流,覆盖9个插件。从需求发现、策略制定、PRD撰写到上线发布和增长分析,把Teresa Torres等PM方法论编码成Agent可以执行的命令。相当于把PM的软技能变成了硬代码。
#9 roboflow/supervision
? Python · ⭐ 44k (+4.0k 本周) · ? 3.9k
Roboflow出品的计算机视觉通用工具包。提供从数据加载、模型推理到实时区域计数、目标追踪、标注可视化等全套功能。兼容YOLO、SAM等多种主流CV模型,能大幅简化视觉应用的开发。做CV项目的朋友应该不陌生,这个库一直在迭代。
#10 lfnovo/open-notebook
? TypeScript · ⭐ 30k (+3.8k 本周) · ? 3.4k
开源的、注重隐私的Google Notebook LM替代方案。支持本地部署和多种LLM后端接入,可以导入文档、网页等资料进行AI驱动的问答与分析。对研究笔记和知识库管理来说,是个不错的自有产权选择。
#11 refactoringhq/tolaria
? TypeScript · ⭐ 16k (+3.5k 本周) · ? 1.1k
Tolaria是一款跨平台桌面应用,用于管理基于Markdown的知识库。采用“文件优先”原则——笔记是纯文本Markdown文件,每个知识库是一个Git仓库,数据完全归你所有,不依赖任何专有服务。如果你追求数据自主权,这个值得一看。
#12 NVIDIA/SkillSpector
? Python · ⭐ 4.0k (+2.6k 本周) · ? 302
英伟达推出的AI Agent技能安全扫描工具。可以扫描Git仓库、目录等来源,检测64种漏洞模式——涵盖提示注入、数据窃取、权限提升等16类。提供0到100的风险评分,支持终端、JSON、SARIF多格式输出。Agent安全越来越成为刚需,英伟达这一步走得很及时。
#13 aaif-goose/goose
? Rust · ⭐ 49k (+2.5k 本周) · ? 5.2k
Goose是已经移交给Linux Foundation的开源AI Agent,提供桌面应用、CLI和API。相比GitHub Copilot Agent模式这类工具,它不局限于编码,还能用于研究、写作、自动化等场景。支持15+大模型提供商和70+ MCP扩展,通用性很强。
#14 CopilotKit/CopilotKit
? TypeScript · ⭐ 35k (+2.5k 本周) · ? 4.4k
一个用于构建Agent原生应用的开源框架,支持React、Angular、Vue等前端框架。提供生成式UI、共享状态和人机协作工作流,让开发者能在现有应用中深度集成AI Agent能力。如果你的项目需要把Agent“嵌入”UI里,这个框架值得研究。
#15 openai/plugins
? Ja vaScript · ⭐ 2.9k (+1.4k 本周) · ? 343
OpenAI官方的Codex插件示例集合,涵盖Figma设计、Notion知识管理、iOS/macOS应用开发、Web应用部署、Expo移动端等多个场景。每个插件包含manifest和配套技能文件。对想自己开发Codex插件的团队是很好的起点。
#16 opencv/opencv
⚡ C++ · ⭐ 89k (+1.2k 本周) · ? 57k
经典永流传——OpenCV,计算机视觉的元老级开源库,提供图像处理、视频分析、机器学习等数千种算法。支持C++、Python、Ja va等多种语言,广泛应用于工业质检、自动驾驶、AR/VR等领域。这周又涨了一点star,说明基础库依然有人在用。
#17 NVIDIA/cosmos
? Jupyter Notebook · ⭐ 10k (+721 本周) · ? 656
NVIDIA Cosmos是一个开放的世界模型平台,包含基础模型、数据集和工具。Cosmos 3提供了视频生成和世界理解能力(生成器+推理器),支持文本/图像到视频的生成,面向物理AI和具身智能研究。英伟达在物理AI上的布局越来越具体了。
#18 huggingface/OpenEnv
? Python · ⭐ 2.2k (+230 本周) · ? 391
Hugging Face推出的Agentic RL训练环境框架,采用Gymnasium风格的API。提供隔离的执行环境用于强化学习训练,支持异步操作,附带BlackJack等示例,从PyPI直接就能装。对做Agent强化学习研究的团队来说,这是个实用的工具。
