作者: Manus AI 日期: 2026年5月15日
摘要
本报告针对开源爬虫浏览器项目 Nanobrowser 进行了深度调研,重点分析了其性能、防风控能力以及开源协议。同时,结合 downly.cn 文章中介绍的 CloakBrowser,对两款工具在技术架构、反检测机制、适用场景及授权模式等方面进行了横向对比。Nanobrowser 侧重于构建基于大语言模型(LLM)的浏览器自动化多智能体(Multi-agent)系统,而 CloakBrowser 则专注于在底层 Chromium 源码级别提供极致的隐身和反风控能力。
1. Nanobrowser 调研分析
1.1 项目概述与定位
Nanobrowser 是一个运行在浏览器中的开源 AI 网页自动化工具,定位为 OpenAI Operator 的免费替代方案 [1]。它以 Chrome 扩展程序的形式存在,允许用户使用自己的 LLM API 密钥(支持 OpenAI、Anthropic、Gemini、Ollama 等)来运行多智能体工作流。
1.2 性能表现
Nanobrowser 的性能主要取决于其背后的多智能体架构和所连接的 LLM 模型:
- 多智能体协作:系统内置了 Planner(规划者)和 Navigator(导航者)等专门的 AI 智能体。Planner 负责高级推理和规划,Navigator 负责具体的网页导航任务。这种分工协作模式提高了复杂任务的执行效率 [1]。
- 模型灵活性:用户可以为不同的智能体配置不同的模型以平衡性能和成本。例如,官方推荐使用 Claude Sonnet 4 作为 Planner 以获得更好的推理能力,使用 Claude Haiku 3.5 作为 Navigator 以提高导航效率 [1]。
- 本地运行:作为 Chrome 扩展,其核心逻辑在本地浏览器中运行,减少了云端通信的延迟,同时也支持连接本地模型(如 Ollama)以实现零 API 成本和完全隐私 [1]。
1.3 防风控能力
Nanobrowser 的防风控能力相对基础,主要依赖于其作为标准 Chrome 扩展的运行环境:
- 真实浏览器环境:由于它直接在用户日常使用的 Chrome 或 Edge 浏览器中作为扩展运行,其底层指纹(如 Canvas、WebGL、User-Agent 等)就是用户真实的浏览器指纹,这在一定程度上降低了被识别为无头浏览器(Headless Browser)的风险 [1]。
- 局限性:Nanobrowser 并没有在底层对 Chromium 进行防检测修改。如果目标网站使用高级的机器人检测技术(如分析鼠标轨迹、按键延迟或检测自动化扩展特征),Nanobrowser 可能会被识别。它更适合用于常规的网页自动化和数据提取,而非对抗强风控的爬虫场景。
1.4 开源方式与协议
- 开源协议:Nanobrowser 采用 Apache License 2.0 协议完全开源 [1]。
- 开源方式:代码托管在 GitHub 上,包含扩展程序的完整源代码。用户可以自由地查看、修改、分发和用于商业用途,只需保留原始版权声明。
- 限制条款:项目在 README 中明确声明,不支持且不参与任何基于该代码库的加密货币、代币、NFT 或其他区块链相关应用的衍生项目 [1]。
2. Nanobrowser 与 CloakBrowser 对比分析
downly.cn 文章中介绍的 CloakBrowser 是一款旨在提供高度隐身能力的 Chromium 浏览器项目 [2]。以下是两款工具的深度对比:
2.1 技术架构与修改层次
| 特性 | Nanobrowser | CloakBrowser |
|---|---|---|
| 产品形态 | Chrome 浏览器扩展程序 | 深度修改的 Chromium 二进制文件及 Python/JS 封装 |
| 修改层次 | 应用层(扩展注入) | 底层(C++ 源码级编译) |
| 核心驱动 | LLM 多智能体系统(Planner/Navigator) | Playwright / Puppeteer 自动化框架 |
| 部署方式 | 浏览器插件安装 / 源码构建 | Docker 部署 / 二进制文件下载 |
分析:Nanobrowser 是建立在现有浏览器之上的“大脑”,通过 AI 驱动操作;而 CloakBrowser 是重构了浏览器“躯体”,使其在自动化操作时看起来像真实人类。
2.2 防风控与隐身能力
| 防风控维度 | Nanobrowser | CloakBrowser |
|---|---|---|
| 自动化信号消除 | 依赖真实浏览器环境,无底层修改 | 源码级移除 navigator.webdriver,禁用自动化启动参数,模拟 CDP 行为 [2] |
| 指纹伪装 | 使用当前真实浏览器指纹 | 基于种子的确定性指纹噪声化(Canvas, WebGL, Audio, GPU 等) [2] |
| 代理与网络特征 | 依赖浏览器全局代理或扩展代理 | 深度清理代理特征,GeoIP 自动对齐时区和语言,防 WebRTC 泄露 [2] |
| 行为拟人化 | 依赖 AI 生成的操作指令 | 内置 humanize=True 参数,模拟真实鼠标轨迹、按键延迟和物理滚动 [2] |
| 检测通过率 | 面对高级检测(如 Cloudflare Turnstile)可能受限 | 宣称通过 reCAPTCHA v3 (0.9分)、Cloudflare Turnstile、FingerprintJS 等 30/30 项测试 [2] [3] |
分析:在防风控能力上,CloakBrowser 具有压倒性优势。它通过 57 个 C++ 源码级补丁彻底消除了自动化特征,是专门为对抗高级机器人检测而设计的。Nanobrowser 则不具备这种底层的反检测能力。
2.3 开源协议与商业模式
| 授权维度 | Nanobrowser | CloakBrowser |
|---|---|---|
| 开源协议 | Apache License 2.0(完全开源) [1] | 混合授权:封装代码 MIT,核心二进制文件闭源/专有协议 [3] [4] |
| 代码可见性 | 100% 源码可见 | 仅 Python/JS 封装层可见,核心 C++ 修改不可见 |
| 使用限制 | 免费商用,禁止用于区块链/加密货币项目 [1] | 免费使用,但严禁重新分发、转售、逆向工程或修改二进制文件 [4] |
| 云端/CI 使用 | 无限制 | 允许内部 Docker/CI 使用,但禁止作为 SaaS 提供给第三方 [4] |
分析:Nanobrowser 是真正的开源项目,赋予开发者极大的自由度。CloakBrowser 采取了“核心闭源、接口开源”的策略,其编译好的 Chromium 二进制文件受到严格的专有协议(Binary License)保护,限制了其被二次打包或商业化分发的可能。
3. 总结与建议
Nanobrowser 和 CloakBrowser 虽然都涉及浏览器自动化,但解决的是完全不同的痛点:
-
选择 Nanobrowser 如果您需要:
- 构建基于 LLM 的智能工作流(如自动总结新闻、智能购物比价)。
- 一个免费的、本地运行的 OpenAI Operator 替代品。
- 完全开源的代码库以便进行深度二次开发。
- 目标网站没有极其严苛的反爬虫机制。
-
选择 CloakBrowser 如果您需要:
- 极高的防风控能力,需要绕过 Cloudflare、reCAPTCHA v3、Kasada 等高级检测。
- 稳定的、基于 Playwright/Puppeteer 的大规模数据抓取。
- 确定性的浏览器指纹管理(用于账号矩阵、社交媒体自动化)。
- 能够接受其核心二进制文件闭源的授权限制。
综合建议:如果您关注的重点是防风控能力,那么 CloakBrowser 是更专业的选择。但如果您希望在完全开源的框架下探索 AI 驱动的自动化,Nanobrowser 则提供了优秀的平台。在某些高级场景下,甚至可以考虑将两者的优势结合:使用 CloakBrowser 作为底层驱动,结合 LLM 智能体来实现既智能又隐蔽的自动化操作。
参考文献
[1] GitHub - nanobrowser/nanobrowser. https://github.com/nanobrowser/nanobrowser [2] CloakBrowser 技术调研 | Downly. https://www.downly.cn/articles/bba61f3e-4033-4ebd-8ab7-71e45cd8e42b [3] GitHub - CloakHQ/CloakBrowser. https://github.com/CloakHQ/CloakBrowser [4] CloakBrowser Binary License. https://github.com/CloakHQ/CloakBrowser/blob/main/BINARY-LICENSE.md
相关推荐

2025 AI 技术峰会

AI 实战课程
热门工具
AI 助手
智能对话,提升效率
智能图像处理
一键美化,智能修图
AI 翻译
多语言实时翻译






评论 (0)
暂无评论,快来发表第一条评论吧!