作者: Manus AI 日期: 2026年5月15日

摘要

本报告针对开源爬虫浏览器项目 Nanobrowser 进行了深度调研,重点分析了其性能、防风控能力以及开源协议。同时,结合 downly.cn 文章中介绍的 CloakBrowser,对两款工具在技术架构、反检测机制、适用场景及授权模式等方面进行了横向对比。Nanobrowser 侧重于构建基于大语言模型(LLM)的浏览器自动化多智能体(Multi-agent)系统,而 CloakBrowser 则专注于在底层 Chromium 源码级别提供极致的隐身和反风控能力。

1. Nanobrowser 调研分析

1.1 项目概述与定位

Nanobrowser 是一个运行在浏览器中的开源 AI 网页自动化工具,定位为 OpenAI Operator 的免费替代方案 [1]。它以 Chrome 扩展程序的形式存在,允许用户使用自己的 LLM API 密钥(支持 OpenAI、Anthropic、Gemini、Ollama 等)来运行多智能体工作流。

1.2 性能表现

Nanobrowser 的性能主要取决于其背后的多智能体架构和所连接的 LLM 模型:

  • 多智能体协作:系统内置了 Planner(规划者)和 Navigator(导航者)等专门的 AI 智能体。Planner 负责高级推理和规划,Navigator 负责具体的网页导航任务。这种分工协作模式提高了复杂任务的执行效率 [1]。
  • 模型灵活性:用户可以为不同的智能体配置不同的模型以平衡性能和成本。例如,官方推荐使用 Claude Sonnet 4 作为 Planner 以获得更好的推理能力,使用 Claude Haiku 3.5 作为 Navigator 以提高导航效率 [1]。
  • 本地运行:作为 Chrome 扩展,其核心逻辑在本地浏览器中运行,减少了云端通信的延迟,同时也支持连接本地模型(如 Ollama)以实现零 API 成本和完全隐私 [1]。

1.3 防风控能力

Nanobrowser 的防风控能力相对基础,主要依赖于其作为标准 Chrome 扩展的运行环境:

  • 真实浏览器环境:由于它直接在用户日常使用的 Chrome 或 Edge 浏览器中作为扩展运行,其底层指纹(如 Canvas、WebGL、User-Agent 等)就是用户真实的浏览器指纹,这在一定程度上降低了被识别为无头浏览器(Headless Browser)的风险 [1]。
  • 局限性:Nanobrowser 并没有在底层对 Chromium 进行防检测修改。如果目标网站使用高级的机器人检测技术(如分析鼠标轨迹、按键延迟或检测自动化扩展特征),Nanobrowser 可能会被识别。它更适合用于常规的网页自动化和数据提取,而非对抗强风控的爬虫场景。

1.4 开源方式与协议

  • 开源协议:Nanobrowser 采用 Apache License 2.0 协议完全开源 [1]。
  • 开源方式:代码托管在 GitHub 上,包含扩展程序的完整源代码。用户可以自由地查看、修改、分发和用于商业用途,只需保留原始版权声明。
  • 限制条款:项目在 README 中明确声明,不支持且不参与任何基于该代码库的加密货币、代币、NFT 或其他区块链相关应用的衍生项目 [1]。

2. Nanobrowser 与 CloakBrowser 对比分析

downly.cn 文章中介绍的 CloakBrowser 是一款旨在提供高度隐身能力的 Chromium 浏览器项目 [2]。以下是两款工具的深度对比:

2.1 技术架构与修改层次

特性NanobrowserCloakBrowser
产品形态Chrome 浏览器扩展程序深度修改的 Chromium 二进制文件及 Python/JS 封装
修改层次应用层(扩展注入)底层(C++ 源码级编译)
核心驱动LLM 多智能体系统(Planner/Navigator)Playwright / Puppeteer 自动化框架
部署方式浏览器插件安装 / 源码构建Docker 部署 / 二进制文件下载

分析:Nanobrowser 是建立在现有浏览器之上的“大脑”,通过 AI 驱动操作;而 CloakBrowser 是重构了浏览器“躯体”,使其在自动化操作时看起来像真实人类。

2.2 防风控与隐身能力

防风控维度NanobrowserCloakBrowser
自动化信号消除依赖真实浏览器环境,无底层修改源码级移除 navigator.webdriver,禁用自动化启动参数,模拟 CDP 行为 [2]
指纹伪装使用当前真实浏览器指纹基于种子的确定性指纹噪声化(Canvas, WebGL, Audio, GPU 等) [2]
代理与网络特征依赖浏览器全局代理或扩展代理深度清理代理特征,GeoIP 自动对齐时区和语言,防 WebRTC 泄露 [2]
行为拟人化依赖 AI 生成的操作指令内置 humanize=True 参数,模拟真实鼠标轨迹、按键延迟和物理滚动 [2]
检测通过率面对高级检测(如 Cloudflare Turnstile)可能受限宣称通过 reCAPTCHA v3 (0.9分)、Cloudflare Turnstile、FingerprintJS 等 30/30 项测试 [2] [3]

分析:在防风控能力上,CloakBrowser 具有压倒性优势。它通过 57 个 C++ 源码级补丁彻底消除了自动化特征,是专门为对抗高级机器人检测而设计的。Nanobrowser 则不具备这种底层的反检测能力。

2.3 开源协议与商业模式

授权维度NanobrowserCloakBrowser
开源协议Apache License 2.0(完全开源) [1]混合授权:封装代码 MIT,核心二进制文件闭源/专有协议 [3] [4]
代码可见性100% 源码可见仅 Python/JS 封装层可见,核心 C++ 修改不可见
使用限制免费商用,禁止用于区块链/加密货币项目 [1]免费使用,但严禁重新分发、转售、逆向工程或修改二进制文件 [4]
云端/CI 使用无限制允许内部 Docker/CI 使用,但禁止作为 SaaS 提供给第三方 [4]

分析:Nanobrowser 是真正的开源项目,赋予开发者极大的自由度。CloakBrowser 采取了“核心闭源、接口开源”的策略,其编译好的 Chromium 二进制文件受到严格的专有协议(Binary License)保护,限制了其被二次打包或商业化分发的可能。

3. 总结与建议

NanobrowserCloakBrowser 虽然都涉及浏览器自动化,但解决的是完全不同的痛点:

  1. 选择 Nanobrowser 如果您需要

    • 构建基于 LLM 的智能工作流(如自动总结新闻、智能购物比价)。
    • 一个免费的、本地运行的 OpenAI Operator 替代品。
    • 完全开源的代码库以便进行深度二次开发。
    • 目标网站没有极其严苛的反爬虫机制。
  2. 选择 CloakBrowser 如果您需要

    • 极高的防风控能力,需要绕过 Cloudflare、reCAPTCHA v3、Kasada 等高级检测。
    • 稳定的、基于 Playwright/Puppeteer 的大规模数据抓取。
    • 确定性的浏览器指纹管理(用于账号矩阵、社交媒体自动化)。
    • 能够接受其核心二进制文件闭源的授权限制。

综合建议:如果您关注的重点是防风控能力,那么 CloakBrowser 是更专业的选择。但如果您希望在完全开源的框架下探索 AI 驱动的自动化Nanobrowser 则提供了优秀的平台。在某些高级场景下,甚至可以考虑将两者的优势结合:使用 CloakBrowser 作为底层驱动,结合 LLM 智能体来实现既智能又隐蔽的自动化操作。

参考文献

[1] GitHub - nanobrowser/nanobrowser. https://github.com/nanobrowser/nanobrowser [2] CloakBrowser 技术调研 | Downly. https://www.downly.cn/articles/bba61f3e-4033-4ebd-8ab7-71e45cd8e42b [3] GitHub - CloakHQ/CloakBrowser. https://github.com/CloakHQ/CloakBrowser [4] CloakBrowser Binary License. https://github.com/CloakHQ/CloakBrowser/blob/main/BINARY-LICENSE.md

评论 (0)

暂无评论,快来发表第一条评论吧!

AI 技术峰会

2025 AI 技术峰会

AI 实战课程

AI 实战课程

热门工具

AI 助手

智能对话,提升效率

智能图像处理

一键美化,智能修图

AI 翻译

多语言实时翻译