WebBrain — бесплатное open-source расширение, которое добавляет возможности AI-агента в Chrome и Firefox. Читает страницы, извлекает данные и автоматизирует веб-задачи — на любом LLM по вашему выбору. Self-hosted альтернатива проприетарным браузерным AI-плагинам.
Посмотрите, как WebBrain читает страницы, извлекает данные и автоматизирует задачи в браузере.
Полноценный AI-агент, который живёт в боковой панели браузера и понимает любую веб-страницу.
Читает и понимает любую веб-страницу — статьи, документацию, дашборды, формы. Задавайте вопросы и получайте мгновенные ответы по содержимому текущей страницы.
Кликает, печатает, прокручивает, навигирует и взаимодействует со страницами вместо вас. Автоматизируйте рутинные задачи инструкциями на естественном языке.
Извлекает структурированные данные с любой страницы — таблицы, списки, ссылки, формы. Экспортируйте каталоги товаров, результаты поиска или любое содержимое страницы. Работает и с PDF.
Работает с локальным llama.cpp, OpenAI, Claude и OpenRouter. Используйте любимую модель — или работайте полностью офлайн с локальным AI.
Ваши данные остаются вашими. С локальным LLM — нулевая утечка данных. Никакой телеметрии, отслеживания и аккаунтов. Полностью open-source.
Автоматическое управление контекстом не даёт переполниться окну токенов. Аккуратно подрезает историю диалога и ограничивает вывод инструментов — сессия идёт ровно и без срывов.
Сочетайте быструю текстовую модель для планирования с отдельной vision-моделью для чтения скриншотов. Дешевле и быстрее, чем гонять всё через одну большую мультимодальную модель.
Опциональная плейн-текст биография — имя, рабочий email, компания, одноразовый пароль — позволяет агенту без вопросов проходить малозначимые регистрации. По умолчанию отключено, всё хранится локально.
Закрывает баннеры согласия (OneTrust, Cookiebot, Didomi, Quantcast) перед тем, как анализировать страницу. Распознаёт paywall и честно сообщает об этом, а не выдумывает текст статьи и не пытается его обойти.
Plug in a CapSolver API key and the agent will auto-solve reCAPTCHA v2/v3, hCaptcha, and Cloudflare Turnstile when they block a step — instead of stopping to ask. Off by default, BYO key, no captcha service is shipped or contacted unless you turn it on.
Плагин доступен на English, Español, Français, Türkçe и 中文. При первом запуске автоматически определяет язык браузера; переключайте в любой момент по значку глобуса в боковой панели. Маркетинговый сайт локализован соответственно.
Скриншоты уменьшаются по размеру и итеративно сжимаются в JPEG, прежде чем покинуть вашу машину, — image-токены остаются маленькими. Умное подрезание контекста и ограничения на вывод инструментов делают облачные расходы предсказуемыми, без сюрпризов на длинных сессиях.
Подключайтесь к любому OpenAI-совместимому API или запускайте локальную модель. Меняйте провайдера в любой момент в настройках расширения.
Доступно для Chrome и Firefox. Бесплатно, open-source, аккаунт не нужен.
Manifest V3 · Chrome 116+ · Также работает в Brave, Edge, Opera, Vivaldi и других Chromium-совместимых браузерах.
WebBrain стоит на стыке нативных AI-плагинов для браузера и полноценных agent-фреймворков. Вот как он выглядит в сравнении.
| Параметр | WebBrain | Claude в Chrome |
|---|---|---|
| Open-source | Лицензия MIT | Проприетарно |
| Цена | Навсегда бесплатно | Нужен Claude Pro ($20/мес) |
| Поддержка локальных LLM | llama.cpp, Ollama | Нет — только Claude |
| Мульти-провайдер | All OpenAI-compatible endpoints | Только Claude |
| Chrome | Да (MV3) | Да |
| Firefox | Да (MV2) | Нет |
| Интерфейс в боковой панели | Да | Да |
| Режимы «Спросить» / «Действовать» | Да | Похоже |
| Полностью офлайн | Да (с локальным LLM) | Нет — нужно облако |
| Self-hosted | Да | Нет |
| Аспект | WebBrain | OpenClaw / Browser-Use / и т.п. |
|---|---|---|
| Что это? | Браузерное расширение (для конечного пользователя) | Agent-фреймворк / SDK (для разработчиков) |
| Целевой пользователь | Любой — программирование не требуется | Разработчики, собирающие автоматизации |
| Установка | Установка в браузер в один клик | Требуется Python/Docker |
| Интерфейс | Встроенный чат в боковой панели | Без UI — только код или API |
| Управление браузером | Content script (легковесно) | CDP / Playwright (полный контроль) |
| Сценарии с несколькими вкладками | Отдельный чат для каждой вкладки | Программируемая оркестрация нескольких вкладок |
| Headless-режим | Нет — работает в вашем браузере | Да — headless-автоматизация |
| Расширяемость | Добавление своих LLM-провайдеров | Полноценный Python SDK, кастомные инструменты |
| Лучше всего для | Ежедневный AI-помощник при сёрфинге | Автоматический скрейпинг / тест-пайплайны |
WebBrain — браузерное расширение для конечных пользователей, которым нужен AI-помощник прямо во время веб-сёрфинга. Agent-фреймворки вроде OpenClaw — это инструменты для разработчиков, которые строят автоматические браузерные пайплайны. Разные инструменты под разные задачи — и их можно использовать вместе.
Да. WebBrain даёт похожие возможности AI-агента в браузере — читает страницы, извлекает данные, нажимает кнопки, заполняет формы и автоматизирует многошаговые сценарии. В отличие от проприетарного плагина Claude, требующего подписки Claude Pro и работающего только с моделями Anthropic, WebBrain полностью бесплатный, open-source (лицензия MIT) и поддерживает разных LLM-провайдеров, включая локальные модели, которые целиком работают на вашей машине.
Это разные категории инструментов. WebBrain — браузерное расширение: ставите его в Chrome или Firefox и общаетесь с ним в боковой панели, никакого кода не требуется. OpenClaw, Browser-Use и подобные фреймворки — это SDK для разработчиков, чтобы собирать автоматические браузерные пайплайны на Python, обычно через headless-браузер и CDP. Иначе говоря: WebBrain — для повседневного веб-сёрфинга с AI-помощником; agent-фреймворки — для скрейпинга-ботов и автотестов. Их можно использовать вместе — они хорошо дополняют друг друга.
Да. По умолчанию WebBrain использует llama.cpp, который запускает локальную AI-модель прямо у вас на компьютере. API-ключи не нужны, интернета AI не требует, данные не покидают машину. Скачайте GGUF-модель, запустите llama-server — и у вас полностью приватный AI-агент в браузере. Также можно использовать Ollama через его OpenAI-совместимый эндпоинт.
WebBrain поддерживает четыре типа провайдеров: llama.cpp (любая локальная GGUF-модель), OpenAI (GPT-4o, GPT-4 и т.д.), Claude (Claude Opus, Sonnet, Haiku через нативный API) и OpenRouter (доступ к 100+ моделям от разных провайдеров). Подходит любой OpenAI-совместимый эндпоинт, так что можно использовать Together AI, Groq, Mistral или любой локальный сервер с OpenAI-совместимым интерфейсом.
По состоянию на 21 апреля 2026 главная рекомендация — Qwen 3.6 35B. Почему: в нашем vision-бенчмарке (vision-model-shootout) она обошла Gemma 4 на понимании скриншотов и при этом остаётся практичной для локального инференса.
Для потребительских GPU идеален RTX 5090, а RTX 4090 обычно подходит при INT4 AutoRound-квантизации через Intel/Qwen3.6-35B-A3B-int4-AutoRound.
Для максимальной скорости рекомендуем серверить через vLLM. Пример команды:
python -u -m vllm.entrypoints.openai.api_server --model Intel/Qwen3.6-35B-A3B-int4-AutoRound --served-model-name qwen3.6-35b --quantization auto --dtype bfloat16 --max-model-len 65536 --max-num-batched-tokens 32768 --max-num-seqs 4 --host 0.0.0.0 --port 8000 --gpu-memory-utilization 0.92 --enable-prefix-caching --enable-chunked-prefill --limit-mm-per-prompt '{"image": 4, "video": 1}' --mm-processor-cache-type shm --reasoning-parser qwen3 --enable-auto-tool-choice --tool-call-parser qwen3_coder --trust-remote-code --allowed-origins '["*"]' --speculative-config '{"method": "dflash", "model": "z-lab/Qwen3.6-35B-A3B-DFlash", "num_speculative_tokens": 15}' --attention-backend flash_attn
DFlash speculative decoding — опционально.
Если LLM-сервер запущен на другой машине в локальной сети (например, http://192.168.1.x:8000), Chrome блокирует запрос, пока сервер не отдаст CORS-заголовки. Решение зависит от сервера:
vLLM: запускайте с --allowed-origins '["*"]' (значение обязательно — JSON-список).
Ollama: перед стартом установите переменную окружения OLLAMA_ORIGINS=*.
llama.cpp: CORS включён по умолчанию — менять ничего не надо.
Если сервер крутится на localhost (на той же машине, что и браузер), CORS обычно не нужен. Проблема возникает только при обращении к другой машине в локальной сети. Убедитесь, что Base URL в настройках WebBrain заканчивается на /v1 (например, http://192.168.1.47:8000/v1).
Да. WebBrain поставляется в двух версиях: для Chrome (Manifest V3, использует sidePanel API) и для Firefox (Manifest V2, использует sidebar_action). Функциональность одинаковая. Firefox-версию можно загрузить как временное дополнение для разработки или опубликовать на addons.mozilla.org для постоянной установки.
Да — в Firefox боковая панель по умолчанию слева, но её можно переместить. Кликните правой кнопкой по заголовку панели и выберите «Переместить боковую панель вправо» (или через меню «Вид → Боковая панель → Переместить боковую панель вправо»). Позиция сохраняется между перезапусками. У Chrome панель sidePanel по умолчанию справа и не перемещается из самой панели.
В WebBrain два режима: режим «Спросить» (по умолчанию) работает только на чтение и ничего не меняет на странице. Режим «Действовать» даёт полноценные возможности агента (нажимать, печатать, переходить), но включается только после явного подтверждения пользователя и сопровождается заметной баннером-предупреждением. Агента можно остановить в любой момент кнопкой «Стоп». Исходный код расширения полностью открыт на GitHub для аудита.
Просто откройте любую страницу, разверните боковую панель WebBrain и сформулируйте задачу на естественном языке: «Извлеки все названия товаров и цены с этой страницы», «Найди все email-адреса на странице» или «Сделай тезисное резюме статьи». AI-агент читает содержимое страницы, понимает структуру и возвращает извлечённые данные. Для более сложного скрейпинга переключитесь в режим «Действовать» — агент сможет переходить между страницами, нажимать кнопки пагинации и собирать данные сразу с нескольких.
По умолчанию WebBrain для любого действия, которое создаёт, изменяет, удаляет, отправляет, публикует, постит или покупает, идёт строго через видимый интерфейс. Он переходит на страницу, заполняет форму и нажимает кнопку — ровно так же, как сделали бы вы. Прямые вызовы REST/GraphQL-эндпоинтов через фоновый fetch() для мутаций он не делает. Это сделано намеренно: API-действия невидимы (вы не видите, что отправляется), часто требуют отдельных токенов, которые вы могли не настроить, и имеют гораздо больший радиус последствий, чем один видимый промах. UI-first означает, что всё происходит на экране, в обычной браузерной сессии — и в любой момент это можно остановить.
Для чтения данных — забрать README, посмотреть issue, сравнить цены между сайтами, заглянуть на страницу со статусом — WebBrain свободно пользуется фоновыми HTTP-запросами через инструменты fetch_url и research_url. Чтение — это не действие; оно ничего не меняет на удалённом сервисе, поэтому те же опасения здесь не работают.
Если конкретно для одной задачи вы хотите разрешить API-мутации, в начале сообщения наберите /allow-api (можно с краткой формулировкой задачи). Этот переключатель в рамках одного диалога позволяет WebBrain в случае реальной поломки или недоступности UI откатываться к API-эндпоинтам, при этом по-прежнему предпочитая UI, когда он работает. Пока переключатель активен, над полем ввода висит липкий бейдж; он сбрасывается при сбросе диалога.
Да. Read-only сетевые инструменты WebBrain — fetch_url и research_url — также поставляются как отдельный плагин для LM Studio по адресу webbrain/web-tools. Поставьте командой lms clone webbrain/web-tools и включите в любом чате LM Studio — любая модель с поддержкой tool-вызовов сможет дёргать эти два инструмента, и браузерное расширение ставить не обязательно. Чистый Node, без headless-браузера. Исходники: lmstudio-plugin/.
Да, в Chrome — агент работает в фоновом service worker и привязан к той вкладке, с которой стартовал, поэтому продолжает нажимать, печатать и читать именно эту вкладку, даже если вы перевели фокус. Инструменты, нацеленные на вкладку (CDP-клик, ввод, навигация, скриншот), в Chrome работают и с фоновыми вкладками. Боковая панель блокирует ввод, пока задача выполняется, чтобы вы случайно не запустили вторую на новой вкладке — нужно дождаться или остановить текущую. Учтите, что браузеры приглушают таймеры и анимации в фоне, так что сильно анимированные сайты могут реагировать чуть медленнее.
В Firefox агент тоже продолжает работать на исходной вкладке, но авто-скриншоты ограничены: API скриншотов в Firefox умеет снимать только текущую активную вкладку, а не конкретную фоновую. WebBrain это понимает и пропускает скриншот на этом ходу, вместо того чтобы скармливать модели изображение чужой страницы. Агент продолжит планировать по текстовому контексту, пока вы не вернётесь на его вкладку.
Не нажимайте и не печатайте сами на той же вкладке, где работает агент — это создаёт гонки, где вы и агент дерётесь за одну и ту же страницу. Переключаться между вкладками — нормально; со-водить одну вкладку — нет.
Автозаполнение профиля — опциональная функция в Настройки → Профиль. Вы пишете короткое био — имя, рабочий email, компанию и одноразовый пароль для малозначимых регистраций — и включаете её. Когда она активна, WebBrain добавляет этот текст в системный prompt агента, чтобы тот заполнял формы регистрации, не спрашивая каждый раз.
Текст хранится в открытом виде в локальном хранилище браузера. Он не отправляется в проект WebBrain, но отправляется тому LLM-провайдеру, которого вы настроили, на каждом ходу как часть системного prompt. По умолчанию выключено.
Не вводите сюда пароли важных аккаунтов (Google, Apple, iCloud, банк, корпоративный SSO, основная почта). Эти аккаунты должны быть с 2FA, и их в любом случае не стоит отдавать агенту. Одноразовый пароль, который вы переиспользуете для подписки на рассылки и бесплатные триалы, — то самое.
Cookie-баннеры: WebBrain распознаёт баннеры согласия популярных фреймворков (OneTrust, Cookiebot, Didomi, Quantcast, Google Funding Choices, TrustArc) и закрывает их до того, как начинать рассуждать о странице. Приоритет — «Отклонить всё» / «Отклонить необязательные» / «Только необходимые», если они видны; иначе соглашается на «Принять всё», вместо того чтобы тонуть в лабиринте «Управление настройками».
Paywall: WebBrain честно сообщает о paywall'е и рассказывает, что реально смог увидеть (заголовок, подзаголовок, первые абзацы). Он не пытается обойти paywall — никаких archive.today, 12ft.io, чистки cookie, отключения JS или фокусов с reader-mode. Если нужна вся статья — войдите по подписке или попросите WebBrain поискать бесплатное освещение той же истории.
На момент 7.0.0 — пока нет. Режим dry-run запланирован и уже в дорожной карте.
Три независимых слоя:
Скриншоты с заботой о токенах. Прежде чем любое изображение покинет вашу машину, WebBrain уменьшает его (короткая сторона ограничена, пропорции сохраняются) и итеративно сжимает в JPEG до тех пор, пока оно не уложится в бюджет image-токенов на ход. Скриншот 2000×1200, который на GPT-4o обошёлся бы примерно в 1500 входных токенов, сжимается до ~300–500 токенов без реальной потери для задач чтения страниц. Реализовано в _fitImageDimensions, есть юнит-тесты на расчёт бюджета.
Умное подрезание контекста. История диалога, выводы инструментов и встроенные дампы DOM ограничены на ход и подрезаются от старого к новому, когда контекстное окно активной модели приближается к заполнению. Вы не увидите, как сессия тихо распухает с 10k токенов до 100k из-за того, что read_page вернул статью размером с роман.
Отдельная vision-модель. Пара: дешёвая текстовая модель (например, GPT-4o-mini) для планирования и tool-вызовов плюс отдельная vision-модель (например, GPT-4o) только для скриншотов — и вы не платите цену мультимодальной модели на каждом ходу. Настраивается в Настройки → Зрение.
В итоге: длинные сессии с облачными провайдерами остаются предсказуемыми. Для полного контроля — поднимайте llama.cpp локально, цена за токен нулевая.
Конечно! WebBrain под лицензией MIT и приветствует контрибьюции. Загляните в репозиторий на GitHub — там issue, фича-реквесты и правила контрибьюции.