Open-source AI-агент для браузера

WebBrain — бесплатное open-source расширение, которое добавляет возможности AI-агента в Chrome и Firefox. Читает страницы, извлекает данные и автоматизирует веб-задачи — на любом LLM по вашему выбору. Self-hosted альтернатива проприетарным браузерным AI-плагинам.

Установить расширение Открыть на GitHub
https://example.com/products

Каталог товаров

🧠 WebBrain.one
Извлеки все названия товаров и цены с этой страницы
Чтение страницы
Извлечение данных
Найдено 24 товара. Вот результаты:
1. Widget Pro — $29.99
2. Super Gadget — $49.99
3. MegaTool X — $19.99
...и ещё 21
Спросите что угодно об этой странице...
Демо

WebBrain в действии

Посмотрите, как WebBrain читает страницы, извлекает данные и автоматизирует задачи в браузере.

Возможности

Всё, что нужно от AI в браузере

Полноценный AI-агент, который живёт в боковой панели браузера и понимает любую веб-страницу.

📖

Понимание страницы

Читает и понимает любую веб-страницу — статьи, документацию, дашборды, формы. Задавайте вопросы и получайте мгновенные ответы по содержимому текущей страницы.

🤖

Полноценный браузерный агент

Кликает, печатает, прокручивает, навигирует и взаимодействует со страницами вместо вас. Автоматизируйте рутинные задачи инструкциями на естественном языке.

📊

Извлечение данных

Извлекает структурированные данные с любой страницы — таблицы, списки, ссылки, формы. Экспортируйте каталоги товаров, результаты поиска или любое содержимое страницы. Работает и с PDF.

🔌

Поддержка разных LLM

Работает с локальным llama.cpp, OpenAI, Claude и OpenRouter. Используйте любимую модель — или работайте полностью офлайн с локальным AI.

🛡️

Сначала приватность

Ваши данные остаются вашими. С локальным LLM — нулевая утечка данных. Никакой телеметрии, отслеживания и аккаунтов. Полностью open-source.

Умный контекст

Автоматическое управление контекстом не даёт переполниться окну токенов. Аккуратно подрезает историю диалога и ограничивает вывод инструментов — сессия идёт ровно и без срывов.

👁️

Отдельная модель для зрения

Сочетайте быструю текстовую модель для планирования с отдельной vision-моделью для чтения скриншотов. Дешевле и быстрее, чем гонять всё через одну большую мультимодальную модель.

👤

Автозаполнение профиля

Опциональная плейн-текст биография — имя, рабочий email, компания, одноразовый пароль — позволяет агенту без вопросов проходить малозначимые регистрации. По умолчанию отключено, всё хранится локально.

🍪

Понимает Cookie и paywall

Закрывает баннеры согласия (OneTrust, Cookiebot, Didomi, Quantcast) перед тем, как анализировать страницу. Распознаёт paywall и честно сообщает об этом, а не выдумывает текст статьи и не пытается его обойти.

🧩

Optional CAPTCHA Solver

Plug in a CapSolver API key and the agent will auto-solve reCAPTCHA v2/v3, hCaptcha, and Cloudflare Turnstile when they block a step — instead of stopping to ask. Off by default, BYO key, no captcha service is shipped or contacted unless you turn it on.

🌐

Многоязычный интерфейс

Плагин доступен на English, Español, Français, Türkçe и 中文. При первом запуске автоматически определяет язык браузера; переключайте в любой момент по значку глобуса в боковой панели. Маркетинговый сайт локализован соответственно.

💰

Бережём токены

Скриншоты уменьшаются по размеру и итеративно сжимаются в JPEG, прежде чем покинуть вашу машину, — image-токены остаются маленькими. Умное подрезание контекста и ограничения на вывод инструментов делают облачные расходы предсказуемыми, без сюрпризов на длинных сессиях.

LLM-провайдеры

Свой AI с собой

Подключайтесь к любому OpenAI-совместимому API или запускайте локальную модель. Меняйте провайдера в любой момент в настройках расширения.

🦙
llama.cpp
Ollama
OpenAI
Claude
OpenRouter
LM Studio
vLLM
Grok
Gemini
DeepSeek
Mistral
С чего начать

Установить WebBrain

Доступно для Chrome и Firefox. Бесплатно, open-source, аккаунт не нужен.

🌐

Chrome и Chromium

Manifest V3 · Chrome 116+ · Также работает в Brave, Edge, Opera, Vivaldi и других Chromium-совместимых браузерах.

Почему WebBrain?

Чем отличается WebBrain?

WebBrain стоит на стыке нативных AI-плагинов для браузера и полноценных agent-фреймворков. Вот как он выглядит в сравнении.

В сравнении с AI-плагинами для браузера

Параметр WebBrain Claude в Chrome
Open-sourceЛицензия MITПроприетарно
ЦенаНавсегда бесплатноНужен Claude Pro ($20/мес)
Поддержка локальных LLMllama.cpp, OllamaНет — только Claude
Мульти-провайдерAll OpenAI-compatible endpointsТолько Claude
ChromeДа (MV3)Да
FirefoxДа (MV2)Нет
Интерфейс в боковой панелиДаДа
Режимы «Спросить» / «Действовать»ДаПохоже
Полностью офлайнДа (с локальным LLM)Нет — нужно облако
Self-hostedДаНет

В сравнении с AI-фреймворками для агентов (другая категория)

Аспект WebBrain OpenClaw / Browser-Use / и т.п.
Что это?Браузерное расширение (для конечного пользователя)Agent-фреймворк / SDK (для разработчиков)
Целевой пользовательЛюбой — программирование не требуетсяРазработчики, собирающие автоматизации
УстановкаУстановка в браузер в один кликТребуется Python/Docker
ИнтерфейсВстроенный чат в боковой панелиБез UI — только код или API
Управление браузеромContent script (легковесно)CDP / Playwright (полный контроль)
Сценарии с несколькими вкладкамиОтдельный чат для каждой вкладкиПрограммируемая оркестрация нескольких вкладок
Headless-режимНет — работает в вашем браузереДа — headless-автоматизация
РасширяемостьДобавление своих LLM-провайдеровПолноценный Python SDK, кастомные инструменты
Лучше всего дляЕжедневный AI-помощник при сёрфингеАвтоматический скрейпинг / тест-пайплайны

WebBrain — браузерное расширение для конечных пользователей, которым нужен AI-помощник прямо во время веб-сёрфинга. Agent-фреймворки вроде OpenClaw — это инструменты для разработчиков, которые строят автоматические браузерные пайплайны. Разные инструменты под разные задачи — и их можно использовать вместе.

FAQ

Часто задаваемые вопросы

WebBrain — это бесплатная альтернатива браузерному плагину Claude?

Да. WebBrain даёт похожие возможности AI-агента в браузере — читает страницы, извлекает данные, нажимает кнопки, заполняет формы и автоматизирует многошаговые сценарии. В отличие от проприетарного плагина Claude, требующего подписки Claude Pro и работающего только с моделями Anthropic, WebBrain полностью бесплатный, open-source (лицензия MIT) и поддерживает разных LLM-провайдеров, включая локальные модели, которые целиком работают на вашей машине.

Чем WebBrain отличается от OpenClaw, Browser-Use и других agent-фреймворков?

Это разные категории инструментов. WebBrain — браузерное расширение: ставите его в Chrome или Firefox и общаетесь с ним в боковой панели, никакого кода не требуется. OpenClaw, Browser-Use и подобные фреймворки — это SDK для разработчиков, чтобы собирать автоматические браузерные пайплайны на Python, обычно через headless-браузер и CDP. Иначе говоря: WebBrain — для повседневного веб-сёрфинга с AI-помощником; agent-фреймворки — для скрейпинга-ботов и автотестов. Их можно использовать вместе — они хорошо дополняют друг друга.

Можно ли пользоваться WebBrain полностью офлайн?

Да. По умолчанию WebBrain использует llama.cpp, который запускает локальную AI-модель прямо у вас на компьютере. API-ключи не нужны, интернета AI не требует, данные не покидают машину. Скачайте GGUF-модель, запустите llama-server — и у вас полностью приватный AI-агент в браузере. Также можно использовать Ollama через его OpenAI-совместимый эндпоинт.

Какие AI-модели поддерживает WebBrain?

WebBrain поддерживает четыре типа провайдеров: llama.cpp (любая локальная GGUF-модель), OpenAI (GPT-4o, GPT-4 и т.д.), Claude (Claude Opus, Sonnet, Haiku через нативный API) и OpenRouter (доступ к 100+ моделям от разных провайдеров). Подходит любой OpenAI-совместимый эндпоинт, так что можно использовать Together AI, Groq, Mistral или любой локальный сервер с OpenAI-совместимым интерфейсом.

Какая модель рекомендуется в первую очередь?

По состоянию на 21 апреля 2026 главная рекомендация — Qwen 3.6 35B. Почему: в нашем vision-бенчмарке (vision-model-shootout) она обошла Gemma 4 на понимании скриншотов и при этом остаётся практичной для локального инференса.

Для потребительских GPU идеален RTX 5090, а RTX 4090 обычно подходит при INT4 AutoRound-квантизации через Intel/Qwen3.6-35B-A3B-int4-AutoRound.

Для максимальной скорости рекомендуем серверить через vLLM. Пример команды:

python -u -m vllm.entrypoints.openai.api_server --model Intel/Qwen3.6-35B-A3B-int4-AutoRound --served-model-name qwen3.6-35b --quantization auto --dtype bfloat16 --max-model-len 65536 --max-num-batched-tokens 32768 --max-num-seqs 4 --host 0.0.0.0 --port 8000 --gpu-memory-utilization 0.92 --enable-prefix-caching --enable-chunked-prefill --limit-mm-per-prompt '{"image": 4, "video": 1}' --mm-processor-cache-type shm --reasoning-parser qwen3 --enable-auto-tool-choice --tool-call-parser qwen3_coder --trust-remote-code --allowed-origins '["*"]' --speculative-config '{"method": "dflash", "model": "z-lab/Qwen3.6-35B-A3B-DFlash", "num_speculative_tokens": 15}' --attention-backend flash_attn

DFlash speculative decoding — опционально.

Получаю «Failed to fetch» при подключении к локальному LLM-серверу (vLLM, Ollama, llama.cpp) в моей сети

Если LLM-сервер запущен на другой машине в локальной сети (например, http://192.168.1.x:8000), Chrome блокирует запрос, пока сервер не отдаст CORS-заголовки. Решение зависит от сервера:

vLLM: запускайте с --allowed-origins '["*"]' (значение обязательно — JSON-список).
Ollama: перед стартом установите переменную окружения OLLAMA_ORIGINS=*.
llama.cpp: CORS включён по умолчанию — менять ничего не надо.

Если сервер крутится на localhost (на той же машине, что и браузер), CORS обычно не нужен. Проблема возникает только при обращении к другой машине в локальной сети. Убедитесь, что Base URL в настройках WebBrain заканчивается на /v1 (например, http://192.168.1.47:8000/v1).

WebBrain работает в Firefox?

Да. WebBrain поставляется в двух версиях: для Chrome (Manifest V3, использует sidePanel API) и для Firefox (Manifest V2, использует sidebar_action). Функциональность одинаковая. Firefox-версию можно загрузить как временное дополнение для разработки или опубликовать на addons.mozilla.org для постоянной установки.

Можно ли передвинуть боковую панель Firefox с левой стороны на правую, как боковую панель Chrome?

Да — в Firefox боковая панель по умолчанию слева, но её можно переместить. Кликните правой кнопкой по заголовку панели и выберите «Переместить боковую панель вправо» (или через меню «Вид → Боковая панель → Переместить боковую панель вправо»). Позиция сохраняется между перезапусками. У Chrome панель sidePanel по умолчанию справа и не перемещается из самой панели.

WebBrain безопасен? Может ли он менять веб-страницы?

В WebBrain два режима: режим «Спросить» (по умолчанию) работает только на чтение и ничего не меняет на странице. Режим «Действовать» даёт полноценные возможности агента (нажимать, печатать, переходить), но включается только после явного подтверждения пользователя и сопровождается заметной баннером-предупреждением. Агента можно остановить в любой момент кнопкой «Стоп». Исходный код расширения полностью открыт на GitHub для аудита.

Как использовать WebBrain для веб-скрейпинга и извлечения данных?

Просто откройте любую страницу, разверните боковую панель WebBrain и сформулируйте задачу на естественном языке: «Извлеки все названия товаров и цены с этой страницы», «Найди все email-адреса на странице» или «Сделай тезисное резюме статьи». AI-агент читает содержимое страницы, понимает структуру и возвращает извлечённые данные. Для более сложного скрейпинга переключитесь в режим «Действовать» — агент сможет переходить между страницами, нажимать кнопки пагинации и собирать данные сразу с нескольких.

WebBrain вызывает API напрямую или всегда кликает через интерфейс?

По умолчанию WebBrain для любого действия, которое создаёт, изменяет, удаляет, отправляет, публикует, постит или покупает, идёт строго через видимый интерфейс. Он переходит на страницу, заполняет форму и нажимает кнопку — ровно так же, как сделали бы вы. Прямые вызовы REST/GraphQL-эндпоинтов через фоновый fetch() для мутаций он не делает. Это сделано намеренно: API-действия невидимы (вы не видите, что отправляется), часто требуют отдельных токенов, которые вы могли не настроить, и имеют гораздо больший радиус последствий, чем один видимый промах. UI-first означает, что всё происходит на экране, в обычной браузерной сессии — и в любой момент это можно остановить.

Для чтения данных — забрать README, посмотреть issue, сравнить цены между сайтами, заглянуть на страницу со статусом — WebBrain свободно пользуется фоновыми HTTP-запросами через инструменты fetch_url и research_url. Чтение — это не действие; оно ничего не меняет на удалённом сервисе, поэтому те же опасения здесь не работают.

Если конкретно для одной задачи вы хотите разрешить API-мутации, в начале сообщения наберите /allow-api (можно с краткой формулировкой задачи). Этот переключатель в рамках одного диалога позволяет WebBrain в случае реальной поломки или недоступности UI откатываться к API-эндпоинтам, при этом по-прежнему предпочитая UI, когда он работает. Пока переключатель активен, над полем ввода висит липкий бейдж; он сбрасывается при сбросе диалога.

А в LM Studio это можно использовать?

Да. Read-only сетевые инструменты WebBrain — fetch_url и research_url — также поставляются как отдельный плагин для LM Studio по адресу webbrain/web-tools. Поставьте командой lms clone webbrain/web-tools и включите в любом чате LM Studio — любая модель с поддержкой tool-вызовов сможет дёргать эти два инструмента, и браузерное расширение ставить не обязательно. Чистый Node, без headless-браузера. Исходники: lmstudio-plugin/.

Можно переключиться на другую вкладку, пока WebBrain работает над страницей?

Да, в Chrome — агент работает в фоновом service worker и привязан к той вкладке, с которой стартовал, поэтому продолжает нажимать, печатать и читать именно эту вкладку, даже если вы перевели фокус. Инструменты, нацеленные на вкладку (CDP-клик, ввод, навигация, скриншот), в Chrome работают и с фоновыми вкладками. Боковая панель блокирует ввод, пока задача выполняется, чтобы вы случайно не запустили вторую на новой вкладке — нужно дождаться или остановить текущую. Учтите, что браузеры приглушают таймеры и анимации в фоне, так что сильно анимированные сайты могут реагировать чуть медленнее.

В Firefox агент тоже продолжает работать на исходной вкладке, но авто-скриншоты ограничены: API скриншотов в Firefox умеет снимать только текущую активную вкладку, а не конкретную фоновую. WebBrain это понимает и пропускает скриншот на этом ходу, вместо того чтобы скармливать модели изображение чужой страницы. Агент продолжит планировать по текстовому контексту, пока вы не вернётесь на его вкладку.

Не нажимайте и не печатайте сами на той же вкладке, где работает агент — это создаёт гонки, где вы и агент дерётесь за одну и ту же страницу. Переключаться между вкладками — нормально; со-водить одну вкладку — нет.

Как работает автозаполнение профиля и безопасно ли это?

Автозаполнение профиля — опциональная функция в Настройки → Профиль. Вы пишете короткое био — имя, рабочий email, компанию и одноразовый пароль для малозначимых регистраций — и включаете её. Когда она активна, WebBrain добавляет этот текст в системный prompt агента, чтобы тот заполнял формы регистрации, не спрашивая каждый раз.

Текст хранится в открытом виде в локальном хранилище браузера. Он не отправляется в проект WebBrain, но отправляется тому LLM-провайдеру, которого вы настроили, на каждом ходу как часть системного prompt. По умолчанию выключено.

Не вводите сюда пароли важных аккаунтов (Google, Apple, iCloud, банк, корпоративный SSO, основная почта). Эти аккаунты должны быть с 2FA, и их в любом случае не стоит отдавать агенту. Одноразовый пароль, который вы переиспользуете для подписки на рассылки и бесплатные триалы, — то самое.

Что WebBrain делает с cookie-баннерами и paywall'ами?

Cookie-баннеры: WebBrain распознаёт баннеры согласия популярных фреймворков (OneTrust, Cookiebot, Didomi, Quantcast, Google Funding Choices, TrustArc) и закрывает их до того, как начинать рассуждать о странице. Приоритет — «Отклонить всё» / «Отклонить необязательные» / «Только необходимые», если они видны; иначе соглашается на «Принять всё», вместо того чтобы тонуть в лабиринте «Управление настройками».

Paywall: WebBrain честно сообщает о paywall'е и рассказывает, что реально смог увидеть (заголовок, подзаголовок, первые абзацы). Он не пытается обойти paywall — никаких archive.today, 12ft.io, чистки cookie, отключения JS или фокусов с reader-mode. Если нужна вся статья — войдите по подписке или попросите WebBrain поискать бесплатное освещение той же истории.

Поддерживает ли WebBrain режим dry-run?

На момент 7.0.0 — пока нет. Режим dry-run запланирован и уже в дорожной карте.

Как WebBrain держит счета за облачные LLM под контролем?

Три независимых слоя:

Скриншоты с заботой о токенах. Прежде чем любое изображение покинет вашу машину, WebBrain уменьшает его (короткая сторона ограничена, пропорции сохраняются) и итеративно сжимает в JPEG до тех пор, пока оно не уложится в бюджет image-токенов на ход. Скриншот 2000×1200, который на GPT-4o обошёлся бы примерно в 1500 входных токенов, сжимается до ~300–500 токенов без реальной потери для задач чтения страниц. Реализовано в _fitImageDimensions, есть юнит-тесты на расчёт бюджета.

Умное подрезание контекста. История диалога, выводы инструментов и встроенные дампы DOM ограничены на ход и подрезаются от старого к новому, когда контекстное окно активной модели приближается к заполнению. Вы не увидите, как сессия тихо распухает с 10k токенов до 100k из-за того, что read_page вернул статью размером с роман.

Отдельная vision-модель. Пара: дешёвая текстовая модель (например, GPT-4o-mini) для планирования и tool-вызовов плюс отдельная vision-модель (например, GPT-4o) только для скриншотов — и вы не платите цену мультимодальной модели на каждом ходу. Настраивается в Настройки → Зрение.

В итоге: длинные сессии с облачными провайдерами остаются предсказуемыми. Для полного контроля — поднимайте llama.cpp локально, цена за токен нулевая.

Могу ли я внести свой вклад в WebBrain?

Конечно! WebBrain под лицензией MIT и приветствует контрибьюции. Загляните в репозиторий на GitHub — там issue, фича-реквесты и правила контрибьюции.

Расскажите, поделитесь любовью

WebBrain под лицензией MIT и работает целиком в вашем браузере. Если он вам полезен — поставьте звезду или поделитесь: именно так независимые open-source проекты находят свою аудиторию.