Question 1

WebBrain — это бесплатная альтернатива браузерному плагину Claude?

Accepted Answer

Да. WebBrain даёт похожие возможности AI-агента в браузере — читает страницы, извлекает данные, нажимает кнопки, заполняет формы и автоматизирует многошаговые сценарии. В отличие от проприетарного плагина Claude, требующего подписки Claude Pro и работающего только с моделями Anthropic, WebBrain полностью бесплатный, open-source (лицензия MIT) и поддерживает разных LLM-провайдеров, включая локальные модели, которые целиком работают на вашей машине.

Question 2

Чем WebBrain отличается от OpenClaw, Browser-Use и других agent-фреймворков?

Accepted Answer

Это разные категории инструментов. WebBrain — браузерное расширение: ставите его в Chrome или Firefox и общаетесь с ним в боковой панели, никакого кода не требуется. OpenClaw, Browser-Use и подобные фреймворки — это SDK для разработчиков, чтобы собирать автоматические браузерные пайплайны на Python, обычно через headless-браузер и CDP. Иначе говоря: WebBrain — для повседневного веб-сёрфинга с AI-помощником; agent-фреймворки — для скрейпинга-ботов и автотестов. Их можно использовать вместе — они хорошо дополняют друг друга.

Question 3

Можно ли пользоваться WebBrain полностью офлайн?

Accepted Answer

Да. По умолчанию WebBrain использует llama.cpp, который запускает локальную AI-модель прямо у вас на компьютере. API-ключи не нужны, интернета AI не требует, данные не покидают машину. Скачайте GGUF-модель, запустите llama-server — и у вас полностью приватный AI-агент в браузере. Также можно использовать Ollama через его OpenAI-совместимый эндпоинт.

Question 4

Какие AI-модели поддерживает WebBrain?

Accepted Answer

WebBrain поддерживает четыре типа провайдеров: llama.cpp (любая локальная GGUF-модель), OpenAI (GPT-4o, GPT-4 и т.д.), Claude (Claude Opus, Sonnet, Haiku через нативный API) и OpenRouter (доступ к 100+ моделям от разных провайдеров). Подходит любой OpenAI-совместимый эндпоинт, так что можно использовать Together AI, Groq, Mistral или любой локальный сервер с OpenAI-совместимым интерфейсом.

Question 5

Какая модель рекомендуется в первую очередь?

Accepted Answer

По состоянию на 21 апреля 2026 главная рекомендация — Qwen 3.6 35B. Почему: в нашем vision-бенчмарке (vision-model-shootout) она обошла Gemma 4 на понимании скриншотов и при этом остаётся практичной для локального инференса. Для потребительских GPU идеален RTX 5090, а RTX 4090 обычно подходит при INT4 AutoRound-квантизации через Intel/Qwen3.6-35B-A3B-int4-AutoRound. Для максимальной скорости рекомендуем серверить через vLLM. Пример команды: python -u -m vllm.entrypoints.openai.api_server --model Intel/Qwen3.6-35B-A3B-int4-AutoRound --served-model-name qwen3.6-35b --quantization auto --dtype bfloat16 --max-model-len 65536 --max-num-batched-tokens 32768 --max-num-seqs 4 --host 0.0.0.0 --port 8000 --gpu-memory-utilization 0.92 --enable-prefix-caching --enable-chunked-prefill --limit-mm-per-prompt '{"image": 4, "video": 1}' --mm-processor-cache-type shm --reasoning-parser qwen3 --enable-auto-tool-choice --tool-call-parser qwen3_coder --trust-remote-code --allowed-origins '["*"]' --speculative-config '{"method": "dflash", "model": "z-lab/Qwen3.6-35B-A3B-DFlash", "num_speculative_tokens": 15}' --attention-backend flash_attn DFlash speculative decoding — опционально.

Question 6

Получаю «Failed to fetch» при подключении к локальному LLM-серверу (vLLM, Ollama, llama.cpp) в моей сети

Accepted Answer

Если LLM-сервер запущен на другой машине в локальной сети (например, http://192.168.1.x:8000), Chrome блокирует запрос, пока сервер не отдаст CORS-заголовки. Решение зависит от сервера: vLLM: запускайте с --allowed-origins '["*"]' (значение обязательно — JSON-список). Ollama: перед стартом установите переменную окружения OLLAMA_ORIGINS=*. llama.cpp: CORS включён по умолчанию — менять ничего не надо. Если сервер крутится на localhost (на той же машине, что и браузер), CORS обычно не нужен. Проблема возникает только при обращении к другой машине в локальной сети. Убедитесь, что Base URL в настройках WebBrain заканчивается на /v1 (например, http://192.168.1.47:8000/v1).

Question 7

WebBrain работает в Firefox?

Accepted Answer

Да. WebBrain поставляется в двух версиях: для Chrome (Manifest V3, использует sidePanel API) и для Firefox (Manifest V2, использует sidebar_action). Функциональность одинаковая. Firefox-версию можно загрузить как временное дополнение для разработки или опубликовать на addons.mozilla.org для постоянной установки.

Question 8

Можно ли передвинуть боковую панель Firefox с левой стороны на правую, как боковую панель Chrome?

Accepted Answer

Да — в Firefox боковая панель по умолчанию слева, но её можно переместить. Кликните правой кнопкой по заголовку панели и выберите «Переместить боковую панель вправо» (или через меню «Вид → Боковая панель → Переместить боковую панель вправо»). Позиция сохраняется между перезапусками. У Chrome панель sidePanel по умолчанию справа и не перемещается из самой панели.

Question 9

WebBrain безопасен? Может ли он менять веб-страницы?

Accepted Answer

В WebBrain два режима: режим «Спросить» (по умолчанию) работает только на чтение и ничего не меняет на странице. Режим «Действовать» даёт полноценные возможности агента (нажимать, печатать, переходить), но включается только после явного подтверждения пользователя и сопровождается заметной баннером-предупреждением. Агента можно остановить в любой момент кнопкой «Стоп». Исходный код расширения полностью открыт на GitHub для аудита.

Question 10

Как использовать WebBrain для веб-скрейпинга и извлечения данных?

Accepted Answer

Просто откройте любую страницу, разверните боковую панель WebBrain и сформулируйте задачу на естественном языке: «Извлеки все названия товаров и цены с этой страницы», «Найди все email-адреса на странице» или «Сделай тезисное резюме статьи». AI-агент читает содержимое страницы, понимает структуру и возвращает извлечённые данные. Для более сложного скрейпинга переключитесь в режим «Действовать» — агент сможет переходить между страницами, нажимать кнопки пагинации и собирать данные сразу с нескольких.

Question 11

WebBrain вызывает API напрямую или всегда кликает через интерфейс?

Accepted Answer

По умолчанию WebBrain для любого действия, которое создаёт, изменяет, удаляет, отправляет, публикует, постит или покупает, идёт строго через видимый интерфейс. Он переходит на страницу, заполняет форму и нажимает кнопку — ровно так же, как сделали бы вы. Прямые вызовы REST/GraphQL-эндпоинтов через фоновый fetch() для мутаций он не делает. Это сделано намеренно: API-действия невидимы (вы не видите, что отправляется), часто требуют отдельных токенов, которые вы могли не настроить, и имеют гораздо больший радиус последствий, чем один видимый промах. UI-first означает, что всё происходит на экране, в обычной браузерной сессии — и в любой момент это можно остановить. Для чтения данных — забрать README, посмотреть issue, сравнить цены между сайтами, заглянуть на страницу со статусом — WebBrain свободно пользуется фоновыми HTTP-запросами через инструменты fetch_url и research_url. Чтение — это не действие; оно ничего не меняет на удалённом сервисе, поэтому те же опасения здесь не работают. Если конкретно для одной задачи вы хотите разрешить API-мутации, в начале сообщения наберите /allow-api (можно с краткой формулировкой задачи). Этот переключатель в рамках одного диалога позволяет WebBrain в случае реальной поломки или недоступности UI откатываться к API-эндпоинтам, при этом по-прежнему предпочитая UI, когда он работает. Пока переключатель активен, над полем ввода висит липкий бейдж; он сбрасывается при сбросе диалога.

Question 12

А в LM Studio это можно использовать?

Accepted Answer

Да. Read-only сетевые инструменты WebBrain — fetch_url и research_url — также поставляются как отдельный плагин для LM Studio по адресу webbrain/web-tools. Поставьте командой lms clone webbrain/web-tools и включите в любом чате LM Studio — любая модель с поддержкой tool-вызовов сможет дёргать эти два инструмента, и браузерное расширение ставить не обязательно. Чистый Node, без headless-браузера. Исходники: lmstudio-plugin/.

Question 13

Можно переключиться на другую вкладку, пока WebBrain работает над страницей?

Accepted Answer

Да, в Chrome — агент работает в фоновом service worker и привязан к той вкладке, с которой стартовал, поэтому продолжает нажимать, печатать и читать именно эту вкладку, даже если вы перевели фокус. Инструменты, нацеленные на вкладку (CDP-клик, ввод, навигация, скриншот), в Chrome работают и с фоновыми вкладками. Боковая панель блокирует ввод, пока задача выполняется, чтобы вы случайно не запустили вторую на новой вкладке — нужно дождаться или остановить текущую. Учтите, что браузеры приглушают таймеры и анимации в фоне, так что сильно анимированные сайты могут реагировать чуть медленнее. В Firefox агент тоже продолжает работать на исходной вкладке, но авто-скриншоты ограничены: API скриншотов в Firefox умеет снимать только текущую активную вкладку, а не конкретную фоновую. WebBrain это понимает и пропускает скриншот на этом ходу, вместо того чтобы скармливать модели изображение чужой страницы. Агент продолжит планировать по текстовому контексту, пока вы не вернётесь на его вкладку. Не нажимайте и не печатайте сами на той же вкладке, где работает агент — это создаёт гонки, где вы и агент дерётесь за одну и ту же страницу. Переключаться между вкладками — нормально; со-водить одну вкладку — нет.

Question 14

Как работает автозаполнение профиля и безопасно ли это?

Accepted Answer

Автозаполнение профиля — опциональная функция в Настройки → Профиль. Вы пишете короткое био — имя, рабочий email, компанию и одноразовый пароль для малозначимых регистраций — и включаете её. Когда она активна, WebBrain добавляет этот текст в системный prompt агента, чтобы тот заполнял формы регистрации, не спрашивая каждый раз. Текст хранится в открытом виде в локальном хранилище браузера. Он не отправляется в проект WebBrain, но отправляется тому LLM-провайдеру, которого вы настроили, на каждом ходу как часть системного prompt. По умолчанию выключено. Не вводите сюда пароли важных аккаунтов (Google, Apple, iCloud, банк, корпоративный SSO, основная почта). Эти аккаунты должны быть с 2FA, и их в любом случае не стоит отдавать агенту. Одноразовый пароль, который вы переиспользуете для подписки на рассылки и бесплатные триалы, — то самое.

Question 15

Что WebBrain делает с cookie-баннерами и paywall'ами?

Accepted Answer

Cookie-баннеры: WebBrain распознаёт баннеры согласия популярных фреймворков (OneTrust, Cookiebot, Didomi, Quantcast, Google Funding Choices, TrustArc) и закрывает их до того, как начинать рассуждать о странице. Приоритет — «Отклонить всё» / «Отклонить необязательные» / «Только необходимые», если они видны; иначе соглашается на «Принять всё», вместо того чтобы тонуть в лабиринте «Управление настройками». Paywall: WebBrain честно сообщает о paywall'е и рассказывает, что реально смог увидеть (заголовок, подзаголовок, первые абзацы). Он не пытается обойти paywall — никаких archive.today, 12ft.io, чистки cookie, отключения JS или фокусов с reader-mode. Если нужна вся статья — войдите по подписке или попросите WebBrain поискать бесплатное освещение той же истории.

Question 16

Поддерживает ли WebBrain режим dry-run?

Accepted Answer

На момент 7.0.0 — пока нет. Режим dry-run запланирован и уже в дорожной карте.

Question 17

Как WebBrain держит счета за облачные LLM под контролем?

Accepted Answer

Три независимых слоя: Скриншоты с заботой о токенах. Прежде чем любое изображение покинет вашу машину, WebBrain уменьшает его (короткая сторона ограничена, пропорции сохраняются) и итеративно сжимает в JPEG до тех пор, пока оно не уложится в бюджет image-токенов на ход. Скриншот 2000×1200, который на GPT-4o обошёлся бы примерно в 1500 входных токенов, сжимается до ~300–500 токенов без реальной потери для задач чтения страниц. Реализовано в _fitImageDimensions, есть юнит-тесты на расчёт бюджета. Умное подрезание контекста. История диалога, выводы инструментов и встроенные дампы DOM ограничены на ход и подрезаются от старого к новому, когда контекстное окно активной модели приближается к заполнению. Вы не увидите, как сессия тихо распухает с 10k токенов до 100k из-за того, что read_page вернул статью размером с роман. Отдельная vision-модель. Пара: дешёвая текстовая модель (например, GPT-4o-mini) для планирования и tool-вызовов плюс отдельная vision-модель (например, GPT-4o) только для скриншотов — и вы не платите цену мультимодальной модели на каждом ходу. Настраивается в Настройки → Зрение. В итоге: длинные сессии с облачными провайдерами остаются предсказуемыми. Для полного контроля — поднимайте llama.cpp локально, цена за токен нулевая.

Question 18

Могу ли я внести свой вклад в WebBrain?

Accepted Answer

Конечно! WebBrain под лицензией MIT и приветствует контрибьюции. Загляните в репозиторий на GitHub — там issue, фича-реквесты и правила контрибьюции.

Параметр	WebBrain	Claude в Chrome
Open-source	Лицензия MIT	Проприетарно
Цена	Навсегда бесплатно	Нужен Claude Pro ($20/мес)
Поддержка локальных LLM	llama.cpp, Ollama	Нет — только Claude
Мульти-провайдер	All OpenAI-compatible endpoints	Только Claude
Chrome	Да (MV3)	Да
Firefox	Да (MV2)	Нет
Интерфейс в боковой панели	Да	Да
Режимы «Спросить» / «Действовать»	Да	Похоже
Полностью офлайн	Да (с локальным LLM)	Нет — нужно облако
Self-hosted	Да	Нет

Аспект	WebBrain	OpenClaw / Browser-Use / и т.п.
Что это?	Браузерное расширение (для конечного пользователя)	Agent-фреймворк / SDK (для разработчиков)
Целевой пользователь	Любой — программирование не требуется	Разработчики, собирающие автоматизации
Установка	Установка в браузер в один клик	Требуется Python/Docker
Интерфейс	Встроенный чат в боковой панели	Без UI — только код или API
Управление браузером	Content script (легковесно)	CDP / Playwright (полный контроль)
Сценарии с несколькими вкладками	Отдельный чат для каждой вкладки	Программируемая оркестрация нескольких вкладок
Headless-режим	Нет — работает в вашем браузере	Да — headless-автоматизация
Расширяемость	Добавление своих LLM-провайдеров	Полноценный Python SDK, кастомные инструменты
Лучше всего для	Ежедневный AI-помощник при сёрфинге	Автоматический скрейпинг / тест-пайплайны

Open-source AI-агент для браузера

Каталог товаров

WebBrain в действии

Всё, что нужно от AI в браузере

Понимание страницы

Полноценный браузерный агент

Извлечение данных

Поддержка разных LLM

Сначала приватность

Умный контекст

Отдельная модель для зрения

Автозаполнение профиля

Понимает Cookie и paywall

Optional CAPTCHA Solver

Многоязычный интерфейс

Бережём токены

Свой AI с собой

Спросить или Действовать

Режим «Спросить»

Режим «Действовать»

Установить WebBrain

Chrome и Chromium

Firefox

Чем отличается WebBrain?

В сравнении с AI-плагинами для браузера

В сравнении с AI-фреймворками для агентов (другая категория)

Часто задаваемые вопросы

Расскажите, поделитесь любовью