WebBrain — безкоштовне open-source розширення, яке додає можливості AI-агента у Chrome та Firefox. Читайте сторінки, видобувайте дані й автоматизуйте веб-задачі — на будь-якій LLM на ваш вибір. Self-hosted альтернатива пропрієтарним браузерним AI-плагінам.
Подивіться, як WebBrain читає сторінки, видобуває дані та автоматизує задачі в браузері.
Повноцінний AI-агент, який живе в бічній панелі браузера й розуміє будь-яку веб-сторінку.
Читає та розуміє будь-яку веб-сторінку — статті, документацію, дашборди, форми. Ставте запитання й одразу отримуйте відповіді за вмістом поточної сторінки.
Клікає, друкує, гортає, навігує та взаємодіє зі сторінками за вас. Автоматизуйте рутинні задачі інструкціями природною мовою.
Видобуває структуровані дані з будь-якої сторінки — таблиці, списки, посилання, форми. Експортуйте каталоги товарів, результати пошуку або будь-який вміст. Працює і з PDF.
Працює з локальним llama.cpp, OpenAI, Claude та OpenRouter. Використовуйте улюблену модель — або працюйте повністю офлайн із локальним AI.
Ваші дані залишаються вашими. Із локальним LLM — нуль витоку даних. Жодної телеметрії, відстеження чи акаунтів. Повністю open-source.
Автоматичне керування контекстом не дає переповнитись вікну токенів. Розумно підрізає історію діалогу й обмежує вивід інструментів — сесія йде рівно й без зривів.
Поєднайте швидку текстову модель для планування з окремою vision-моделлю для читання скриншотів. Дешевше та швидше, ніж проганяти все через одну велику мультимодальну.
Опціональна plain-text біографія — ім'я, робочий email, компанія, одноразовий пароль — дозволяє агенту легко проходити маловажливі реєстрації, не питаючи щоразу. За замовчуванням вимкнено, усе зберігається локально.
Закриває банери згоди (OneTrust, Cookiebot, Didomi, Quantcast), перш ніж аналізувати сторінку. Розпізнає paywall і чесно повідомляє про нього, а не вигадує текст статті й не намагається його обійти.
Plug in a CapSolver API key and the agent will auto-solve reCAPTCHA v2/v3, hCaptcha, and Cloudflare Turnstile when they block a step — instead of stopping to ask. Off by default, BYO key, no captcha service is shipped or contacted unless you turn it on.
Плагін доступний у English, Español, Français, Türkçe та 中文. При першому запуску автоматично визначає мову браузера; перемикайте будь-коли значком глобуса в бічній панелі. Маркетинговий сайт локалізовано відповідно.
Скриншоти зменшуються за розміром та ітеративно стискаються в JPEG, перш ніж покинути вашу машину, — image-токени лишаються маленькими. Розумне підрізання контексту та обмеження виводу інструментів роблять хмарні рахунки передбачуваними — жодних сюрпризів у довгих сесіях.
Підключайтеся до будь-якого OpenAI-сумісного API або запускайте локальну модель. Змінюйте провайдера будь-коли в налаштуваннях розширення.
Доступно для Chrome і Firefox. Безкоштовно, open-source, акаунт не потрібен.
Manifest V3 · Chrome 116+ · Також працює в Brave, Edge, Opera, Vivaldi та інших Chromium-сумісних браузерах.
WebBrain стоїть на перетині нативних AI-плагінів для браузера та повноцінних agent-фреймворків. Ось як він виглядає в порівнянні.
| Параметр | WebBrain | Claude у Chrome |
|---|---|---|
| Open-source | Ліцензія MIT | Пропрієтарно |
| Ціна | Назавжди безкоштовно | Потрібен Claude Pro ($20/міс) |
| Підтримка локальних LLM | llama.cpp, Ollama | Ні — лише Claude |
| Мульти-провайдер | All OpenAI-compatible endpoints | Лише Claude |
| Chrome | Так (MV3) | Так |
| Firefox | Так (MV2) | Ні |
| Інтерфейс у бічній панелі | Так | Так |
| Режими «Запитати» / «Діяти» | Так | Схоже |
| Повністю офлайн | Так (із локальним LLM) | Ні — потрібна хмара |
| Self-hosted | Так | Ні |
| Аспект | WebBrain | OpenClaw / Browser-Use / тощо |
|---|---|---|
| Що це? | Браузерне розширення (для кінцевого користувача) | Agent-фреймворк / SDK (для розробників) |
| Цільовий користувач | Будь-хто — кодити не потрібно | Розробники, що будують автоматизації |
| Встановлення | Встановлення в браузер в один клік | Потрібен Python/Docker |
| Інтерфейс | Вбудований чат у бічній панелі | Без UI — лише код або API |
| Керування браузером | Content script (легко) | CDP / Playwright (повний контроль) |
| Сценарії з кількома вкладками | Окрема розмова для кожної вкладки | Програмована оркестрація багатьох вкладок |
| Headless-режим | Ні — працює у вашому браузері | Так — headless-автоматизація |
| Розширюваність | Додавання своїх LLM-провайдерів | Повноцінний Python SDK, кастомні інструменти |
| Найкраще для | Щоденний AI-помічник у браузері | Автоматичний скрейпінг / тест-пайплайни |
WebBrain — браузерне розширення для кінцевих користувачів, яким потрібен AI-помічник прямо під час серфінгу. Agent-фреймворки на кшталт OpenClaw — це інструменти для розробників, які будують автоматичні браузерні пайплайни. Різні інструменти під різні задачі — і їх можна використовувати разом.
Так. WebBrain дає схожі можливості AI-агента в браузері — читає сторінки, видобуває дані, натискає кнопки, заповнює форми та автоматизує багатокрокові сценарії. На відміну від пропрієтарного плагіна Claude, що потребує підписки Claude Pro і працює лише з моделями Anthropic, WebBrain повністю безкоштовний, open-source (ліцензія MIT) і підтримує різних LLM-провайдерів, зокрема локальні моделі, що повністю працюють на вашій машині.
Це різні категорії інструментів. WebBrain — браузерне розширення: ставите його у Chrome або Firefox і спілкуєтеся з ним у бічній панелі, без коду. OpenClaw, Browser-Use і подібні фреймворки — SDK для розробників, щоб будувати автоматичні браузерні пайплайни на Python, зазвичай через headless-браузер і CDP. Іншими словами: WebBrain — для щоденного серфінгу з AI-помічником; agent-фреймворки — для скрейпінг-ботів та автотестів. Ними можна користуватися паралельно — вони доповнюють одне одного.
Так. За замовчуванням WebBrain використовує llama.cpp, який запускає локальну AI-модель просто у вас на комп'ютері. API-ключі не потрібні, інтернету AI не потребує, дані не покидають машину. Завантажте GGUF-модель, запустіть llama-server — і у вас повністю приватний AI-агент у браузері. Також можна користуватися Ollama через його OpenAI-сумісний ендпоінт.
WebBrain підтримує чотири типи провайдерів: llama.cpp (будь-яка локальна GGUF-модель), OpenAI (GPT-4o, GPT-4 тощо), Claude (Claude Opus, Sonnet, Haiku через нативний API) та OpenRouter (доступ до 100+ моделей від різних провайдерів). Підходить будь-який OpenAI-сумісний ендпоінт, тож можна використовувати Together AI, Groq, Mistral або будь-який локальний сервер з OpenAI-сумісним інтерфейсом.
Станом на 21 квітня 2026 головна рекомендація — Qwen 3.6 35B. Чому: у нашому vision-бенчмарку (vision-model-shootout) вона обігнала Gemma 4 на розумінні скриншотів, залишаючись практичною для локального інференсу.
Для споживчих GPU ідеальний RTX 5090, а RTX 4090 зазвичай придатний з INT4 AutoRound-квантуванням через Intel/Qwen3.6-35B-A3B-int4-AutoRound.
Для максимальної швидкості рекомендуємо обслуговувати через vLLM. Приклад команди:
python -u -m vllm.entrypoints.openai.api_server --model Intel/Qwen3.6-35B-A3B-int4-AutoRound --served-model-name qwen3.6-35b --quantization auto --dtype bfloat16 --max-model-len 65536 --max-num-batched-tokens 32768 --max-num-seqs 4 --host 0.0.0.0 --port 8000 --gpu-memory-utilization 0.92 --enable-prefix-caching --enable-chunked-prefill --limit-mm-per-prompt '{"image": 4, "video": 1}' --mm-processor-cache-type shm --reasoning-parser qwen3 --enable-auto-tool-choice --tool-call-parser qwen3_coder --trust-remote-code --allowed-origins '["*"]' --speculative-config '{"method": "dflash", "model": "z-lab/Qwen3.6-35B-A3B-DFlash", "num_speculative_tokens": 15}' --attention-backend flash_attn
DFlash speculative decoding — опційно.
Якщо LLM-сервер запущено на іншій машині в локальній мережі (наприклад, http://192.168.1.x:8000), Chrome блокує запит, поки сервер не віддасть CORS-заголовки. Розв'язання залежить від сервера:
vLLM: запускайте з --allowed-origins '["*"]' (значення обов'язково — JSON-список).
Ollama: перед стартом установіть змінну середовища OLLAMA_ORIGINS=*.
llama.cpp: CORS увімкнено за замовчуванням — змінювати нічого не треба.
Якщо сервер працює на localhost (на тій самій машині, що й браузер), CORS зазвичай не потрібен. Проблема виникає тільки при зверненні до іншої машини в локальній мережі. Переконайтеся, що Base URL у налаштуваннях WebBrain закінчується на /v1 (наприклад, http://192.168.1.47:8000/v1).
Так. WebBrain постачається у двох версіях: для Chrome (Manifest V3, використовує sidePanel API) та для Firefox (Manifest V2, використовує sidebar_action). Функціональність однакова. Firefox-версію можна завантажити як тимчасове розширення для розробки або опублікувати на addons.mozilla.org для постійного встановлення.
Так — у Firefox бічна панель за замовчуванням ліворуч, але її можна перемістити. Клікніть правою кнопкою по заголовку панелі й виберіть «Перемістити бічну панель праворуч» (або через меню «Перегляд → Бічна панель → Перемістити бічну панель праворуч»). Розташування зберігається між перезапусками. Панель sidePanel у Chrome за замовчуванням праворуч і не пересувається з самої панелі.
У WebBrain два режими: режим «Запитати» (за замовчуванням) працює лише на читання і нічого не змінює на сторінці. Режим «Діяти» дає повноцінні можливості агента (клікати, друкувати, навігувати), але вмикається лише після явного підтвердження користувача й супроводжується помітним банером-попередженням. Агента можна зупинити будь-коли кнопкою «Стоп». Сирці розширення повністю відкриті на GitHub для аудиту.
Просто відкрийте будь-яку сторінку, розгорніть бічну панель WebBrain і сформулюйте задачу природною мовою: «Видобудь усі назви товарів і ціни з цієї сторінки», «Знайди всі email-адреси на сторінці» або «Зроби тезове резюме статті». AI-агент читає вміст сторінки, розуміє структуру і повертає видобуті дані. Для складнішого скрейпінгу перемкніть у режим «Діяти» — агент може переходити між сторінками, натискати кнопки пагінації та збирати дані одразу з кількох.
За замовчуванням для будь-якої дії, що створює, змінює, видаляє, надсилає, публікує, постить чи купує, WebBrain завжди йде через видимий інтерфейс. Він переходить на сторінку, заповнює форму і натискає кнопку — точно так, як зробили б ви. Прямі виклики REST/GraphQL-ендпоінтів через фоновий fetch() для мутацій він не робить. Це навмисно: API-дії невидимі (ви не бачите, що відправляється), часто потребують окремих токенів, які ви могли не налаштувати, і мають набагато більший радіус наслідків, ніж один видимий промах. UI-first означає, що все відбувається на екрані, у звичайній браузерній сесії — і будь-коли це можна зупинити.
Для читання даних — забрати README, переглянути issue, порівняти ціни між сайтами, заглянути на сторінку статусу — WebBrain вільно користується фоновими HTTP-запитами через інструменти fetch_url та research_url. Читання — не дія; воно нічого не змінює на віддаленому сервісі, тож ті самі побоювання тут не діють.
Якщо конкретно для одної задачі ви хочете дозволити API-мутації, на початку повідомлення наберіть /allow-api (можна з коротким описом задачі). Цей перемикач у межах одного діалогу дає WebBrain у разі реальної несправності чи недоступності UI відкочуватись до API-ендпоінтів, проте поки UI працює — пріоритет за ним. Поки перемикач активний, над полем вводу висить липкий бейдж; він скидається при скиданні діалогу.
Так. Read-only мережеві інструменти WebBrain — fetch_url і research_url — також постачаються як окремий плагін для LM Studio за адресою webbrain/web-tools. Встановіть командою lms clone webbrain/web-tools й увімкніть у будь-якому чаті LM Studio — будь-яка модель із підтримкою tool-викликів зможе викликати ці два інструменти, і браузерне розширення ставити не обов'язково. Чистий Node, без headless-браузера. Сирці: lmstudio-plugin/.
Так, у Chrome — агент працює у фоновому service worker і прив'язаний до тієї вкладки, де стартував, тож продовжує натискати, друкувати і читати саме її, навіть якщо ви перевели фокус. Інструменти, націлені на вкладку (CDP-клік, ввід, навігація, скриншот), у Chrome працюють і з фоновими вкладками. Бічна панель блокує ввід, поки задача триває, аби ви випадково не запустили другу на новій вкладці — доведеться зачекати або зупинити поточну. Зверніть увагу, що браузери приглушують таймери й анімації у фоні, тож на сильно анімованих сайтах реакція може бути трохи повільнішою.
У Firefox агент також продовжує працювати на своїй початковій вкладці, але авто-скриншоти обмежені: API скриншотів у Firefox уміє знімати тільки активну вкладку, а не конкретну фонову. WebBrain це розпізнає й пропускає скриншот на цьому ходу, щоб не годувати моделі зображенням чужої сторінки. Агент і далі плануватиме за текстовим контекстом, поки ви не повернетеся на його вкладку.
Не натискайте і не друкуйте самі на тій самій вкладці, де працює агент — це створює гонитви, де ви та агент б'єтеся за одну сторінку. Перемикатися між вкладками — норма; разом кермувати однією — ні.
Автозаповнення профілю — опціональна функція в Налаштування → Профіль. Ви пишете коротке біо — ім'я, робочий email, компанію та одноразовий пароль для маловажливих реєстрацій — і вмикаєте її. Коли її увімкнено, WebBrain додає цей текст до системного prompt агента, щоб той заповнював форми реєстрації, не запитуючи щоразу.
Текст зберігається у відкритому вигляді в локальному сховищі браузера. Він не надсилається в проєкт WebBrain, але надсилається тому LLM-провайдеру, якого ви налаштували, на кожному ходу як частина системного prompt. За замовчуванням вимкнено.
Не вводьте сюди паролі важливих акаунтів (Google, Apple, iCloud, банк, корпоративний SSO, основна пошта). Ці акаунти мають бути з 2FA, і їх у будь-якому разі не варто віддавати агенту. Одноразовий пароль, який ви повторно використовуєте для розсилок і безкоштовних триалів, — те, що треба.
Cookie-банери: WebBrain розпізнає банери згоди популярних фреймворків (OneTrust, Cookiebot, Didomi, Quantcast, Google Funding Choices, TrustArc) і закриває їх, перш ніж починати міркувати про сторінку. Пріоритет — «Відхилити все» / «Відхилити необов'язкові» / «Лише необхідні», якщо вони видимі; інакше погоджується на «Прийняти все», аби не тонути в лабіринті «Керування налаштуваннями».
Paywall: WebBrain чесно повідомляє про paywall і розповідає, що реально зміг побачити (заголовок, підзаголовок, перші абзаци). Він не намагається обійти paywall — жодних archine.today, 12ft.io, чистки cookie, вимкнення JS чи трюків з reader-mode. Потрібна вся стаття — увійдіть за підпискою або попросіть WebBrain пошукати безкоштовне висвітлення тієї самої історії.
Станом на 7.0.0 — ще ні. Режим dry-run заплановано й уже в дорожній карті.
Три незалежні шари:
Скриншоти з турботою про токени. Перш ніж будь-яке зображення покине вашу машину, WebBrain зменшує його (коротка сторона обмежена, пропорції зберігаються) та ітеративно стискає в JPEG, доки воно не вмiститься в бюджет image-токенів на хід. Скриншот 2000×1200, який на GPT-4o обійшовся б приблизно у 1500 вхідних токенів, стискається до ~300–500 токенів без реальної втрати для задач читання сторінок. Реалізовано у _fitImageDimensions, є юніт-тести на розрахунок бюджету.
Розумне підрізання контексту. Історія діалогу, виводи інструментів і вбудовані дампи DOM обмежені на хід і підрізаються від найстаршого, коли контекстне вікно активної моделі наближається до повного. Ви не побачите, як сесія тихо роздувається з 10k токенів до 100k через те, що read_page повернув статтю завдовжки з роман.
Окрема vision-модель. Пара: дешева текстова модель (наприклад, GPT-4o-mini) для планування і tool-викликів плюс окрема vision-модель (наприклад, GPT-4o) лише для скриншотів — і ви не платите ціну мультимодальної моделі на кожному ходу. Налаштовується в Налаштування → Зір.
Підсумок: довгі сесії з хмарними провайдерами лишаються передбачуваними. Для повного контролю — підіймайте llama.cpp локально, ціна за токен нульова.
Звісно! WebBrain під ліцензією MIT і вітає внески. Зазирніть у репозиторій на GitHub — там issue, запити фіч та правила контрибуції.