Question 1

WebBrain は Claude のブラウザプラグインの無料代替ですか?

Accepted Answer

はい。WebBrain は同様の AI ブラウザエージェント機能を提供します — ページを読み、データを抽出し、ボタンをクリックし、フォームを入力し、多段のワークフローを自動化します。Claude Pro のサブスクリプションが必要で Anthropic のモデルしか使えないプロプライエタリな Claude のプラグインと違い、WebBrain は完全無料・オープンソース (MIT ライセンス) で、ローカルマシン上で完全に動作するモデルも含め、複数の LLM プロバイダーに対応しています。

Question 2

WebBrain Cloud のサブスクリプション料金はいくらですか？

Accepted Answer

WebBrain Cloud は現在、デバイスプロファイルごとに月額 5 ドルです。当面は Claude Pro よりかなり安価です。現在はフェアユースポリシーの範囲内で無制限に利用できます。通常の個人利用は問題ありませんが、悪用、自動化された大量利用、再販売、通常を大きく超える高負荷利用は認められません。 サブスクリプションはユーザーアカウントではなく、拡張機能がそのブラウザ + OS GUID に対して生成するデバイス識別子に紐づきます。拡張機能のストレージをリセットする、ブラウザプロファイルを削除する、ブラウザを再インストールする、ブラウザ/OS を変更する、またはデバイスを失うことでこの識別子が失われた場合、復旧や移行はできず、その損失に対する返金も行いません。 プラグイン設定ページの Account セクションにある Manage billing ボタンから、購読または請求管理ができます。手動で解約する場合は、決済時に使用したメールアドレスでメールしてください。

Question 3

WebBrain は OpenClaw や Browser-Use など、他の AI エージェントフレームワークとどう違いますか?

Accepted Answer

それらは別カテゴリのツールです。WebBrain はブラウザ拡張で、Chrome や Firefox にインストールし、サイドパネルでチャットします。コーディングは不要です。OpenClaw や Browser-Use のようなフレームワークは、Python で自動ブラウザパイプラインを構築するための開発者向け SDK で、通常はヘッドレスブラウザと CDP を使います。要するに WebBrain は日常のブラウジングを AI アシスタントと一緒に行うためのもの、エージェントフレームワークはスクレイピングボットやテスト自動化を作るためのもの。両方を併用してもよく、補完関係にあります。

Question 4

WebBrain は完全にオフラインで使えますか?

Accepted Answer

はい。WebBrain のデフォルトプロバイダーは llama.cpp で、ローカルの AI モデルをあなたのコンピューター上で実行します。API キーは不要、AI の利用にインターネットは不要、データもマシンから出ません。GGUF モデルをダウンロードして llama-server を起動すれば、完全にプライベートな AI ブラウザエージェントが手に入ります。Ollama の OpenAI 互換エンドポイントも使えます。

Question 5

WebBrain はどの AI モデルに対応していますか?

Accepted Answer

WebBrain は 4 種類のプロバイダーに対応しています: llama.cpp (任意のローカル GGUF モデル)、OpenAI (GPT-4o、GPT-4 など)、Claude (ネイティブ API 経由で Claude Opus、Sonnet、Haiku)、OpenRouter (さまざまなプロバイダーの 100 を超えるモデルにアクセス)。OpenAI 互換の API エンドポイントなら何でも動くので、Together AI、Groq、Mistral、あるいは OpenAI 互換インターフェイスを備えた任意のローカルサーバーも使えます。

Question 6

いちばんおすすめのモデルは?

Accepted Answer

2026 年 4 月 21 日 時点でのトップ推奨は Qwen 3.6 35B です。理由: 当方のビジョンベンチマーク (vision-model-shootout) で、スクリーンショット理解において Gemma 4 を上回り、ローカル推論でも実用的なままでした。 コンシューマー GPU なら RTX 5090 が理想で、RTX 4090 でも Intel/Qwen3.6-35B-A3B-int4-AutoRound による INT4 AutoRound 量子化で多くの場合実用に足ります。 最高速度を狙うなら vLLM でサーブすることをおすすめします。コマンド例: python -u -m vllm.entrypoints.openai.api_server --model Intel/Qwen3.6-35B-A3B-int4-AutoRound --served-model-name qwen3.6-35b --quantization auto --dtype bfloat16 --max-model-len 65536 --max-num-batched-tokens 32768 --max-num-seqs 4 --host 0.0.0.0 --port 8000 --gpu-memory-utilization 0.92 --enable-prefix-caching --enable-chunked-prefill --limit-mm-per-prompt '{"image": 4, "video": 1}' --mm-processor-cache-type shm --reasoning-parser qwen3 --enable-auto-tool-choice --tool-call-parser qwen3_coder --trust-remote-code --allowed-origins '["*"]' --speculative-config '{"method": "dflash", "model": "z-lab/Qwen3.6-35B-A3B-DFlash", "num_speculative_tokens": 15}' --attention-backend flash_attn DFlash speculative decoding は任意です。

Question 7

ネットワーク上のローカル LLM サーバー (vLLM、Ollama、llama.cpp) に接続すると「Failed to fetch」が出ます

Accepted Answer

LLM サーバーがローカルネットワーク上の別のマシン (例: http://192.168.1.x:8000) にある場合、サーバーが CORS ヘッダー を返さないと Chrome がリクエストをブロックします。対処はサーバーごとに異なります: vLLM: --allowed-origins '["*"]' 付きで起動 (値は必ず JSON 配列)。 Ollama: 起動前に環境変数 OLLAMA_ORIGINS=* を設定。 llama.cpp: CORS はデフォルトで有効 — 変更不要です。 サーバーが localhost (ブラウザと同じマシン) で動いている場合、通常 CORS は不要です。問題が出るのはローカルネットワークの別マシンに接続するときだけ。WebBrain の設定で Base URL が /v1 で終わっていることも確認してください (例: http://192.168.1.47:8000/v1)。 例外: ブラウザ拡張機能から Ollama を使う場合は、同じマシンでも OLLAMA_ORIGINS が必要になることがあります。下の Ollama FAQ を参照してください。

Question 8

localhost の Ollama が WebBrain 拡張機能から 403 を返すのはなぜですか？

Accepted Answer

最近の Ollama は、同じマシン上で動作していても、ブラウザ拡張機能の origin からのリクエストを拒否することがあります。拡張機能は chrome-extension://... や moz-extension://... のような Origin を送信するため、それらの origin が許可されていないと Ollama が 403 を返す場合があります。 すでにポート 11434 を使用している Ollama デスクトップアプリを終了し、次のいずれかで Ollama を起動してください。 OLLAMA_ORIGINS="*" ollama serve OLLAMA_ORIGINS="chrome-extension://*,moz-extension://*" ollama serve WebBrain の Ollama ベース URL は http://localhost:11434/v1 のままにしてください。ターミナルの curl チェックはブラウザ拡張機能の origin を送信しないため、この設定なしでも成功することがあります。

Question 9

WebBrain は Firefox で動きますか?

Accepted Answer

はい。WebBrain は Chrome 版 (Manifest V3、sidePanel API を使用) と Firefox 版 (Manifest V2、sidebar_action を使用) の両方を提供します。機能はどちらも同じです。Firefox 版は開発用の一時的なアドオンとして読み込むこともでき、addons.mozilla.org に公開して恒久インストールすることもできます。

Question 10

Chrome のサイドパネルのように、Firefox のサイドバーを左から右に移動できますか?

Accepted Answer

はい — Firefox のサイドバーはデフォルトでは左ですが、移動できます。サイドバーのヘッダー上で右クリックし、「サイドバーを右に移動」を選びます (メニューバーの 「表示 → サイドバー → サイドバーを右に移動」 でも可)。位置は再起動後も保持されます。Chrome の sidePanel はデフォルトで右側にあり、パネル自体からユーザーが移動することはできません。

Question 11

WebBrain は安全ですか? Web ページを変更しますか?

Accepted Answer

WebBrain には 2 つのモードがあります。質問モード (デフォルト) は読み取り専用で、ページ上の何も変更できません。実行モードはフルブラウザエージェント機能 (クリック、入力、ナビゲーション) を有効にしますが、起動前に明示的なユーザー確認が必要で、目に見える警告バナーが表示されます。エージェントは「停止」ボタンでいつでも止められます。拡張のソースコードは GitHub で完全公開されており、監査可能です。

Question 12

「WebBrain started debugging this browser」のバナーとは何ですか?なぜ WebBrain は CDP を使うのですか?

Accepted Answer

ページ上で確実に操作するため、WebBrain は標準の拡張機能 API である chrome.debugger を介して Chrome DevTools Protocol(CDP)を使用します。これが Chrome の「WebBrain started debugging this browser」バナーが表示される理由です。CDP により、エージェントは最新のサイトが実際に受け入れる信頼された入力イベントでクリックや入力を行えます。content script から発行される合成イベントは、多くのサイト・Web Components・フレームワーク制御の入力欄で拒否されます。また WebBrain はこれを使って、ビジョンのフォールバック用にピクセル精度のスクリーンショットを取得し、content script からは見えないクロスオリジンの iframe や shadow DOM にアクセスします。 読み取り専用の質問モードは CDP を必要としません。ページやアクセシビリティツリーの読み取りは通常の content script を通ります。CDP が必要なのは実行モードの信頼性とクロスオリジン処理であり、Manifest V3 拡張機能には信頼された入力のためのデバッガ不要の API は存在しません。WebBrain はデバッガを操作が必要なときだけタブごとにアタッチし、拡張機能全体がオープンソースなので、セッションが何をしているかを正確に監査できます。CDP は強力なので、その影響範囲は抑えるべきものとして扱い(必要なときだけアタッチし、読み取りには使わない)、さらに絞り込むことをセキュリティのロードマップに含めています。

Question 13

質問が多すぎます。無効にできますか？

Accepted Answer

これらの承認プロンプトは安全のためにあります。信頼しているサイトであっても、悪意ある第三者が LLM の指示をまねたり、コンテンツを注入したりして、あなたが承認しない操作をエージェントに代行させようとする可能性があります。そのため WebBrain は、重大な結果につながる操作の前に承認を求めます。それでもこれらのプロンプトを省略したい場合は無効にできます。サイドプラグインを開き、ヘッダーの歯車アイコンをクリックし、settings.html の Permissions タブに移動して、Ask before consequential actions をオフにしてください。

Question 14

Web スクレイピングやデータ抽出に WebBrain をどう使えばよいですか?

Accepted Answer

任意の Web ページを開き、WebBrain のサイドパネルを開いて、自然言語で頼むだけです。「このページのすべての製品名と価格を抽出して」「このページにあるメールアドレスを全部取得して」「この記事を箇条書きで要約して」。AI エージェントはページ内容を読み、構造を理解し、抽出データを返します。より複雑なスクレイピングをしたいときは実行モードに切り替えれば、ページ間を移動し、ページネーションのボタンを押し、複数ページのデータを集約できます。

Question 15

WebBrain は API を直接呼びますか、それとも常に UI 経由でクリックしますか?

Accepted Answer

デフォルトでは、WebBrain は何かを作成・変更・削除・送信・送出・投稿・購入するあらゆる操作を、必ず可視 UI 経由で行います。ページに移動し、フォームを埋め、ボタンを押す — あなたが普段やる手順そのままです。バックグラウンドの fetch() で REST/GraphQL エンドポイントを直接呼んでミューテーションを行うことは拒否します。これは意図的なものです: API 操作は不可視で (何が送られているかが見えません)、別途設定が必要な認証トークンを要求することが多く、可視のクリックミス 1 つよりはるかに広い影響範囲を持ちます。UI-first とはつまり、すべてが画面上、いつもの認証済みブラウザセッション内で起こり、いつでも止められるということです。 データの読み取り — README を取りに行く、issue を調べる、サイト間で価格を比較する、ステータスページを確認するなど — については、WebBrain は fetch_url や research_url ツール経由でバックグラウンド HTTP リクエストを自由に使います。読み取りは操作とは違い、リモートサービス上の何も変えないので、同じ安全上の懸念は当てはまりません。 特定のタスクで API ミューテーションを許可したい場合は、メッセージ冒頭に /allow-api と入力します (短いタスク記述を続けても構いません)。この会話単位のオーバーライドにより、UI が本当に動かない/使えないときには WebBrain が API エンドポイントにフォールバックできるようになりますが、UI で済む場合は UI を優先するという方針は維持されます。オーバーライドが有効な間、入力欄の上に固定のバッジが表示され、会話をリセットすると解除されます。

Question 16

LM Studio でも使えますか?

Accepted Answer

はい。WebBrain の読み取り専用ネットワークツール — fetch_url と research_url — は単独の LM Studio プラグインとしても webbrain/web-tools で提供されています。lms clone webbrain/web-tools でインストールし、LM Studio の任意のチャットでオンに切り替えれば、ツール呼び出しに対応した任意のモデルが、ブラウザ拡張を入れなくてもこの 2 つのツールを呼び出せます。純粋な Node で、ヘッドレスブラウザは不要。ソース: lmstudio-plugin/。

Question 17

WebBrain がページで作業中、別のタブに切り替えても大丈夫ですか?

Accepted Answer

Chrome なら大丈夫です — エージェントはバックグラウンドの service worker で動き、起動時のタブに紐づけられているので、フォーカスを他に移してもそのタブで引き続きクリック・入力・読み取りを行います。タブを対象とするツール (CDP のクリック、入力、ナビゲーション、スクリーンショット) は、Chrome ではバックグラウンドタブでもすべて動作します。タスク実行中はサイドバーが入力欄をロックするので、新しいタブで誤って 2 つ目のタスクを開始してしまうことはありません — 待つか、現在のタスクを止める必要があります。なお、ブラウザはバックグラウンドタブのタイマーやアニメーションを絞るので、アニメーションの多いサイトでは反応がやや遅くなることがあります。 Firefox でもエージェントは元のタブで動き続けますが、自動スクリーンショットには制限があります。Firefox のスクリーンショット API は現在アクティブなタブしか撮れず、バックグラウンドの特定タブは撮れません。WebBrain はこれを検知し、関係ないページの画像をモデルに食わせる代わりに、その回はスクリーンショットをスキップします。エージェントはあなたがそのタブに戻るまで、テキストベースの文脈で計画を続けます。 エージェントが作業しているのと同じタブで自分から積極的にクリックや入力をするのは避けてください — あなたとエージェントが同じページを取り合うレース状態になります。タブを切り替えるのはかまいませんが、同じタブを共同運転するのはダメです。

Question 18

プロフィール自動入力はどう動きますか? 安全ですか?

Accepted Answer

プロフィール自動入力は 設定 → プロフィール にあるオプション機能です。短い bio — 名前、仕事用メール、所属、低リスクなサインアップ向けの使い捨てパスワード — を入力してオンにします。有効にすると、WebBrain はそのテキストをエージェントのシステムプロンプトに付け足し、毎回聞かずにサインアップフォームを埋められるようにします。 テキストはブラウザのローカルストレージに平文で保存されます。WebBrain プロジェクトへは送信されませんが、設定済みの LLM プロバイダーへはシステムプロンプトの一部として毎ターン送信されます。既定はオフです。 ここに重要アカウント (Google、Apple、iCloud、銀行、社内 SSO、メインのメール) のパスワードは絶対に入れないでください。それらは 2FA を有効にすべきで、そもそもエージェントに渡すべきではありません。意図された使い方は、ニュースレターの登録や無料体験などで使い回す使い捨てパスワードです。

Question 19

WebBrain は Cookie バナーやペイウォールをどう扱いますか?

Accepted Answer

Cookie バナー: WebBrain は一般的なフレームワーク (OneTrust、Cookiebot、Didomi、Quantcast、Google Funding Choices、TrustArc) の同意バナーを認識し、ページについて推論する前に閉じます。優先順位は「すべて拒否」/「必須でないものを拒否」/「必要なものだけ」がはっきり見えるときはそれら。そうでなければ「すべて受け入れる」にフォールバックし、「設定を管理」の迷路にハマるのを避けます。 ペイウォール: WebBrain はペイウォールがあれば正直にそれを報告し、実際に見えた範囲 (見出し、リード、最初の段落) を伝えます。ペイウォールの迂回は試みません — archive.today も 12ft.io も、Cookie の削除も JS の無効化もリーダーモードのトリックも使いません。記事全文が必要なら、サブスクでログインするか、同じ話題を扱う無料の記事を WebBrain に探してもらってください。

Question 20

WebBrain は dry-run モードに対応していますか?

Accepted Answer

7.0.0 時点では未対応です。dry-run モードは計画済みで、すでにロードマップに載っています。

Question 21

WebBrain はどうやってクラウド LLM の請求を抑えていますか?

Accepted Answer

独立した 3 層構造です: トークンに配慮したスクリーンショット。 画像があなたのマシンから出ていく前に、WebBrain はリサイズ (短辺をキャップしつつアスペクト比を維持) し、JPEG で反復的に圧縮して 1 ターンあたりの画像トークン予算に収めます。GPT-4o で約 1,500 入力トークンかかる 2000×1200 のスクリーンショットも、ページ読み取り用途では実用上の損失なく ~300–500 トークンに圧縮されます。実装は _fitImageDimensions にあり、予算計算のユニットテストも備えています。 スマートなコンテキストトリミング。 会話履歴、ツール出力、インラインの DOM ダンプは 1 ターンあたりで上限がかかり、アクティブモデルのコンテキスト窓が満杯に近づくと古いものから順にトリミングされます。read_page が小説並みの長さの記事を返したからといって、実行が静かに 10k トークンから 100k トークンに膨らむことはありません。 専用の画像認識モデル。 計画とツール呼び出しには安いテキストモデル (例: GPT-4o-mini)、スクリーンショットだけは別の画像認識対応モデル (例: GPT-4o) というふうに組み合わせれば、毎ターン マルチモーダルモデルの料金を払わずに済みます。設定は 設定 → 画像認識 から。 結果として、クラウドプロバイダーとの長時間セッションは予測可能なままです。完全な制御が欲しいなら、ローカルで llama.cpp を — トークン単価はゼロです。

Question 22

WebBrain にコントリビュートできますか?

Accepted Answer

もちろんです! WebBrain は MIT ライセンスでコントリビュートを歓迎します。Issue、機能要望、コントリビューションガイドラインは GitHub リポジトリ をご覧ください。

機能	WebBrain	Claude in Chrome
オープンソース	MIT ライセンス	プロプライエタリ
価格	永久無料	Claude Pro が必要 ($20/月)
ローカル LLM 対応	llama.cpp、Ollama	なし — Claude のみ
マルチプロバイダー	All OpenAI-compatible endpoints	Claude のみ
Chrome	あり (MV3)	あり
Firefox	あり (MV2)	なし
サイドパネル UI	あり	あり
質問 / 実行モード	あり	類似
完全オフライン	可 (ローカル LLM 利用時)	不可 — クラウド必須
セルフホスト可	あり	なし

観点	WebBrain	OpenClaw / Browser-Use / その他
これは何?	ブラウザ拡張 (エンドユーザー向けツール)	エージェントフレームワーク / SDK (開発者向けツール)
対象ユーザー	誰でも — コーディング不要	自動化を構築する開発者
インストール	ブラウザにワンクリック	Python/Docker のセットアップが必要
UI	サイドパネルのチャットを内蔵	UI なし — コード/API のみ
ブラウザ制御	Content script (軽量)	CDP / Playwright (フル制御)
マルチタブワークフロー	タブごとの会話	プログラム可能なマルチタブのオーケストレーション
ヘッドレスモード	なし — あなたのブラウザ内で動作	あり — ヘッドレス自動化
拡張性	カスタム LLM プロバイダーを追加可能	本格的な Python SDK、カスタムツール
向いている用途	日常のブラウジング AI アシスタント	自動スクレイピング / テストパイプライン

オープンソースの AI ブラウザエージェント

製品カタログ

ローカル AI の未来

WebBrain の動作を見る

WebBrain が主導権を保つ仕組み

ブラウザ AI に必要なものすべて

ページ理解

フル機能のブラウザエージェント

データ抽出

マルチプロバイダー LLM

プライバシー第一

スマートコンテキスト

専用の画像認識モデル

プロフィール自動入力

Cookie & ペイウォール対応

Optional CAPTCHA Solver

多言語 UI

トークンに配慮

自分の AI を持ち込む

質問する、行動させる

質問モード

実行モード

WebBrain をインストール

Chrome / Chromium

Firefox

WebBrain は他と何が違う?

vs. ブラウザ AI プラグイン

vs. AI エージェントフレームワーク (別カテゴリ)

よくある質問

広めて、思いを共有