WebBrain adalah ekstensi peramban gratis dan open-source yang membawa kapabilitas agen AI ke Chrome dan Firefox. Baca halaman, ekstrak data, dan otomatiskan tugas web — ditenagai LLM pilihan Anda. Alternatif yang bisa di-host sendiri untuk plugin AI peramban berpemilik.
Lihat bagaimana WebBrain membaca halaman, mengekstrak data, dan mengotomatiskan tugas peramban.
Agen AI berfitur lengkap yang tinggal di panel samping peramban dan memahami halaman web apa pun.
Membaca dan memahami halaman web apa pun — artikel, dokumentasi, dasbor, formulir. Ajukan pertanyaan dan dapatkan jawaban instan dari isi halaman saat ini.
Mengklik, mengetik, menggulir, menavigasi, dan berinteraksi dengan halaman atas nama Anda. Otomatiskan tugas berulang dengan instruksi bahasa natural.
Ekstrak data terstruktur dari halaman apa pun — tabel, daftar, tautan, formulir. Ekspor katalog produk, hasil pencarian, atau isi halaman apa pun. Bekerja dengan PDF.
Bekerja dengan llama.cpp lokal, OpenAI, Claude, dan OpenRouter. Gunakan model pilihan Anda — atau jalankan sepenuhnya offline dengan AI lokal.
Data Anda tetap milik Anda. Jalankan dengan LLM lokal untuk nol kebocoran data. Tanpa telemetri, tanpa pelacakan, tanpa akun. Sepenuhnya open-source.
Manajemen konteks otomatis mencegah token meluap. Memangkas riwayat percakapan dengan cerdas dan membatasi keluaran alat agar sesi berjalan mulus tanpa terputus.
Pasangkan model teks cepat untuk perencanaan dengan model visi terpisah untuk membaca tangkapan layar. Lebih murah dan lebih cepat dibanding menggunakan satu model multimodal besar untuk semuanya.
Bio plaintext opsional — nama, email kerja, perusahaan, kata sandi sekali pakai — membuat agen melewati formulir pendaftaran berisiko rendah tanpa bertanya setiap kali. Mati secara bawaan, semuanya disimpan secara lokal.
Menutup spanduk persetujuan (OneTrust, Cookiebot, Didomi, Quantcast) sebelum menalar isi halaman. Mendeteksi paywall dan memberi tahu Anda dengan jujur, alih-alih mengarang isi artikel atau mencoba menerobosnya.
Plug in a CapSolver API key and the agent will auto-solve reCAPTCHA v2/v3, hCaptcha, and Cloudflare Turnstile when they block a step — instead of stopping to ask. Off by default, BYO key, no captcha service is shipped or contacted unless you turn it on.
Plugin tersedia dalam English, Español, Français, Türkçe, dan 中文. Mendeteksi bahasa peramban Anda secara otomatis saat pertama kali digunakan; ganti kapan saja melalui ikon bola dunia di panel samping. Situs marketing dilokalisasi senada.
Tangkapan layar diubah ukurannya dan dikompresi JPEG secara iteratif sebelum meninggalkan mesin Anda, sehingga token gambar tetap kecil. Pemangkasan konteks cerdas dan batas keluaran alat menjaga tagihan cloud tetap terprediksi — tanpa pengeluaran kejutan pada sesi panjang.
Hubungkan ke API kompatibel OpenAI apa pun atau jalankan model lokal. Ganti penyedia kapan saja dari pengaturan ekstensi.
Tersedia untuk Chrome dan Firefox. Gratis, open-source, tanpa akun.
Manifest V3 · Chrome 116+ · Juga bekerja dengan Brave, Edge, Opera, Vivaldi, dan peramban kompatibel-Chromium lain.
WebBrain berada di persimpangan plugin AI peramban dan kerangka kerja agen penuh. Berikut posisinya.
| Fitur | WebBrain | Claude di Chrome |
|---|---|---|
| Open Source | Lisensi MIT | Tertutup |
| Harga | Gratis selamanya | Butuh Claude Pro ($20/bulan) |
| Dukungan LLM lokal | llama.cpp, Ollama | Tidak — Claude saja |
| Multi-penyedia | All OpenAI-compatible endpoints | Claude saja |
| Chrome | Ya (MV3) | Ya |
| Firefox | Ya (MV2) | Tidak |
| UI panel samping | Ya | Ya |
| Mode Tanya / Aksi | Ya | Mirip |
| Sepenuhnya offline | Ya (dengan LLM lokal) | Tidak — butuh cloud |
| Bisa di-host sendiri | Ya | Tidak |
| Aspek | WebBrain | OpenClaw / Browser-Use / dll. |
|---|---|---|
| Ini apa? | Ekstensi peramban (alat pengguna akhir) | Kerangka agen / SDK (alat pengembang) |
| Pengguna sasaran | Siapa saja — tanpa coding | Pengembang yang membangun otomasi |
| Pemasangan | Pemasangan peramban satu klik | Perlu setup Python/Docker |
| UI | Obrolan panel samping bawaan | Tanpa UI — hanya kode atau API |
| Kendali peramban | Content script (ringan) | CDP / Playwright (kendali penuh) |
| Alur kerja multi-tab | Percakapan per tab | Orkestrasi multi-tab terprogram |
| Mode headless | Tidak — berjalan di peramban Anda | Ya — otomasi headless |
| Ekstensibilitas | Tambahkan penyedia LLM kustom | Python SDK penuh, alat kustom |
| Cocok untuk | Asisten AI peramban sehari-hari | Pipeline scraping / pengujian otomatis |
WebBrain adalah ekstensi peramban untuk pengguna akhir yang menginginkan asisten AI saat menjelajah. Kerangka agen seperti OpenClaw adalah alat pengembang untuk membangun pipeline peramban otomatis. Alat yang berbeda untuk pekerjaan yang berbeda — dan Anda bisa menggunakan keduanya.
Ya. WebBrain menyediakan kapabilitas agen peramban AI yang serupa — membaca halaman, mengekstrak data, mengklik tombol, mengisi formulir, dan mengotomatiskan alur kerja multi-langkah. Tidak seperti plugin peramban Claude berpemilik yang membutuhkan langganan Claude Pro dan hanya bekerja dengan model Anthropic, WebBrain sepenuhnya gratis, open-source (lisensi MIT), dan mendukung beberapa penyedia LLM termasuk model lokal yang sepenuhnya berjalan di mesin Anda.
Mereka kategori alat yang berbeda. WebBrain adalah ekstensi peramban — Anda memasangnya di Chrome atau Firefox dan mengobrol di panel samping, tanpa coding. Kerangka seperti OpenClaw dan Browser-Use adalah SDK pengembang untuk membangun pipeline peramban otomatis dengan Python, biasanya menggunakan peramban headless dan CDP. Bayangkan begini: WebBrain untuk menjelajah sehari-hari bersama asisten AI; kerangka agen untuk membangun bot scraping dan otomasi pengujian. Anda bisa menggunakan keduanya — mereka saling melengkapi.
Ya. Penyedia bawaan WebBrain adalah llama.cpp, yang menjalankan model AI lokal di komputer Anda. Tidak perlu kunci API, AI tidak butuh internet, dan data tidak pernah meninggalkan mesin Anda. Cukup unduh model GGUF, jalankan llama-server, dan Anda punya agen peramban AI yang sepenuhnya privat. Anda juga dapat menggunakan Ollama dengan endpoint kompatibel-OpenAI miliknya.
WebBrain mendukung empat jenis penyedia: llama.cpp (model GGUF lokal apa pun), OpenAI (GPT-4o, GPT-4, dsb.), Claude (Claude Opus, Sonnet, Haiku melalui API asli), dan OpenRouter (akses ke 100+ model dari berbagai penyedia). Endpoint API apa pun yang kompatibel-OpenAI dapat digunakan, jadi Anda juga bisa memakai layanan seperti Together AI, Groq, Mistral, atau server lokal apa pun dengan antarmuka kompatibel-OpenAI.
Per 21 April 2026, rekomendasi teratas adalah Qwen 3.6 35B. Alasannya: pada tolok ukur visi kami (vision-model-shootout), ia mengungguli Gemma 4 pada pemahaman tangkapan layar sembari tetap praktis untuk inferensi lokal.
Untuk GPU konsumen, RTX 5090 ideal, dan RTX 4090 sering kali bisa dijalankan dengan kuantisasi INT4 AutoRound via Intel/Qwen3.6-35B-A3B-int4-AutoRound.
Untuk kecepatan maksimal, kami merekomendasikan menyajikan melalui vLLM. Contoh perintah:
python -u -m vllm.entrypoints.openai.api_server --model Intel/Qwen3.6-35B-A3B-int4-AutoRound --served-model-name qwen3.6-35b --quantization auto --dtype bfloat16 --max-model-len 65536 --max-num-batched-tokens 32768 --max-num-seqs 4 --host 0.0.0.0 --port 8000 --gpu-memory-utilization 0.92 --enable-prefix-caching --enable-chunked-prefill --limit-mm-per-prompt '{"image": 4, "video": 1}' --mm-processor-cache-type shm --reasoning-parser qwen3 --enable-auto-tool-choice --tool-call-parser qwen3_coder --trust-remote-code --allowed-origins '["*"]' --speculative-config '{"method": "dflash", "model": "z-lab/Qwen3.6-35B-A3B-DFlash", "num_speculative_tokens": 15}' --attention-backend flash_attn
DFlash speculative decoding bersifat opsional.
Jika server LLM Anda berada di mesin lain dalam jaringan lokal (mis. http://192.168.1.x:8000), Chrome memblokir permintaan kecuali server mengirim header CORS. Solusinya bergantung pada server Anda:
vLLM: Mulai dengan --allowed-origins '["*"]' (nilainya harus berupa list JSON).
Ollama: Atur variabel lingkungan OLLAMA_ORIGINS=* sebelum memulai.
llama.cpp: CORS aktif secara bawaan — tidak perlu perubahan.
Jika server berjalan di localhost (mesin yang sama dengan peramban), CORS biasanya tidak diperlukan. Masalah ini hanya menyangkut koneksi antar mesin di jaringan lokal. Pastikan base URL pada pengaturan WebBrain diakhiri dengan /v1 (mis. http://192.168.1.47:8000/v1).
Ya. WebBrain dirilis dengan versi Chrome (Manifest V3, menggunakan sidePanel API) dan versi Firefox (Manifest V2, menggunakan sidebar_action). Kedua versi memiliki fitur yang identik. Versi Firefox dapat dimuat sebagai add-on sementara untuk pengembangan, atau dipublikasikan ke addons.mozilla.org untuk pemasangan permanen.
Bisa — sidebar Firefox bawaannya di kiri, tetapi Anda dapat memindahkannya. Klik kanan di mana saja pada header sidebar dan pilih Move Sidebar to Right (atau gunakan View → Sidebar → Move Sidebar to Right dari bilah menu). Posisinya tersimpan antar restart. sidePanel Chrome bawaannya di kanan dan tidak bisa dipindahkan pengguna dari panel itu sendiri.
WebBrain memiliki dua mode: mode Tanya (bawaan) hanya-baca dan tidak dapat memodifikasi apa pun pada halaman. Mode Aksi mengaktifkan kapabilitas agen peramban penuh (klik, ketik, navigasi) tetapi membutuhkan konfirmasi pengguna secara eksplisit sebelum aktif, dan disertai spanduk peringatan yang terlihat. Anda dapat menghentikan agen kapan saja dengan tombol Berhenti. Kode sumber ekstensi sepenuhnya terbuka untuk audit di GitHub.
Cukup buka halaman web mana pun, buka panel samping WebBrain, dan minta dengan bahasa natural: "Ekstrak semua nama produk dan harga dari halaman ini", "Ambil semua alamat email pada halaman ini", atau "Ringkas artikel ini dalam poin". Agen AI membaca isi halaman, memahami strukturnya, dan mengembalikan data yang diekstraksi. Untuk scraping yang lebih kompleks, beralih ke mode Aksi — agen dapat berpindah antar halaman, mengeklik tombol pagination, dan mengagregasi data lintas banyak halaman.
Secara bawaan, WebBrain selalu melalui UI yang terlihat untuk setiap tindakan yang membuat, memodifikasi, menghapus, mengirim, mengeposkan, atau membeli sesuatu. Ia akan menavigasi ke halaman, mengisi formulir, dan mengeklik tombol — persis seperti yang akan Anda lakukan. Ia menolak memanggil endpoint REST/GraphQL secara langsung melalui fetch() latar belakang untuk mutasi. Ini disengaja: tindakan API tidak terlihat (Anda tidak melihat apa yang dikirim), sering memerlukan token autentikasi terpisah yang mungkin belum Anda konfigurasi, dan memiliki radius dampak yang jauh lebih besar daripada satu salah klik yang terlihat. UI-first berarti semuanya tampil di layar, di dalam sesi peramban normal Anda, dan dapat dihentikan.
Untuk membaca data — mengambil README, melihat issue, membandingkan harga antar situs, memeriksa halaman status — WebBrain dengan bebas menggunakan permintaan HTTP latar belakang melalui alat fetch_url dan research_url. Membaca bukanlah tindakan; tidak mengubah apa pun pada layanan jarak jauh, sehingga kekhawatiran keamanan yang sama tidak berlaku.
Jika Anda secara khusus ingin mengizinkan mutasi API untuk sebuah tugas tertentu, ketikkan /allow-api di awal pesan Anda (opsional diikuti dengan deskripsi tugas singkat). Override per-percakapan ini memungkinkan WebBrain jatuh ke endpoint API saat UI benar-benar gagal atau tak bisa digunakan, sembari tetap memprioritaskan UI saat UI bisa. Sebuah lencana tetap muncul di atas area input selama override aktif, dan akan hilang saat Anda mereset percakapan.
Ya. Alat jaringan hanya-baca WebBrain — fetch_url dan research_url — juga hadir sebagai plugin LM Studio mandiri di webbrain/web-tools. Pasang dengan lms clone webbrain/web-tools dan aktifkan di obrolan LM Studio mana pun — model apa pun yang mendukung tool calling kemudian dapat memanggil kedua alat itu tanpa Anda memasang ekstensi peramban. Murni Node, tanpa peramban headless. Sumber: lmstudio-plugin/.
Ya, di Chrome — agen berjalan di service worker latar belakang dan terikat pada tab tempat ia mulai, jadi ia terus mengeklik, mengetik, dan membaca tab spesifik itu walau Anda memindahkan fokus ke tempat lain. Alat yang menargetkan tab (klik CDP, mengetik, navigasi, tangkapan layar) semuanya bekerja pada tab latar belakang di Chrome. Sidebar mengunci input saat tugas berjalan agar Anda tidak tak sengaja memulai tugas kedua pada tab baru — Anda perlu menunggu atau menghentikan yang sedang berjalan. Perlu diingat bahwa peramban membatasi timer dan animasi pada tab latar belakang, jadi situs yang banyak animasi mungkin merespons sedikit lebih lambat.
Di Firefox, agen juga akan terus berjalan pada tab aslinya, tetapi tangkapan layar otomatis terbatas: API tangkapan layar Firefox hanya dapat menangkap tab yang sedang aktif, bukan tab tertentu di latar belakang. WebBrain mendeteksi ini dan melewatkan tangkapan layar pada giliran itu alih-alih memberi model gambar halaman yang tidak relevan. Agen akan terus merencanakan dari konteks berbasis teks sampai Anda beralih kembali ke tab miliknya.
Hindari mengeklik atau mengetik secara aktif pada tab yang sama tempat agen bekerja — itu menciptakan kondisi balapan di mana Anda dan agen saling memperebutkan halaman yang sama. Beralih tab tidak masalah; menyetir bersama-sama tab yang sama tidak.
Isi-otomatis profil adalah fitur opsional di Pengaturan → Profil. Anda memasukkan bio singkat — nama, email kerja, perusahaan, dan kata sandi sekali pakai untuk pendaftaran berisiko rendah — lalu mengaktifkannya. Saat aktif, WebBrain menambahkan teks itu ke prompt sistem agen sehingga ia dapat mengisi formulir pendaftaran tanpa bertanya setiap kali.
Teks tersebut disimpan dalam bentuk teks biasa di penyimpanan lokal peramban Anda. Teks itu tidak dikirim ke proyek WebBrain, tetapi dikirim ke penyedia LLM yang Anda konfigurasi pada setiap giliran, sebagai bagian dari prompt sistem. Mati secara bawaan.
Jangan menaruh kata sandi akun penting (Google, Apple, iCloud, perbankan, SSO kantor, email utama) di sini. Akun-akun itu seharusnya menggunakan 2FA dan tidak perlu Anda serahkan kepada agen. Kasus penggunaan yang dimaksud adalah kata sandi sekali pakai yang Anda pakai ulang untuk pendaftaran newsletter dan uji coba gratis.
Spanduk cookie: WebBrain mengenali spanduk persetujuan dari kerangka umum (OneTrust, Cookiebot, Didomi, Quantcast, Google Funding Choices, TrustArc) dan menutupnya sebelum menalar halaman. Prioritasnya adalah "Tolak semua" / "Tolak non-esensial" / "Hanya yang perlu" jika terlihat jelas; jika tidak, ia jatuh ke "Terima semua" alih-alih hilang dalam labirin "Kelola preferensi".
Paywall: WebBrain melaporkan paywall dengan jujur dan memberi tahu Anda apa yang sebenarnya dapat dilihatnya (judul, dek, paragraf pertama). Ia tidak mencoba menembus paywall — tidak ada archive.today, 12ft.io, pembersihan cookie, penonaktifan JS, atau trik mode pembaca. Jika ingin artikel penuh, masuk dengan langganan atau minta WebBrain mencari liputan gratis untuk cerita yang sama.
Per 7.0.0, belum. Mode dry-run direncanakan dan sudah ada di roadmap.
Tiga lapisan independen:
Tangkapan layar hemat token. Sebelum gambar meninggalkan mesin Anda, WebBrain mengubah ukurannya (sisi pendek dibatasi, rasio aspek dipertahankan) dan mengompresi JPEG secara iteratif hingga muat dengan anggaran token gambar per giliran. Tangkapan layar 2000×1200 yang akan menghabiskan ~1.500 token input di GPT-4o akan dikompresi menjadi ~300–500 token tanpa kerugian praktis untuk tugas membaca halaman. Diimplementasikan di _fitImageDimensions dengan unit test untuk perhitungan anggarannya.
Pemangkasan konteks cerdas. Riwayat percakapan, keluaran alat, dan dump DOM inline dibatasi per giliran dan dipangkas yang terlama lebih dulu saat jendela konteks model aktif mendekati penuh. Anda tidak akan melihat eksekusi diam-diam membengkak dari 10k token menjadi 100k karena read_page mengembalikan artikel sepanjang novel.
Model visi khusus. Pasangkan model teks murah (mis. GPT-4o-mini) untuk perencanaan dan pemanggilan alat dengan model visi terpisah (mis. GPT-4o) hanya untuk tangkapan layar, sehingga Anda tidak membayar harga model multimodal di setiap giliran. Konfigurasikan di Pengaturan → Visi.
Hasil akhirnya: sesi panjang dengan penyedia cloud tetap terprediksi. Untuk kendali penuh, gunakan llama.cpp secara lokal — biaya per token nol.
Tentu saja! WebBrain berlisensi MIT dan menyambut kontribusi. Lihat repositori GitHub untuk issue, permintaan fitur, dan panduan kontribusi.