Ejen Pelayar AI Sumber Terbuka

WebBrain ialah sambungan pelayar percuma dan sumber terbuka yang membawa keupayaan ejen AI ke Chrome dan Firefox. Baca halaman, ekstrak data dan automatikkan tugas web — dikuasakan oleh LLM pilihan anda. Alternatif yang boleh dihos sendiri kepada pemalam AI pelayar berhak milik.

Pasang Sambungan Lihat di GitHub
https://example.com/products

Katalog Produk

🧠 WebBrain.one
Ekstrak semua nama produk dan harga dari halaman ini
Membaca halaman
Mengekstrak data
Menemui 24 produk. Berikut keputusannya:
1. Widget Pro — $29.99
2. Super Gadget — $49.99
3. MegaTool X — $19.99
...dan 21 lagi
Tanya apa-apa sahaja tentang halaman ini...
Demo

Saksikan WebBrain beraksi

Lihat bagaimana WebBrain membaca halaman, mengekstrak data dan mengautomatikkan tugas pelayar.

Ciri

Segalanya yang anda perlukan dalam AI pelayar

Ejen AI berciri lengkap yang tinggal di panel sisi pelayar dan memahami mana-mana halaman web.

📖

Pemahaman Halaman

Membaca dan memahami mana-mana halaman web — artikel, dokumen, papan pemuka, borang. Tanya soalan dan dapatkan jawapan segera daripada kandungan halaman semasa.

🤖

Ejen Pelayar Penuh

Mengklik, menaip, menatal, menavigasi dan berinteraksi dengan halaman bagi pihak anda. Automatikkan tugas berulang dengan arahan bahasa semula jadi.

📊

Pengekstrakan Data

Ekstrak data berstruktur daripada mana-mana halaman — jadual, senarai, pautan, borang. Eksport katalog produk, hasil carian, atau mana-mana kandungan halaman. Berfungsi dengan PDF.

🔌

LLM Berbilang Pembekal

Berfungsi dengan llama.cpp tempatan, OpenAI, Claude dan OpenRouter. Gunakan model pilihan anda — atau jalankan sepenuhnya luar talian dengan AI tempatan.

🛡️

Privasi Diutamakan

Data anda kekal milik anda. Jalankan dengan LLM tempatan untuk kebocoran data sifar. Tiada telemetri, tiada penjejakan, tiada akaun diperlukan. Sepenuhnya sumber terbuka.

Konteks Pintar

Pengurusan konteks automatik menghalang limpahan token. Memangkas sejarah perbualan dengan pintar dan menghadkan output alat untuk sesi yang lancar tanpa gangguan.

👁️

Model Penglihatan Khusus

Pasangkan model teks pantas untuk perancangan dengan model penglihatan berasingan untuk membaca tangkapan skrin. Lebih murah dan lebih pantas daripada menggunakan satu model multimodal besar untuk segalanya.

👤

Auto-isi Profil

Bio teks biasa pilihan — nama, e-mel kerja, syarikat, kata laluan sekali pakai — membolehkan ejen melepasi borang pendaftaran berisiko rendah tanpa bertanya setiap kali. Dimatikan secara lalai, semuanya disimpan secara tempatan.

🍪

Mengenali Cookie & Paywall

Menutup sepanduk persetujuan (OneTrust, Cookiebot, Didomi, Quantcast) sebelum berfikir tentang halaman. Mengesan paywall dan memberitahu anda dengan jujur dan bukannya mereka-reka kandungan artikel atau cuba memintasnya.

🧩

Optional CAPTCHA Solver

Plug in a CapSolver API key and the agent will auto-solve reCAPTCHA v2/v3, hCaptcha, and Cloudflare Turnstile when they block a step — instead of stopping to ask. Off by default, BYO key, no captcha service is shipped or contacted unless you turn it on.

🌐

UI Berbilang Bahasa

Pemalam disediakan dalam English, Español, Français, Türkçe dan 中文. Mengesan bahasa pelayar anda secara automatik pada penggunaan pertama; tukar bila-bila masa daripada ikon globe di panel sisi. Laman pemasaran turut dilokalkan sepadan.

💰

Jimat Token

Tangkapan skrin diubah saiz dan dimampatkan JPEG secara berulang sebelum meninggalkan mesin anda, menjadikan token imej kekal kecil. Pemangkasan konteks pintar dan had output alat memastikan bil awan boleh diramal — tiada perbelanjaan mengejut pada sesi panjang.

Pembekal LLM

Bawa AI Anda Sendiri

Sambung ke mana-mana API serasi OpenAI atau jalankan model tempatan. Tukar pembekal bila-bila masa dari tetapan sambungan.

🦙
llama.cpp
Ollama
OpenAI
Claude
OpenRouter
LM Studio
vLLM
Grok
Gemini
DeepSeek
Mistral
Mulakan

Pasang WebBrain

Tersedia untuk Chrome dan Firefox. Percuma, sumber terbuka, tiada akaun diperlukan.

🌐

Chrome & Chromium

Manifest V3 · Chrome 116+ · Juga berfungsi dengan Brave, Edge, Opera, Vivaldi dan pelayar serasi Chromium yang lain.

🦊

Firefox

Manifest V2 · Firefox 109+

Mengapa WebBrain?

Bagaimana WebBrain berbanding?

WebBrain berada di persimpangan antara pemalam AI asli pelayar dan rangka kerja ejen penuh. Begini perbandingannya.

vs. Pemalam AI Pelayar

Ciri WebBrain Claude dalam Chrome
Sumber TerbukaLesen MITBerhak milik
HargaPercuma selamanyaMemerlukan Claude Pro ($20/bulan)
Sokongan LLM tempatanllama.cpp, OllamaTidak — Claude sahaja
Berbilang pembekalAll OpenAI-compatible endpointsClaude sahaja
ChromeYa (MV3)Ya
FirefoxYa (MV2)Tidak
UI panel sisiYaYa
Mod Tanya / BertindakYaSerupa
Sepenuhnya luar talianYa (dengan LLM tempatan)Tidak — perlukan awan
Boleh dihos sendiriYaTidak

vs. Rangka Kerja Ejen AI (kategori berbeza)

Aspek WebBrain OpenClaw / Browser-Use / dsb.
Apa itu?Sambungan pelayar (alat pengguna akhir)Rangka kerja ejen / SDK (alat pembangun)
Pengguna sasaranSesiapa sahaja — tanpa pengaturcaraanPembangun yang membina automasi
PemasanganPemasangan pelayar satu klikPerlukan persediaan Python/Docker
UISembang panel sisi terbina dalamTiada UI — kod atau API sahaja
Kawalan pelayarContent script (ringan)CDP / Playwright (kawalan penuh)
Aliran kerja berbilang tabPerbualan setiap tabOrkestrasi berbilang tab boleh diprogram
Mod headlessTidak — berjalan dalam pelayar andaYa — automasi headless
KebolehlanjutanTambah pembekal LLM tersuaiPython SDK penuh, alat tersuai
Terbaik untukPembantu AI penyemakan imbas harianPipeline mengikis / ujian automatik

WebBrain ialah sambungan pelayar untuk pengguna akhir yang inginkan pembantu AI semasa mereka melayari. Rangka kerja ejen seperti OpenClaw ialah alat pembangun untuk membina pipeline pelayar automatik. Alat berbeza untuk kerja berbeza — dan anda boleh menggunakan kedua-duanya.

FAQ

Soalan Lazim

Adakah WebBrain alternatif percuma kepada pemalam pelayar Claude?

Ya. WebBrain menyediakan keupayaan ejen pelayar AI yang serupa — membaca halaman, mengekstrak data, mengklik butang, mengisi borang, dan mengautomatikkan aliran kerja berbilang langkah. Tidak seperti pemalam pelayar Claude berhak milik yang memerlukan langganan Claude Pro dan hanya berfungsi dengan model Anthropic, WebBrain adalah sepenuhnya percuma, sumber terbuka (lesen MIT) dan menyokong pelbagai pembekal LLM termasuk model tempatan yang berjalan sepenuhnya pada mesin anda.

Bagaimana WebBrain dibandingkan dengan OpenClaw, Browser-Use dan rangka kerja ejen AI yang lain?

Ia adalah kategori alat yang berbeza. WebBrain ialah sambungan pelayar — anda memasangnya di Chrome atau Firefox dan bersembang dengannya dalam panel sisi, tiada pengaturcaraan diperlukan. Rangka kerja seperti OpenClaw dan Browser-Use ialah SDK pembangun untuk membina pipeline pelayar automatik dalam Python, biasanya menggunakan pelayar headless dan CDP. Anggap begini: WebBrain untuk penyemakan imbas harian dengan pembantu AI; rangka kerja ejen untuk membina bot mengikis dan automasi ujian. Anda boleh menggunakan kedua-duanya — mereka saling melengkapi.

Bolehkah saya menggunakan WebBrain sepenuhnya luar talian?

Ya. Pembekal lalai WebBrain ialah llama.cpp yang menjalankan model AI tempatan pada komputer anda. Tiada kunci API diperlukan, tiada internet diperlukan untuk AI, dan tiada data meninggalkan mesin anda. Hanya muat turun model GGUF, mulakan llama-server, dan anda mempunyai ejen pelayar AI yang sepenuhnya peribadi. Anda juga boleh menggunakan Ollama dengan endpoint serasi OpenAInya.

Model AI manakah yang disokong oleh WebBrain?

WebBrain menyokong empat jenis pembekal: llama.cpp (mana-mana model GGUF tempatan), OpenAI (GPT-4o, GPT-4, dsb.), Claude (Claude Opus, Sonnet, Haiku melalui API asli) dan OpenRouter (akses kepada lebih 100 model dari pelbagai pembekal). Mana-mana endpoint API serasi OpenAI berfungsi, jadi anda juga boleh menggunakan perkhidmatan seperti Together AI, Groq, Mistral atau mana-mana pelayan tempatan dengan antara muka serasi OpenAI.

Apakah model yang paling disyorkan?

Setakat 21 April 2026, saranan utama ialah Qwen 3.6 35B. Mengapa: dalam tanda aras penglihatan kami (vision-model-shootout), ia mengatasi Gemma 4 dalam pemahaman tangkapan skrin sambil tetap praktikal untuk inferens tempatan.

Untuk GPU pengguna, RTX 5090 adalah ideal, manakala RTX 4090 sering boleh digunakan dengan kuantisasi INT4 AutoRound melalui Intel/Qwen3.6-35B-A3B-int4-AutoRound.

Untuk kelajuan maksimum, kami mengesyorkan menyajikannya pada vLLM. Contoh arahan:

python -u -m vllm.entrypoints.openai.api_server --model Intel/Qwen3.6-35B-A3B-int4-AutoRound --served-model-name qwen3.6-35b --quantization auto --dtype bfloat16 --max-model-len 65536 --max-num-batched-tokens 32768 --max-num-seqs 4 --host 0.0.0.0 --port 8000 --gpu-memory-utilization 0.92 --enable-prefix-caching --enable-chunked-prefill --limit-mm-per-prompt '{"image": 4, "video": 1}' --mm-processor-cache-type shm --reasoning-parser qwen3 --enable-auto-tool-choice --tool-call-parser qwen3_coder --trust-remote-code --allowed-origins '["*"]' --speculative-config '{"method": "dflash", "model": "z-lab/Qwen3.6-35B-A3B-DFlash", "num_speculative_tokens": 15}' --attention-backend flash_attn

DFlash speculative decoding adalah pilihan.

Saya mendapat "Failed to fetch" semasa menyambung ke pelayan LLM tempatan (vLLM, Ollama, llama.cpp) pada rangkaian saya

Jika pelayan LLM anda berada pada mesin lain di rangkaian tempatan anda (cth. http://192.168.1.x:8000), Chrome akan menyekat permintaan melainkan pelayan menghantar pengepala CORS. Penyelesaian bergantung pada pelayan anda:

vLLM: Mulakan dengan --allowed-origins '["*"]' (nilai mestilah senarai JSON).
Ollama: Tetapkan pemboleh ubah persekitaran OLLAMA_ORIGINS=* sebelum memulakan.
llama.cpp: CORS didayakan secara lalai — tiada perubahan diperlukan.

Jika pelayan anda berjalan pada localhost (mesin yang sama dengan pelayar), CORS biasanya tidak diperlukan. Isu ini hanya menjejaskan sambungan merentas mesin pada rangkaian tempatan. Pastikan base URL dalam tetapan WebBrain berakhir dengan /v1 (cth. http://192.168.1.47:8000/v1).

Adakah WebBrain berfungsi pada Firefox?

Ya. WebBrain dihantar dengan kedua-dua versi Chrome (Manifest V3, menggunakan sidePanel API) dan versi Firefox (Manifest V2, menggunakan sidebar_action). Kedua-dua versi mempunyai ciri yang sama. Versi Firefox boleh dimuatkan sebagai add-on sementara untuk pembangunan, atau diterbitkan ke addons.mozilla.org untuk pemasangan kekal.

Bolehkah saya mengalihkan sidebar Firefox dari kiri ke kanan, seperti panel sisi Chrome?

Boleh — sidebar Firefox lalainya di sebelah kiri, tetapi anda boleh menukarnya. Klik kanan di mana-mana pada pengepala sidebar dan pilih Move Sidebar to Right (atau gunakan View → Sidebar → Move Sidebar to Right dari bar menu). Kedudukan kekal antara mula semula. sidePanel Chrome lalainya di sebelah kanan dan tidak boleh dipindahkan oleh pengguna dari panel itu sendiri.

Adakah WebBrain selamat digunakan? Bolehkah ia mengubah suai halaman web?

WebBrain mempunyai dua mod: mod Tanya (lalai) adalah baca sahaja dan tidak boleh mengubah suai apa-apa pada halaman. Mod Bertindak membolehkan keupayaan ejen pelayar penuh (mengklik, menaip, menavigasi) tetapi memerlukan pengesahan pengguna yang jelas sebelum diaktifkan, dan disertakan dengan sepanduk amaran yang kelihatan. Anda boleh menghentikan ejen pada bila-bila masa dengan butang Henti. Kod sumber sambungan terbuka sepenuhnya untuk audit di GitHub.

Bagaimanakah saya menggunakan WebBrain untuk mengikis web dan pengekstrakan data?

Cuma buka mana-mana halaman web, buka panel sisi WebBrain, dan tanya dalam bahasa semula jadi: "Ekstrak semua nama produk dan harga dari halaman ini", "Dapatkan semua alamat e-mel pada halaman ini", atau "Ringkaskan artikel ini dalam poin bullet". Ejen AI membaca kandungan halaman, memahami strukturnya, dan mengembalikan data yang diekstrak. Untuk pengikisan yang lebih kompleks, tukar ke mod Bertindak — ejen boleh menavigasi antara halaman, mengklik butang penomboran, dan mengagregat data merentas pelbagai halaman.

Adakah WebBrain memanggil API secara langsung, atau ia sentiasa mengklik melalui UI?

Secara lalai, WebBrain sentiasa melalui UI yang kelihatan untuk apa-apa tindakan yang mencipta, mengubah suai, memadamkan, menghantar, mengeposkan atau membeli sesuatu. Ia akan menavigasi ke halaman, mengisi borang dan mengklik butang — sama persis seperti yang anda akan lakukan. Ia menolak memanggil endpoint REST/GraphQL secara langsung melalui fetch() latar belakang untuk perubahan. Ini adalah disengajakan: tindakan API tidak kelihatan (anda tidak melihat apa yang dihantar), sering memerlukan token pengesahan berasingan yang mungkin tidak anda konfigurasikan, dan mempunyai radius letupan yang jauh lebih besar daripada satu klik salah yang kelihatan. UI-first bermaksud segala-galanya berada pada skrin, dalam sesi pelayar biasa anda, dan boleh dihentikan.

Untuk membaca data — mengambil README, melihat issue, membandingkan harga merentas tapak, memeriksa halaman status — WebBrain dengan bebas menggunakan permintaan HTTP latar belakang melalui alat fetch_url dan research_url. Membaca bukanlah sama dengan bertindak; ia tidak mengubah apa-apa pada perkhidmatan jauh, jadi kebimbangan keselamatan tidak terpakai.

Jika anda secara khusus ingin membenarkan perubahan API untuk tugas tertentu, taip /allow-api pada permulaan mesej anda (pilihan: diikuti dengan penerangan tugas yang ringkas). Penggantian per-perbualan ini membolehkan WebBrain berundur ke endpoint API apabila UI benar-benar gagal atau tidak dapat digunakan, sambil masih mengutamakan UI apabila UI berfungsi. Lencana melekat kekal kelihatan di atas kawasan input semasa penggantian aktif, dan ia akan kosong apabila anda menetapkan semula perbualan.

Bolehkah saya menggunakannya dalam LM Studio juga?

Boleh. Alat rangkaian baca sahaja WebBrain — fetch_url dan research_url — juga dihantar sebagai pemalam LM Studio berdiri sendiri di webbrain/web-tools. Pasang dengan lms clone webbrain/web-tools dan hidupkan dalam mana-mana sembang LM Studio — mana-mana model yang berkeupayaan tool boleh memanggil dua alat itu tanpa anda memasang sambungan pelayar. Node tulen, tiada pelayar headless. Sumber: lmstudio-plugin/.

Bolehkah saya bertukar ke tab lain semasa WebBrain sedang bekerja pada halaman?

Boleh, pada Chrome — ejen berjalan dalam service worker latar belakang dan terikat pada tab tempat ia bermula, jadi ia terus mengklik, menaip dan membaca tab tertentu itu walaupun anda mengalihkan tumpuan ke tempat lain. Alat yang menyasarkan tab (klik CDP, taip, navigasi, tangkapan skrin) semuanya berfungsi pada tab latar belakang di Chrome. Bar sisi mengunci input semasa tugas dijalankan supaya anda tidak boleh memulakan tugas kedua secara tidak sengaja pada tab baharu — anda perlu menunggu atau menghentikan tugas semasa. Perhatikan bahawa pelayar mendaifkan pemasa dan animasi pada tab latar belakang, jadi tapak yang banyak beranimasi mungkin bertindak balas sedikit lebih perlahan.

Pada Firefox, ejen akan terus berjalan pada tab asalnya juga, tetapi tangkapan skrin automatik terhad: API tangkapan skrin Firefox hanya boleh menangkap tab yang sedang aktif, bukan tab tertentu di latar belakang. WebBrain mengesan ini dan melangkau tangkapan skrin untuk giliran itu dan bukannya menyuap model imej halaman yang tidak berkaitan. Ejen akan terus merancang daripada konteks berasaskan teks sehingga anda kembali ke tabnya.

Elakkan mengklik atau menaip secara aktif pada tab yang sama yang sedang dikerjakan oleh ejen — itu mencipta keadaan perlumbaan di mana anda dan ejen bergaduh untuk halaman yang sama. Bertukar tab tidak mengapa; memandu bersama tab yang sama tidak.

Bagaimanakah auto-isi Profil berfungsi, dan adakah ia selamat?

Auto-isi profil ialah ciri pilihan dalam Tetapan → Profil. Anda memasukkan bio ringkas — nama, e-mel kerja, syarikat dan kata laluan pakai buang untuk pendaftaran berisiko rendah — dan menghidupkannya. Apabila didayakan, WebBrain menambahkan teks tersebut kepada system prompt ejen supaya ia boleh mengisi borang pendaftaran tanpa bertanya setiap kali.

Teks disimpan sebagai teks biasa dalam storan tempatan pelayar anda. Ia tidak dihantar kepada projek WebBrain, tetapi ia dihantar kepada pembekal LLM yang anda konfigurasikan pada setiap giliran, sebagai sebahagian daripada system prompt. Dimatikan secara lalai.

Jangan letakkan kata laluan untuk akaun penting (Google, Apple, iCloud, perbankan, SSO kerja, e-mel utama) di sini. Akaun-akaun itu sepatutnya menggunakan 2FA dan tidak sepatutnya diserahkan kepada ejen. Kes penggunaan yang dimaksudkan ialah kata laluan pakai buang yang anda guna semula untuk pendaftaran surat berita dan percubaan percuma.

Apa yang dilakukan WebBrain dengan sepanduk cookie dan paywall?

Sepanduk cookie: WebBrain mengenali sepanduk persetujuan daripada rangka kerja biasa (OneTrust, Cookiebot, Didomi, Quantcast, Google Funding Choices, TrustArc) dan menutupnya sebelum berfikir tentang halaman. Keutamaan adalah "Tolak semua" / "Tolak yang bukan penting" / "Hanya yang perlu" apabila kelihatan jelas; ia berundur ke "Terima semua" daripada hilang dalam labirin "Urus pilihan".

Paywall: WebBrain melaporkan paywall dengan jujur dan memberitahu anda apa yang sebenarnya boleh dilihatnya (tajuk, deck, perenggan pertama). Ia tidak cuba memintas paywall — tiada archive.today, 12ft.io, pembersihan cookie, melumpuhkan JS atau helah mod pembaca. Jika anda mahukan artikel penuh, log masuk dengan langganan atau minta WebBrain mencari liputan percuma untuk cerita yang sama.

Adakah WebBrain menyokong mod dry-run?

Setakat 7.0.0, belum lagi. Mod dry-run dirancang dan sudah ada dalam peta jalan.

Bagaimanakah WebBrain mengawal bil LLM awan?

Tiga lapisan bebas:

Tangkapan skrin jimat token. Sebelum mana-mana imej meninggalkan mesin anda, WebBrain mengubah saiznya (sisi pendek dihadkan, mengekalkan nisbah aspek) dan memampatkannya JPEG secara berulang sehingga ia muat dengan bajet token imej setiap giliran. Tangkapan skrin 2000×1200 yang akan dikenakan kira-kira 1,500 token input pada GPT-4o akan dimampatkan kepada ~300–500 token tanpa kehilangan praktikal untuk tugas membaca halaman. Dilaksanakan dalam _fitImageDimensions dengan ujian unit untuk matematik bajet.

Pemangkasan konteks pintar. Sejarah perbualan, output alat dan dump DOM sebaris dibatasi setiap giliran dan dipangkas yang paling lama dahulu apabila tetingkap konteks model aktif menghampiri penuh. Anda tidak akan melihat larian membengkak secara senyap dari 10k token kepada 100k kerana read_page mengembalikan artikel sepanjang novel.

Model penglihatan khusus. Pasangkan model teks murah (cth. GPT-4o-mini) untuk perancangan dan panggilan alat dengan model penglihatan berasingan (cth. GPT-4o) hanya untuk tangkapan skrin, jadi anda tidak membayar harga model multimodal pada setiap giliran. Konfigurasi di bawah Tetapan → Penglihatan.

Hasil bersih: sesi panjang dengan pembekal awan kekal boleh diramal. Untuk kawalan penuh, gunakan llama.cpp secara tempatan — kos sifar setiap token.

Bolehkah saya menyumbang kepada WebBrain?

Sudah tentu! WebBrain berlesen MIT dan mengalu-alukan sumbangan. Lihat repositori GitHub untuk issue, permintaan ciri dan garis panduan sumbangan.

Sebarkan, kongsi kasih sayang

WebBrain berlesen MIT dan berjalan sepenuhnya dalam pelayar anda. Jika ia berguna, beri kami bintang atau kongsi — itulah cara projek sumber terbuka bebas ditemui.