Question 1

Adakah WebBrain alternatif percuma kepada pemalam pelayar Claude?

Accepted Answer

Ya. WebBrain menyediakan keupayaan ejen pelayar AI yang serupa — membaca halaman, mengekstrak data, mengklik butang, mengisi borang, dan mengautomatikkan aliran kerja berbilang langkah. Tidak seperti pemalam pelayar Claude berhak milik yang memerlukan langganan Claude Pro dan hanya berfungsi dengan model Anthropic, WebBrain adalah sepenuhnya percuma, sumber terbuka (lesen MIT) dan menyokong pelbagai pembekal LLM termasuk model tempatan yang berjalan sepenuhnya pada mesin anda.

Question 2

Bagaimana WebBrain dibandingkan dengan OpenClaw, Browser-Use dan rangka kerja ejen AI yang lain?

Accepted Answer

Ia adalah kategori alat yang berbeza. WebBrain ialah sambungan pelayar — anda memasangnya di Chrome atau Firefox dan bersembang dengannya dalam panel sisi, tiada pengaturcaraan diperlukan. Rangka kerja seperti OpenClaw dan Browser-Use ialah SDK pembangun untuk membina pipeline pelayar automatik dalam Python, biasanya menggunakan pelayar headless dan CDP. Anggap begini: WebBrain untuk penyemakan imbas harian dengan pembantu AI; rangka kerja ejen untuk membina bot mengikis dan automasi ujian. Anda boleh menggunakan kedua-duanya — mereka saling melengkapi.

Question 3

Bolehkah saya menggunakan WebBrain sepenuhnya luar talian?

Accepted Answer

Ya. Pembekal lalai WebBrain ialah llama.cpp yang menjalankan model AI tempatan pada komputer anda. Tiada kunci API diperlukan, tiada internet diperlukan untuk AI, dan tiada data meninggalkan mesin anda. Hanya muat turun model GGUF, mulakan llama-server, dan anda mempunyai ejen pelayar AI yang sepenuhnya peribadi. Anda juga boleh menggunakan Ollama dengan endpoint serasi OpenAInya.

Question 4

Model AI manakah yang disokong oleh WebBrain?

Accepted Answer

WebBrain menyokong empat jenis pembekal: llama.cpp (mana-mana model GGUF tempatan), OpenAI (GPT-4o, GPT-4, dsb.), Claude (Claude Opus, Sonnet, Haiku melalui API asli) dan OpenRouter (akses kepada lebih 100 model dari pelbagai pembekal). Mana-mana endpoint API serasi OpenAI berfungsi, jadi anda juga boleh menggunakan perkhidmatan seperti Together AI, Groq, Mistral atau mana-mana pelayan tempatan dengan antara muka serasi OpenAI.

Question 5

Apakah model yang paling disyorkan?

Accepted Answer

Setakat 21 April 2026, saranan utama ialah Qwen 3.6 35B. Mengapa: dalam tanda aras penglihatan kami (vision-model-shootout), ia mengatasi Gemma 4 dalam pemahaman tangkapan skrin sambil tetap praktikal untuk inferens tempatan. Untuk GPU pengguna, RTX 5090 adalah ideal, manakala RTX 4090 sering boleh digunakan dengan kuantisasi INT4 AutoRound melalui Intel/Qwen3.6-35B-A3B-int4-AutoRound. Untuk kelajuan maksimum, kami mengesyorkan menyajikannya pada vLLM. Contoh arahan: python -u -m vllm.entrypoints.openai.api_server --model Intel/Qwen3.6-35B-A3B-int4-AutoRound --served-model-name qwen3.6-35b --quantization auto --dtype bfloat16 --max-model-len 65536 --max-num-batched-tokens 32768 --max-num-seqs 4 --host 0.0.0.0 --port 8000 --gpu-memory-utilization 0.92 --enable-prefix-caching --enable-chunked-prefill --limit-mm-per-prompt '{"image": 4, "video": 1}' --mm-processor-cache-type shm --reasoning-parser qwen3 --enable-auto-tool-choice --tool-call-parser qwen3_coder --trust-remote-code --allowed-origins '["*"]' --speculative-config '{"method": "dflash", "model": "z-lab/Qwen3.6-35B-A3B-DFlash", "num_speculative_tokens": 15}' --attention-backend flash_attn DFlash speculative decoding adalah pilihan.

Question 6

Saya mendapat "Failed to fetch" semasa menyambung ke pelayan LLM tempatan (vLLM, Ollama, llama.cpp) pada rangkaian saya

Accepted Answer

Jika pelayan LLM anda berada pada mesin lain di rangkaian tempatan anda (cth. http://192.168.1.x:8000), Chrome akan menyekat permintaan melainkan pelayan menghantar pengepala CORS. Penyelesaian bergantung pada pelayan anda: vLLM: Mulakan dengan --allowed-origins '["*"]' (nilai mestilah senarai JSON). Ollama: Tetapkan pemboleh ubah persekitaran OLLAMA_ORIGINS=* sebelum memulakan. llama.cpp: CORS didayakan secara lalai — tiada perubahan diperlukan. Jika pelayan anda berjalan pada localhost (mesin yang sama dengan pelayar), CORS biasanya tidak diperlukan. Isu ini hanya menjejaskan sambungan merentas mesin pada rangkaian tempatan. Pastikan base URL dalam tetapan WebBrain berakhir dengan /v1 (cth. http://192.168.1.47:8000/v1).

Question 7

Adakah WebBrain berfungsi pada Firefox?

Accepted Answer

Ya. WebBrain dihantar dengan kedua-dua versi Chrome (Manifest V3, menggunakan sidePanel API) dan versi Firefox (Manifest V2, menggunakan sidebar_action). Kedua-dua versi mempunyai ciri yang sama. Versi Firefox boleh dimuatkan sebagai add-on sementara untuk pembangunan, atau diterbitkan ke addons.mozilla.org untuk pemasangan kekal.

Question 8

Bolehkah saya mengalihkan sidebar Firefox dari kiri ke kanan, seperti panel sisi Chrome?

Accepted Answer

Boleh — sidebar Firefox lalainya di sebelah kiri, tetapi anda boleh menukarnya. Klik kanan di mana-mana pada pengepala sidebar dan pilih Move Sidebar to Right (atau gunakan View → Sidebar → Move Sidebar to Right dari bar menu). Kedudukan kekal antara mula semula. sidePanel Chrome lalainya di sebelah kanan dan tidak boleh dipindahkan oleh pengguna dari panel itu sendiri.

Question 9

Adakah WebBrain selamat digunakan? Bolehkah ia mengubah suai halaman web?

Accepted Answer

WebBrain mempunyai dua mod: mod Tanya (lalai) adalah baca sahaja dan tidak boleh mengubah suai apa-apa pada halaman. Mod Bertindak membolehkan keupayaan ejen pelayar penuh (mengklik, menaip, menavigasi) tetapi memerlukan pengesahan pengguna yang jelas sebelum diaktifkan, dan disertakan dengan sepanduk amaran yang kelihatan. Anda boleh menghentikan ejen pada bila-bila masa dengan butang Henti. Kod sumber sambungan terbuka sepenuhnya untuk audit di GitHub.

Question 10

Bagaimanakah saya menggunakan WebBrain untuk mengikis web dan pengekstrakan data?

Accepted Answer

Cuma buka mana-mana halaman web, buka panel sisi WebBrain, dan tanya dalam bahasa semula jadi: "Ekstrak semua nama produk dan harga dari halaman ini", "Dapatkan semua alamat e-mel pada halaman ini", atau "Ringkaskan artikel ini dalam poin bullet". Ejen AI membaca kandungan halaman, memahami strukturnya, dan mengembalikan data yang diekstrak. Untuk pengikisan yang lebih kompleks, tukar ke mod Bertindak — ejen boleh menavigasi antara halaman, mengklik butang penomboran, dan mengagregat data merentas pelbagai halaman.

Question 11

Adakah WebBrain memanggil API secara langsung, atau ia sentiasa mengklik melalui UI?

Accepted Answer

Secara lalai, WebBrain sentiasa melalui UI yang kelihatan untuk apa-apa tindakan yang mencipta, mengubah suai, memadamkan, menghantar, mengeposkan atau membeli sesuatu. Ia akan menavigasi ke halaman, mengisi borang dan mengklik butang — sama persis seperti yang anda akan lakukan. Ia menolak memanggil endpoint REST/GraphQL secara langsung melalui fetch() latar belakang untuk perubahan. Ini adalah disengajakan: tindakan API tidak kelihatan (anda tidak melihat apa yang dihantar), sering memerlukan token pengesahan berasingan yang mungkin tidak anda konfigurasikan, dan mempunyai radius letupan yang jauh lebih besar daripada satu klik salah yang kelihatan. UI-first bermaksud segala-galanya berada pada skrin, dalam sesi pelayar biasa anda, dan boleh dihentikan. Untuk membaca data — mengambil README, melihat issue, membandingkan harga merentas tapak, memeriksa halaman status — WebBrain dengan bebas menggunakan permintaan HTTP latar belakang melalui alat fetch_url dan research_url. Membaca bukanlah sama dengan bertindak; ia tidak mengubah apa-apa pada perkhidmatan jauh, jadi kebimbangan keselamatan tidak terpakai. Jika anda secara khusus ingin membenarkan perubahan API untuk tugas tertentu, taip /allow-api pada permulaan mesej anda (pilihan: diikuti dengan penerangan tugas yang ringkas). Penggantian per-perbualan ini membolehkan WebBrain berundur ke endpoint API apabila UI benar-benar gagal atau tidak dapat digunakan, sambil masih mengutamakan UI apabila UI berfungsi. Lencana melekat kekal kelihatan di atas kawasan input semasa penggantian aktif, dan ia akan kosong apabila anda menetapkan semula perbualan.

Question 12

Bolehkah saya menggunakannya dalam LM Studio juga?

Accepted Answer

Boleh. Alat rangkaian baca sahaja WebBrain — fetch_url dan research_url — juga dihantar sebagai pemalam LM Studio berdiri sendiri di webbrain/web-tools. Pasang dengan lms clone webbrain/web-tools dan hidupkan dalam mana-mana sembang LM Studio — mana-mana model yang berkeupayaan tool boleh memanggil dua alat itu tanpa anda memasang sambungan pelayar. Node tulen, tiada pelayar headless. Sumber: lmstudio-plugin/.

Question 13

Bolehkah saya bertukar ke tab lain semasa WebBrain sedang bekerja pada halaman?

Accepted Answer

Boleh, pada Chrome — ejen berjalan dalam service worker latar belakang dan terikat pada tab tempat ia bermula, jadi ia terus mengklik, menaip dan membaca tab tertentu itu walaupun anda mengalihkan tumpuan ke tempat lain. Alat yang menyasarkan tab (klik CDP, taip, navigasi, tangkapan skrin) semuanya berfungsi pada tab latar belakang di Chrome. Bar sisi mengunci input semasa tugas dijalankan supaya anda tidak boleh memulakan tugas kedua secara tidak sengaja pada tab baharu — anda perlu menunggu atau menghentikan tugas semasa. Perhatikan bahawa pelayar mendaifkan pemasa dan animasi pada tab latar belakang, jadi tapak yang banyak beranimasi mungkin bertindak balas sedikit lebih perlahan. Pada Firefox, ejen akan terus berjalan pada tab asalnya juga, tetapi tangkapan skrin automatik terhad: API tangkapan skrin Firefox hanya boleh menangkap tab yang sedang aktif, bukan tab tertentu di latar belakang. WebBrain mengesan ini dan melangkau tangkapan skrin untuk giliran itu dan bukannya menyuap model imej halaman yang tidak berkaitan. Ejen akan terus merancang daripada konteks berasaskan teks sehingga anda kembali ke tabnya. Elakkan mengklik atau menaip secara aktif pada tab yang sama yang sedang dikerjakan oleh ejen — itu mencipta keadaan perlumbaan di mana anda dan ejen bergaduh untuk halaman yang sama. Bertukar tab tidak mengapa; memandu bersama tab yang sama tidak.

Question 14

Bagaimanakah auto-isi Profil berfungsi, dan adakah ia selamat?

Accepted Answer

Auto-isi profil ialah ciri pilihan dalam Tetapan → Profil. Anda memasukkan bio ringkas — nama, e-mel kerja, syarikat dan kata laluan pakai buang untuk pendaftaran berisiko rendah — dan menghidupkannya. Apabila didayakan, WebBrain menambahkan teks tersebut kepada system prompt ejen supaya ia boleh mengisi borang pendaftaran tanpa bertanya setiap kali. Teks disimpan sebagai teks biasa dalam storan tempatan pelayar anda. Ia tidak dihantar kepada projek WebBrain, tetapi ia dihantar kepada pembekal LLM yang anda konfigurasikan pada setiap giliran, sebagai sebahagian daripada system prompt. Dimatikan secara lalai. Jangan letakkan kata laluan untuk akaun penting (Google, Apple, iCloud, perbankan, SSO kerja, e-mel utama) di sini. Akaun-akaun itu sepatutnya menggunakan 2FA dan tidak sepatutnya diserahkan kepada ejen. Kes penggunaan yang dimaksudkan ialah kata laluan pakai buang yang anda guna semula untuk pendaftaran surat berita dan percubaan percuma.

Question 15

Apa yang dilakukan WebBrain dengan sepanduk cookie dan paywall?

Accepted Answer

Sepanduk cookie: WebBrain mengenali sepanduk persetujuan daripada rangka kerja biasa (OneTrust, Cookiebot, Didomi, Quantcast, Google Funding Choices, TrustArc) dan menutupnya sebelum berfikir tentang halaman. Keutamaan adalah "Tolak semua" / "Tolak yang bukan penting" / "Hanya yang perlu" apabila kelihatan jelas; ia berundur ke "Terima semua" daripada hilang dalam labirin "Urus pilihan". Paywall: WebBrain melaporkan paywall dengan jujur dan memberitahu anda apa yang sebenarnya boleh dilihatnya (tajuk, deck, perenggan pertama). Ia tidak cuba memintas paywall — tiada archive.today, 12ft.io, pembersihan cookie, melumpuhkan JS atau helah mod pembaca. Jika anda mahukan artikel penuh, log masuk dengan langganan atau minta WebBrain mencari liputan percuma untuk cerita yang sama.

Question 16

Adakah WebBrain menyokong mod dry-run?

Accepted Answer

Setakat 7.0.0, belum lagi. Mod dry-run dirancang dan sudah ada dalam peta jalan.

Question 17

Bagaimanakah WebBrain mengawal bil LLM awan?

Accepted Answer

Tiga lapisan bebas: Tangkapan skrin jimat token. Sebelum mana-mana imej meninggalkan mesin anda, WebBrain mengubah saiznya (sisi pendek dihadkan, mengekalkan nisbah aspek) dan memampatkannya JPEG secara berulang sehingga ia muat dengan bajet token imej setiap giliran. Tangkapan skrin 2000×1200 yang akan dikenakan kira-kira 1,500 token input pada GPT-4o akan dimampatkan kepada ~300–500 token tanpa kehilangan praktikal untuk tugas membaca halaman. Dilaksanakan dalam _fitImageDimensions dengan ujian unit untuk matematik bajet. Pemangkasan konteks pintar. Sejarah perbualan, output alat dan dump DOM sebaris dibatasi setiap giliran dan dipangkas yang paling lama dahulu apabila tetingkap konteks model aktif menghampiri penuh. Anda tidak akan melihat larian membengkak secara senyap dari 10k token kepada 100k kerana read_page mengembalikan artikel sepanjang novel. Model penglihatan khusus. Pasangkan model teks murah (cth. GPT-4o-mini) untuk perancangan dan panggilan alat dengan model penglihatan berasingan (cth. GPT-4o) hanya untuk tangkapan skrin, jadi anda tidak membayar harga model multimodal pada setiap giliran. Konfigurasi di bawah Tetapan → Penglihatan. Hasil bersih: sesi panjang dengan pembekal awan kekal boleh diramal. Untuk kawalan penuh, gunakan llama.cpp secara tempatan — kos sifar setiap token.

Question 18

Bolehkah saya menyumbang kepada WebBrain?

Accepted Answer

Sudah tentu! WebBrain berlesen MIT dan mengalu-alukan sumbangan. Lihat repositori GitHub untuk issue, permintaan ciri dan garis panduan sumbangan.

Ciri	WebBrain	Claude dalam Chrome
Sumber Terbuka	Lesen MIT	Berhak milik
Harga	Percuma selamanya	Memerlukan Claude Pro ($20/bulan)
Sokongan LLM tempatan	llama.cpp, Ollama	Tidak — Claude sahaja
Berbilang pembekal	All OpenAI-compatible endpoints	Claude sahaja
Chrome	Ya (MV3)	Ya
Firefox	Ya (MV2)	Tidak
UI panel sisi	Ya	Ya
Mod Tanya / Bertindak	Ya	Serupa
Sepenuhnya luar talian	Ya (dengan LLM tempatan)	Tidak — perlukan awan
Boleh dihos sendiri	Ya	Tidak

Aspek	WebBrain	OpenClaw / Browser-Use / dsb.
Apa itu?	Sambungan pelayar (alat pengguna akhir)	Rangka kerja ejen / SDK (alat pembangun)
Pengguna sasaran	Sesiapa sahaja — tanpa pengaturcaraan	Pembangun yang membina automasi
Pemasangan	Pemasangan pelayar satu klik	Perlukan persediaan Python/Docker
UI	Sembang panel sisi terbina dalam	Tiada UI — kod atau API sahaja
Kawalan pelayar	Content script (ringan)	CDP / Playwright (kawalan penuh)
Aliran kerja berbilang tab	Perbualan setiap tab	Orkestrasi berbilang tab boleh diprogram
Mod headless	Tidak — berjalan dalam pelayar anda	Ya — automasi headless
Kebolehlanjutan	Tambah pembekal LLM tersuai	Python SDK penuh, alat tersuai
Terbaik untuk	Pembantu AI penyemakan imbas harian	Pipeline mengikis / ujian automatik

Ejen Pelayar AI Sumber Terbuka

Katalog Produk

Saksikan WebBrain beraksi

Segalanya yang anda perlukan dalam AI pelayar

Pemahaman Halaman

Ejen Pelayar Penuh

Pengekstrakan Data

LLM Berbilang Pembekal

Privasi Diutamakan

Konteks Pintar

Model Penglihatan Khusus

Auto-isi Profil

Mengenali Cookie & Paywall

Optional CAPTCHA Solver

UI Berbilang Bahasa

Jimat Token

Bawa AI Anda Sendiri

Tanya atau Bertindak

Mod Tanya

Mod Bertindak

Pasang WebBrain

Chrome & Chromium

Firefox

Bagaimana WebBrain berbanding?

vs. Pemalam AI Pelayar

vs. Rangka Kerja Ejen AI (kategori berbeza)

Soalan Lazim

Sebarkan, kongsi kasih sayang