Question 1

Ang WebBrain ba ay libreng alternatibo sa browser plugin ng Claude?

Accepted Answer

Oo. Nagbibigay ang WebBrain ng katulad na AI browser agent capabilities — pagbabasa ng mga pahina, pagkuha ng datos, pag-click sa mga button, pagpu-puno ng form, at pag-automate ng multi-step na workflow. Hindi tulad ng proprietary Claude browser plugin na nangangailangan ng Claude Pro subscription at gumagana lamang sa mga modelo ng Anthropic, ang WebBrain ay ganap na libre, open-source (MIT license), at sumusuporta sa maraming LLM provider kasama ang mga lokal na modelo na buong-buong tumatakbo sa iyong makina.

Question 2

Paano ihahambing ang WebBrain sa OpenClaw, Browser-Use, at iba pang AI agent framework?

Accepted Answer

Magkaibang kategorya ng tool ang mga ito. Ang WebBrain ay isang browser extension — iinstall mo ito sa Chrome o Firefox at makikipag-usap sa side panel, walang coding na kinakailangan. Ang mga framework tulad ng OpenClaw at Browser-Use ay mga developer SDK para sa paggawa ng automated browser pipelines sa Python, kadalasang gumagamit ng headless browser at CDP. Isipin mo na lang: ang WebBrain ay para sa pang-araw-araw na pagba-browse kasama ang AI assistant; ang mga agent framework ay para sa paggawa ng scraping bot at test automation. Maaari mong gamitin ang dalawa — komplementaryo ang mga ito.

Question 3

Magagamit ko ba ang WebBrain nang ganap na offline?

Accepted Answer

Oo. Ang default na provider ng WebBrain ay ang llama.cpp na nagpapatakbo ng lokal na AI model sa iyong computer. Walang kailangang API key, walang kailangang internet para sa AI, at walang dataong umaalis sa iyong makina. Mag-download lang ng GGUF model, simulan ang llama-server, at meron ka nang isang ganap na pribadong AI browser agent. Maaari mo ring gamitin ang Ollama gamit ang OpenAI-compatible endpoint nito.

Question 4

Anong mga AI model ang sinusuportahan ng WebBrain?

Accepted Answer

Sinusuportahan ng WebBrain ang apat na uri ng provider: llama.cpp (anumang lokal na GGUF model), OpenAI (GPT-4o, GPT-4, atbp.), Claude (Claude Opus, Sonnet, Haiku sa pamamagitan ng native API), at OpenRouter (access sa 100+ models mula sa iba't ibang provider). Anumang OpenAI-compatible na API endpoint ay gumagana, kaya magagamit mo rin ang mga serbisyong tulad ng Together AI, Groq, Mistral, o anumang lokal na server na may OpenAI-compatible interface.

Question 5

Ano ang pinakamahusay na inirerekomenda na modelo?

Accepted Answer

Sa petsang Abril 21, 2026, ang nangungunang rekomendasyon ay ang Qwen 3.6 35B. Dahilan: sa aming vision benchmark (vision-model-shootout), nadaig nito ang Gemma 4 sa pag-unawa sa mga screenshot habang nananatiling praktikal para sa lokal na inference. Para sa mga consumer GPU, perpekto ang RTX 5090, at madalas na pwede ang RTX 4090 gamit ang INT4 AutoRound quantization sa pamamagitan ng Intel/Qwen3.6-35B-A3B-int4-AutoRound. Para sa max speed, inirerekomenda naming i-serve ito gamit ang vLLM. Halimbawang command: python -u -m vllm.entrypoints.openai.api_server --model Intel/Qwen3.6-35B-A3B-int4-AutoRound --served-model-name qwen3.6-35b --quantization auto --dtype bfloat16 --max-model-len 65536 --max-num-batched-tokens 32768 --max-num-seqs 4 --host 0.0.0.0 --port 8000 --gpu-memory-utilization 0.92 --enable-prefix-caching --enable-chunked-prefill --limit-mm-per-prompt '{"image": 4, "video": 1}' --mm-processor-cache-type shm --reasoning-parser qwen3 --enable-auto-tool-choice --tool-call-parser qwen3_coder --trust-remote-code --allowed-origins '["*"]' --speculative-config '{"method": "dflash", "model": "z-lab/Qwen3.6-35B-A3B-DFlash", "num_speculative_tokens": 15}' --attention-backend flash_attn Opsyonal ang DFlash speculative decoding.

Question 6

Nakakakuha ako ng "Failed to fetch" pag nag-co-connect sa isang lokal na LLM server (vLLM, Ollama, llama.cpp) sa aking network

Accepted Answer

Kung ang iyong LLM server ay nasa ibang makina sa iyong lokal na network (hal. http://192.168.1.x:8000), hinaharangan ng Chrome ang request maliban kung magpadala ang server ng CORS headers. Ang ayos ay depende sa iyong server: vLLM: Simulan gamit ang --allowed-origins '["*"]' (ang value ay dapat na JSON list). Ollama: Itakda ang environment variable na OLLAMA_ORIGINS=* bago magsimula. llama.cpp: Naka-enable ang CORS by default — walang kailangang baguhin. Kung tumatakbo ang iyong server sa localhost (parehong makina ng browser), kadalasan ay hindi kinakailangan ang CORS. Ang isyu ay para lamang sa cross-machine na koneksyon sa lokal na network. Tiyaking nagtatapos sa /v1 ang base URL sa setting ng WebBrain (hal. http://192.168.1.47:8000/v1).

Question 7

Gumagana ba ang WebBrain sa Firefox?

Accepted Answer

Oo. Mayroong WebBrain Chrome version (Manifest V3, gamit ang sidePanel API) at Firefox version (Manifest V2, gamit ang sidebar_action). Magkapareho ang mga tampok ng dalawang bersyon. Ang Firefox version ay maaaring i-load bilang temporary add-on para sa development, o i-publish sa addons.mozilla.org para sa permanenteng pag-install.

Question 8

Maaari ko bang ilipat ang Firefox sidebar mula sa kaliwa papuntang kanan, tulad ng side panel ng Chrome?

Accepted Answer

Oo — ang sidebar ng Firefox ay nasa kaliwa by default, ngunit maaari mo itong i-flip. Mag-right-click kahit saan sa header ng sidebar at piliin ang Move Sidebar to Right (o gamitin ang View → Sidebar → Move Sidebar to Right mula sa menu bar). Mananatili ang posisyon kahit pagkatapos mag-restart. Ang sidePanel ng Chrome ay nasa kanan by default at hindi maililipat ng user mula sa panel mismo.

Question 9

Ligtas bang gamitin ang WebBrain? Maaari ba nitong baguhin ang mga web page?

Accepted Answer

May dalawang mode ang WebBrain: ang mode ng Pagtatanong (default) ay read-only at hindi maaaring baguhin ang anumang bagay sa pahina. Ang mode ng Pagkilos ay nag-e-enable ng buong browser agent capabilities (pag-click, pag-type, pagna-navigate) ngunit nangangailangan ng tahasang kumpirmasyon ng user bago i-activate, at may kasamang nakikitang warning banner. Maaari mong itigil ang ahente anumang oras gamit ang Stop button. Ang source code ng extension ay buong nakabukas sa GitHub para sa audit.

Question 10

Paano ko magagamit ang WebBrain para sa web scraping at pagkuha ng datos?

Accepted Answer

Buksan lang ang anumang web page, buksan ang WebBrain side panel, at tumanong gamit ang natural na wika: "Kunin ang lahat ng pangalan at presyo ng produkto sa pahinang ito", "Kunin ang lahat ng email address sa pahinang ito", o "Mag-summarize ng artikulong ito sa bullet points". Babasahin ng AI agent ang nilalaman ng pahina, mauunawaan ang istruktura, at ibabalik ang nakuhang datos. Para sa mas kumplikadong scraping, lumipat sa Mode ng Pagkilos at ang ahente ay maaaring mag-navigate sa pagitan ng mga pahina, mag-click sa mga pagination button, at mag-aggregate ng datos sa maraming pahina.

Question 11

Direktang tumatawag ba ang WebBrain sa API, o palagi itong nag-cli-click sa UI?

Accepted Answer

Bilang default, ang WebBrain ay palaging dumadaan sa nakikitang UI para sa anumang aksyon na gumagawa, nagbabago, nagtatanggal, nagpapadala, nagpo-post, o bumibili ng anuman. Magna-navigate ito sa pahina, magpu-puno ng form, at magki-click ng button — eksakto kung paano mo gagawin. Tumatanggi itong tumawag ng mga REST/GraphQL endpoint nang direkta sa pamamagitan ng background fetch() para sa mga mutation. Sadyang ginagawa ito: ang mga aksyon sa API ay hindi nakikita (hindi mo nakikita kung ano ang ipinapadala), madalas nangangailangan ng hiwalay na auth token na maaaring hindi mo nakonfigure, at may mas malaking blast radius kaysa sa isang nakikitang maling click. Ang UI-first ay nangangahulugang nasa screen ang lahat, sa normal na browser session mo, at maaaring ipahinto anumang oras. Para sa pagbabasa ng datos — pagkuha ng README, pagtingin sa isang issue, paghahambing ng presyo sa iba't ibang site, pagtingin sa status page — malayang gumagamit ang WebBrain ng background HTTP requests sa pamamagitan ng fetch_url at research_url tools. Ang pagbabasa ay hindi pagkilos; hindi nito binabago ang anumang bagay sa remote service, kaya hindi nagagamit ang parehong concerns sa kaligtasan. Kung partikular mong gustong payagan ang mga API mutation para sa isang partikular na gawain, mag-type ng /allow-api sa simula ng iyong mensahe (opsyonal na sundan ng maikling task description). Pinapayagan ng per-conversation override na ito ang WebBrain na bumalik sa mga API endpoint kapag tunay na hindi gumagana o hindi pwede ang UI, habang nananatiling iniprefer ang UI kapag gumagana ang UI. May isang sticky badge na nananatiling nakikita sa itaas ng input area habang aktibo ang override, at mati-clear ito kapag nag-reset ka ng conversation.

Question 12

Magagamit ko rin ba ito sa LM Studio?

Accepted Answer

Oo. Ang read-only na network tools ng WebBrain — fetch_url at research_url — ay ipinapadala rin bilang standalone na LM Studio plugin sa webbrain/web-tools. I-install gamit ang lms clone webbrain/web-tools at i-on sa anumang LM Studio chat — anumang tool-capable na modelo ay maaaring tumawag sa dalawang tool na ito nang hindi mo kailangang i-install ang browser extension. Pure Node, walang headless browser. Source: lmstudio-plugin/.

Question 13

Maaari ba akong lumipat sa ibang tab habang gumagawa ang WebBrain sa isang pahina?

Accepted Answer

Oo, sa Chrome — tumatakbo ang ahente sa background service worker at naka-bind sa tab kung saan ito nagsimula, kaya patuloy itong magki-click, magta-type, at magbabasa sa partikular na tab na iyon kahit gumagalaw ka sa ibang lugar. Ang mga tool na may target na tab (CDP click, type, navigate, screenshot) ay gumagana lahat sa mga backgrounded tab sa Chrome. Nilalock ng sidebar ang input habang tumatakbo ang isang task para hindi ka makapagsimula nang aksidente ng pangalawang task sa bagong tab — kailangan mong maghintay o ipahinto ang kasalukuyan. Tandaan na nililimitahan ng mga browser ang mga timer at animation sa mga background tab, kaya maaaring medyo bumagal ang pagresponde ng mga animated na site. Sa Firefox, magpapatuloy ang ahente na tumakbo sa orihinal nitong tab, pero limitado ang auto-screenshots: ang screenshot API ng Firefox ay nakakakuha lamang ng kasalukuyang aktibong tab, hindi ng partikular na tab sa background. Tinutukoy ito ng WebBrain at nilalaktawan ang screenshot para sa turn na iyon sa halip na ipakain sa modelo ang isang larawan ng isang walang kaugnayang pahina. Patuloy na magpa-plan ang ahente mula sa text-based na konteksto hanggang sa bumalik ka sa tab nito. Iwasang aktibong mag-click o mag-type sa parehong tab na ginagamit ng ahente — gumagawa iyon ng race conditions kung saan kayong dalawa ng ahente ay naglalaban para sa parehong pahina. OK lang ang paglipat sa ibang tab; hindi OK ang sabay na pagpapatakbo ng parehong tab.

Question 14

Paano gumagana ang Profile auto-fill, at ligtas ba ito?

Accepted Answer

Ang Profile auto-fill ay isang opsyonal na tampok sa Settings → Profile. Maglalagay ka ng maikling bio — pangalan, work email, kumpanya, at isang isahang-gamit na password para sa mga low-stakes na signup — at i-on ito. Kapag naka-enable, idinaragdag ng WebBrain ang text na iyon sa system prompt ng ahente para makapag-puno ito ng signup forms nang hindi nagtatanong tuwing kailangan. Ang text ay nakaimbak bilang plain text sa local storage ng iyong browser. Hindi ito ipinapadala sa proyektong WebBrain, ngunit ipinapadala ito sa kung anong LLM provider ang iyong na-configure sa bawat turn, bilang bahagi ng system prompt. Naka-off bilang default. Huwag maglagay ng mga password para sa mahahalagang account (Google, Apple, iCloud, banking, work SSO, primary email) dito. Dapat gumamit ng 2FA ang mga account na iyon at hindi naman dapat ipinapasa sa isang ahente. Ang inilaang gamit ay isang isahang-gamit na password na ginagamit mo ulit para sa mga newsletter signup at libreng trial.

Question 15

Ano ang ginagawa ng WebBrain sa cookie banners at paywalls?

Accepted Answer

Cookie banners: Tinutukoy ng WebBrain ang consent banners mula sa mga karaniwang framework (OneTrust, Cookiebot, Didomi, Quantcast, Google Funding Choices, TrustArc) at isinasara ang mga ito bago mag-reason tungkol sa pahina. Ang priority ay "Reject all" / "Reject non-essential" / "Only necessary" kapag malinaw na nakikita; bumabalik ito sa "Accept all" sa halip na maglaho sa "Manage preferences" na maze. Paywalls: Tapat na inulat ng WebBrain ang paywall at sasabihin sa iyo kung ano talaga ang nakita nito (headline, dek, mga unang talata). Hindi nito sinusubukang i-bypass ang mga paywall — walang archive.today, 12ft.io, pagtatanggal ng cookie, pag-disable ng JS, o reader-mode tricks. Kung gusto mo ang buong artikulo, mag-log in gamit ang subscription o hilingin sa WebBrain na maghanap ng libreng coverage ng parehong kwento.

Question 16

Sinusuportahan ba ng WebBrain ang dry-run mode?

Accepted Answer

Sa 7.0.0, hindi pa. Ang dry-run mode ay planado at nasa roadmap na.

Question 17

Paano kinokontrol ng WebBrain ang singil sa cloud LLM?

Accepted Answer

Tatlong magkakahiwalay na layer: Mga screenshot na pinatipid sa tokens. Bago umalis sa iyong makina ang anumang larawan, binabago ng WebBrain ang sukat nito (may cap sa shorter side, pinapanatili ang aspect ratio) at iteratively na nila-JPEG-compress hanggang kasya ito sa per-turn image-token budget. Ang isang 2000×1200 na screenshot na gagastos ng ~1,500 input tokens sa GPT-4o ay napi-compress sa ~300–500 tokens na walang praktikal na pagkawala para sa mga gawaing nagbabasa ng pahina. Ipinatupad sa _fitImageDimensions kasama ang unit tests para sa budget math. Matalinong context trimming. Ang kasaysayan ng usapan, output ng mga tool, at mga inline DOM dump ay limitado per turn at binabawasan na nag-uunang sa pinakamatandang kapag ang context window ng aktibong modelo ay malapit nang mapuno. Hindi mo makikita na ang isang run ay tahimik na lumaki mula 10k tokens patungong 100k dahil nagbalik ang read_page ng isang artikulong kasinghaba ng nobela. Nakalaang vision model. Magsama ng murang text model (hal. GPT-4o-mini) para sa pagpaplano at tool calls sa isang hiwalay na vision-capable na modelo (hal. GPT-4o) para lang sa mga screenshot, kaya hindi mo babayaran ang presyo ng multimodal-model sa bawat turn. I-configure sa ilalim ng Settings → Vision. Net result: mananatiling predictable ang mahahabang sesyon sa cloud providers. Para sa buong kontrol, gamitin ang llama.cpp nang lokal — zero ang cost per token.

Question 18

Maaari ba akong mag-contribute sa WebBrain?

Accepted Answer

Talagang pwede! Naka-MIT license ang WebBrain at tumatanggap ng mga contribution. Tingnan ang GitHub repository para sa mga issue, feature request, at contribution guidelines.

Tampok	WebBrain	Claude sa Chrome
Open Source	MIT License	Proprietary
Presyo	Libre habambuhay	Kailangan ng Claude Pro ($20/buwan)
Suporta sa lokal na LLM	llama.cpp, Ollama	Hindi — Claude lamang
Multi-provider	All OpenAI-compatible endpoints	Claude lamang
Chrome	Oo (MV3)	Oo
Firefox	Oo (MV2)	Hindi
UI sa side panel	Oo	Oo
Mode ng Pagtatanong / Pagkilos	Oo	Magkatulad
Ganap na offline	Oo (gamit ang lokal na LLM)	Hindi — kailangan ang cloud
Self-hostable	Oo	Hindi

Aspeto	WebBrain	OpenClaw / Browser-Use / atbp.
Ano ito?	Browser extension (gamit ng end-user)	Agent framework / SDK (gamit ng developer)
Target user	Sino man — walang coding	Mga developer na gumagawa ng automation
Pagi-install	One-click browser install	Kailangan ng Python/Docker setup
UI	Built-in na side panel chat	Walang UI — code o API lamang
Kontrol sa browser	Content script (magaan)	CDP / Playwright (buong kontrol)
Multi-tab workflows	Bawat-tab na conversation	Programmable multi-tab orchestration
Headless mode	Hindi — tumatakbo sa iyong browser	Oo — headless automation
Kakayahang palawakin	Magdagdag ng custom LLM providers	Buong Python SDK, mga custom na tool
Pinakamabuti para sa	Pang-araw-araw na AI assistant sa browsing	Mga automated scraping / testing pipelines

Ang Open-Source na AI Browser Agent

Catalog ng Produkto

Panoorin ang WebBrain sa aksyon

Lahat ng kailangan mo sa isang AI sa browser

Pag-unawa sa Pahina

Buong Browser Agent

Pagkuha ng Datos

Multi-Provider na LLM

Privacy Una

Matalinong Konteksto

Nakalaang Vision Model

Auto-fill ng Profile

May Kaalaman sa Cookie at Paywall

Optional CAPTCHA Solver

Multilingual UI

Pinatipid sa Tokens

Dalhin ang Sariling AI

Magtanong o Kumilos

Mode ng Pagtatanong

Mode ng Pagkilos

I-install ang WebBrain

Chrome at Chromium

Firefox

Paano ihahambing ang WebBrain?

vs. Browser AI Plugins

vs. AI Agent Frameworks (ibang kategorya)

Mga Madalas Itanong

Ipalaganap ang salita, ibahagi ang pagmamahal