🚨 Najnovije vijesti : OpenAI je pokrenuo Operator , agenta pokretanog umjetnom inteligencijom koji može koristiti vlastiti preglednik za obavljanje zadataka umjesto vas. Trenutno je dostupan samo Pro korisnicima u SAD-u, ali uskoro dolazi globalno. 🌍
Cool, zar ne? Ali pričekajte – jesmo li sigurni da web stranice neće odbiti? 🤔 Hoće li trenutna anti-bot tehnologija kao što su IP zabrane, otisci prstiju preglednika, TLS otisci prstiju i, naravno, CAPTCHA ići u korak s novim OpenAI alatom?
Dakle, tko zapravo pobjeđuje u ovoj borbi između složenih automatiziranih robota i obrane protiv robota? Čitajte dalje kako biste saznali! 🔥
Kada su se LLM modeli prvi put pojavili na tržištu, to je bila revolucija. Način na koji pristupamo svakodnevnim zadacima na poslu zauvijek se promijenio, burza je reagirala s uzbuđenjem 🚀 i svi su uskočili u vlak umjetne inteligencije (iako još nije postojala prava umjetna inteligencija iza većine online proizvoda).
Kao i uvijek, početni hype je na kraju izblijedio i počela su se javljati neka važna pitanja. Ne morate biti inženjer strojnog učenja ili velemajstor Kagglea (BTW, možemo nas pronaći i tamo ! 😉) da biste znali da LLM-ovi ne rade na magiji 🧙— potrebno im je mnoštvo podataka da bi bili obučeni .
Dakle, odakle dolaze svi ti podaci? Jednostavan odgovor: Web! 🌍
Web je najveći izvor podataka na planetu, stoga ne čudi da su tvrtke poput OpenAI-a godinama crpile internet kako bi prikupile podatke potrebne za obuku svoje revolucionarne tehnologije. I sve dok se web scraping provodi etički, u tome nema ničeg lošeg 🤷.
Stručni savjet : Zaronite duboko u tu temu čitajući naš članak o tome kako ostati etičan i zakonit u doba AI struganja weba .
Ali ovdje je caka: većina vlasnika web stranica nije oduševljena time što AI tvrtke koriste njihove podatke! 😠
Uostalom, podaci su novac 💰. Prošlo je nekoliko godina otkako je The Economist objavio članak " Najvrjedniji svjetski resurs više nije nafta, već podaci ". Dakle, iskreno, nema potrebe to dalje objašnjavati.
Ukratko, besplatno davanje podataka je u osnovi isto što i davanje gotovine 💸. Nije ni čudo da vlasnici web-mjesta - osobito velike tvrtke - nisu baš oduševljeni time. 😅
Sada kada se krajolik razvija i novi AI operateri i alati stupaju na scenu, web stranice bi mogle biti stvarno nezadovoljne zbog toga. 😬
U svom članku o tome kako Operator radi , OpenAI je podijelio:
“Operator pokreće novi model koji se zove Computer-Using Agent (CUA). Kombinirajući sposobnosti vida GPT-4 s naprednim razmišljanjem kroz učenje s pojačanjem, CUA je osposobljen za interakciju s grafičkim korisničkim sučeljima (GUI)—gumbima, izbornicima i tekstualnim poljima koje ljudi vide na ekranu.”
Jasno je da, iako su tvrtke koje se bave umjetnom inteligencijom poput OpenAI-a ranije izgradile botove za struganje kako bi prikupile podatke iz popularnih izvora za obuku svojih modela, one sada daju korisnicima alat koji može "čarobno" komunicirati s web stranicama i kretati se njima. To je i uzbudljivo i zastrašujuće! 😱
Pogledajte OpenAI's Operator na djelu u prezentacijskom videu:
Opet iz službenog prezentacijskog članka:
„Operater može „vidjeti“ (kroz snimke zaslona) i „interagirati“ (koristeći sve radnje koje dopuštaju miš i tipkovnica) s preglednikom, omogućujući mu da poduzima radnje na webu bez potrebe za prilagođenim API integracijama.
Ako naiđe na izazove ili pogriješi, Operator može iskoristiti svoje sposobnosti razmišljanja za samoispravljanje. Kada se zaglavi i treba mu pomoć, jednostavno vraća kontrolu korisniku, osiguravajući glatko iskustvo suradnje.”
To je nevjerojatno obećavajuće, ali također izaziva ozbiljne brige. 🤔 Što ako korisnici počnu zlorabiti Operatora u zlonamjerne svrhe? Svima nam je dosta botova (poput onih neželjenih komentara koji preplavljuju YouTube), a ovo bi brzo moglo prerasti u veliki problem. ⚠️
Pod pretpostavkom da OpenAI uspije spriječiti Operatora u izvođenju štetnih ili neželjenih radnji – baš kao što su radili na tome da ChatGPT ne odgovori na opasna pitanja – možemo li doista biti sigurni da će većina web stranica pozdraviti ovu vrstu nove, automatizirane interakcije koju pokreće AI? 🤖
Prije nego što se upustimo u veliko pitanje koje smo ostavili otvorenim, prvo razjasnimo s kakvom vrstom interakcija imamo posla. Na kraju dana, ako ti novi AI operateri nisu tako učinkoviti kao što mislimo, zašto bismo se uopće trudili štititi od njih? 👀
Anti-bot nije šala. Tvrtke kao što je Cloudflare—vodeći pružatelj usluga WAF ( Web Application Firewall ), poznat po svojim snažnim rješenjima protiv robota —troše milijune dolara svake godine na istraživanje i razvoj kako bi ostali ispred . 🤑
Trenutno samo američki korisnici koji plaćaju 200 dolara mjesečno za najvišu razinu pretplate na ChatGPT Pro mogu pristupiti OpenAI-jevom Operatoru , tako da nije svatko imao priliku isprobati ga. Ali za one koji imaju? Rezultati su impresivni! 🤯
Prvi korisnici i recenzenti tehnike otkrili su da je OpenAI nevjerojatan u automatizaciji svakodnevnih zadataka kao što su:
Kako je to moguće? Operater otvara mini prozor preglednika i dovršava zadatke na temelju vaših tekstualnih upita—baš kao što bi obični korisnik:
Naravno, proizvod je još uvijek u fazi "pretpregleda istraživanja" i nije savršen. Povremeno ćete ga morati gurnuti ili spasiti iz niza neuspjelih pokušaja.
Iako su neki korisnici Reddita izrazili pritužbe — posebno s obzirom na visoku cijenu — ne može se poreći da je ova tehnologija već izvanredna čak iu ovoj fazi. Gledajte kako rezervirate let , na primjer!
➡️ Pravo pitanje sada: Hoće li web-stranice prihvatiti automatizaciju koju pokreće AI ili će uzvratiti? I ako hoće, kako? ⚔️
Anti-bot i anti-scraping rješenja nisu nikakva novost - mnoga ih mjesta koriste godinama za zaštitu od automatiziranih skripti koje skrapuju podatke i stupaju u interakciju s njihovim stranicama. 🚫
Ako vas zanimaju ove metode, pogledajte naš webinar o naprednim anti-bot tehnikama:
Kao što možda već znate—posebno ako ste pratili našu seriju o naprednom skrapanju weba —govorimo o:
Ograničivači brzine : Alati koji ograničavaju broj zahtjeva od korisnika u određenom vremenu kako bi se spriječilo preopterećenje. Oni rade tako da zabranjuju IP adrese .
TLS Fingerprinting : Metoda koja prati jedinstvene karakteristike šifrirane veze preglednika za identifikaciju robota. Istražite ulogu TLS otiska prsta u struganju weba .
Otisak prsta preglednika : Tehnika za otkrivanje jedinstvenih atributa uređaja ili preglednika za uočavanje automatiziranih alata.
Ove početne obrane usmjerene su na blokiranje zahtjeva automatiziranih alata (kao što su AI operateri) prije nego što uopće dobiju priliku pristupiti stranici 🛡️.
Ako te obrane zakažu, druge tehnike dolaze u igru. Neki primjeri? Analiza ponašanja korisnika,JavaScript izazovi i CAPTCHA!
CAPTCHA su posebno učinkovite jer su dizajnirane da ih ljudi lako riješe, ali da ih botovi teško provaljuju.
Ali kako umjetna inteligencija postaje pametnija i počinje više razmišljati kao ljudi, prepoznavanje robota postaje sve teže. Zbog toga se razbacuju neke lude ideje, poput korištenja videoigara kao CAPTCHA . 🎮
Ali pravo pitanje je — jesu li CAPTCHA ultimativno rješenje protiv AI operatera? Zaronimo i saznajmo! 💡
TL;DR : Ne, ne baš… 🙅♂️
Otkako se OpenAI Operator pojavio na tržištu za testiranje, korisnici ga tjeraju da dovrši zadatke koji uključuju CAPTCHA – prijavu na društvene medije, ispunjavanje obrazaca i više.
Ali kao što je navedeno na prezentacijskoj stranici OpenAI's Computer-Using Agent , ljudska intervencija je još uvijek potrebna:
"Iako većinu koraka obrađuje automatski, CUA traži korisničku potvrdu za osjetljive radnje, poput unosa podataka za prijavu ili odgovaranja na CAPTCHA obrasce."
Naravno, ponekad se AI-jev mehanizam za razmišljanje može provući kroz CAPTCHA 🥷, ali češće nego ne, neuspješno zakaže — s rezultatima koji su i urnebesni i frustrirajući. Kada se testira na Redditu, Google kartama, Amazonu i G2 , opetovano ga isključuje zaštita od robota.
Gledanje AI operatera kako se ruše i pale protiv CAPTCHA-a postalo je viralni trend. Videozapisi ovih AI alata koji se probijaju kroz pokušaje prijave preplavljuju Reddit i X:
Drugi recenzenti tehnike potvrđuju istu frustraciju: OpenAI Operator blokira većina CAPTCHA .
S jedne strane, ovo je ohrabrujuće - CAPTCHA-e rade svoj posao i sprječavaju automatizirane robote da prave haos. S druge strane, mi smo u igri mačke i miša 🐁 🐈. Operateri anti-bot tehnologije i AI nastavit će se razvijati, naizmjenično biti korak ispred.
Pravi gubitnici? Redovni korisnici! Vjerojatno će više web stranica implementirati CAPTCHA, što će pregledavanje učiniti bolnijim za sve. I budimo iskreni — svi mi mrzimo CAPTCHA. 😩
Ova bitka ne utječe samo na operatere AI-etički skraperi weba također bivaju uhvaćeni u unakrsnoj vatri. Kako web-mjesta pojačavaju mjere protiv robota, legitimne skripte za skrapiranje bit će nepravedno blokirane, otežavajući ekstrakciju podataka za istraživače, tvrtke i programere .
Srećom, postoji bolji način za programsku interakciju sa stranicama bez suočavanja s CAPTCHA-ama i drugim anti-bot noćnim morama: Scraping Browser !
OpenAI Operator automatizira obične preglednike baš kao i drugi alati za automatizaciju preglednika. Ali evo u čemu je stvar—većina anti-bot tehnologija, uključujući CAPTCHA, ne pojavljuje se zbog same automatizacije. Pojavljuju se zbog toga kako je preglednik konfiguriran !
Većina biblioteka za automatizaciju preglednika postavlja preglednike na načine koji ih izlažu kao automatizirane, potpuno poništavajući svrhu korištenja "običnog" preglednika. Tu stupaju na scenu anti-bot sustavi i blokiraju pristup. 🚫
Umjesto fokusiranja na to može li umjetna inteligencija zaobići CAPTCHA, stvarna promjena je upotreba pravog preglednika—onog optimiziranog za scraping i automatizaciju . Upravo tu dolazi Bright Data's Scraping Browser , prepun:
Pouzdani TLS otisci prstiju za izbjegavanje otkrivanja
Neograničena skalabilnost za ekstrakciju podataka velikih razmjera
Ugrađena IP rotacija koju pokreće 72-milijunska IP proxy mreža
Automatski ponovni pokušaji obrade neuspjelih zahtjeva
Supermoći rješavanja CAPTCHA koje nadmašuju AI operatere 🧠
Ovdje nema nikakvog iznenađenja— Scraping Browser ugrađeni CAPTCHA Solver daleko je učinkovitiji od OpenAI Operatora. Zašto? Zato što ga podupiru godine razvoja istog tima koji je u nekoliko minuta riješio nedavne ispade podataka SEO-a . ⚡
CAPTCHA alat tvrtke Bright Data pokazao se uspješnim protiv:
Ne samo da smanjuje šanse da se CAPTCHA pojave , već ih i kada se pojave rješava bez napora . 🔥
Scraping Browser radi sa svim glavnim okvirima za automatizaciju preglednika—uključujući Playwright, Puppeteer i Selenium. Dakle, bez obzira želite li potpunu programsku kontrolu ili čak dodati AI logiku na vrh , pokriveni ste.
Pogledajte Bright Data's Scraping Browser na djelu:
Dakle… trebamo li nastaviti tjerati umjetnu inteligenciju da rješava CAPTCHA ili samo koristiti alat koji radi? Izbor je očit. Preglednik za struganje FTW. 🏆
OpenAI's Operator je tu da revolucionira web interakciju—ali nije svemoćan. Iako je impresivan, još uvijek se bori protiv CAPTCHA i biva blokiran.
Izbjegnite gnjavažu uz Scraping Browser, koji sadrži ugrađeni CAPTCHA Solver za besprijekornu automatizaciju. Krenite u našu potragu za demokratizacijom weba, osiguravajući da ostane dostupan svima, posvuda, čak i putem automatiziranih skripti!
Do sljedećeg puta nastavite istraživati internet slobodno i bez CAPTCHA!