🚨 Berita terkini : OpenAI telah meluncurkan Operator , agen bertenaga AI yang dapat menggunakan perambannya sendiri untuk melakukan tugas bagi Anda. Saat ini, Operator hanya tersedia untuk pengguna Pro di AS, tetapi akan segera hadir secara global. 🌍
Keren, kan? Tapi tunggu dulu—apakah kita yakin situs web tidak akan melawan? 🤔 Akankah teknologi anti-bot saat ini seperti larangan IP, sidik jari peramban, sidik jari TLS, dan, tentu saja, CAPTCHA mengikuti perkembangan alat baru OpenAI?
Jadi, siapa yang sebenarnya menang dalam pertarungan antara bot otomatis yang rumit dan pertahanan anti-bot? Baca terus untuk mengetahuinya! 🔥
Ketika model LLM pertama kali beredar di pasaran, hal itu merupakan sebuah revolusi. Cara kita mengerjakan tugas sehari-hari di tempat kerja berubah selamanya, pasar saham bereaksi dengan antusias 🚀, dan semua orang berbondong-bondong menggunakan AI (meskipun belum ada AI yang nyata di balik sebagian besar produk daring).
Seperti biasa, kehebohan awal akhirnya memudar, dan beberapa pertanyaan penting mulai muncul. Anda tidak perlu menjadi insinyur pembelajaran mesin atau ahli Kaggle (BTW, kami juga dapat menemukan kami di sana ! 😉) untuk mengetahui bahwa LLM tidak berjalan dengan sihir 🧙— mereka membutuhkan banyak sekali data untuk dilatih .
Jadi, dari mana semua data itu berasal? Jawaban mudahnya: Web! 🌍
Web adalah sumber data terbesar di dunia, jadi tidak mengherankan jika perusahaan seperti OpenAI telah mengorek Internet selama bertahun-tahun untuk mengumpulkan data yang dibutuhkan guna melatih teknologi inovatif mereka. Selama pengorekkan web dilakukan secara etis, tidak ada yang salah dengan itu 🤷.
Kiat pro : Pelajari topik tersebut lebih dalam dengan membaca artikel kami tentang cara tetap beretika dan legal di era pengikisan web AI .
Tapi inilah kendalanya: Sebagian besar pemilik situs tidak senang dengan perusahaan AI yang menggunakan data mereka! 😠
Bagaimanapun, data sama dengan uang 💰. Sudah beberapa tahun sejak The Economist menerbitkan artikel " Sumber daya paling berharga di dunia bukan lagi minyak, tetapi data ." Jadi, sejujurnya, tidak perlu dijelaskan lebih lanjut.
Singkatnya, memberikan data Anda secara gratis pada dasarnya sama dengan membagikan uang tunai 💸. Tidak heran pemilik situs—terutama perusahaan besar—tidak begitu senang dengan hal itu. 😅
Sekarang lanskapnya terus berkembang dan operator serta alat AI baru mulai bermunculan, situs web mungkin mulai merasa sangat tidak senang dengan hal itu. 😬
Dalam artikelnya tentang cara kerja Operator , OpenAI berbagi:
“Operator didukung oleh model baru yang disebut Computer-Using Agent (CUA). Dengan menggabungkan kemampuan penglihatan GPT-4 dengan penalaran tingkat lanjut melalui pembelajaran penguatan, CUA dilatih untuk berinteraksi dengan antarmuka pengguna grafis (GUI)—tombol, menu, dan bidang teks yang dilihat orang di layar.”
Jelas bahwa, sementara perusahaan AI seperti OpenAI sebelumnya telah membuat bot scraping untuk mengumpulkan data dari sumber-sumber populer guna melatih model mereka, mereka kini memberi pengguna alat yang dapat "secara ajaib" berinteraksi dengan dan menavigasi situs web. Itu mengasyikkan sekaligus menakutkan! 😱
Lihat Operator OpenAI beraksi dalam video presentasi:
Sekali lagi, dari artikel presentasi resmi:
“Operator dapat “melihat” (melalui tangkapan layar) dan “berinteraksi” (menggunakan semua tindakan yang dimungkinkan oleh mouse dan keyboard) dengan browser, yang memungkinkannya mengambil tindakan di web tanpa memerlukan integrasi API khusus.
Jika menemui kendala atau melakukan kesalahan, Operator dapat memanfaatkan kemampuan penalarannya untuk mengoreksi diri sendiri. Jika mengalami kendala dan memerlukan bantuan, operator cukup menyerahkan kendali kembali kepada pengguna, sehingga memastikan pengalaman yang lancar dan kolaboratif.”
Itu sangat menjanjikan, tetapi juga menimbulkan beberapa kekhawatiran serius. 🤔 Bagaimana jika pengguna mulai menyalahgunakan Operator untuk tujuan jahat? Kita semua sudah muak dengan bot (seperti komentar spam yang membanjiri YouTube), dan ini dapat dengan cepat berubah menjadi masalah besar. ⚠️
Dengan asumsi OpenAI berhasil mencegah Operator melakukan tindakan yang berbahaya atau tidak diinginkan—seperti halnya mereka telah berupaya mencegah ChatGPT menjawab pertanyaan berbahaya—dapatkah kita benar-benar yakin bahwa sebagian besar situs web akan menyambut interaksi baru, otomatis, dan bertenaga AI semacam ini? 🤖
Sebelum menyelami pertanyaan besar yang masih belum terjawab, mari kita perjelas dulu jenis interaksi apa yang sedang kita hadapi. Pada akhirnya, jika operator AI baru ini tidak seefektif yang kita kira, mengapa kita harus repot-repot melindungi diri dari mereka sejak awal? 👀
Anti-bot bukan lelucon. Perusahaan seperti Cloudflare—pemimpin penyedia WAF ( Web Application Firewall ), yang dikenal karena solusi anti-bot yang kuat— menghabiskan jutaan dolar setiap tahun untuk penelitian dan pengembangan agar tetap unggul . 🤑
Saat ini, hanya pengguna AS yang membayar $200 per bulan untuk tingkat langganan tertinggi ChatGPT Pro yang dapat mengakses Operator OpenAI , jadi tidak semua orang berkesempatan untuk mengujinya. Namun bagi mereka yang sudah mencobanya? Hasilnya sangat mengesankan! 🤯
Pengguna awal dan pengulas teknologi menemukan OpenAI luar biasa dalam mengotomatisasi tugas sehari-hari seperti:
Bagaimana mungkin? Operator membuka jendela browser mini dan menyelesaikan tugas berdasarkan perintah teks Anda—seperti yang dilakukan pengguna biasa:
Tentu saja, produk tersebut masih dalam tahap "pratinjau penelitian" dan belum sempurna. Terkadang, Anda perlu memberikannya dorongan atau menyelamatkannya dari serangkaian upaya yang gagal.
Meskipun beberapa pengguna Reddit telah menyuarakan keluhan —terutama mengingat harganya yang mahal— tidak dapat disangkal bahwa teknologi ini sudah luar biasa bahkan pada tahap ini. Misalnya, lihat saja saat memesan tiket pesawat !
➡️ Pertanyaan sebenarnya sekarang: Akankah situs web menyambut otomatisasi bertenaga AI, atau akankah mereka melawannya? Dan jika ya, bagaimana? ⚔️
Solusi anti-bot dan anti-scraping bukanlah hal baru—banyak situs telah menggunakannya selama bertahun-tahun untuk melindungi dari skrip otomatis yang mengikis data dan berinteraksi dengan halaman mereka. 🚫
Jika Anda penasaran dengan metode ini, lihat webinar kami tentang teknik anti-bot tingkat lanjut:
Seperti yang mungkin sudah Anda ketahui—terutama jika Anda mengikuti seri kami tentang web scraping tingkat lanjut —kita berbicara tentang:
Pembatas laju : Alat yang membatasi jumlah permintaan dari pengguna dalam waktu tertentu untuk mencegah kelebihan beban. Alat ini bekerja dengan cara memblokir IP .
Sidik Jari TLS : Metode yang melacak karakteristik unik koneksi terenkripsi browser untuk mengidentifikasi bot. Jelajahi peran sidik jari TLS dalam pengikisan web .
Sidik Jari Peramban : Suatu teknik untuk mendeteksi atribut perangkat atau peramban yang unik guna menemukan alat otomatis.
Pertahanan awal ini berfokus pada pemblokiran permintaan dari alat otomatis (seperti operator AI) sebelum mereka mendapat kesempatan mengakses situs 🛡️.
Jika pertahanan tersebut gagal, teknik lain akan digunakan. Beberapa contohnya? Analisis perilaku pengguna,tantangan JavaScript , dan CAPTCHA!
CAPTCHA sangat efektif karena dirancang agar mudah dipecahkan oleh manusia, tetapi sulit dipecahkan oleh bot.
Namun, seiring dengan kecerdasan buatan yang semakin cerdas dan mulai berpikir seperti manusia, mengenali bot menjadi semakin sulit. Inilah sebabnya beberapa ide liar, seperti menggunakan video game sebagai CAPTCHA , mulai bermunculan. 🎮
Namun pertanyaan sebenarnya adalah—apakah CAPTCHA merupakan solusi terbaik untuk melawan operator AI? Mari kita bahas dan cari tahu! 💡
TL;DR : Tidak, tidak juga… 🙅♂️
Sejak OpenAI Operator memasuki pasaran untuk pengujian, pengguna telah menggunakannya untuk menyelesaikan tugas yang melibatkan CAPTCHA—masuk ke media sosial, mengisi formulir, dan banyak lagi.
Namun seperti yang dicatat di halaman presentasi Agen Pengguna Komputer OpenAI, intervensi manusia masih diperlukan:
“Meskipun menangani sebagian besar langkah secara otomatis, CUA meminta konfirmasi pengguna untuk tindakan sensitif, seperti memasukkan detail login atau menanggapi formulir CAPTCHA.”
Tentu, terkadang mesin penalaran AI dapat lolos dari CAPTCHA 🥷, tetapi lebih sering gagal total —dengan hasil yang menggelikan sekaligus membuat frustrasi. Saat diuji di Reddit, Google Maps, Amazon, dan G2 , mesin tersebut berulang kali dimatikan oleh perlindungan anti-bot.
Melihat operator AI gagal dan gagal dalam CAPTCHA telah menjadi tren yang viral. Video alat AI ini yang gagal dalam upaya login membanjiri Reddit dan X:
Pengulas teknologi lainnya mengonfirmasikan frustrasi yang sama: OpenAI Operator diblokir oleh sebagian besar CAPTCHA .
Di satu sisi, ini meyakinkan—CAPTCHA menjalankan tugasnya dan menghentikan bot otomatis agar tidak menimbulkan kekacauan. Di sisi lain, kita berada dalam permainan kucing-kucingan 🐁 🐈. Operator teknologi anti-bot dan AI akan terus berkembang, bergiliran menjadi selangkah lebih maju.
Siapa yang benar-benar pecundang? Pengguna biasa! Lebih banyak situs kemungkinan akan menerapkan CAPTCHA, membuat penjelajahan menjadi lebih sulit bagi semua orang. Dan jujur saja—kita semua membenci CAPTCHA. 😩
Pertarungan ini tidak hanya memengaruhi operator AI—pengikis web yang beretika juga ikut terdampak. Saat situs meningkatkan langkah anti-bot, skrip pengikis yang sah akan diblokir secara tidak adil, sehingga menyulitkan peneliti, bisnis, dan pengembang untuk mengekstraksi data .
Untungnya, ada cara yang lebih baik untuk berinteraksi dengan situs secara terprogram tanpa berurusan dengan CAPTCHA dan mimpi buruk anti-bot lainnya: Scraping Browser !
OpenAI Operator mengotomatiskan peramban biasa seperti alat otomatisasi peramban lainnya. Namun, inilah masalahnya—sebagian besar teknologi anti-bot, termasuk CAPTCHA, tidak muncul karena otomatisasi itu sendiri. Teknologi tersebut muncul karena cara peramban dikonfigurasikan !
Sebagian besar pustaka otomatisasi peramban menyiapkan peramban dengan cara yang mengeksposnya sebagai peramban otomatis, sehingga sepenuhnya mengalahkan tujuan penggunaan peramban "biasa". Di sinilah sistem anti-bot masuk dan memblokir akses. 🚫
Alih-alih berfokus pada apakah AI dapat melewati CAPTCHA, pengubah permainan yang sebenarnya adalah menggunakan browser yang tepat—yang dioptimalkan untuk pengikisan dan otomatisasi . Di sinilah Scraping Browser dari Bright Data hadir, yang dilengkapi dengan:
Sidik jari TLS yang andal untuk menghindari deteksi
Skalabilitas tak terbatas untuk ekstraksi data skala besar
Rotasi IP bawaan didukung oleh jaringan proxy 72 juta IP
Percobaan ulang otomatis untuk menangani permintaan yang gagal
Kekuatan super pemecahan CAPTCHA yang mengungguli operator AI 🧠
Tidak mengherankan di sini —Pemecah CAPTCHA bawaan Scraping Browser jauh lebih efektif daripada Operator OpenAI. Mengapa? Karena didukung oleh pengembangan selama bertahun-tahun dari tim yang sama yang menangani gangguan data SEO baru-baru ini dalam hitungan menit . ⚡
Pemecah CAPTCHA Bright Data telah terbukti berhasil melawan:
Tidak hanya mengurangi kemungkinan munculnya CAPTCHA , tetapi saat CAPTCHA muncul, ia menyelesaikannya dengan mudah . 🔥
Scraping Browser berfungsi dengan semua kerangka kerja otomatisasi browser utama—termasuk Playwright, Puppeteer, dan Selenium. Jadi, apakah Anda menginginkan kontrol programatik penuh atau bahkan menambahkan logika AI di atasnya , Anda sudah terlindungi.
Lihat Scraping Browser Bright Data beraksi:
Jadi… haruskah kita terus memaksa AI untuk memecahkan CAPTCHA, atau cukup gunakan alat yang berfungsi? Pilihannya jelas. Mengikis Browser FTW. 🏆
Operator OpenAI hadir untuk merevolusi interaksi web—tetapi tidak sepenuhnya canggih. Meskipun mengesankan, Operator masih kesulitan menghadapi CAPTCHA dan diblokir.
Hindari kerepotan dengan Scraping Browser, yang dilengkapi dengan CAPTCHA Solver bawaan untuk otomatisasi yang lancar. Mulailah perjalanan kami untuk mendemokratisasi Web, memastikannya tetap dapat diakses oleh semua orang, di mana saja, bahkan melalui skrip otomatis!
Sampai jumpa lagi, teruslah menjelajahi Internet dengan bebas dan tanpa CAPTCHA!