Google gemetar mengangkat tim di belakang Proyek Pelautagen AI-nya yang dapat menavigasi peramban Chrome dan menyelesaikan tugas atas nama pengguna, WIRED telah mempelajarinya. Dalam beberapa bulan terakhir, beberapa staf Google Labs yang mengerjakan prototipe penelitian telah beralih ke proyek dengan prioritas lebih tinggi, menurut dua orang yang mengetahui masalah tersebut.
Seorang juru bicara Google mengkonfirmasi perubahan tersebut, namun mengatakan kemampuan penggunaan komputer yang dikembangkan di bawah Project Mariner akan dimasukkan ke dalam strategi agen perusahaan di masa depan. Google telah menggabungkan beberapa kemampuan ini ke dalam produk agen lainnya, termasuk yang baru saja diluncurkan Agen Geminijuru bicara itu menambahkan.
Perubahan ini terjadi ketika Google dan laboratorium AI lainnya bergegas merespons munculnya agen berkemampuan tinggi seperti ini Cakar Terbuka. Meskipun alat-alat ini sebagian besar digunakan oleh para pengembang saat ini, Silicon Valley yakin bahwa alat-alat ini akan segera dapat menyediakan asisten untuk keperluan umum bagi masyarakat dan bisnis. CEO Nvidia Jensen Huang membandingkan alat buzzy ini dengan sistem operasi baru untuk komputer agen. “Setiap perusahaan di dunia saat ini perlu memiliki strategi OpenClaw,” katanya pada konferensi pengembang perusahaan awal pekan ini.
CEO Google Sundar Pichai menyoroti Project Mariner selama konferensi I/O tahun lalu. Pada saat itu, agen browser sepertinya merupakan taruhan besar berikutnya dalam industri ini, dengan OpenAI dan Perplexity meluncurkan agen konsumen yang berjanji untuk mengotomatisasi tugas online bagi pengguna. Agen dapat mengklik, menggulir, dan mengisi formulir di halaman web, seperti halnya manusia. Namun, penerapan produk-produk ini masih kesulitan memenuhi ekspektasi industri.
Agen browser Comet dari Perplexity baru saja mencapai 2,8 juta pengguna aktif mingguan pada bulan Desember 2025. Sementara itu, Agen ChatGPT OpenAI dilaporkan jatuh ke kurang dari 1 juta pengguna aktif mingguan dalam beberapa bulan terakhir. Dibandingkan dengan ratusan juta pengguna yang berbicara dengan ChatGPT setiap minggunya, penggunaan agen browser pada dasarnya merupakan kesalahan pembulatan.
Agen Baru di Kota
Momentum di dunia AI telah berubah secara dramatis dalam setahun terakhir menuju agen seperti Claude Code dan OpenClaw (yang penciptanya dipekerjakan oleh OpenAI). Tidak seperti agen penjelajahan web, sistem ini mengontrol komputer melalui baris perintah, yang telah terbukti menjadi cara yang lebih andal untuk menyelesaikan tugas. Beberapa produk ini menyertakan penggunaan komputer sebagai salah satu fiturnya, serta kemampuan agen lainnya. Sebagai perbandingan, agen browser kini tampak agak terbatas sebagai produk yang berdiri sendiri.
Kian Katanforoosh, CEO platform peningkatan keterampilan AI Workera yang mengajar tentang AI di Stanford, mengatakan salah satu alasan mengapa agen pengguna komputer belum berkembang adalah karena kebutuhan komputasi mereka yang sangat besar. Sebagian besar agen ini bekerja dengan mengambil serangkaian tangkapan layar halaman web, memasukkannya ke dalam model AI, dan kemudian mengambil tindakan berdasarkan apa yang mereka lihat. Memproses semua informasi itu bisa lambat dan terkadang tidak dapat diandalkan.
“Apa yang ditunjukkan oleh Claude Code dan OpenClaw adalah bahwa bekerja dengan terminal sebenarnya jauh lebih efisien, karena terminalnya berbasis teks dan LLM berbasis teks,” kata Katanforoosh. “Mungkin diperlukan 10 hingga 100X langkah lebih sedikit untuk mencapai hasil yang sama.”
Hal ini tidak berarti bahwa agen browser tidak mengalami kemajuan, atau penelitian mengenai penggunaan komputer menemui jalan buntu.
Bulan lalu, startup Standard Intelligence merilis a model penggunaan komputer dilatih menggunakan video, bukan tangkapan layar. Startup tersebut mengatakan bahwa mereka mengembangkan encoder video yang dapat mengompresi video ke dalam jendela konteks model AI, yang diklaim 50X lebih efisien dibandingkan model penggunaan komputer sebelumnya. Untuk memamerkan kemampuan model AI-nya, startup ini menghubungkannya ke mobil, video langsung, dan keyboard komputer. Model itu mampu melakukannya secara singkat berkendara secara mandiri di sekitar San Francisco.
Ang Li, CEO startup agen penggunaan komputer Simular dan mantan peneliti Google DeepMind, berpendapat bahwa agen penggunaan komputer mengisi kesenjangan kritis dalam kemampuan agen, dan kemungkinan besar akan selalu diperlukan.
“Saya melihat selalu ada pemisahan 80/20. Anda sudah bisa menggunakan terminal untuk menyelesaikan banyak masalah, tapi akan selalu ada masalah yang harus Anda selesaikan di GUI (antarmuka pengguna grafis),” katanya. “Misalnya, jika Anda ingin mengunjungi situs web asuransi kesehatan, atau perangkat lunak lama lainnya, sering kali mereka tidak memiliki API yang dapat dipanggil oleh agen terminal.”
Namun, laboratorium AI secara umum tampaknya mulai mengalihkan perhatian mereka dari agen penggunaan komputer ke agen pengkodean. Bahkan untuk tugas-tugas yang tidak melibatkan pengkodean, laboratorium AI telah menemukan bahwa kemampuan agen pengkodean untuk menggunakan aplikasi lain, memodifikasi file, dan membuat perangkat lunak yang dipesan lebih dahulu dapat membuatnya lebih bermanfaat bagi pengguna. Misalnya, jika seseorang memerlukan bantuan untuk membuat anggaran, mereka dapat mengunggah laporan bank ke agen pengkodean dan meminta agen tersebut membuat dasbor khusus untuk membantu pengguna menilai kebiasaan belanja mereka.
Kata eksekutif OpenAI mereka ingin Codex memberdayakan agen tujuan umum di dalam ChatGPT. Sementara itu, Anthropic telah membuat versi ini, Claude Rekan Kerjacabang dari Claude Code yang tidak mengharuskan pengguna membuka terminal. Kebingungan, yang banyak bertaruh pada agen browser, baru-baru ini meluncurkan produk serupa bernama Komputer Pribadi.
Meskipun agen pengkodean sudah mulai populer di kalangan pengembang, masih belum jelas apakah kemampuan tambahan akan meningkatkan adopsi di kalangan masyarakat biasa. Google dan OpenAI mengatakan konsumen dapat menggunakan agen AI untuk memesan bahan makanan dari Instacart atau memesan reservasi makan malam. Meskipun hal-hal tersebut terdengar mudah, orang mungkin tidak ingin mengotomatiskan tugas-tugas tersebut sampai mereka yakin agen mereka tidak akan melakukan kesalahan.