Anthropic Bekerja Sama Dengan Para Pesaingnya untuk Mencegah AI Meretas Segalanya

Berikut bocoran wahyu pada akhir bulan Maret itu Antropis telah dikembangkan baru yang kuat Claude model, perusahaan secara formal diumumkan Pratinjau Mythos pada hari Selasa bersama dengan berita tentang konsorsium industri yang dibentuknya, yang dikenal sebagai Project Glasswing, untuk mengatasi implikasi keamanan siber dari model baru ini dan meningkatkan kemampuan secara umum di bidang AI.

Kelompok ini termasuk Microsoft, ApelDan Google maupun Layanan Web AmazonYayasan Linux, Cisco, NvidiaBroadcom, dan lebih dari 40 organisasi teknologi, keamanan siber, infrastruktur penting, dan keuangan lainnya yang akan memiliki akses pribadi ke model tersebut, yang belum dirilis secara umum. Idenya, sebagian, adalah untuk memberikan waktu kepada para pengembang platform teknologi dasar dunia untuk mengaktifkan Mythos Preview di sistem mereka sendiri sehingga mereka dapat memitigasi kerentanan dan mengeksploitasi rantai yang dikembangkan model tersebut dalam simulasi serangan. Secara lebih luas, Anthropic menekankan bahwa tujuan diadakannya upaya ini adalah untuk memulai eksplorasi mendesak tentang bagaimana kemampuan AI di seluruh industri berada pada titik kritis, kata perusahaan tersebut, dalam meningkatkan praktik keamanan perangkat lunak dan pertahanan digital saat ini di seluruh dunia.

“Pesan sebenarnya adalah bahwa ini bukan tentang model atau Antropis,” Logan Graham, pemimpin tim merah terdepan perusahaan tersebut, mengatakan kepada WIRED. “Kita perlu mempersiapkan diri sekarang untuk dunia di mana kemampuan ini tersedia secara luas dalam 6, 12, 24 bulan. Banyak hal yang berbeda mengenai keamanan. Banyak asumsi yang mendasari paradigma keamanan modern yang kita bangun mungkin akan hancur.”

Model dikembangkan dan dilatih oleh beberapa perusahaan semakin mampu menemukan kerentanan dalam kode dan mengusulkan mitigasi-atau strategi untuk eksploitasi. Hal ini menciptakan generasi berikutnya dari permainan klasik kucing-dan-tikus keamanan di mana sebuah alat dapat membantu para pembela HAM namun juga dapat menyulut pelaku kejahatan dan mempermudah melakukan serangan yang dulunya terlalu mahal atau rumit untuk bisa dilakukan.

“Pratinjau Claude Mythos adalah lompatan yang sangat besar,” kata CEO Anthropic Dario Amodei pada hari Selasa dalam video peluncuran Project Glasswing. “Kami belum melatihnya secara khusus untuk menjadi ahli dalam dunia maya. Kami melatihnya untuk menjadi ahli dalam bidang kode, namun sebagai efek samping dari menjadi ahli dalam bidang kode, ia juga menjadi ahli dalam dunia maya.” Dia menambahkan dalam videonya bahwa “model yang lebih kuat akan datang dari kita dan orang lain. Oleh karena itu, kita memerlukan rencana untuk merespons hal ini.”

Graham dari Anthropic mencatat bahwa selain penemuan kerentanan—termasuk menghasilkan rantai serangan potensial dan bukti konsep—Mythos Preview mampu melakukan pengembangan eksploitasi yang lebih maju, pengujian penetrasi, penilaian keamanan titik akhir, mencari kesalahan konfigurasi sistem, dan mengevaluasi biner perangkat lunak tanpa akses ke kode sumbernya.

Dalam peluncuran Mythos Preview secara bertahap, dimulai dengan fase kolaborasi industri, Graham mengatakan bahwa Anthropic berusaha memanfaatkan prinsip pengungkapan kerentanan terkoordinasi, yaitu proses memberikan waktu kepada pengembang untuk menambal bug sebelum didiskusikan secara publik.

“Kami telah melihat Mythos Preview mencapai hal-hal yang dapat dicapai oleh peneliti keamanan senior,” kata Graham. “Hal ini memiliki implikasi yang sangat besar terhadap bagaimana kemampuan seperti ini harus dilepaskan. Jika tidak dilakukan dengan hati-hati, hal ini dapat menjadi percepatan yang berarti bagi penyerang.”

Mitra Project Glasswing, termasuk beberapa pesaing Anthropic, memberikan pernyataan kolaboratif sebagai bagian dari peluncuran tersebut.

“Google senang melihat inisiatif keamanan siber lintas industri ini terwujud,” kata Heather Adkins, wakil presiden teknik keamanan Google, dalam sebuah pernyataan. “Kami sudah lama percaya bahwa AI menghadirkan tantangan baru dan membuka peluang baru dalam pertahanan siber.”

Mereka yang memelihara komponen infrastruktur internet dan perusahaan yang mengembangkan platform teknologi dasar juga tampak antusias dengan kolaborasi ini, terutama mengingat Anthropic mengatakan penggunaan Mythos Preview telah mulai mengungkap ribuan kerentanan kritis, termasuk beberapa bug berusia puluhan tahun yang berulang kali terlewatkan atau diabaikan bahkan dalam kode yang paling banyak diteliti.

“Saat kita memasuki fase di mana keamanan siber tidak lagi terikat pada kapasitas manusia, peluang untuk menggunakan AI secara bertanggung jawab guna meningkatkan keamanan dan mengurangi risiko dalam skala besar belum pernah terjadi sebelumnya,” CISO global Microsoft, Igor Tsyganskiy, mengatakan dalam sebuah pernyataan. “Bergabung dengan Project Glasswing, dengan akses ke Pratinjau Claude Mythos, memungkinkan kami mengidentifikasi dan memitigasi risiko sejak dini serta meningkatkan solusi keamanan dan pengembangan sehingga kami dapat melindungi pelanggan dan Microsoft dengan lebih baik.”

Graham mengatakan timnya di Anthropic, sebuah kelompok penelitian terdepan, merasakan urgensi dan perlunya kolaborasi global.

“Mungkin hal terpenting yang perlu dilakukan kelompok ini adalah mencari tahu semua pertanyaan yang memerlukan jawaban dan kemudian menemukan jawabannya,” kata Graham. “Proyek Glasswing adalah titik awal. Proyek ini akan gagal jika hanya segelintir perusahaan yang menggunakan model tersebut. Proyek ini harus berkembang menjadi sesuatu yang lebih besar.”