Nvidia Akan Menghabiskan $26 Miliar untuk Membangun Model AI Open-Weight, Arsip Menunjukkan

Nvidia akan menghabiskan $26 miliar selama lima tahun ke depan untuk membangun open source kecerdasan buatan model, menurut a pengarsipan keuangan tahun 2025. Para eksekutif mengkonfirmasi berita tersebut, yang belum pernah dilaporkan sebelumnya, dalam wawancara dengan WIRED.

Investasi yang cukup besar bisa terlihat Nvidia berevolusi dari pembuat chip dengan tumpukan perangkat lunak yang mengesankan menjadi bonafid laboratorium perbatasan mampu bersaing dengan OpenAI Dan Pencarian Mendalam. Ini adalah langkah strategis yang dapat memperkuat posisi Nvidia sebagai produsen chip AI terkemuka di dunia, karena model-modelnya disesuaikan dengan perangkat keras perusahaan.

Model sumber terbuka adalah model yang bobot atau parameternya yang menentukan perilaku model dirilis ke publik—terkadang disertai detail arsitektur dan pelatihannya. Hal ini memungkinkan siapa pun mengunduh dan menjalankannya di komputer mereka sendiri atau di cloud. Dalam kasus Nvidia, perusahaan juga mengungkapkan inovasi teknis yang terlibat dalam pembuatan dan pelatihan modelnya, sehingga memudahkan startup dan peneliti untuk memodifikasi dan mengembangkan inovasi perusahaan.

Pada hari Rabu, Nvidia juga merilis Nemotron 3 Super, model AI open-weight paling mumpuni hingga saat ini. Model baru ini memiliki 128 miliar parameter (ukuran ukuran dan kompleksitas model), sehingga kira-kira setara dengan versi terbesar GPT-OSS OpenAI, meskipun perusahaan mengklaim bahwa kinerjanya mengungguli GPT-OSS dan model lainnya di beberapa tolok ukur.

Secara khusus, Nvidia mengklaim Nemotron 3 Super menerima skor 37 pada Indeks Kecerdasan Buatan, yang memberi skor pada model di 10 tolok ukur berbeda. GPT-OSS mendapat skor 33—tetapi beberapa model Tiongkok mendapat skor lebih tinggi. Nvidia mengatakan Nemotron 3 Super diam-diam diuji di PinchBench, sebuah benchmark baru yang menilai kemampuan model untuk mengendalikan OpenClaw, dan menempati peringkat nomor satu dalam pengujian tersebut.

Nvidia juga memperkenalkan sejumlah trik teknis yang digunakannya untuk melatih Nemotron 3. Ini termasuk teknik arsitektur dan pelatihan yang meningkatkan kemampuan penalaran model, penanganan konteks panjang, dan daya tanggap terhadap pembelajaran penguatan.

“Nvidia menangani pengembangan model terbuka dengan lebih serius,” kata Bryan Catanzaro, VP penelitian pembelajaran mendalam terapan di Nvidia. “Dan kami membuat banyak kemajuan.”

Buka Perbatasan

Meta adalah perusahaan AI besar pertama yang melakukannya merilis model terbukaLlama, pada tahun 2023. Namun, CEO Mark Zuckerberg baru-baru ini memulai kembali upaya AI perusahaan, dan mengisyaratkan hal itu ini mungkin tidak membuat model masa depan terbuka sepenuhnya. OpenAI menawarkan model bobot terbuka, disebut GPT-osstetapi lebih rendah dibandingkan penawaran milik perusahaan yang terbaik, tidak cocok untuk dimodifikasi.

Model AS terbaik, dari OpenAI, AntropisDan Googlehanya dapat diakses melalui cloud atau melalui antarmuka obrolan. Sebaliknya, bobot untuk banyak model top Tiongkok, dari DeepSeek, Alibaba, Moonshot AI, Z.ai, dan MiniMax dirilis secara terbuka dan gratis. Hasilnya, banyak perusahaan rintisan dan peneliti di seluruh dunia kini memanfaatkan model Tiongkok.

“Kami berkepentingan untuk membantu ekosistem berkembang,” kata Catanzaro, yang bergabung dengan Nvidia pada tahun 2011 dan membantu mempelopori peralihan perusahaan dari pembuatan kartu grafis untuk gaming menjadi pembuatan silikon untuk AI. Nvidia merilis model Nemotron pertama pada November 2023. Ia menambahkan bahwa Nvidia baru-baru ini menyelesaikan pra-pelatihan model dengan 550 miliar parameter. (Pelatihan awal melibatkan memasukkan data dalam jumlah besar ke dalam model yang tersebar di sejumlah besar chip khusus yang berjalan secara paralel.) Nvidia telah merilis serangkaian model yang dikhususkan untuk digunakan di berbagai bidang seperti robotika, pemodelan iklim, dan pelipatan protein.

Kari Briski, VP perangkat lunak AI generatif untuk perusahaan, mengatakan model AI masa depan Nvidia akan membantu perusahaan meningkatkan tidak hanya chipnya tetapi juga pusat data skala komputer super yang dibangunnya. “Kami membangunnya untuk memperluas sistem kami dan menguji tidak hanya komputasi tetapi juga penyimpanan dan jaringan, dan untuk membangun peta jalan arsitektur perangkat keras kami,” katanya.

Merilis model secara terbuka mungkin juga memiliki manfaat strategis jangka panjang bagi Nvidia. Chip perusahaan tetap menjadi standar emas untuk melatih model AI besar, dengan pelanggan menghabiskan miliaran dolar untuk memperoleh perangkat keras perusahaan untuk pusat data mereka. Namun kebangkitan model terbuka Tiongkok pada suatu saat mungkin mengikis posisi Nvidia jika model tersebut menunjukkan peningkatan dramatis pada perangkat keras pesaingnya.

Pada bulan Januari 2025, DeepSeek merilis yang mutakhir model terbuka menggunakan pendekatan yang lebih efisien yang membuat pelatihannya jauh lebih murah. Namun berbagai model China lainnya dari perusahaan besar menyukainya Alibabaserta startup sejenisnya AI Tembakan Bulan, Z.aiDan Mini Maksjuga menjadi populer di Barat. model Alibaba Qwenyang mudah digunakan dan dimodifikasi serta dipelihara dengan baik, banyak digunakan oleh para peneliti dan startup.

Model DeepSeek baru, yang diperkirakan akan segera dirilis, dikabarkan secara luas telah dilatih secara eksklusif pada chip yang dibuat oleh perusahaan China Huawei, yang tunduk pada sanksi pemerintah AS. Jika benar, rilis ini dapat mendorong lebih banyak startup dan peneliti untuk mencoba perangkat keras Huawei, khususnya di Tiongkok.

Dalam hal ini, Nvidia dapat membantu membentuk persaingan AI antara AS dan Tiongkok dengan menyediakan alternatif buatan AS untuk model open-weight Tiongkok.

“Kami adalah perusahaan Amerika, namun kami bekerja dengan perusahaan di seluruh dunia,” kata Catanzaro. “Adalah kepentingan kami untuk membuat ekosistem menjadi beragam dan kuat di mana pun.”

Beberapa pakar industri telah memperingatkan bahwa pergeseran inovasi terbuka ke belahan dunia lain dapat berdampak buruk bagi AS dalam jangka panjang.

“Saya penggemar berat Nemotron,” kata Nathan Lambert, peneliti AI di Allen Institute for AI (Ai2) yang memimpin penelitian ini. Proyek ATOM (Model Benar-benar Terbuka Amerika).. Lambert menambahkan bahwa pemerintah AS juga harus mendanai model terbuka.

Andy Konwinski, seorang ilmuwan komputer dan pengusaha yang memimpin Institut Laudesebuah organisasi nirlaba yang fokus mempromosikan keterbukaan dalam AI, mengatakan investasi Nvidia sangat signifikan karena posisinya sebagai penghubung penelitian AI. “Mereka berada di garis depan dari begitu banyak upaya AI yang terbuka dan tertutup,” kata Konwinski. “Ini adalah sinyal yang belum pernah terjadi sebelumnya mengenai keyakinan mereka terhadap keterbukaan.”