Konten artikel
Meta Platforms Inc mengatakan pada hari Jumat akan merilis kepada para peneliti model bahasa besar baru, program dasar untuk sistem kecerdasan buatan baru, mengintensifkan perlombaan senjata AI ketika perusahaan teknologi besar bergegas memasukkan teknologi ke dalam produk mereka dan mengesankan investor.
Pertempuran umum untuk menguasai bidang teknologi AI dimulai akhir tahun lalu dengan peluncuran perangkat lunak ChatGPT OpenAI yang didukung Microsoft, dan mendorong kelas berat teknologi dari Alphabet Inc hingga Baidu China untuk mengumumkan penawaran mereka sendiri.
Iklan 2
Konten artikel
Konten artikel
Meta LLaMA, yang merupakan singkatan dari Meta AI Model Bahasa Besar, akan tersedia di bawah lisensi nonkomersial untuk peneliti, entitas pemerintah, masyarakat sipil, dan akademisi, katanya dalam posting blog.
Model bahasa besar menambang sejumlah besar teks untuk meringkas informasi dan membuat konten. Mereka dapat menjawab pertanyaan, misalnya dengan kalimat yang dapat dibaca seolah-olah ditulis oleh manusia.
Model, yang menurut Meta membutuhkan daya komputasi “jauh lebih sedikit” daripada penawaran sebelumnya, dilatih dalam 20 bahasa dengan penekanan pada huruf Latin dan Cyrillic.
“Pengumuman Meta hari ini tampaknya merupakan langkah dalam menguji kemampuan AI generatif mereka sehingga mereka dapat mengimplementasikannya ke dalam produk mereka di masa mendatang,” kata Jill Luria, analis perangkat lunak senior di DA Davidson.
Iklan 3
Konten artikel
“Generative AI adalah aplikasi baru AI yang Meta kurang berpengalaman, tetapi jelas penting untuk masa depan bisnis mereka.”
Kecerdasan buatan telah muncul sebagai titik terang untuk investasi di industri teknologi, yang pertumbuhannya lambat telah menyebabkan PHK yang meluas dan menurunkan taruhan eksperimental.
Meta mengatakan LLaMA dapat mengungguli pesaing dengan memeriksa lebih banyak parameter, atau variabel yang diperhitungkan oleh algoritme.
Secara khusus, dia mengatakan bahwa versi LLaMA dengan 13 miliar parameter dapat mengungguli GPT-3, pendahulu terbaru dari model tempat ChatGPT dibuat.
Dia menggambarkan model LLaMA dari 65 miliar variabel sebagai “kompetitif” dengan Google Chinchilla70B dan PaLM-540B, yang lebih besar dari model yang digunakan Google untuk menunjukkan pencarian bertenaga obrolan Bard.
Iklan 4
Konten artikel
Seorang juru bicara Meta mengaitkan kinerja dengan jumlah data yang “lebih bersih” dan “perbaikan arsitektur” dalam model yang meningkatkan stabilitas pelatihan.
Meta dirilis pada Mei tahun lalu model bahasa besar OPT-175B, juga ditujukan untuk para peneliti, yang membentuk dasar untuk iterasi baru dari chatbot BlenderBot.
Dia kemudian memperkenalkan model yang disebut Galactica, yang dapat menulis artikel sains dan memecahkan masalah matematika, tetapi dengan cepat menarik demo tersebut setelah menghasilkan tanggapan palsu yang tampaknya dapat dipercaya. (Laporan oleh Yuvraj Malik dan Eva Matthews di Bengaluru dan Katie Paul di New York; Disunting oleh Shailesh Cooper dan Grant McCall)
“Pop culture ninja. Social media enthusiast. Typical problem solver. Coffee practitioner. Fall in love. Travel enthusiast.”
komentar
Postmedia berkomitmen untuk menjaga forum diskusi yang aktif dan sipil dan mendorong semua pembaca untuk membagikan pendapat mereka tentang artikel kami. Komentar mungkin memerlukan waktu hingga satu jam untuk dimoderasi sebelum muncul di situs. Kami meminta agar komentar Anda tetap relevan dan penuh hormat. Kami telah mengaktifkan notifikasi email – sekarang Anda akan menerima email jika mendapat tanggapan atas komentar Anda, jika ada pembaruan pada utas komentar yang Anda ikuti, atau jika pengguna yang Anda ikuti. Kunjungi Pedoman Komunitas kami untuk informasi lebih lanjut dan detail tentang cara menyesuaikan pengaturan email Anda.
Bergabung dalam percakapan