Meta Luncurkan Llama 4: Semua Tentang Model AI Open-Source Terbaru

Dalam dorongan strategis untuk memperkuat pijakannya di ruang AI generatif, Meta merilis model pertama dari AI Suite open-source terbaru, Llama 4, pada hari Sabtu.
Dalam sebuah video Instagram, CEO Meta Mark Zuckerberg membagikan ambisi AI yang berani perusahaan: “Tujuan kami adalah untuk membangun AI terkemuka di dunia, open source it, dan membuatnya dapat diakses secara universal … Saya sudah mengatakan untuk sementara waktu itu AI akan memimpin jalan, dan dengan Llama 4, kita mulai melihat itu terjadi.”
Dua model awal- Llama 4 Scout dan Llama 4 Maverick-Are sekarang tersedia untuk diunduh melalui situs web Llama dan memeluk wajah. Model -model ini juga berfungsi sebagai fondasi untuk Meta AI, asisten virtual perusahaan yang sekarang diintegrasikan di WhatsApp, Instagram, Messenger, dan Web.
Selain itu, Meta memperkenalkan Llama 4 Behemoth, menggambarkannya sebagai salah satu model bahasa besar yang paling cerdas (LLM), dan versi paling kuat yang pernah mereka kembangkan. Ini dimaksudkan untuk membantu melatih dan memandu model masa depan.
Peluncuran ini juga menandai penggunaan meta dari kerangka kerja campuran (MOE). MOE membagi model menjadi komponen khusus yang dapat difokuskan pada bidang-bidang seperti fisika, puisi, biologi, atau pemrograman. Selama tugas apa pun, hanya modul ahli yang paling relevan yang diaktifkan, meningkatkan efisiensi dan mengurangi biaya untuk pelatihan dan inferensi.
Sorotan model
Llama 4 Scout dibangun dengan 17 miliar parameter dan 16 pakar, menawarkan jendela konteks 10 juta token. Dirancang untuk beroperasi pada GPU tunggal, ini mencerminkan tren terhadap model ringan dan berkinerja tinggi yang mirip dengan rilis Gemma 3 terbaru Google.
Llama 4 Maverick, juga pada 17 miliar parameter tetapi dengan 128 ahli, dimaksudkan sebagai model tujuan umum untuk berbagai kasus penggunaan asisten. Meta menggambarkannya sebagai “pekerja keras” yang dapat diandalkan yang mampu menangani obrolan, penalaran, dan tugas digital lainnya.
Meta Klaim Maverick mengungguli GPT-4O Openai dan Google Gemini 2.0 berkedip di beberapa tolok ukur, termasuk pembuatan kode, penalaran, pemahaman multibahasa, analisis gambar, dan menangani konteks yang panjang. Ini juga menyaingi Deepseek v3.1, model yang jauh lebih besar, dalam kinerja di seluruh pengkodean dan tugas berbasis logika.
Awal tahun ini, Deepseek mengklaim modelnya dapat mencocokkan mereka dari perusahaan -perusahaan AS terkemuka, mendorong kekhawatiran atas peningkatan persaingan global di AI. Namun, eksekutif Meta dan Google telah meremehkan dampaknya.
Apa selanjutnya: raksasa dan seterusnya
Masih dalam pengembangan, model raksasa LLAMA 4 diharapkan menampilkan 288 miliar parameter aktif, 16 ahli, dan hampir 2 triliun total parameter. Meta mengatakan itu mengungguli GPT-4.5, Claude Sonnet 3.7, dan Gemini 2.0 Pro dalam tes terkait batang.
Zuckerberg juga menggoda penalaran llama 4, sebuah model yang difokuskan secara khusus pada tugas pemecahan masalah dan analitik yang kompleks. Rincian lebih lanjut diharapkan dalam beberapa minggu mendatang.
“Ini hanyalah awal lineup Llama 4,” tulis Meta dalam sebuah posting blog. “Kami percaya sistem AI paling canggih harus mampu mengambil tindakan umum, terlibat dalam percakapan alami, dan mengatasi masalah yang belum pernah mereka temui sebelumnya.”
Meningkatkan
Meta mengungkapkan bahwa unduhan model Llama melampaui satu miliar hanya dua minggu sebelum peluncuran Llama 4 dari 650 juta pada bulan Desember 2024.
Kembali pada bulan Januari, Zuckerberg mengumumkan pengeluaran infrastruktur AI perusahaan untuk tahun 2025 akan berkisar antara $ 60 miliar dan $ 65 miliar, yang mencakup investasi di server, pusat data, dan sumber daya lain yang diperlukan untuk mendukung upaya AI yang berkembang Meta.