Model AI devstral baru Mistral dirancang untuk pengkodean

AI Startup Mistral pada hari Rabu mengumumkan model AI baru yang berfokus pada pengkodean: Devstral.
Devstral, yang menurut Mistral dikembangkan dalam kemitraan dengan perusahaan AI All Hands AI, tersedia secara terbuka di bawah lisensi Apache 2.0, yang berarti dapat digunakan secara komersial tanpa batasan. Mistral mengklaim bahwa Devstral mengungguli model terbuka lainnya seperti Google Gemma 3 27b dan Chinese AI Lab V3 Deepseek Pada swe-bench diverifikasi, tolok ukur keterampilan pengkodean yang mengukur.
“Devstral unggul dalam menggunakan alat untuk menjelajahi basis kode, mengedit beberapa file dan daya[ing] Agen Rekayasa Perangkat Lunak, ”tulis Mistral dalam posting blog yang disediakan untuk TechCrunch.”[I]t menjalankan perancah agen kode seperti OpenHands atau SWE-agent, yang menentukan antarmuka antara model dan kasus uji […] Devstral cukup ringan untuk dijalankan pada satu [Nvidia] RTX 4090 atau Mac dengan 32GB RAM, menjadikannya pilihan ideal untuk penyebaran lokal dan penggunaan di perangkat. ”
Devstral tiba sebagai asisten pengkodean AI – dan model yang memberi daya pada mereka – tumbuh semakin populer. Bulan lalu, JetBrainsperusahaan di balik berbagai alat pengembangan aplikasi populer, merilis model AI “terbuka” pertamanya untuk pengkodean. Dalam beberapa bulan terakhir, pakaian AI termasuk Google, Selancar anginDan Openai Telah meluncurkan model, baik yang tersedia secara terbuka maupun hak milik, dioptimalkan untuk tugas pemrograman.
Model AI masih berjuang untuk kode KUALITAS KODE-AI yang menghasilkan kode cenderung memperkenalkan kerentanan keamanan Dan kesalahankarena kelemahan Di bidang -bidang seperti kemampuan untuk memahami logika pemrograman. Namun janji mereka untuk meningkatkan produktivitas pengkodean adalah mendorong perusahaan – dan pengembang – untuk dengan cepat mengadopsi mereka. Satu jajak pendapat terbaru menemukan bahwa 76% dev yang digunakan atau berencana untuk menggunakan alat AI dalam proses pengembangan mereka tahun lalu.
Mistral sebelumnya mengarungi ruang pemrograman bantu dengan Kodestralmodel generatif untuk kode. Tetapi Codestral tidak dirilis di bawah lisensi yang memungkinkan para pengembang untuk menggunakan model untuk aplikasi komersial; lisensinya secara eksplisit melarang “setiap penggunaan internal oleh karyawan dalam konteks [a] kegiatan bisnis perusahaan. “
Devstral, yang Mistral sebut “pratinjau penelitian,” dapat diunduh dari platform pengembangan AI, termasuk memeluk wajah, dan juga mengetuk melalui API Mistral. Harganya $ 0,1 per juta token input dan $ 0,3 per juta token output, token menjadi bit data mentah yang bekerja dengan model AI. (Satu juta token setara dengan sekitar 750.000 kata, atau sekitar 163.000 kata lebih panjang dari “perang dan perdamaian.”)
Mistral mengatakan ini “bekerja keras membangun model pengkodean agen yang lebih besar yang akan tersedia dalam beberapa minggu mendatang.” Devstral bukan model kecil per se, tetapi berada di sisi yang lebih kecil pada 24 miliar parameter. (Parameter secara kasar sesuai dengan keterampilan pemecahan masalah model, dan model dengan lebih banyak parameter umumnya berkinerja lebih baik daripada yang dengan parameter lebih sedikit.)
Mistral, yang didirikan pada tahun 2023, adalah lab Model Frontier, yang bertujuan untuk membangun berbagai layanan bertenaga AI, termasuk platform chatbot, Le Chat, dan aplikasi seluler. Ini didukung oleh VC termasuk General Catalyst dan telah mengumpulkan lebih dari € 1,1 miliar (sekitar $ 1,24 miliar) hingga saat ini. Pelanggan Mistral termasuk BNP Paribas, AXA, dan Mirakl.
Devstral adalah peluncuran produk ketiga Mistral bulan ini. Beberapa minggu yang lalu, Mistral meluncurkan Mistral Medium 3, model tujuan umum yang efisien. Sekitar waktu yang sama, perusahaan meluncurkan Le Chat Enterprise, layanan chatbot yang berfokus pada perusahaan yang menawarkan alat seperti pembangun “agen” AI dan mengintegrasikan model Mistral dengan layanan pihak ketiga seperti Gmail, Google Drive, dan SharePoint.