BAGAIMANA DEEPSEEK DAN GENERASI NEXTHERAG AI BISA Mengikis Nilai Model Bahasa

Jaap Arriens | Nurphoto via Getty Images
Model bahasa besar seperti yang dikembangkan oleh MicrosoftOpenai perusahaan yang terbalik akan menjadi komoditisasi tahun ini di tengah kemajuan cepat terhadap agen intelijen buatan generasi berikutnya dan lebih gencar, saingan open-source, menurut eksekutif teknologi terkemuka.
Pekan lalu, perusahaan AI Cina Deepseek merilis R1, An model penalaran open-source yang mengklaim saingan model O1 Openai baik biaya dan kinerja. Sumber terbuka mengacu pada perangkat lunak yang kode sumbernya tersedia secara bebas di web terbuka untuk kemungkinan modifikasi dan redistribusi.
Minggu ini, meningkatnya kesadaran akan model baru Deepseek menyebabkan kemerosotan yang parah di saham Nvidia dan raksasa teknologi lainnya, karena investor takut akan kemungkinan penghematan dalam pengeluaran untuk unit pemrosesan grafis yang kuat yang diperlukan untuk melatih dan menjalankan beban kerja AI tingkat lanjut.
Nvidia Kehilangan hampir $ 600 miliar dalam kapitalisasi pasar Pada hari Senin-penurunan satu hari terbesar untuk perusahaan mana pun dalam sejarah AS.
Sementara itu, para eksekutif dan ilmuwan di laboratorium AI memimpin semuanya membicarakan pergeseran dari model bahasa besar ke apa yang disebut “agen AI” yang dapat melakukan tindakan atas nama Anda.
LLMS adalah teknologi dasar di balik aplikasi AI generatif saat ini. Namun, para ahli percaya dorongan ke arah sistem AI agen – yang menggabungkan teknologi LLM – tahun ini akan mengikis nilai model ini.
Komoditisasi LLMS
LLMS diharapkan menjadi lebih dari komoditas dalam waktu dekat karena teknologi menjadi semakin maju dan biaya yang terlibat dalam pelatihan dan menjalankannya terus turun.
Thomas Wolf, co-founder dan chief science officer dari Hugging Face, menyarankan LLMS akan menjadi lebih terintegrasi ke dalam sistem cerdas yang terkait dengan database perusahaan sendiri.
“Saya pikir orang-orang bergerak dari kegilaan ini di sekitar model, memahami bahwa, berkat open-source … banyak model ini akan bebas dan tersedia secara bebas,” kata Wolf kepada CNBC. Hugging Face adalah repositori kode populer untuk proyek AI open-source.
“Dalam revolusi internet, kami beralih dari membangun situs web sebagai bisnis utama untuk benar-benar membangun perusahaan asli internet-jadi, Airbnb AI, garis AI,” tambahnya. “Mereka bukan tentang model. Mereka tentang sistem dan bagaimana Anda membuat model berguna untuk tugas.”
Kedatangan model R1 Deepseek minggu lalu dilihat oleh beberapa CEO teknologi sebagai A Indikator lebih lanjut LLMS menjadi semakin dikomoditisasi.
R1 menggabungkan beberapa aspek kunci yang membedakannya dari model lain di pasaran. Sebagai contoh, model ini menggabungkan kerangka kerja “presisi campuran” yang menggunakan kombinasi angka floating point 32-bit presisi penuh (FP32) dan angka floating point 8-bit presisi rendah (FP8).
Yang terakhir lebih cepat diproses tetapi bisa kurang akurat. Namun, alih -alih mengandalkan satu atau yang lain, Deepseek menggunakan FP8 untuk sebagian besar perhitungan dan beralih ke FP32 untuk tugas -tugas tertentu di mana tingkat akurasi yang lebih tinggi diperlukan.
“Karena AI menjadi lebih efisien dan mudah diakses, kita akan melihat penggunaannya meroket, mengubahnya menjadi komoditas yang tidak bisa kita dapatkan,” Microsoft CEO Satya Nadella menulis di platform media sosial X, dalam referensi yang jelas untuk Deepseek.
Sementara itu, Matt Calkins, CEO perusahaan perangkat lunak AS Appian, mengatakan kepada CNBC bahwa keberhasilan Deepseek hanya menunjukkan bahwa model AI akan menjadi lebih dari komoditas di masa depan.
“Menurut pendapat saya, kita akan melihat komoditisasi AI. Banyak perusahaan akan mencapai AI kompetitif, dan kurangnya diferensiasi akan buruk untuk movers pertama yang menghabiskan tinggi,” kata Calkins melalui email.
Apa itu agen AI?
Dalam dua tahun terakhir, sebagian besar fokusnya adalah pada produk-produk bertenaga LLM, dari chatbots AI generatif seperti Openai's ChatGPT hingga alat yang dapat menghasilkan gambar dan konten video.
Aplikasi generatif berbasis LLM seperti ChatGPT mengandalkan sejumlah pegangan dari pengguna untuk terus mendorong mereka untuk output, sedangkan sebaliknya, agen AI dirancang untuk lebih berorientasi pada tindakan.
Jika Anda ingin memesan janji temu dokter, misalnya, Anda dapat meminta informasi ChatGPT tentang praktik dokter umum terdekat – mirip dengan bagaimana Anda akan meminta web menggunakan mesin pencari Google.
Di masa depan, eksekutif teknologi memprediksi AI generasi berikutnya akan melibatkan agen yang dapat mengetahui di mana dokter umum terdekat, menyediakan waktu yang tersedia untuk dokter Anda, dan memesan janji temu Anda – semuanya secara langsung dalam satu platform. Ini diharapkan untuk mengubah cara kami berinteraksi dengan web.
“Selama beberapa dekade sejak web ditemukan, antarmuka standar halaman web dan menu tidak terlalu banyak berubah,” Bobby Blumofe, kepala petugas teknologi Akamai, mengatakan kepada CNBC sebelumnya.
“Kami semacam hidup dalam tirani ini ditambatkan ke layar dan ditambatkan ke halaman web dan menu yang harus Anda ingat bagaimana menavigasi.”
Pergeseran dari model ke agen
Pekan lalu, Arthur Mensch, CEO Mistral mengatakan bahwa dia pikir “fokus harus beralih ke sistem” yang mengintegrasikan model bahasa dan data bisnis kontekstual.
“Di situlah ini bergeser,” kata Mensch kepada Arjun Kharpal dari CNBC di pertemuan tahunan Forum Ekonomi Dunia di Davos, Swiss.

“Ini juga berarti bahwa industri yang mengadopsinya, akan menyaring keahliannya ke dalam sistem -sistem itu – dan di situlah yang diperlukan untuk benar -benar mendorong nilai AI ke dalam industri -industri itu.”
Mistral, yang didukung oleh Microsofttelah dengan cepat menjadi salah satu perusahaan AI paling buzzest di Eropa. Didirikan hanya dua tahun yang lalu, itu Terakhir dihargai oleh investor sekitar $ 6 miliar pada Juni 2024.
Tren agen telah mendapatkan daya tarik yang cukup besar. Minggu lalu, Openai meluncurkan agennya sendiri, yang disebut operator. Openai menggambarkannya sebagai “agen yang dapat pergi ke web untuk melakukan tugas untuk Anda,” menambahkan itu dilatih untuk berinteraksi dengan “tombol, menu, dan bidang teks yang digunakan orang setiap hari” di web.
Microsoft, yang telah menginvestasikan miliaran dolar di Openai, meluncurkan agen AI itu sendiri pada bulan November.
Antropik, an AmazonStartup AI yang terbalik yang didirikan oleh Ex-Openai Research Executives, tahun lalu diperkenalkan “penggunaan komputer,” yang merupakan kemampuan yang memungkinkan agen AI untuk menggunakan komputer seperti manusia untuk menyelesaikan tugas yang kompleks.
Dario Amodei, CEO Anthropic, mengatakan kepada Andrew Ross Sorkin dari CNBC di Davos minggu lalu bahwa penggunaan komputer harus dianggap sebagai pendahulu untuk “visi yang lebih luas” yang mengintegrasikan agen -agen ini dengan aplikasi yang umum digunakan.
“Kami merencanakan tahun ini pada tahun 2025 untuk membangun sesuatu yang kami sebut 'kolaborator virtual,'” kata Amodei, menggambarkannya sebagai “agen yang beroperasi di komputer Anda.”

“Anda dapat memberikan tugasnya. Anda bisa mengatakan, menulis fitur ini untuk aplikasi ini, dan itu akan menulis beberapa kode, itu akan mengkompilasi kode, itu akan memeriksa kode, itu akan berbicara dengan rekan kerjanya di Slack, Atau di Google Documents, atau di beberapa platform lain, “kepala Antropik menjelaskan.
Antropik berencana untuk secara bertahap membangun potongan -potongan visi ini selama tahun depan – sambil tetap memastikan itu “aman dan terkendali,” tambah Amodei.
Paul O'Sullivan, kepala petugas teknologi Salesforce untuk Inggris dan Irlandia, memprediksi komunikasi verbal akan menjadi lebih penting di dunia baru agen AI. Salesforce bisa dibilang lebih awal untuk game AI agen, setelah meluncurkan sistem agen -nya sendiri pada bulan September sebelum Microsoft, Openai atau Anthropic.
“Kami akan berkomunikasi lebih banyak,” katanya kepada CNBC dalam sebuah wawancara baru -baru ini. “Layar akan menjadi lebih kecil, mata kita akan menjadi lebih buruk. Tapi mereka mungkin akan diganti dengan perangkat seluler yang lebih kuat daripada laptop.”