Deepseek vs sisanya: Apakah model bahasa besar China benar -benar 'pengganggu'?

Yuliana Hasanah January 28, 2025

0 4 minutes read

Yang kalah, yang menang setelah penjualan terhubung ke pasar deepseek slams

New Delhi:

Ada seorang anak baru di blok chatbot / model bahasa besar (LLM) yang digerakkan oleh kecerdasan buatan, dan mengancam akan meledakkan sisanya dari air. Bertemu Deepseekdikembangkan oleh laboratorium penelitian yang berbasis di Hangzhou dengan sebagian kecil dari anggaran (jika Anda yakin laporan) yang digunakan untuk membuat ChatgptGemini, Claude AI, dan lainnya yang dibuat oleh laboratorium komputer yang berbasis di Amerika Serikat.

Dan penawaran terbaru – Deepseek V3, parameter 671 miliar, model 'campuran ahli'; dan Deepseek R1, model penalaran canggih yang menggunakan AI, mungkin lebih baik daripada Openai's 01 – telah menggarisbawahi statusnya sebagai potensi pengganggu keuangan dan teknologi kelas berat di bidang ini.

Berapa banyak pengganggu itu?

Per hari Senin Deepseek v3 adalah Aplikasi teratas yang diunduh di Apple Store di AS; Biarkan itu meresap … chatbot yang dikembangkan Cina sekarang menjadi aplikasi yang paling banyak diturunkan di AS.

Dan gangguan itu, bahkan jika dilihat sebagai 'potensial' saat ini, telah menimbulkan keraguan tentang seberapa baik beberapa perusahaan teknologi AS telah menginvestasikan miliaran yang dijanjikan untuk pengembangan AI.

Baca | Deepseek mempertanyakan kami pengeluaran miliaran dolar Big Tech

Either way, kualitas dan efisiensi biaya model Deepseek telah membalik narasi ini; Bahkan jika, dalam jangka panjang, model Cina ini gagal, dikembangkan dengan sebagian kecil dari sumber daya keuangan dan teknologi yang tersedia untuk perusahaan di barat adalah pembuka mata.

Sekali lagi, berapa banyak pengganggu itu?

Nah, bulan lalu kata pencipta Deepseek Melatih model V3 membutuhkan kurang dari $ 6 juta (Meskipun para kritikus mengatakan penambahan biaya dari tahap pengembangan sebelumnya dapat mendorong biaya akhirnya di utara $ 1 miliar) dalam daya komputasi dari chip H800 NVIDIA, penawaran kelas menengah. “Apakah Deepseek benar -benar membangun openai seharga $ 5 juta? Tentu saja tidak,” kata analis Bernstein Stacy Rasgon kepada Reuters.

Tapi hancurkan keuangan yang tersedia dan menjadi sangat luar biasa.

Openai's 01 menagih token input $ 15 per juta.

R1 Deepseek mengenakan biaya input $ 0,55 per juta.

Harga, oleh karena itu, benar -benar meniupkan kompetisi.

Dan, tergantung pada kasus penggunaan akhir, Deepseek diyakini antara 20 dan 50 kali lebih terjangkau, dan efisiendari model 01 Openai. Faktanya, hasil skor tes penalaran logis mengejutkan; Deepseek mengungguli Chatgpt dan Claude AI sebesar tujuh hingga 14 persen.

Dev.tokomunitas online populer untuk pengembang perangkat lunak, mengatakan mencetak 92 persen dalam menyelesaikan tugas yang kompleks, pemecahan masalah, dibandingkan dengan 78 persen oleh GPT-4.

Ngomong -ngomong, input token, lihat unit informasi sebagai bagian dari prompt atau pertanyaan. Ini pada dasarnya adalah apa yang dibutuhkan model untuk menganalisis atau memahami konteks kueri atau instruksi.

Untuk konteks, Openai diyakini menghabiskan $ 5 miliar setiap tahun untuk mengembangkan modelnya.

Jadi, bahkan jika kritikus Deepseek (lihat di atas) benar, itu masih sebagian kecil dari biaya Openai.

Ini menerjemahkan, seperti yang ditunjukkan oleh bos perusahaan Sam Altman, menjadi kemampuan komputasi yang ditingkatkan secara signifikan, tetapi untuk model Deepseek untuk memberikan setidaknya banyak daya pemrosesan pada anggaran yang relatif shoestring adalah pengangkat alis.

Dan Tuan Altman mengakui hal itu, menyebut model r1 “sangat mengesankan”.

Bos Google Sundar Pichai melangkah lebih jauh, memberi tahu CNBC di Davos, “Saya pikir kita harus mengambil pengembangan dari China dengan sangat serius.” Dan Presiden AS Donald Trump terdengar panggilan “bangun”.

Dan ada ratusan miliar dolar yang telah hilang dari perusahaan AS di tengah kekalahan minggu ini di saham teknologi; Pembuat chip Nvidia, misalnya, kehilangan lebih dari $ 600 miliar dan indeks Nasdaq yang kaya teknologi selesai Senin turun lebih dari tiga persen, dengan kemungkinan penurunan yang tidak disukai berdasarkan meta raksasa AI dan laporan pendapatan Microsoft yang diharapkan.

Baca | Nvidia kehilangan hampir $ 600 miliar karena Deepseek Jolts Tech Saham

Untuk konteks, Meta dan Microsoft keduanya memiliki model AI mereka sendiri, di garis depan yang merupakan llama dan copilot; Yang pertama adalah LLM yang pertama kali dirilis pada Februari 2023 dan yang terakhir sekarang menjadi fitur terintegrasi dalam berbagai aplikasi Microsoft 365, seperti MS Word dan Excel.

Meskipun tidak ada, bisa dibilang, pada tingkat teknologi yang sama dengan Openai atau ChatGpt, Meta dan MS telah menginvestasikan miliaran dalam proyek AI dan LLM, baik di AS maupun di luar negeri. Misalnya, beberapa analis percaya bahwa perusahaan cloud AS besar akan menghabiskan $ 250 miliar tahun ini untuk infrastruktur AI saja.

Tapi apa yang benar -benar membuat Deepseek spesial lebih dari sekadar biaya dan teknologi.

Itu, tidak seperti para pesaingnya, itu benar-benar open-source.

Itu Kode R1 sepenuhnya terbuka untuk umum di bawah lisensi MITyang merupakan lisensi perangkat lunak permisif yang memungkinkan pengguna untuk menggunakan, memodifikasi, dan mendistribusikan perangkat lunak dengan beberapa batasan.

Ini berarti Anda dapat mengunduhnya, menggunakannya secara komersial tanpa biaya, mengubah arsitekturnya, dan mengintegrasikannya ke dalam sistem Anda yang ada.

Deepseek juga lebih cepat dari GPT 4, lebih praktis dan, menurut banyak ahli, bahkan memahami idiom regional dan konteks budaya lebih baik daripada rekan -rekan baratnya.

Ada lebih banyak pertimbangan.

Bagaimana, misalnya, apakah Deepseek mempengaruhi ikatan diplomatik dan militer antara Cina dan AS (dan India juga, sebenarnya), dan apa masalah etika dengan model AI yang benar-benar open-source?

Tapi yang tidak dapat disangkal adalah bahwa Deepseek China adalah pengganggu. Dan para ahli percaya bahwa Cina sekarang telah melompat-dari 18 hingga enam bulan di belakang model AI canggih yang dikembangkan di AS.

Sementara itu, keberhasilan Deepseek telah diperhatikan di lingkaran politik top China.

Pada 20 Januari, hari itu dirilis ke publik (dan juga hari Trump dilantik sebagai presiden AS), pendiri Liang Wenfeng menghadiri simposium tertutup untuk pengusaha dan para ahli yang diselenggarakan oleh Perdana Menteri Cina Li Qiang. Kehadirannya telah dipandang sebagai tanda Deepseek bisa menjadi penting bagi tujuan kebijakan Beijing untuk mencapai swasembada dalam industri strategis seperti AI.

Dengan masukan dari agensi

NDTV sekarang tersedia di saluran WhatsApp. Klik tautan Untuk mendapatkan semua pembaruan terbaru dari NDTV di obrolan Anda.

Source