Klaim AI Deepseek telah mengguncang dunia – tetapi tidak semua orang yakin

Latika Nasyidah January 30, 2025

0 5 minutes read

Salah satu pendiri LinkedIn Reid Hoffman: Deepseek AI membuktikan ini sekarang menjadi 'kompetisi permainan' dengan China

Firma intelijen buatan Cina Deepseek mengguncang pasar minggu ini dengan mengklaim model AI barunya mengungguli Openai dan menghabiskan sebagian kecil dari harga untuk dibangun.

Pernyataan – khususnya bahwa model bahasa besar Deepseek harganya hanya $ 5,6 juta untuk dilatih – telah memicu kekhawatiran atas jumlah pengingat yang saat ini dikeluarkan oleh raksasa teknologi untuk infrastruktur komputasi yang diperlukan untuk melatih dan menjalankan beban kerja AI tingkat lanjut.

Tetapi tidak semua orang yakin dengan klaim Deepseek.

CNBC meminta para pakar industri untuk pandangan mereka tentang Deepseek, dan bagaimana sebenarnya dibandingkan dengan Openai, pencipta chatbot viral chatgpt yang memicu revolusi AI.

Apa itu Deepseek?

Pekan lalu, Deepseek merilis R1, its Model Penalaran Baru Rival itu Openai's O1. Model penalaran adalah model bahasa besar yang pecah diminta menjadi potongan -potongan kecil dan mempertimbangkan beberapa pendekatan sebelum menghasilkan respons. Ini dirancang untuk memproses masalah kompleks dengan cara yang mirip dengan manusia.

Deepseek didirikan pada tahun 2023 oleh Liang Wenfeng, salah satu pendiri dana lindung nilai kuantitatif yang berfokus pada AI, untuk fokus pada model bahasa besar dan mencapai kecerdasan umum buatan, atau AGI.

AGI sebagai konsep secara longgar mengacu pada gagasan AI yang sama dengan atau melampaui kecerdasan manusia pada berbagai tugas.

Banyak teknologi di balik R1 bukanlah hal baru. Yang penting, bagaimanapun, adalah bahwa Deepseek adalah yang pertama menggunakannya dalam model AI berkinerja tinggi dengan-menurut perusahaan-pengurangan besar dalam persyaratan daya.

“Takeaway adalah bahwa ada banyak kemungkinan untuk mengembangkan industri ini. Cara intensif chip/modal kelas atas adalah salah satu pendekatan teknologi,” kata Xiaomeng Lu, direktur praktik geo-teknologi Eurasia Group.

“Tapi Deepseek membuktikan bahwa kita masih dalam tahap pengembangan AI yang baru lahir dan jalan yang ditetapkan oleh Openai mungkin bukan satu -satunya rute ke AI yang sangat mampu.”

Apa bedanya dengan openai?

Deepseek memiliki dua sistem utama yang telah mengumpulkan buzz dari komunitas AI: V3, model bahasa besar yang membuka produknya, dan R1, model penalarannya.

Kedua model itu open-source, yang berarti kode dasar mereka gratis dan tersedia untuk umum untuk pengembang lain untuk menyesuaikan dan mendistribusikan kembali.

Model Deepseek jauh lebih kecil daripada banyak model bahasa besar lainnya. V3 memiliki total 671 miliar parameter, atau variabel yang dipelajari model selama pelatihan. Dan sementara OpenAI tidak mengungkapkan parameter, para ahli memperkirakan model terbarunya memiliki setidaknya satu triliun.

Dalam hal kinerja, Deepseek mengatakan Model R1-nya mencapai kinerja yang sebanding dengan O1 Openai pada tugas penalaran, mengutip tolok ukur termasuk AIME 2024, Codeforces, GPQA Diamond, Math-500, MMLU dan SWE-Bench diverifikasi.

Baca lebih lanjut liputan Deepseek

Dalam sebuah laporan teknis, perusahaan mengatakan model V3 -nya memiliki biaya pelatihan hanya $ 5,6 juta – sebagian kecil dari miliaran dolar yang dihabiskan oleh laboratorium AI barat seperti Openai dan Anthropic untuk melatih dan menjalankan model AI dasar mereka. Namun, belum jelas berapa banyak biaya Deepseek untuk dijalankan.

Namun, jika biaya pelatihan akurat, itu berarti model ini dikembangkan pada sebagian kecil dari biaya model saingan oleh Openai, Antropik, Google dan lainnya.

Daniel Newman, CEO Tech Insight firma The Futurum Group, mengatakan perkembangan ini menunjukkan “terobosan besar,” meskipun ia meragukan beberapa angka yang tepat.

“Saya percaya terobosan Deepseek menunjukkan infleksi yang berarti untuk penskalaan hukum dan merupakan kebutuhan nyata,” katanya. “Karena itu, masih ada banyak pertanyaan dan ketidakpastian tentang gambaran penuh biaya karena berkaitan dengan pengembangan Deepseek.”

Sementara itu, Paul Triolio, Wakil Presiden Senior untuk China dan Pimpinan Kebijakan Teknologi di perusahaan penasihat DGA Group, mencatat sulit untuk menarik perbandingan langsung antara biaya model Deepseek dan pengembang utama AS.

“Angka 5,6 juta untuk Deepseek V3 hanya untuk satu pelatihan, dan perusahaan menekankan bahwa ini tidak mewakili biaya keseluruhan R&D untuk mengembangkan model,” katanya. “Biaya keseluruhan kemudian kemungkinan jauh lebih tinggi, tetapi masih lebih rendah dari jumlah yang dihabiskan oleh perusahaan AI AS utama.”

Deepseek tidak segera tersedia untuk komentar ketika dihubungi oleh CNBC.

Membandingkan Deepseek, Openai pada harga

Deepseek dan Openai keduanya mengungkapkan harga untuk perhitungan model mereka di situs web mereka.

Deepseek mengatakan R1 harganya 55 sen per 1 juta token input – “token” mengacu pada setiap unit teks individu yang diproses oleh model – dan $ 2,19 per 1 juta token output.

Sebagai perbandingan, halaman penetapan harga OpenAI untuk O1 menunjukkan biaya perusahaan $ 15 per 1 juta token input dan $ 60 per 1 juta token output. Untuk GPT-4O Mini, model bahasa yang lebih kecil dan berbiaya rendah, perusahaan tersebut mengenakan biaya 15 sen per 1 juta token input.

Skeptisisme atas chip

Pengungkapan Deepseek tentang R1 telah menyebabkan perdebatan publik yang memanas tentang kebenaran klaimnya – paling tidak karena modelnya dibangun meskipun kontrol ekspor dari AS membatasi penggunaan chip AI canggih ke Cina.

Deepseek mengklaim bahwa ia memiliki terobosan menggunakan klip NVIDIA dewasa, termasuk chip H800 dan A100, yang kurang maju daripada H100 cuthting h100 pembuat chip, yang tidak dapat diekspor ke Cina.

Namun, di Komentar untuk CNBC minggu laluCEO skala AI Alexandr Wang, mengatakan dia yakin Deepseek menggunakan chip yang dilarang – klaim yang disangkal Deepseek.

Sejak itu Nvidia telah keluar dan mengatakan bahwa GPU yang digunakan Deepseek sepenuhnya sesuai dengan ekspor.

The Real Deal atau tidak?

Pakar industri tampaknya secara luas setuju bahwa apa yang telah dicapai Deepseek sangat mengesankan, meskipun beberapa orang telah mendesak skeptisisme atas beberapa klaim perusahaan Cina.

“Deepseek secara sah mengesankan, tetapi tingkat histeria adalah dakwaan dari banyak orang,” wirausahawan AS Palmer Luckey, yang mendirikan Oculus dan Anduril menulis di X.

“Angka $ 5 juta adalah palsu. Didorong oleh dana lindung nilai Tiongkok untuk memperlambat investasi di startup AI Amerika, melayani celana pendek mereka sendiri terhadap titans Amerika seperti Nvidia, dan menyembunyikan penggelapan sanksi.”

Seena Rejal, Kepala Pejabat Komersial Netmind, startup yang berkantor pusat di London yang menawarkan akses ke model AI Deepseek melalui jaringan GPU terdistribusi, mengatakan dia tidak melihat alasan untuk tidak percaya Deepseek.

“Bahkan jika itu tidak sesuai dengan faktor tertentu, itu masih masuk dengan sangat efisien,” kata Rejal kepada CNBC dalam wawancara telepon awal pekan ini. “Logika dari apa yang mereka jelaskan sangat masuk akal.”

Namun, beberapa orang mengklaim teknologi Deepseek mungkin tidak dibangun dari awal.

“Deepseek membuat kesalahan yang sama O1, indikasi kuat teknologi itu ditipis,” kata investor miliarder Vinod Khosla pada X, tanpa memberikan rincian lebih lanjut.

Ini adalah klaim bahwa Openai sendiri telah menyinggung, memberi tahu CNBC dalam sebuah pernyataan pada hari Rabu bahwa mereka meninjau laporan Deepseek mungkin telah “tidak tepat” menggunakan data output dari modelnya untuk mengembangkan model AI mereka, metode yang disebut sebagai “distilasi.”

“Kami mengambil penanggulangan yang agresif dan proaktif untuk melindungi teknologi kami dan akan terus bekerja sama dengan pemerintah AS untuk melindungi model yang paling mampu dibangun di sini,” kata juru bicara Openai kepada CNBC.

Komoditisasi AI

Namun pengawasan di sekitar Deepseek bergetar, para ilmuwan AI secara luas setuju itu menandai langkah positif bagi industri.

Yann Lecun, Kepala Ilmuwan AI di Metamengatakan bahwa keberhasilan Deepseek mewakili kemenangan untuk model AI open-source, tidak harus menang bagi China atas meta AS berada di belakang model AI open-source populer yang disebut Llama.

“Kepada orang -orang yang melihat kinerja Deepseek dan berpikir: 'China melampaui AS di AI.' Anda membaca ini salah.

“Deepseek telah mendapat untung dari penelitian terbuka dan open source (misalnya Pytorch dan Llama dari meta). Mereka datang dengan ide -ide baru dan membangunnya di atas pekerjaan orang lain. Karena pekerjaan mereka diterbitkan dan open source, semua orang dapat mengambil untung darinya. Itulah kekuatan penelitian terbuka dan open source. “