Pengeluaran perangkat keras Deepseek bisa setinggi $ 500 juta, perkiraan laporan baru

Latika Nasyidah January 31, 2025

0 2 minutes read

Teknologi besar terburu -buru untuk mengadopsi Deepseek R1

Faisal Bashir | Lightrocket | Gambar getty

Deepseek China menjadi topik terbesar dalam teknologi minggu ini, dengan banyak orang di industri dan di Wall Street berfokus pada satu angka: $ 6 juta.

Di Deepseek's kertas Tentang model intelijen buatan terbarunya, perusahaan mengatakan bahwa total biaya pelatihan sebesar $ 5,576 juta, berdasarkan harga sewa Nvidia's unit pemrosesan grafis. Deepseek termasuk peringatan yang jelas, dengan mengatakan bahwa jumlahnya hanya mencakup “pelatihan resmi” model dan mengecualikan biaya yang terkait dengan “penelitian penelitian dan ablasi sebelumnya pada arsitektur, algoritma, atau data.”

Di awal minggu, Asisten AI Deepseek mengambil tempat yang didambakan untuk aplikasi gratis yang paling banyak diunduh di AS di ApelToko aplikasi, mencopot chatgpt Openai. Saham teknologi global dijual, dengan chipmaker nvidia dan Broadcom kekalahan Kapitalisasi pasar gabungan $ 800 miliar pada hari Senin.

A Laporan baru dari semi -analisissebuah perusahaan riset dan konsultan semikonduktor, menambahkan lebih banyak konteks pada pengeluaran Deepseek. Perusahaan memperkirakan bahwa pengeluaran perangkat keras Deepseek “jauh lebih tinggi dari $ 500 juta selama sejarah perusahaan,” menambahkan bahwa biaya litbang dan total biaya kepemilikan adalah signifikan. Menghasilkan “data sintetis” untuk model untuk dilatih akan membutuhkan “jumlah komputasi yang cukup besar,” tulis semi -analisis.

Laporan itu mengatakan soneta Claude 3.5 dari biaya antropik “$ 10 jutaan untuk berlatih,” tetapi mencatat bahwa antropik mengumpulkan miliaran untuk dolar dari Amazon Dan Googleindikasi berapa banyak lebih banyak uang yang diperlukan untuk menjalankan model dan perusahaan.

“Itu karena mereka harus bereksperimen, datang dengan arsitektur baru, mengumpulkan dan membersihkan data, membayar karyawan, dan banyak lagi,” kata semi -analisis.

Makalah Deepseek sendiri tidak termasuk estimasi biaya komputasi. Perusahaan tidak segera menanggapi permintaan komentar.

“Jelas Deepseek adalah unik karena mereka mencapai tingkat biaya dan kemampuan ini terlebih dahulu,” tulis Semianalis. Perusahaan menambahkan bahwa Deepseek's “adalah model yang sangat baik” dan bahwa “mengejar ke tepi penalaran ini dengan cepat secara objektif mengesankan.”

Para ahli dan analis minggu ini menggembar -gemborkan kualitas model Deepseek, dan mencatat betapa mengesankannya mempertimbangkan AS Ekspor Chip Curbed ke Cina tiga kali dalam tiga tahun. Itu menyebabkan kekhawatiran bahwa AS jatuh di belakang musuh utamanya di pasar Diprediksi menjadi $ 1 triliun teratas dalam pendapatan dalam satu dekade.

Analis Bernstein menulis dalam catatan hari Senin bahwa “menurut banyak orang panas (kadang -kadang histeris) yang kami lihat [over the weekend,] Implikasinya berkisar di mana saja dari 'yang sangat menarik' hingga 'ini adalah leher kematian kompleks infrastruktur AI seperti yang kita ketahui.' “

Deepseek didirikan pada tahun 2023 oleh Liang Wenfeng, salah satu pendiri High-Flyer, dana lindung nilai kuantitatif yang berfokus pada AI. Startup AI dilaporkan tumbuh dari unit penelitian AI hedge fund pada bulan April 2023 untuk fokus pada model bahasa besar dan mencapai kecerdasan umum buatan, atau AGI – cabang AI yang sama Openai dan lainnya sedang mengejar.

Deepseek masih sepenuhnya dimiliki oleh dan didanai oleh High-Flyer, menurut analis di Jefferies.

Buzz di sekitar Deepseek mulai mengambil Steam awal bulan ini, ketika startup merilis R1, model penalaran yang menyaingi Openai's O1. Ini sumber terbuka, artinya pengembang AI mana pun dapat menggunakannya.

Seperti chatbot Cina lainnya, Deepseek's memiliki keterbatasan pada topik -topik tertentu: Ketika ditanya tentang beberapa kebijakan pemimpin Cina Xi Jinping, misalnya, Deepseek dilaporkan menjauhkan pengguna dari baris yang sama.

CEO Openai Sam Altman telah memuji model itu secara publik, tetapi perusahaan juga mengatakan mereka percaya ada bukti bahwa Deepseek dipanen secara tidak tepat Data openai untuk membangun produknya.

Di sebuah acara di Washington, DC, pada hari Kamis yang diselenggarakan oleh Openai, Altman mengatakan Deepseek “jelas model yang hebat.”

“Ini adalah pengingat tingkat kompetisi dan kebutuhan untuk AL Demokrat untuk menang,” katanya. Dia mengatakan itu juga menunjukkan “tingkat minat dalam penalaran, tingkat minat pada open source.”

JAM TANGAN: CEO NVIDIA Jensen Huang dan Presiden Trump bertemu dengan kebijakan AI