Teknologi

Seberapa Deepseek Beralih Dari Pedagang Saham ke Bintang AI

Dua tahun yang lalu, ketika perusahaan teknologi Cina bernama besar seperti Baidu dan Alibaba mengejar kemajuan Silicon Valley dalam kecerdasan buatan dengan pengumuman yang heboh dan chatbots baru, Deepseek mengambil pendekatan yang berbeda. Itu memusatkan perhatian pada penelitian.

Strategi terbayar.

Start-up Cina telah menyentak dunia teknologi dengan klaimnya bahwa ia menciptakan model AI yang kuat yang secara signifikan lebih murah untuk dibangun daripada penawaran saingan Amerika yang lebih baik.

Dalam persaingan antara Cina dan Amerika Serikat atas dominasi kecerdasan buatan, Deepseek tampaknya muncul entah dari mana. Faktanya, telah meroket melalui dunia teknologi China dalam beberapa tahun terakhir dengan jalan yang sama sekali tidak konvensional.

Misinya untuk mengejar cermin penelitian bahwa perusahaan seperti Openai, perusahaan Lembah Silikon yang menandai tanda tangan Amerika atas AI pada musim gugur tahun 2022. Tetapi kesamaan sebagian besar berakhir di sana.

Asal -usul Deepseek berada di bidang keuangan, bukan teknologi demi teknologi. Perusahaan induknya, dana lindung nilai Tiongkok yang disebut High-Flyer, mulai bukan sebagai laboratorium yang dikhususkan untuk melindungi umat manusia dari AI seperti AI terbuka, tetapi sebagai bisnis menggunakan AI untuk membuat taruhan di pasar saham Cina.

High-Flyer telah berkembang dengan memanfaatkan pasar yang didominasi oleh investor ritel China, yang dikenal karena masuk dan keluar dari saham secara impulsif. Pada tahun 2021, High-Flyer mendapati dirinya ditekan oleh penumpasan peraturan di Cina pada perdagangan spekulatif, yang dirasakan pihak berwenang di Beijing bertentangan dengan upaya mereka untuk menjaga pasar tetap tenang.

Jadi Flyer tinggi mengejar peluang baru yang katanya selaras dengan prioritas pemerintah Tiongkok: AI lanjutan

“Kami ingin melakukan hal-hal dengan nilai yang lebih besar dan hal-hal yang melampaui industri investasi, tetapi telah disalahartikan sebagai spekulasi saham AI,” kata Kepala Eksekutif Flyer, Lu Zhengzhe, mengatakan kepada media pemerintah China pada tahun 2023. “Kami telah mendirikan Tim baru yang independen dari investasi, yang setara dengan start-up kedua. ”

Deepseek lahir. Seperti halnya banyak start-up Cina lainnya, Deepseek datang di pasar yang mapan dengan pendekatan bisnis yang berbeda.

Model terbaru Deepseek untuk kecerdasan buatan diyakini hampir sekuat saingan Amerika tetapi jauh lebih efisien. Keberhasilannya menunjukkan bahwa memimpin AI Silicon Valley telah menyusut. Terobosan Deepseek, terlepas dari upaya Washington untuk membatasi akses Cina ke chip canggih yang dibutuhkan untuk AI, menimbulkan pertanyaan tentang seberapa efektif kontrol tersebut bisa menjadi jangka panjang – meskipun pendiri Deepseek telah mengakui bahwa pembatasan chip adalah batasan.

Deepseek tidak bergantung pada membuat produk AI yang menghadap konsumen untuk pendapatan, dan hanya bulan ini merilis chatbot pertamanya, yang memungkinkan siapa pun untuk menghasilkan teks dan foto dengan perintah sederhana. Sebagai gantinya, perusahaan menggunakan uang yang dibuat oleh Flyer tinggi dari perdagangan saham ke bankroll riset yang ambisius. Pendekatan ini membedakannya dari saingan AS, yang semuanya pada akhirnya adalah perusahaan teknologi konsumen.

Pendekatan yang tidak konvensional ini juga memungkinkan Deepseek untuk menghindari peraturan ketat yang telah digunakan pemerintah Cina pada penggunaan AI oleh publik. Karena fokusnya adalah penelitian dan penjualan ke bisnis yang menggunakan modelnya – dan, sampai rilis chatbotnya bulan ini, bukan aplikasi konsumen – pekerjaan awalnya tidak memicu pembatasan pemerintah yang sama.

Deepseek dijalankan oleh kepala eksekutifnya, Liang Wenfeng, seorang insinyur yang tipis dan berkacamata yang belajar di Universitas Zhejiang di kota Hangzhou timur. Dia telah mengatakan berulang kali dalam beberapa wawancara yang telah dia berikan kepada media Cina bahwa untuk mengejar ketinggalan dengan inovasi Amerika, perusahaan Cina harus melakukan penelitian sebelum keuntungan. Deepseek dan High-Flyer tidak menanggapi permintaan komentar.

Apa perusahaan teknologi Cina “kurang dalam inovasi tentu bukan modal, tetapi kurangnya kepercayaan dan pengetahuan tentang bagaimana mengatur kepadatan bakat yang tinggi untuk mencapai inovasi yang efektif,” katanya dalam a Wawancara yang beredar luas dengan outlet teknologi Cina 36kr.

Mereka yang telah bekerja dengan Tn. Liang menggambarkannya sebagai manajer yang cakap dengan latar belakang teknis yang mendalam, menurut wawancara dan akun publik.

“Dia benar-benar seorang INTP,” kata Zihan Wang, seorang insinyur komputer yang bekerja pada model Deepseek sebelumnya, merujuk pada tipe kepribadian introspektif dari Tes Myers-Briggs, tes kepribadian yang populer di kalangan anak muda di Cina. “INTP adalah peneliti yang sangat baik dan mereka memiliki kemauan untuk mengeksplorasi,” kata Mr. Wang. “Dia bukan salah satu dari orang -orang yang ingin mengendalikan segalanya.”

Liang tidak terlalu terganggu dengan detail seperti jadwal proyek, dan sesekali mengirim pertanyaan penelitian yang menggugah pikiran kepada seluruh tim peneliti, kata Wang. Tetapi sebagian besar, Tuan Liang tampaknya terdorong untuk memajukan teknologi dan tidak fokus pada keuntungan.

Tidak seperti banyak perusahaan Cina, yang cenderung fokus pada mempekerjakan programmer, Mr. Liang telah mendapatkan reputasi untuk mempekerjakan orang dari luar komputasi. Penyair dan humaniora jurusan dari universitas -universitas terkemuka di Tiongkok tentang staf Deepseek melatih model untuk menulis puisi Cina klasik dan pertanyaan ace yang diambil dari ujian masuk perguruan tinggi yang sulit di negara itu.

“Sebagian besar tim lulus dari universitas terkemuka di Cina,” kata Yineng Zhang, seorang insinyur perangkat lunak utama di Baseten di San Francisco yang bekerja di SGLANG, sebuah proyek yang bukan bagian dari Deepseek yang membantu orang membangun di atas sistem Deepseek. “Mereka sangat pintar dan sangat muda.”

Selama bertahun -tahun, perusahaan teknologi Cina memelopori aplikasi kecerdasan buatan yang digunakan dalam visi komputer, seperti pengenalan wajah. Tapi rilis Openai dari ChatGPT mendorong perhitungan. Ketika tidak ada perusahaan Cina yang segera merilis sesuatu yang sebanding, banyak yang menyimpulkan bahwa perusahaan Amerika memiliki petunjuk di AI tingkat lanjut

Di Cina, para ilmuwan komputer bertekad untuk membuktikan bahwa mereka dapat bersaing. Pada tahun 2023, banyak perusahaan di Cina merilis model bahasa besar mereka sendiri, teknologi yang menopang chatbots seperti ChatGPT.

Tetapi membuat model canggih akan membutuhkan menggunakan sejumlah besar chip yang akan menelan biaya ratusan juta dolar.

High-Flyer juga menghabiskan. Pada tahun 2021, itu adalah salah satu segelintir perusahaan Tiongkok yang dapat menimbun lebih dari 10.000 chip NVIDIA A100 canggih.

Namun penelitian Deepseek memberikan keuntungan yang mengejutkan. Tahun lalu, secara dramatis memotong harga yang dibebankan pengembang yang membangun aplikasi menggunakan modelnya, mendorong perang harga dengan saingan yang lebih besar.

Wang, insinyur yang sebelumnya bekerja di Deepseek, mengatakan ada sedikit diskusi tentang aplikasi komersial untuk teknologi yang mereka bangun. Sebaliknya, katanya, perusahaan fokus membuat sistem AI yang dapat digunakan oleh berbagai orang untuk banyak tujuan.

“Selama waktu saya di sana, kami tidak berbicara banyak tentang bagaimana kami menghasilkan uang,” kata Mr. Wang. “Mereka hanya fokus pada membuat model fondasi yang hebat.”

Bagian penting dari popularitas Deepseek adalah bahwa ia telah membuat pengembangnya menjadi pekerjaannya. Berbagi informasi semacam ini, yang disebut Open Source, telah menjadi landasan pengembangan perangkat lunak komputer, Internet dan sekarang kecerdasan buatan.

Di Amerika Serikat, para peneliti dan pengusaha AI telah lama mengikuti kemajuan teknologi Deepseek. Tahun lalu, perusahaan menoleh ketika merilis sistem yang dirancang untuk menghasilkan program komputer mereka sendiri.

Tantangan baru bagi perusahaan dapat datang dengan profil tinggi baru. Pada hari yang sama merilis R1, model di balik chatbot barunya, minggu lalu, Mr. Liang muncul di sebuah diskusi meja bundar dengan Li Qiang, perdana menteri China.

Popularitas mendadak Deepseek telah mendorongnya ke pusat upaya partai komunis Tiongkok untuk memacu inovasi, dan itu bisa terbukti sulit dikelola, kata Jimmy Goodrich, penasihat senior untuk analisis teknologi ke Rand Corporation, sebuah think tank yang didanai pemerintah federal. “Ini merupakan kesulitan besar bagi Deepseek. Saya yakin mereka tidak dalam rencana lima tahun pemerintah, katanya.

“Bisakah mereka mempertahankan visi riang kacau ini ketika pesta dan dunia menonton?”

Zixu Wang Kontribusi penelitian dari Hong Kong.

Source link

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button