Berita

Openai mengatakan Deepseek menyalin chatgpt, tapi itu juga menghadapi klaim hak cipta

Sampai beberapa minggu yang lalu, beberapa orang di dunia barat telah mendengar tentang sebuah perusahaan Kecil Kecerdasan Buatan Cina (AI) yang dikenal sebagai Deepseek. Tapi pada 20 Januari, itu menarik perhatian global Ketika merilis model AI baru yang disebut R1.

R1 adalah model “penalaran”, artinya berfungsi melalui tugas -tugas langkah demi langkah dan merinci proses kerjanya kepada pengguna. Ini adalah versi deepseek yang lebih canggih Model V3yang dirilis pada bulan Desember. Penawaran baru Deepseek hampir sekuat perusahaan saingannya Openai Model AI O1 paling canggih, tetapi dengan sedikit biaya.

Dalam beberapa hari, aplikasi Deepseek melampaui chatgpt dalam unduhan baru dan menetapkan harga saham perusahaan teknologi di Amerika Serikat jatuh. Itu juga mengarahkan openai ke mengeklaim Bahwa saingan Tiongkoknya telah secara efektif mencuri beberapa perhiasan mahkota dari model Openai untuk membangunnya sendiri.

Di sebuah Pernyataan untuk The New York Timesperusahaan berkata:

Kami mengetahui dan meninjau indikasi bahwa Deepseek mungkin telah menyaring model kami secara tidak tepat, dan akan berbagi informasi seperti yang kami ketahui lebih banyak. Kami mengambil tindakan balasan yang agresif dan proaktif untuk melindungi teknologi kami dan akan terus bekerja sama dengan pemerintah AS untuk melindungi model yang paling mampu dibangun di sini.

Percakapan mendekati Deepseek untuk memberikan komentar, tetapi itu tidak merespons.

Tetapi bahkan jika Deepseek menyalin – atau, dalam bahasa ilmiah, “distilasi” – setidaknya beberapa chatgpt untuk membangun R1, ada baiknya diingat bahwa Openai juga dituduh tidak menghormati kekayaan intelektual saat mengembangkan modelnya.

Apa itu distilasi?

Distilasi model adalah teknik pembelajaran mesin yang umum di mana “model siswa” yang lebih kecil dilatih pada prediksi “model guru” yang lebih besar dan lebih kompleks.

Ketika selesai, siswa mungkin hampir sebagus guru tetapi akan mewakili pengetahuan guru secara lebih efektif dan kompak.

Untuk melakukannya, tidak perlu mengakses pekerjaan dalam guru. Yang perlu dilakukan untuk melakukan trik ini adalah mengajukan pertanyaan yang cukup kepada model guru untuk melatih siswa.

Inilah yang diklaim Openai Deepseek telah dilakukan: menanyakan O1 Openai pada skala besar dan menggunakan output yang diamati untuk melatih model Deepseek dan lebih efisien.

Sebagian kecil dari sumber daya

Deepseek klaim Bahwa pelatihan dan penggunaan R1 hanya membutuhkan sebagian kecil dari sumber daya yang diperlukan untuk mengembangkan model terbaik pesaing mereka.

Ada alasan untuk bersikap skeptis terhadap beberapa hype pemasaran perusahaan – misalnya, a Laporan Independen Baru menyarankan pengeluaran perangkat keras untuk R1 setinggi US $ 500 juta. Namun demikian, Deepseek masih dibangun dengan sangat cepat dan efisien dibandingkan dengan model saingan.

Ini mungkin karena Deepseek menyuling output Openai. Namun, saat ini tidak ada metode untuk membuktikan ini secara meyakinkan. Salah satu metode yang ada pada tahap awal pengembangan adalah output AI dengan watermarking. Ini menambah pola yang tidak terlihat pada output, mirip dengan yang diterapkan pada gambar yang dilindungi hak cipta. Ada berbagai cara untuk melakukan ini secara teori, tetapi tidak ada yang efektif atau cukup efisien untuk mempraktikkannya.

Ada alasan lain yang membantu menjelaskan keberhasilan Deepseek, seperti pekerjaan teknis perusahaan yang mendalam dan menantang.

Kemajuan teknis yang dibuat oleh Deepseek termasuk mengambil keuntungan dari chip AI yang kurang kuat tetapi lebih murah (juga disebut unit pemrosesan grafis, atau GPU).

Deepseek tidak punya pilihan selain beradaptasi setelah AS telah melarang perusahaan dari mengekspor chip AI paling kuat ke Cina.

Sementara perusahaan AI barat dapat membeli unit -unit yang kuat ini, larangan ekspor memaksa perusahaan Cina untuk berinovasi untuk memanfaatkan alternatif yang lebih murah.

AS telah melarang ekspor chip komputer paling kuat ke Cina. Atau Gal/Shutterstock

Serangkaian tuntutan hukum

Openai's Ketentuan Penggunaan Secara eksplisit menyatakan tidak ada yang dapat menggunakan model AI untuk mengembangkan produk yang bersaing. Namun, modelnya sendiri dilatih pada dataset besar yang dikikis dari web. Dataset ini terkandung sejumlah besar bahan berhak ciptayang menurut Openai berhak digunakan Atas dasar “Penggunaan yang Adil”:

Pelatihan model AI menggunakan materi internet yang tersedia untuk umum digunakan secara adil, seperti yang didukung oleh preseden lama dan diterima secara luas. Kami memandang prinsip ini sebagai pencipta yang adil, yang diperlukan untuk inovator, dan penting bagi daya saing AS.

Argumen ini akan diuji di pengadilan. Surat kabar, musisi, penulis dan materi iklan lainnya telah mengajukan serangkaian tuntutan hukum terhadap Openai dengan alasan pelanggaran hak cipta.

Tentu saja, ini sangat berbeda dengan apa yang Openai tuduhkan Deepseek lakukan. Namun demikian, Openai tidak menarik banyak simpati karena klaimnya bahwa Deepseek secara tidak sah memanen output modelnya.

Perang kata -kata dan tuntutan hukum adalah artefak tentang bagaimana kemajuan cepat AI telah melampaui pengembangan aturan hukum yang jelas untuk industri. Dan sementara peristiwa baru -baru ini dapat mengurangi kekuatan petahana AI, banyak bergantung pada hasil dari berbagai perselisihan hukum yang sedang berlangsung.

Mengguncang percakapan global

Deepseek telah menunjukkan bahwa adalah mungkin untuk mengembangkan model canggih dengan murah dan efisien. Apakah mereka dapat bersaing dengan OpenAI di lapangan bermain level masih harus dilihat.

Selama akhir pekan, Openai berusaha menunjukkan supremasinya merilis secara terbuka Model konsumennya yang paling canggih, O3-Mini.

Openai mengklaim model ini secara substansial mengungguli bahkan versi yang sebelumnya memimpin pasar sebelumnya, O1, dan merupakan “model yang paling hemat biaya dalam serialal penalaran kami”.

Perkembangan ini menandai era pilihan yang meningkat bagi konsumen, dengan keragaman model AI di pasaran. Ini adalah kabar baik bagi pengguna: Tekanan kompetitif akan membuat model lebih murah untuk digunakan.

Dan manfaatnya meluas lebih jauh.

Melatih dan menggunakan model -model ini tempat -tempat a ketegangan besar tentang konsumsi energi global. Ketika model -model ini menjadi lebih ada di mana -mana, kita semua mendapat manfaat dari peningkatan efisiensinya.

Kenaikan Deepseek tentu menandai wilayah baru untuk membangun model lebih murah dan efisien. Mungkin juga akan mengguncang percakapan global tentang bagaimana perusahaan AI harus mengumpulkan dan menggunakan data pelatihan mereka.Percakapan

(Pengarang: Lea FrermannDosen Senior dalam Pemrosesan Bahasa Alami, Universitas Melbourne, Universitas Melbourne Dan SHANANAN COHNEYDosen cybersecurity, Universitas Melbourne)

Artikel ini diterbitkan ulang dari Percakapan di bawah lisensi Creative Commons. Baca Artikel asli.

(Kecuali untuk tajuk utama, cerita ini belum diedit oleh staf NDTV dan diterbitkan dari feed sindikasi.)


Source

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button