Teknologi

Bagaimana AI Chatbots menyukai chatgpt dan Deepseek Reason

Pada bulan September, OpenAI meluncurkan versi chatgpt baru yang dirancang untuk bernalar melalui tugas yang melibatkan matematika, sains dan pemrograman komputer. Tidak seperti versi chatbot sebelumnya, teknologi baru ini dapat menghabiskan waktu “berpikir” melalui masalah kompleks sebelum menyelesaikan jawaban.

Segera, perusahaan mengatakan teknologi penalaran barunya telah mengungguli sistem terkemuka industri pada serangkaian tes yang melacak kemajuan kecerdasan buatan.

Sekarang perusahaan lain, seperti Google, Anthropic dan China's Deepseek, menawarkan teknologi serupa.

Tapi bisakah AI benar -benar beralasan seperti manusia? Apa artinya dipikirkan komputer? Apakah sistem ini benar -benar mendekati kecerdasan sejati?

Ini panduannya.

Penalaran hanya berarti bahwa chatbot menghabiskan waktu tambahan untuk mengatasi masalah.

“Penalaran adalah ketika sistem melakukan pekerjaan ekstra setelah pertanyaan diajukan,” kata Dan Klein, seorang profesor ilmu komputer di University of California, Berkeley, dan chief technology officer Scaled Cognition, sebuah start-up AI.

Ini dapat memecah masalah menjadi langkah -langkah individual atau mencoba menyelesaikannya melalui coba -coba.

CHATGPT asli segera menjawab pertanyaan. Sistem penalaran baru dapat mengatasi masalah selama beberapa detik – atau bahkan beberapa menit – sebelum menjawab.

Dalam beberapa kasus, sistem penalaran akan memperbaiki pendekatannya terhadap sebuah pertanyaan, berulang kali mencoba meningkatkan metode yang telah dipilihnya. Di lain waktu, dapat mencoba beberapa cara berbeda untuk mendekati masalah sebelum menyelesaikan salah satu dari mereka. Atau mungkin kembali dan memeriksa beberapa pekerjaan yang dilakukannya beberapa detik sebelumnya, hanya untuk melihat apakah itu benar.

Pada dasarnya, sistem mencoba apa pun yang bisa menjawab pertanyaan Anda.

Ini seperti siswa sekolah dasar yang berjuang untuk menemukan cara untuk menyelesaikan masalah matematika dan menulis beberapa pilihan berbeda pada selembar kertas.

Berpotensi beralasan tentang apa pun. Tetapi penalaran paling efektif ketika Anda mengajukan pertanyaan yang melibatkan matematika, sains dan pemrograman komputer.

Anda dapat meminta chatbots sebelumnya untuk menunjukkan kepada Anda bagaimana mereka telah mencapai jawaban tertentu atau untuk memeriksa pekerjaan mereka sendiri. Karena chatgpt asli telah belajar dari teks di internet, di mana orang menunjukkan bagaimana mereka mendapatkan jawaban atau memeriksa pekerjaan mereka sendiri, itu bisa melakukan refleksi diri semacam ini juga.

Tetapi sistem penalaran melangkah lebih jauh. Itu bisa melakukan hal -hal semacam ini tanpa diminta. Dan itu bisa melakukannya dengan cara yang lebih luas dan kompleks.

Perusahaan menyebutnya sistem penalaran karena rasanya seolah -olah beroperasi lebih seperti orang yang berpikir melalui masalah yang sulit.

Perusahaan seperti Openai percaya ini adalah cara terbaik untuk meningkatkan chatbots mereka.

Selama bertahun -tahun, perusahaan -perusahaan ini mengandalkan konsep sederhana: semakin banyak data internet yang mereka pompa ke dalam chatbots mereka, semakin baik sistem yang dilakukan.

Tetapi pada tahun 2024, mereka menggunakan hampir semua teks di internet.

Itu berarti mereka membutuhkan cara baru untuk meningkatkan chatbots mereka. Jadi mereka mulai membangun sistem penalaran.

Tahun lalu, perusahaan seperti Openai mulai bersandar pada teknik yang disebut pembelajaran penguatan.

Melalui proses ini – yang dapat diperpanjang selama berbulan -bulan – sistem AI dapat mempelajari perilaku melalui percobaan dan kesalahan yang luas. Dengan bekerja melalui ribuan masalah matematika, misalnya, dapat mempelajari metode mana yang mengarah pada jawaban yang benar dan tidak.

Para peneliti telah merancang mekanisme umpan balik yang kompleks yang menunjukkan sistem ketika telah melakukan sesuatu yang benar dan ketika telah melakukan sesuatu yang salah.

“Ini sedikit seperti melatih seekor anjing,” kata Jerry Tworek, seorang peneliti Openai. “Jika sistemnya baik -baik saja, Anda memberikannya cookie. Jika tidak baik, Anda berkata, 'Bad Dog.'”

(The New York Times menggugat Openai dan mitranya, Microsoft, pada bulan Desember karena pelanggaran hak cipta konten berita yang terkait dengan sistem AI.)

Ini bekerja dengan cukup baik di bidang -bidang tertentu, seperti pemrograman matematika, sains dan komputer. Ini adalah area di mana perusahaan dapat dengan jelas mendefinisikan perilaku yang baik dan yang buruk. Masalah matematika memiliki jawaban yang pasti.

Pembelajaran penguatan tidak bekerja dengan baik di bidang -bidang seperti penulisan kreatif, filsafat dan etika, di mana perbedaan antara baik dan buruk lebih sulit dijabarkan. Para peneliti mengatakan proses ini umumnya dapat meningkatkan kinerja sistem AI, bahkan ketika menjawab pertanyaan di luar matematika dan sains.

“Ini secara bertahap mempelajari pola penalaran apa yang mengarah ke arah yang benar dan yang tidak,” kata Jared Kaplan, chief science officer di Anthropic.

Tidak. Pembelajaran Penguatan adalah metode yang digunakan perusahaan untuk membangun sistem penalaran. Ini adalah tahap pelatihan yang pada akhirnya memungkinkan chatbots untuk bernalar.

Sangat. Segala sesuatu yang dilakukan chatbot didasarkan pada probabilitas. Ini memilih jalur yang paling seperti data yang dipelajari – apakah data itu berasal dari internet atau dihasilkan melalui pembelajaran penguatan. Terkadang ia memilih opsi yang salah atau tidak masuk akal.

Pakar AI terpecah pada pertanyaan ini. Metode -metode ini masih relatif baru, dan para peneliti masih berusaha memahami batasannya. Di bidang AI, metode baru sering berkembang dengan sangat cepat pada awalnya, sebelum melambat.

Source link

Related Articles

Leave a Reply

Your email address will not be published. Required fields are marked *

Back to top button