Openai sekarang mengungkapkan lebih banyak proses pemikiran model O3-Mini-nya

Menanggapi tekanan dari saingan termasuk Perusahaan AI China DeepseekOpenai mengubah cara model AI terbarunya, O3-Minimengkomunikasikan proses “pemikiran” selangkah demi selangkah.
Pada hari Kamis, Openai diumumkan Pengguna ChatGPT yang gratis dan dibayar itu, platform chatbot bertenaga AI perusahaan, akan melihat “rantai pemikiran” yang diperbarui yang menunjukkan lebih banyak langkah “penalaran” model dan bagaimana hal itu sampai pada jawaban atas pertanyaan. Pelanggan rencana chatgpt premium yang menggunakan O3-mini dalam konfigurasi “penalaran tinggi” juga akan melihat pembacaan yang diperbarui ini, menurut OpenAI.
“Kami memperkenalkan yang diperbarui [chain of thought] Untuk O3-Mini yang dirancang untuk memudahkan orang untuk memahami bagaimana model berpikir, ”kata juru bicara OpenAI mengatakan kepada TechCruch melalui email. “Dengan pembaruan ini, Anda akan dapat mengikuti alasan model, memberi Anda lebih banyak kejelasan dan kepercayaan pada tanggapannya.”
Model penalaran seperti O3-mini benar-benar memeriksa diri mereka sendiri sebelum memberikan hasil, yang membantu mereka Hindari beberapa jebakan Itu biasanya model trip up. Pertukarannya adalah bahwa model penalaran membutuhkan waktu sedikit lebih lama untuk sampai pada solusi-biasanya detik hingga menit lebih lama.
Model R1 Deepseekmodel “penalaran” di sepanjang garis O3-Mini, mengungkapkan proses pemikiran penuhnya, yang menurut banyak peneliti AI adalah pendekatan yang disukai. Selain membuat model lebih mudah dipelajari, langkah -langkah penalaran memberikan pengalaman pengguna yang lebih baik dalam situasi tertentu, membantu menunjukkan kapan model mungkin berada di trek yang benar – atau salah -.
Openai memilih untuk tidak menunjukkan langkah-langkah penalaran penuh untuk O3-Mini dan pendahulunya, O1 dan O1-Mini, sebagian karena alasan kompetitif. Sebaliknya, pengguna hanya melihat ringkasan langkah -langkah penalaran – ringkasan yang kadang -kadang salah.
Ketika kami memberi pengarahan kepada orang-orang di 🍓 sebelum rilis O1-Preview, melihat COT Live biasanya adalah momen “aha” bagi mereka yang menjelaskan bahwa ini akan menjadi masalah besar. Ini bukan tempat tidur mentah tetapi ini merupakan langkah besar yang lebih dekat dan saya senang kita bisa berbagi pengalaman itu dengan dunia. https://t.co/72zpprhmfk
– Noam Brown (@polynoamial) 6 Februari 2025
Openai masih belum menunjukkan langkah-langkah penalaran penuh O3-Mini, tetapi perusahaan mengatakan itu “menemukan keseimbangan”: O3-Mini dapat “berpikir bebas” dan kemudian mengatur “pikiran” menjadi ringkasan yang lebih rinci.
“Untuk meningkatkan kejelasan dan keamanan, kami telah menambahkan langkah pasca-pemrosesan tambahan di mana model mengulas rantai pemikiran mentah, menghilangkan konten yang tidak aman, dan kemudian menyederhanakan ide-ide kompleks,” lanjut juru bicara Openai. “Selain itu, langkah pasca-pemrosesan ini memungkinkan pengguna non-Inggris untuk menerima rantai pemikiran dalam bahasa ibu mereka, menciptakan pengalaman yang lebih mudah diakses dan ramah.”
Di sebuah Reddit ama minggu laluKevin Weil, kepala produk produk Openai, mengisyaratkan bahwa perubahan itu akan datang.
“Kami sedang berupaya menunjukkan banyak lebih dari yang kami tunjukkan hari ini – [showing the model thought process] Akan sangat, segera, ”katanya. “TBD di semua – menunjukkan semua rantai pemikiran mengarah pada distilasi kompetitif, tetapi kami juga tahu orang (setidaknya pengguna listrik) menginginkannya, jadi kami akan menemukan cara yang tepat untuk menyeimbangkannya.”
TechCrunch memiliki buletin yang berfokus pada AI! Daftar di sini untuk mendapatkannya di kotak masuk Anda setiap hari Rabu.