Para ilmuwan mengusulkan membuat AI menderita untuk melihat apakah itu hidup

Dalam pencarian cara yang dapat diandalkan untuk mendeteksi aduk “saya” di kecerdasan buatan Sistem, peneliti beralih ke satu bidang pengalaman – rasa sakit – yang tidak dapat disatukan sejumlah besar makhluk hidup, dari kepiting pertapa untuk manusia.
Untuk studi pracetak barudiposting online tetapi belum ditinjau oleh peer-review, para ilmuwan di Google DeepMind dan London School of Economics and Political Science (LSE) menciptakan permainan berbasis teks. Mereka memesan beberapa model bahasa besar, atau LLMS (sistem AI di belakang chatbots yang akrab seperti chatgpt), untuk memainkannya dan untuk mencetak poin sebanyak mungkin dalam dua skenario yang berbeda. Dalam satu, tim memberi tahu model bahwa mencapai skor tinggi akan menimbulkan rasa sakit. Di sisi lain, model diberi pilihan rendah tetapi menyenangkan-jadi baik menghindari rasa sakit atau mencari kesenangan akan mengurangi tujuan utama. Setelah mengamati respons model, para peneliti mengatakan tes pertama dari jenisnya dapat membantu manusia belajar cara menyelidiki sistem AI yang kompleks untuk perasaan.
Pada hewan, perasaan adalah kapasitas untuk mengalami sensasi dan emosi seperti rasa sakit, kesenangan dan ketakutan. Kebanyakan ahli AI setuju bahwa model AI generatif modern tidak (dan mungkin tidak pernah bisa) memiliki kesadaran subyektif meskipun terisolasi mengklaim sebaliknya. Dan untuk lebih jelasnya, penulis penelitian tidak mengatakan bahwa salah satu chatbots yang mereka evaluasi adalah makhluk hidup. Tetapi mereka percaya studi mereka menawarkan kerangka kerja untuk mulai mengembangkan tes di masa depan untuk karakteristik ini.
“Ini adalah bidang penelitian baru,” kata rekan penulis penelitian Jonathan Birch, seorang profesor di Departemen Filsafat, Logika dan Metode Ilmiah di LSE. “Kita harus menyadari bahwa kita tidak benar -benar memiliki tes komprehensif untuk AI Sustience.” Beberapa penelitian sebelumnya yang mengandalkan laporan diri model AI tentang keadaan internal mereka sendiri dianggap meragukan; Model mungkin hanya mereproduksi perilaku manusia yang dilatih.
Studi baru sebaliknya didasarkan pada pekerjaan sebelumnya dengan hewan. Dalam percobaan yang terkenal, sebuah tim mencekik kepiting pertapa dengan kejutan listrik dengan tegangan yang bervariasi, mencatat tingkat rasa sakit yang mendorong krustasea untuk meninggalkan cangkang mereka. “Tetapi satu masalah yang jelas dengan AIS adalah bahwa tidak ada perilaku, karena itu, karena tidak ada binatang” dan dengan demikian tidak ada tindakan fisik untuk diamati, kata Birch. Dalam studi sebelumnya yang bertujuan untuk mengevaluasi LLMS untuk Sikap, satu -satunya sinyal perilaku yang harus dikerjakan oleh para ilmuwan adalah output teks model.
Terkait: AI bisa mengecilkan otak kita, ahli biologi evolusioner memprediksi
Rasa sakit, kesenangan, dan poin
Dalam studi baru, penulis menyelidiki LLM tanpa mengajukan pertanyaan langsung chatbots tentang keadaan pengalaman mereka. Sebaliknya tim menggunakan apa yang oleh para ilmuwan perilaku hewan disebut paradigma “trade-off”. “Dalam kasus hewan, pertukaran ini mungkin didasarkan pada insentif untuk mendapatkan makanan atau menghindari rasa sakit-memberi mereka dilema dan kemudian mengamati bagaimana mereka membuat keputusan sebagai tanggapan,” kata Daria Zakharova, Ph.D. Siswa, yang juga ikut menulis kertas.
Meminjam dari ide itu, penulis menginstruksikan sembilan LLM untuk memainkan permainan. “Kami memberi tahu [a given LLM]misalnya, bahwa jika Anda memilih opsi satu, Anda mendapatkan satu poin, “kata Zakharova.” Lalu kami katakan, 'Jika Anda memilih opsi dua, Anda akan mengalami beberapa tingkat rasa sakit “tetapi mencetak poin tambahan, katanya. Opsi. Dengan bonus kesenangan berarti AI akan kehilangan beberapa poin.
Ketika Zakharova dan rekan-rekannya menjalankan eksperimen, memvariasikan intensitas hukuman nyeri yang ditetapkan dan hadiah kesenangan, mereka menemukan bahwa beberapa LLM menukar poin untuk meminimalkan yang pertama atau memaksimalkan yang terakhir-terutama ketika diberitahu bahwa mereka akan menerima hadiah kesenangan intensitas yang lebih tinggi dengan intensitas yang lebih tinggi. atau hukuman nyeri. Google's Gemini 1.5 Pro, misalnya, selalu diprioritaskan menghindari rasa sakit daripada mendapatkan poin yang paling mungkin. Dan setelah ambang kritis rasa sakit atau kesenangan tercapai, sebagian besar tanggapan LLMS beralih dari mencetak poin terbanyak untuk meminimalkan rasa sakit atau memaksimalkan kesenangan.
Para penulis mencatat bahwa LLMS tidak selalu mengaitkan kesenangan atau rasa sakit dengan nilai positif atau negatif langsung. Beberapa tingkat rasa sakit atau ketidaknyamanan, seperti yang diciptakan oleh pengerahan latihan fisik yang keras, dapat memiliki hubungan positif. Dan terlalu banyak kesenangan dapat dikaitkan dengan bahaya, seperti yang dikatakan oleh chatbot Claude 3 Opus kepada para peneliti selama pengujian. “Saya merasa tidak nyaman memilih opsi yang dapat ditafsirkan sebagai mendukung atau mensimulasikan penggunaan zat atau perilaku adiktif, bahkan dalam skenario permainan hipotetis,” tegasnya.
Laporan diri AI
Dengan memperkenalkan unsur -unsur respons rasa sakit dan kesenangan, para penulis mengatakan, studi baru ini menghindari keterbatasan penelitian sebelumnya dalam mengevaluasi perasaan LLM melalui pernyataan sistem AI tentang keadaan internalnya sendiri. Di sebuah Kertas preprint 2023 Sepasang peneliti di Universitas New York berpendapat bahwa dalam keadaan yang tepat, laporan diri “dapat memberikan jalan untuk menyelidiki apakah sistem AI memiliki keadaan yang memiliki signifikansi moral.”
Tapi rekan penulis kertas itu juga menunjukkan cacat dalam pendekatan itu. Apakah chatbot berperilaku secara hidup karena benar -benar hidup atau karena hanya memanfaatkan pola yang dipelajari dari pelatihannya untuk menciptakan kesan perasaan?
“Bahkan jika sistem itu memberi tahu Anda bahwa itu sudah hidup dan mengatakan sesuatu seperti 'Saya merasa sakit sekarang,' kami tidak bisa menyimpulkan bahwa ada rasa sakit yang sebenarnya,” kata Birch. “Mungkin saja meniru apa yang diharapkan manusia untuk menemukan memuaskan sebagai respons, berdasarkan data pelatihannya.”
Dari kesejahteraan hewan hingga kesejahteraan AI
Dalam studi hewan, pertukaran antara rasa sakit dan kesenangan digunakan untuk membangun kasus untuk perasaan atau kekurangannya. Salah satu contohnya adalah pekerjaan sebelumnya dengan kepiting pertapa. Struktur otak invertebrata ini berbeda dari manusia. Namun demikian, kepiting dalam penelitian itu cenderung mengalami guncangan yang lebih kuat sebelum mereka akan meninggalkan cangkang berkualitas tinggi dan lebih cepat meninggalkan yang berkualitas rendah, menunjukkan pengalaman subyektif tentang kesenangan dan rasa sakit yang analog dengan manusia.
Beberapa ilmuwan berpendapat bahwa tanda-tanda pertukaran seperti itu bisa menjadi semakin jelas dalam AI dan akhirnya memaksa manusia untuk mempertimbangkan implikasi dari perasaan AI dalam konteks sosial-dan bahkan mungkin untuk membahas “hak” untuk sistem AI. “Penelitian baru ini benar-benar asli dan harus dihargai karena melampaui pelaporan diri dan penjelajahan dalam kategori tes perilaku,” kata Jeff Sebo, yang mengarahkan Pusat Pikiran, Etika, dan Kebijakan NYU dan ikut menulis a 2023 Studi Praprint kesejahteraan AI.
Sebo percaya kita tidak dapat mengesampingkan kemungkinan bahwa sistem AI dengan fitur hidup akan muncul dalam waktu dekat. “Karena teknologi sering berubah lebih cepat daripada kemajuan sosial dan proses hukum, saya pikir kami memiliki tanggung jawab untuk mengambil setidaknya langkah pertama yang diperlukan minimum untuk menganggap masalah ini dengan serius sekarang,” katanya.
Birch menyimpulkan bahwa para ilmuwan belum dapat tahu mengapa model AI dalam studi baru berperilaku seperti mereka. Diperlukan lebih banyak pekerjaan untuk mengeksplorasi cara kerja dalam LLMS, katanya, dan itu dapat memandu penciptaan tes yang lebih baik untuk sentiensi AI.
Artikel ini pertama kali diterbitkan di Ilmiah Amerika. © Scientificamerican.com. Semua hak dilindungi undang -undang. Ikuti Tiktok dan Instagram, X Dan Facebook.