Apa tes Turing? Bagaimana kebangkitan AI generatif mungkin telah merusak permainan imitasi yang terkenal.

“Bisakah mesin berpikir?” Itulah pertanyaan inti ahli matematika legendaris dan ilmuwan komputer Alan Turing berpose Pada bulan Oktober 1950. Turing ingin menilai apakah mesin dapat meniru atau menunjukkan perilaku cerdas tingkat manusia, dan karenanya ia datang dengan tes yang disebut “permainan imitasi.” Ini kemudian dikenal sebagai tes Turing, yang biasanya digunakan untuk menilai seberapa baik mesin dapat meniru perilaku manusia.
Kejadian tes Turing berasal dari kesulitan yang melekat dalam menetapkan kriteria objektif yang membedakan pemikiran asli dari tiruannya. Tantangannya adalah bahwa bukti pemikiran asli dapat ditolak dengan argumen bahwa sebuah mesin hanya diprogram untuk tampak cerdas. Pada dasarnya, inti dari pembuktian jika mesin dapat berpikir adalah mendefinisikan apa pemikiran itu.
Terkait: 8 robot paling aneh di dunia saat ini
Turing ingin menantang ide itu bahwa sifat mekanis komputer berarti mereka tidak dapat, pada prinsipnya, berpikir. Matematikawan menyatakan bahwa, jika komputer tampak tidak dapat dibedakan dari manusia, lalu mengapa itu tidak dianggap sebagai entitas yang berpikir?
Bagaimana cara kerja tes Turing?
Turing mengusulkan permainan tiga partai. Dia pertama kali menguraikan tes di mana seorang pria dan wanita pergi ke kamar terpisah dan tamu pesta menggunakan jawaban yang diketik untuk mencoba dan menentukan orang mana yang, sementara pria dan wanita mencoba meyakinkan mereka bahwa mereka adalah lawan jenis.
Dari sana, Turing mengusulkan tes di mana interogator jarak jauh ditugaskan untuk mengajukan pertanyaan kepada komputer dan subjek manusia, keduanya tidak terlihat, selama lima menit untuk menentukan mana yang hidup. Keberhasilan komputer di “Thinking” kemudian dapat diukur dengan seberapa besar kemungkinan salah diidentifikasi sebagai manusia.
Iterasi gim imitasi kemudian, yang diusulkan oleh Turing pada tahun 1952 dalam siaran BBC, akan melihat komputer mencoba dan meyakinkan juri orang bahwa itu adalah manusia.
Tes Turing diciptakan sebagai lebih dari eksperimen pemikiran filosofis daripada cara praktis untuk mendefinisikan kecerdasan mesin. Namun, itu tumbuh menjadi target utama untuk pembelajaran mesin dan kecerdasan buatan (AI) Sistem untuk dilewati untuk menunjukkan kecerdasan umum buatan.
Turing diprediksi Bahwa pada awal 2000 -an, komputer terprogram akan dapat “memainkan permainan imitasi dengan sangat baik sehingga interogator rata -rata tidak akan memiliki lebih dari 70 persen peluang membuat identifikasi yang tepat setelah lima menit diinterogasi.”
Tapi, itu tidak terjadi. Namun, munculnya chatgpt dan sistem kecerdasan buatan lainnya dan model bahasa besar (LLM) telah menyalakan kembali percakapan di sekitar tes Turing.
Pada Juni 2024, para peneliti mengklaim bahwa LLM GPT-4 dinilai sebagai manusia 54% dari waktu Dalam tes Turing dalam waktu lima menit setelah ditanyai. Itu dengan gemilang mengalahkan prediksi Turing sebesar 30%, meskipun dua dekade kemudian dari tanggal yang diprediksi matematikawan. Tapi ini Penelitian dari University of San Diego Hanya melibatkan dua pemain dalam tes daripada permainan tiga pemain asli Turing, jadi GPT-4 tidak lulus tes Turing dalam kondisi spesifik yang ia tentukan.
Namun demikian, penelitian ini masih menunjukkan bagaimana AIS seperti itu setidaknya dapat meniru manusia dengan beberapa keberhasilan.
Tantangan dan keterbatasan tes Turing
Sementara lulus tes Turing mungkin menjadi tujuan besar untuk membuktikan pemikiran dalam sistem AI, tes ini memiliki keterbatasan dan lawannya.
Turing dirinya merinci dan membahas sembilan keberatan terhadap tes dan teorinya dalam mesin pembuktian yang bisa dipikirkan; Ini berkisar dari konsep teologis pemikiran dan gagasan bahwa mesin tidak dapat merasakan emosi, atau memiliki selera humor, hingga batasan matematika logis yang hanya akan mencegah mesin menjawab pertanyaan atau membuatnya benar.
Tapi mungkin keberatan yang paling relevan berasal dari ahli matematika Ada Lovelace, yang kapan berkomentar Pada komputasi perintis mesin analitik Charles Babbage, menyarankan bahwa mesin tidak dapat “berasal dari apa pun” dan hanya dapat melakukan apa pun yang kami pesan untuk melakukan. Retort Turing dalam makalahnya adalah bertanya apakah manusia memang dapat melakukan sesuatu yang benar -benar baru di dunia deterministik yang terikat oleh hukum alam dan batas -batas alam semesta. Turing juga mencatat bahwa komputer dapat dibatasi tetapi masih dapat berpotensi melakukan hal -hal yang tidak terduga – dengan cara yang sama seperti manusia meskipun dapat dibatasi oleh makeup dan biologi genetik kita.
Di luar ini adalah fakta bahwa tes Turing tidak, menurut, menunjukkan kesadaran atau kecerdasan; Sebaliknya ia bekerja untuk mengkritik apa yang dipahami sebagai pemikiran dan apa yang bisa membentuk mesin berpikir. Tes ini juga bergantung pada penilaian interogator, perbandingan dengan manusia dan penilaian perilaku saja.
Lalu ada argumen bahwa tes Turing dirancang di sekitar bagaimana suatu subjek bertindak, yang berarti mesin hanya dapat mensimulasikan kesadaran atau pemikiran manusia daripada secara aktif memiliki kesetaraannya sendiri. Ini dapat menyebabkan Turing Trap – Di mana sistem AI secara berlebihan fokus pada meniru manusia daripada dirancang untuk memiliki fungsi yang memungkinkan manusia melakukan lebih banyak atau meningkatkan kognisi mereka di luar kemungkinan pikiran manusia.
Apakah tes Turing masih relevan?
Sementara tes Turing mungkin diadakan sebagai tolok ukur untuk sistem AI untuk melampaui, Eleanor Watsonseorang ahli etika AI dan anggota Institute of Electrical and Electronics Engineers (IEEE), mengatakan kepada Live Science bahwa “Tes Turing menjadi semakin usang sebagai tolok ukur yang bermakna untuk kemampuan kecerdasan buatan (AI).”
Watson menjelaskan bahwa LLMS berevolusi dari sekadar meniru manusia menjadi sistem agen yang mampu secara mandiri mengejar tujuan melalui pemrograman “perancah” – mirip dengan bagaimana otak manusia membangun fungsi baru ketika informasi mengalir melalui lapisan neuron.
“Sistem ini dapat terlibat dalam penalaran yang kompleks, menghasilkan pembuatan konten dan membantu dalam penemuan ilmiah. Namun, tantangan sebenarnya bukanlah apakah AI dapat membodohi manusia dalam percakapan, tetapi apakah itu dapat mengembangkan akal sehat, penalaran dan penyelarasan tujuan yang asli yang cocok dengan nilai -nilai dan niat manusia,” kata Watson. “Tanpa penyelarasan yang lebih dalam ini, lulus tes Turing menjadi hanya bentuk mimikri yang canggih daripada kecerdasan sejati.”
Pada dasarnya, tes Turing mungkin menilai hal -hal yang salah untuk sistem AI modern.
Dengan demikian, para ilmuwan “perlu mengembangkan kerangka kerja baru untuk mengevaluasi AI yang melampaui imitasi manusia sederhana untuk menilai kemampuan, keterbatasan, risiko potensial, dan yang paling penting, Penyelarasan dengan nilai dan tujuan manusia“Kata Watson.
Berbeda dengan tes Turing, kerangka kerja ini perlu menjelaskan kekuatan sistem AI dan perbedaan mendasar mereka dari kecerdasan manusia, dengan tujuan memastikan AI “meningkatkan, daripada mengurangi, agensi manusia dan kesejahteraan,” tambah Watson.
“Ukuran AI yang sebenarnya tidak akan seberapa baik itu dapat bertindak manusia,” Watson menyimpulkan, “tetapi seberapa baik itu dapat melengkapi dan menambah kemanusiaan, mengangkat kita ke tingkat yang lebih tinggi.”