Model AI yang lebih tua menunjukkan tanda -tanda penurunan kognitif, penelitian menunjukkan

Orang semakin mengandalkan kecerdasan buatan (AI) Untuk diagnosis medis karena seberapa cepat dan efisien alat-alat ini dapat melihat anomali dan tanda-tanda peringatan dalam sejarah medis, rontgen dan kumpulan data lainnya sebelum menjadi jelas bagi mata telanjang. Tetapi sebuah studi baru yang diterbitkan 20 Desember 2024 di BMJ menimbulkan kekhawatiran bahwa teknologi AI seperti model bahasa besar (LLM) dan chatbots, seperti orang, menunjukkan tanda -tanda kemampuan kognitif yang memburuk seiring bertambahnya usia.
“Temuan ini menantang asumsi bahwa kecerdasan buatan akan segera menggantikan dokter manusia,” tulis penulis penelitian dalam makalah ini, “ketika gangguan kognitif yang terbukti dalam memimpin chatbots dapat memengaruhi keandalan mereka dalam diagnostik medis dan merusak kepercayaan pasien.”
Para ilmuwan yang diuji secara publik tersedia chatbots yang digerakkan oleh LLM termasuk chatgpt openai, soneta antropik dan alphabet's gemini menggunakan Penilaian Kognitif Montreal Tes (MOCA) – Serangkaian tugas yang digunakan ahli saraf untuk menguji kemampuan dalam perhatian, memori, bahasa, keterampilan spasial dan fungsi mental eksekutif.
MOCA paling umum digunakan untuk menilai atau menguji timbulnya gangguan kognitif dalam kondisi seperti penyakit Alzheimer atau demensia. Subjek diberikan tugas -tugas seperti menggambar waktu tertentu pada wajah jam, mulai dari 100 dan berulang kali mengurangi tujuh, mengingat sebanyak mungkin kata dari daftar lisan, dan sebagainya. Pada manusia, 26 dari 30 dianggap sebagai skor kelulusan (yaitu subjek tidak memiliki gangguan kognitif.
Terkait: Chatgpt benar -benar mengerikan dalam mendiagnosis kondisi medis
Sementara beberapa aspek pengujian seperti penamaan, perhatian, bahasa, dan abstraksi tampaknya mudah untuk sebagian besar LLM yang digunakan, mereka semua berkinerja buruk dalam keterampilan visual/spasial dan tugas eksekutif, dengan beberapa melakukan lebih buruk daripada yang lain di bidang -bidang seperti penarikan yang tertunda.
Yang terpenting, sementara versi terbaru dari ChatGPT (versi 4) mencetak yang tertinggi (26 dari 30), Gemini 1.0 LLM yang lebih tua hanya mencetak 16 – yang mengarah ke kesimpulan LLM yang lebih lama menunjukkan tanda -tanda penurunan kognitif.
Penulis penelitian ini mencatat bahwa temuan mereka hanya pengamatan – perbedaan kritis antara cara -cara AI dan pekerjaan pikiran manusia berarti percobaan tidak dapat merupakan perbandingan langsung. Tetapi mereka memperingatkan itu mungkin menunjukkan apa yang mereka sebut “area kelemahan yang signifikan” yang dapat membuat rem pada penyebaran AI dalam kedokteran klinis. Secara khusus, mereka berargumen tidak menggunakan AI dalam tugas yang membutuhkan abstraksi visual dan fungsi eksekutif.
Ini juga menimbulkan gagasan yang agak lucu tentang ahli saraf manusia yang mengambil pasar yang sama sekali baru – AIS sendiri yang hadir dengan tanda -tanda gangguan kognitif.