Studi baru mengklaim ai 'memahami' emosi lebih baik dari kita – terutama dalam situasi yang bermuatan emosional

Dalam apa yang tampak seperti pukulan lebih lanjut terhadap kemampuan di mana kami pikir komputer tidak akan pernah mengalahkan kami, para ilmuwan sekarang menyarankan AI memahami emosi lebih baik daripada kami.
Para ilmuwan telah menemukan bahwa AI memahami emosi lebih baik daripada yang kita lakukan-mencetak jauh lebih tinggi daripada rata-rata orang dalam memilih respons yang benar untuk menyebarkan berbagai situasi yang bermuatan emosional
Dalam studi baru diterbitkan 21 Mei di jurnal Psikologi Komunikasipara ilmuwan dari University of Geneva (Unige) dan University of Bern (Unibe) menerapkan tes kecerdasan emosional yang banyak digunakan (EI) (TANGKAI, Steu, GEMOK-Blends, Regulasi GECO dan manajemen GECO) untuk model bahasa besar yang umum (LLM) termasuk chatgpt-4, chatgpt-o1, gemini 1.5 flash, claude 3.5 haiku, copilot 365 dan deepseek v3.
Mereka sedang menyelidiki dua hal: pertama, membandingkan kinerja AI dan subjek manusia, dan kedua, kemampuan untuk membuat pertanyaan tes baru yang mematuhi keperluan tes AI.
Dengan mempelajari respons manusia yang divalidasi dari penelitian sebelumnya, LLMS memilih respons “benar” dalam tes kecerdasan emosional 81% dari waktu, berdasarkan pendapat para ahli manusia, dibandingkan dengan 56% untuk manusia.
Ketika ChatGPT diminta untuk membuat pertanyaan tes baru, penilai manusia mengatakan upaya ini berdiri untuk tes asli dalam hal kesulitan yang setara dan membersihkan persepsi yang mereka tidak memparafrasekan pertanyaan asli. Korelasi antara uji AI-dihasilkan dan asli digambarkan sebagai “kuat”, dengan koefisien korelasi 0,46 (di mana 1,0 mengacu pada korelasi yang sempurna dan 0 mengacu pada tidak ada korelasi).
Kesimpulan keseluruhan adalah bahwa AI lebih baik dalam “memahami” emosi daripada kita.
Kisah yang lebih dalam
Ketika Live Science berkonsultasi dengan beberapa ahli, tema umum dalam tanggapan mereka adalah menjaga metodologi dengan kuat dalam pikiran. Setiap tes EI umum yang digunakan adalah pilihan ganda-hampir tidak berlaku untuk skenario dunia nyata di mana ketegangan antara orang tinggi, mereka menunjukkan.
“Perlu dicatat bahwa manusia tidak selalu sepakat tentang apa yang dirasakan orang lain, dan bahkan psikolog dapat menafsirkan sinyal emosional secara berbeda,” kata industri keuangan dan pakar keamanan informasi Taimur Ijlal. “Jadi 'mengalahkan' manusia pada tes seperti ini tidak selalu berarti AI memiliki wawasan yang lebih dalam. Itu berarti memberikan jawaban yang diharapkan secara statistik lebih sering.”
Kemampuan yang sedang diuji oleh penelitian ini bukanlah kecerdasan emosional tetapi sesuatu yang lain, tambah mereka. “Sistem AI sangat baik dalam pengenalan pola, terutama ketika isyarat emosional mengikuti struktur yang dapat dikenali seperti ekspresi wajah atau sinyal linguistik,” kata Nauman Jaffar, pendiri dan CEO klinis-alat dokumentasi bertenaga AI yang dibangun untuk para profesional kesehatan mental. “Tetapi menyamakan bahwa dengan 'pemahaman' yang lebih dalam tentang emosi manusia berisiko melebih -lebihkan apa yang sebenarnya dilakukan AI.”
Kuis dalam lingkungan yang terstruktur dan kuantitatif – alih -alih apresiasi terhadap nuansa yang lebih dalam yang dibutuhkan oleh pemahaman emosional sejati – adalah tempat AI bersinar, dan beberapa ahli menunjukkan satu poin penting: bahwa AI berkinerja lebih baik pada tes tentang situasi emosional yang tidak dalam panasnya saat ini – cara manusia mengalaminya.
Jason Hennessey, pendiri dan CEO Hennessy Digital – yang telah menghabiskan waktu bertahun -tahun menganalisis bagaimana pencarian dan generatif sistem proses AI – menyamakan studi dengan Membaca Tes Mata dalam Mata. Ini adalah alat umum untuk mengukur keadaan emosi subjek dan satu AI telah ditunjukkan janji di. Tapi seperti yang dikatakan Hennessey, ketika variabel sama rutinnya dengan pencahayaan dalam konteks foto atau budaya berubah dalam tes semacam itu, “AI Accuracy turun dari tebing.”
Secara keseluruhan, sebagian besar ahli menemukan klaim AI “memahami” emosi lebih baik daripada manusia untuk menjadi sedikit peregangan.
“Apakah itu menunjukkan LLM berguna untuk mengkategorikan reaksi emosional yang umum?” kata Wyatt Mayham, pendiri Northwest IT Consulting. “Tentu. Tapi itu seperti mengatakan seseorang adalah terapis yang hebat karena mereka mencetak gol dengan baik pada kuis Buzzfeed bertema emosional.”
Tetapi ada peringatan akhir, dengan bukti bahwa meskipun AI menggunakan pengenalan pola daripada pemahaman emosional sejati, itu telah mengungguli manusia dalam mengidentifikasi dan menanggapi keadaan emosi dalam setidaknya satu contoh.
Aílton, AI percakapan yang digunakan oleh lebih dari 6.000 pengemudi truk jarak jauh di Brasil, adalah asisten Whatsapp multimodal yang menggunakan suara, teks dan gambar, dan pengembangnya, CEO & Kepala Ilmuwan Marcos Alves di Hal kamukata Aílton mengidentifikasi stres, kemarahan atau kesedihan dengan akurasi sekitar 80% – sekitar 20 poin di atas rekan -rekan manusianya, semua dalam konteks dalam situasi emosional ketika pengemudi berinteraksi dengannya secara real time.
Dalam satu kasus, Aílton merespons dengan cepat dan tepat ketika seorang pengemudi mengirim catatan suara 15 detik setelah kecelakaan fatal seorang kolega, membalas dengan belasungkawa yang bernuansa, menawarkan sumber daya kesehatan mental dan secara otomatis memperingatkan manajer armada.
“Ya, sketsa teks pilihan ganda menyederhanakan pengenalan emosi,” kata Alves. “Empati nyata adalah kontinu dan multimodal. Tetapi mengisolasi lapisan kognitif berguna. Ini mengungkapkan apakah LLM dapat melihat isyarat emosional sebelum menambahkan kebisingan situasional.”
Dia menambahkan kemampuan LLMS untuk menyerap miliaran kalimat dan ribuan jam audio percakapan berarti dapat mengkodekan isyarat mikro-intonasi yang sering dilewatkan manusia. “Pengaturan lab terbatas,” katanya tentang penelitian ini, “tetapi data WhatsApp kami mengkonfirmasi LLM modern sudah mendeteksi dan merespons lebih baik daripada kebanyakan orang, menawarkan empati yang dapat diskalakan pada skala.”