AI menciptakan meme yang lebih baik dan lebih lucu daripada orang, studi menunjukkan – bahkan ketika orang menggunakan AI untuk bantuan

Jangan melepaskan pekerjaan harian Anda, karena studi baru menunjukkan itu kecerdasan buatan (AI) lebih lucu dari Anda.
Dalam studi baru yang dirancang untuk menguji kemampuan kreatif co-model bahasa besar (LLM), meme internet yang dibuat oleh Openai's GPT-4O Model, rata -rata, dinilai lebih lucu, lebih kreatif dan lebih dapat dibagikan daripada yang diciptakan oleh manusia, atau oleh manusia dengan bantuan chatbot. Namun, ketika sampai pada kualitas meme teratas, humor yang dihasilkan manusia masih berlaku.
Temuan diunggah 20 Januari ke arxiv Server pracetak dan disajikan pada Konferensi Internasional ke -30 tentang Antarmuka Pengguna Cerdas, yang berlangsung 24 hingga 27 Maret, di Cagliari, Italia.
Mengomentari hasil di jejaring sosial Bluesky, Ethan MollickProfesor dan co-sutradara laboratorium AI generatif di Wharton University of Pennsylvania, mengatakan: “Saya menyesal mengumumkan bahwa tes meme telah dilewati.”
Terkait: Bisakah kamu mati karena tawa?
Tes Turing asli diusulkan pada tahun 1950 oleh ahli matematika Inggris Alan Turing Sebagai tolok ukur untuk intelijen mesin: jika seorang hakim manusia tidak bisa membedakan antara manusia dan mesin Dalam percakapan, mesin dapat dikatakan menunjukkan kecerdasan tingkat manusia.
Sementara penelitian ini tidak menilai apakah meme yang dihasilkan AI tidak dapat dibedakan dari yang dibuat oleh manusia, itu memang menimbulkan pertanyaan menarik tentang bagaimana kami mengevaluasi kreativitas-terutama karena peserta sering menilai konten yang dihasilkan AI lebih baik.
Pembelajaran Macheme
Para peneliti, dari KTH Royal Institute of Technology, LMU Munich dan Tu Darmstadt, belum berangkat untuk menunjukkan kemampuan komedi AI. Sebaliknya, mereka mulai mengeksplorasi kreativitas bersama, khususnya bagaimana LLM dapat mendukung manusia dengan tugas-tugas kreatif seperti penulisan lelucon.
Mereka mengidentifikasi penciptaan meme, dengan campuran referensi budaya, sarkasme dan tekanan kinerja taruhan rendah, sebagai uji yang sempurna. Meme biasanya mengambil bentuk gambar captioned yang riff pada situasi yang akrab atau budaya pop. Mereka telah menjadi jenis steno internet bersama, digunakan untuk membuat lelucon atau menanggapi peristiwa terkini dalam format yang mudah dicerna dan sering tidak sopan.
“Kompleksitas humor menjadikannya area yang kaya untuk mengeksplorasi dinamika kreativitas bersama, karena kolaborator harus menavigasi nuansa ini untuk menghasilkan konten yang beresonansi dengan orang lain,” tulis para peneliti dalam makalah ini.
Eksperimen melibatkan dua bagian. Pada yang pertama, para peneliti merekrut 124 peserta dan menugaskan mereka ke salah satu dari dua kelompok: satu bekerja sendiri dan yang lainnya bekerja dengan asisten AI Chatbot.
Peserta kemudian diberi tiga putaran untuk menghasilkan keterangan untuk template meme klasik berdasarkan topik kerja, makanan, dan olahraga – termasuk Goreng dari Futurama, Doge Dan Boromir (seseorang tidak hanya berjalan ke Mordor) template. Mereka yang ada di grup yang dibantu AI dapat menggunakan chatbot untuk bertukar pikiran tetapi bertanggung jawab untuk memilih ide-ide terbaik dan membuat meme akhir.
Kelompok hanya manusia menciptakan 335 meme, sementara 307 diproduksi oleh tim hibrida manusia-AI. 150 meme tambahan dihasilkan oleh GPT-4O untuk perbandingan.
Kelompok kedua yang terdiri dari 98 orang kemudian menilai meme tentang betapa lucunya, kreatif, dan dapat dibagikan. Meme itu diacak sehingga penilai tidak tahu siapa atau apa yang membuatnya. Di ketiga kategori, meme yang dihasilkan AIS keluar di atas.
“Menariknya, meme yang diciptakan seluruhnya oleh AI berkinerja lebih baik daripada meme kolaboratif manusia dan manusia yang rata-rata di semua bidang,” tulis para peneliti dalam makalah ini. “Namun, ketika melihat meme berkinerja terbaik, yang diciptakan manusia lebih baik dalam humor, sementara kolaborasi manusia-AI menonjol dalam kreativitas dan kemampuan berbagi.”
Dengan kata lain, sementara meme yang dihasilkan AI rata-rata tertinggi, meme yang diidentifikasi sebagai “yang paling lucu” lebih sering diciptakan oleh manusia.
Regenerasi Konten
Para peneliti mengkredit skor rata -rata AI yang kuat untuk fakta LLMS dilatih pada volume besar konten internet, menjadikannya bagus dalam meniru humor populer yang luas, tetapi tidak begitu banyak dalam mendaratkan zinger nyata dari lucunya. “LLMS menarik selera humor yang luas, tetapi manusia masih lebih cerdas,” tulis mereka.
Studi ini juga meneliti dampak bantuan AI pada produktivitas dan upaya yang dirasakan. Peserta yang bekerja dengan chatbot menghasilkan lebih banyak ide daripada yang bekerja sendiri, tetapi ini tidak selalu diterjemahkan ke konten yang lebih lucu.
Menurut para peneliti, ini karena sementara LLMS dapat membantu pembuatan ide, mereka tidak perlu meningkatkan kualitas kreatif. Ini terutama berlaku untuk humor, yang menurut para peneliti membutuhkan “waktu, konteks budaya, pengetahuan bersama, dan kemampuan untuk menumbangkan harapan.”
Para peneliti menyimpulkan: “Sementara LLMS dapat menghasilkan meme yang lucu dan sesuai kontekstual, mereka sering menghadapi tantangan dalam menangkap referensi budaya yang bernuansa dan seluk -beluk emosional yang melekat dalam kreativitas manusia. Sementara AI dapat meningkatkan produktivitas dan menciptakan konten yang menarik bagi khalayak yang luas, kreativitas humanitas tetap penting untuk konten yang terhubung pada tingkat deeper.”