'Olimpiade Matematika' memiliki pesaing baru – AI Google sekarang 'lebih baik daripada peraih medali emas manusia' dalam menyelesaikan masalah geometri

Peneliti Google telah mengembangkan kecerdasan buatan (AI) Sistem matematika yang dapat mengalahkan peraih medali emas dalam kompetisi geometri internasional.
Sistem, yang disebut “Alphageometry2” (AG2), adalah kerangka kerja AI canggih yang mampu memecahkan 84% masalah geometri yang ditimbulkan dalam Olimpiade Matematika Internasional (IMO). Pemenang medali emas IMO rata-rata memecahkan 81,8% dari masalah Olympiad.
Direkayasa oleh Google DeepMinditu dapat terlibat tidak hanya dalam pencocokan pola tetapi juga dalam pemecahan masalah kreatif, kata para ilmuwan. Mereka menguraikan temuan mereka dalam studi yang diunggah 7 Februari ke pracetak arxiv database.
Pengumuman perusahaan datang satu bulan setelah Microsoft merilis sistem penalaran matematika AI canggih sendiri, Math rstaryang menggunakan model bahasa kecil (SML) untuk memecahkan persamaan yang kompleks. Kedua perusahaan berusaha untuk mendominasi domain matematika AI karena para ilmuwan mengatakan bahwa sistem dengan kemampuan tinggi dalam memecahkan masalah matematika mungkin cukup meniru bentuk lain dari Alasan manusia. AG2 berbeda dari Math-Math Microsoft yang berfokus pada pemecahan masalah lanjutan dengan model penalaran hibrida, sedangkan R-STAR menggunakan model bahasa yang lebih kecil untuk menyelesaikan berbagai masalah yang lebih luas.
Google merilis Versi asli alphageometry Pada Januari 2024, dan versi terbarunya menunjukkan peningkatan kinerja 30% dibandingkan iterasi sebelumnya, kata para ilmuwan dalam penelitian ini. Peningkatan AG2 fokus pada penguasaan geometri yang, tidak seperti kalkulus dan aljabar, membutuhkan campuran penalaran visual dan logika untuk memecahkan masalah yang kompleks.
Para ahli, bagaimanapun, berhati -hati terhadap melihat tonggak sejarah ini sebagai pencapaian Kecerdasan Umum Buatan (AGI) – Di mana sistem AI lebih pintar daripada manusia dalam berbagai disiplin ilmu, bukan hanya menjadi manusia super dalam satu disiplin, terlepas dari data pelatihan.
“Alphageometry2 mewakili suatu bentuk kecerdasan, tetapi kecerdasan manusia jauh melampaui ini – kita menciptakan, daripada sekadar menerapkan pengetahuan atau menciptakan ilusi pemikiran,” John BatesCEO perusahaan AI Ser Group dan seorang dokter dalam ilmu komputer dari University of Cambridge, mengatakan kepada Live Science.
Bagaimana AI dapat menyelesaikan masalah matematika yang paling sulit
Terobosan DeepMind adalah kombinasi yang sukses Model Bahasa Saraf dan mesin simbolik (sistem berbasis logika yang dirancang untuk memecahkan masalah menggunakan simbol dan parameter). Model bahasa menunjukkan konstruksi geometris sementara mesin simbolik mengujinya. Pertandingan ini memungkinkan sistem untuk mengubah bahasa sehari-hari yang akan dilihat manusia dalam masalah geometri dan mengubahnya menjadi “konstruksi tambahan” yang dapat dipahami dan diuji oleh mesin simbolik.
Sistem kemudian bekerja dalam konser untuk mengusulkan konstruksi baru jika yang sebelumnya tidak berfungsi. Pencarian untuk solusi ini dilakukan secara paralel, memberikan informasi dari satu sisi sistem ke sisi lain sampai tiba pada solusi.
AG2 lebih baik daripada versi pertama berkat model bahasa saraf yang dilatih pada kumpulan data yang lebih besar dan lebih beragam, di samping mesin simbolik yang lebih cepat yang prima untuk memverifikasi lebih banyak konstruksi geometris. Sistem ini juga menawarkan algoritma unik untuk mencari dan menemukan bukti geometris.
The DeepMind researchers noted that AG2's drawbacks lie in its longer processing time, and that it can't handle the most challenging IMO geometry problems in 3D geometry, non-linear equations, or problems with variable points (points that change position within a geometry problem ) dan/atau titik tak terbatas (masalah dengan urutan titik yang tak terbatas dan memiliki banyak solusi yang tak terbatas). Akhirnya, sistem tidak dapat menjelaskan bagaimana ia mencapai solusinya dalam bahasa apa pun yang dapat dipahami manusia.
Ruang lingkup aspirasi DeepMind untuk sistem AG2nya tetap tepat dalam peningkatan Penalaran matematika. Namun perbaikan di bidang ini dapat diterapkan pada beberapa disiplin ilmu termasuk desain teknik, verifikasi sistem otomatis, robotika, penelitian farmasi dan penelitian genomik, kata para ilmuwan.
Rencana tersebut untuk AG2 untuk memberikan otomatisasi penuh pemecahan masalah geometri, para ilmuwan menambahkan, tanpa kesalahan. Dalam versi mendatang, mereka berharap dapat memperluas dukungannya dari lebih banyak konsep geometris dan memecah masalah menjadi subkelompok. Mereka juga berencana mempercepat proses inferensi dan keandalan sistem.