
Peneliti Apple: Model AI Saat Ini Masih Jauh dari Kemampuan AGI
Perlombaan menuju pengembangan artificial general intelligence (AGI) masih menghadapi jalan panjang. Hal ini disampaikan oleh tim peneliti Apple dalam makalah terbarunya yang berjudul “The Illusion of Thinking” yang dirilis pada Juni 2025.
Mereka menilai bahwa model AI besar seperti ChatGPT dari OpenAI dan Claude dari Anthropic, meskipun telah mengadopsi large reasoning models (LRM), masih menunjukkan kelemahan mendasar dalam hal kemampuan penalaran.
“Kemampuan, skalabilitas, dan keterbatasan model LRM masih belum sepenuhnya dipahami,” tulis tim peneliti Apple.
Selama ini, evaluasi performa model AI cenderung berfokus pada akurasi jawaban akhir dalam tes matematika atau pemrograman. Namun menurut tim Apple, pendekatan ini tidak mencerminkan kapasitas penalaran sebenarnya dari model AI tersebut.
Pengujian Kemampuan "Berpikir" AI oleh Apple
Tim peneliti melakukan eksperimen dengan menciptakan serangkaian permainan teka-teki untuk menguji kemampuan berpikir dari versi Claude Sonnet, OpenAI o3-mini dan o1, serta DeepSeek-R1 dan V3. Evaluasi ini dilakukan di luar standar benchmark matematika biasa.
Hasilnya mengejutkan:
“Model LRM frontier mengalami kegagalan akurasi total saat dihadapkan dengan kompleksitas tertentu dan tidak mampu melakukan generalisasi penalaran.”
Peneliti juga menemukan bahwa performa model justru menurun seiring meningkatnya kompleksitas soal — sebuah hasil yang bertolak belakang dengan harapan terhadap kemampuan AGI.
AI Mengalami Overthinking dan Penalaran Dangkal
Penelitian lebih lanjut menunjukkan bahwa model AI sering terlalu banyak berpikir: AI dapat menemukan jawaban benar sejak awal, tetapi kemudian memberikan penalaran keliru yang berujung pada jawaban salah.
“Model LRM hanya meniru pola penalaran, bukan menginternalisasi atau menggeneralisasi seperti manusia.”
Hal ini menunjukkan bahwa model AI masih belum memenuhi standar AGI yang sesungguhnya, yaitu kemampuan berpikir logis dan fleksibel seperti manusia.
Tantangan dalam Mewujudkan AGI
AGI dianggap sebagai tujuan akhir dari pengembangan AI, yaitu menciptakan mesin yang mampu berpikir dan mengambil keputusan setara dengan manusia.
Meski demikian, sejumlah pemimpin industri tetap optimis. Pada Januari lalu, CEO OpenAI Sam Altman mengklaim bahwa perusahaannya semakin dekat membangun AGI.
Sementara itu, CEO Anthropic Dario Amodei bahkan memperkirakan bahwa AGI akan melebihi kemampuan manusia dalam 1-2 tahun mendatang.
“Jika kita perhatikan kecepatan perkembangan saat ini, kemungkinan AGI hadir pada 2026 atau 2027 sangat tinggi,” ujarnya pada November lalu.
Namun temuan dari Apple menunjukkan bahwa jalan menuju AGI tidak semudah yang diperkirakan, dan model saat ini masih menghadapi batasan mendasar dalam memahami dan menyelesaikan masalah kompleks secara konsisten.