Perlombaan untuk mengembangkan kecerdasan buatan umum (AGI) masih panjang, menurut para peneliti dari Apple, yang berpendapat bahwa model AI terkemuka seperti ChatGPT dan Claude masih menghadapi kesulitan dalam berargumentasi. Meskipun telah ada model-model berargumentasi besar (LRMs), kemampuan dan keterbatasan mereka masih belum sepenuhnya dipahami. Penilaian saat ini sebagian besar berfokus pada akurasi jawaban akhir tanpa memberikan pandangan tentang kemampuan berargumentasi.
Penelitian menunjukkan bahwa LRM tidak menggeneralisasi argumen secara efektif dan sering mengalami keruntuhan akurasi seiring dengan meningkatnya kompleksitas. Para peneliti menyimpulkan bahwa model ini hanya meniru argumen tanpa benar-benar menangkapnya, yang tidak memenuhi persyaratan AGI. AGI tetap menjadi tujuan yang jauh, meskipun beberapa pemimpin industri percaya itu dapat dicapai dalam beberapa tahun ke depan.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
Peneliti Apple: Model AI masih jauh dari kemampuan penalaran di tingkat AGI
Perlombaan untuk mengembangkan kecerdasan buatan umum (AGI) masih panjang, menurut para peneliti dari Apple, yang berpendapat bahwa model AI terkemuka seperti ChatGPT dan Claude masih menghadapi kesulitan dalam berargumentasi. Meskipun telah ada model-model berargumentasi besar (LRMs), kemampuan dan keterbatasan mereka masih belum sepenuhnya dipahami. Penilaian saat ini sebagian besar berfokus pada akurasi jawaban akhir tanpa memberikan pandangan tentang kemampuan berargumentasi.
Penelitian menunjukkan bahwa LRM tidak menggeneralisasi argumen secara efektif dan sering mengalami keruntuhan akurasi seiring dengan meningkatnya kompleksitas. Para peneliti menyimpulkan bahwa model ini hanya meniru argumen tanpa benar-benar menangkapnya, yang tidak memenuhi persyaratan AGI. AGI tetap menjadi tujuan yang jauh, meskipun beberapa pemimpin industri percaya itu dapat dicapai dalam beberapa tahun ke depan.