Publikasi baru
AI memprediksi hasil penelitian ilmu saraf lebih baik daripada para ahli
Terakhir ditinjau: 03.07.2025

Semua konten iLive ditinjau secara medis atau diperiksa fakta untuk memastikan akurasi faktual sebanyak mungkin.
Kami memiliki panduan sumber yang ketat dan hanya menautkan ke situs media terkemuka, lembaga penelitian akademik, dan, jika mungkin, studi yang ditinjau secara medis oleh rekan sejawat. Perhatikan bahwa angka dalam tanda kurung ([1], [2], dll.) Adalah tautan yang dapat diklik untuk studi ini.
Jika Anda merasa salah satu konten kami tidak akurat, ketinggalan zaman, atau dipertanyakan, pilih dan tekan Ctrl + Enter.

Sebuah studi oleh para peneliti di University College London (UCL) telah menunjukkan bahwa model bahasa besar (LLM) seperti GPT dapat memprediksi hasil penelitian ilmu saraf dengan akurasi yang melebihi para ahli manusia. Karya tersebut, yang diterbitkan dalam Nature Human Behavior, menunjukkan bagaimana kecerdasan buatan yang dilatih pada kumpulan data teks besar tidak hanya dapat mengekstrak informasi tetapi juga mengidentifikasi pola untuk memprediksi hasil ilmiah.
Pendekatan Baru untuk Peramalan Sains
Menurut penulis utama studi tersebut, Dr. Ken Lo (UCL Psychology & Language Sciences), pengembangan AI generatif seperti ChatGPT telah membuka kemungkinan yang luas untuk generalisasi dan ekstraksi pengetahuan. Namun, alih-alih mempelajari kemampuan AI untuk menganalisis informasi masa lalu, para peneliti memutuskan untuk menyelidiki apakah AI dapat memprediksi hasil eksperimen di masa mendatang.
"Kemajuan ilmiah sering kali melibatkan uji coba, yang membutuhkan waktu dan sumber daya. Bahkan peneliti berpengalaman pun dapat melewatkan detail penting dalam literatur. Pekerjaan kami menunjukkan bahwa LLM dapat mendeteksi pola dan memprediksi hasil eksperimen," kata Dr. Lo.
BrainBench: AI dan Pengujian Pakar
Untuk menguji kemampuan LLM, para peneliti menciptakan alat yang disebut BrainBench, yang mencakup pasangan abstrak ilmiah dari ilmu saraf:
- Satu abstrak berisi hasil penelitian yang sebenarnya.
- Yang kedua adalah hasil yang dimodifikasi tetapi masuk akal yang dibuat oleh para ahli.
Sebanyak 15 model bahasa dan 171 pakar ilmu saraf diuji kemampuannya untuk membedakan hasil nyata dari hasil palsu. Hasilnya sangat mengesankan:
- AI menunjukkan akurasi rata-rata 81%, sementara para ahli hanya mendapat skor 63%.
- Bahkan spesialis dengan penilaian diri pengetahuan tertinggi hanya mencapai 66%.
Model dan perspektif yang ditingkatkan
Para ilmuwan juga mengadaptasi LLM sumber terbuka (versi Mistral), melatihnya pada literatur ilmiah tentang ilmu saraf. Model yang dihasilkan, yang disebut BrainGPT, menunjukkan akurasi yang lebih tinggi — 86%.
"Pekerjaan kami menunjukkan bahwa AI dapat menjadi bagian integral dari proses desain eksperimental, tidak hanya membuat pekerjaan lebih cepat, tetapi juga lebih efisien," kata Profesor Bradley Love (UCL).
Peluang dan Tantangan
Para peneliti menyarankan bahwa pendekatan mereka dapat disesuaikan dengan berbagai disiplin ilmu. Namun, hasil studi tersebut menimbulkan pertanyaan penting: apakah penelitian ilmiah modern cukup inovatif? Akurasi AI yang tinggi dalam peramalan menunjukkan bahwa banyak temuan ilmiah konsisten dengan pola yang ada.
"Kami sedang membangun peralatan AI yang akan membantu ilmuwan merancang eksperimen dan memprediksi kemungkinan hasil, mempercepat iterasi, dan membuat keputusan yang lebih tepat," tambah Dr. Lo.
Terobosan dalam penggunaan AI ini menjanjikan percepatan penemuan ilmiah dan peningkatan efisiensi penelitian di seluruh dunia.