^
A
A
A

AI memprediksi hasil penelitian ilmu saraf lebih baik daripada para ahli

 
, Editor medis
Terakhir ditinjau: 03.07.2025
 
Fact-checked
х

Semua konten iLive ditinjau secara medis atau diperiksa fakta untuk memastikan akurasi faktual sebanyak mungkin.

Kami memiliki panduan sumber yang ketat dan hanya menautkan ke situs media terkemuka, lembaga penelitian akademik, dan, jika mungkin, studi yang ditinjau secara medis oleh rekan sejawat. Perhatikan bahwa angka dalam tanda kurung ([1], [2], dll.) Adalah tautan yang dapat diklik untuk studi ini.

Jika Anda merasa salah satu konten kami tidak akurat, ketinggalan zaman, atau dipertanyakan, pilih dan tekan Ctrl + Enter.

28 November 2024, 13:10

Sebuah studi oleh para peneliti di University College London (UCL) telah menunjukkan bahwa model bahasa besar (LLM) seperti GPT dapat memprediksi hasil penelitian ilmu saraf dengan akurasi yang melebihi para ahli manusia. Karya tersebut, yang diterbitkan dalam Nature Human Behavior, menunjukkan bagaimana kecerdasan buatan yang dilatih pada kumpulan data teks besar tidak hanya dapat mengekstrak informasi tetapi juga mengidentifikasi pola untuk memprediksi hasil ilmiah.


Pendekatan Baru untuk Peramalan Sains

Menurut penulis utama studi tersebut, Dr. Ken Lo (UCL Psychology & Language Sciences), pengembangan AI generatif seperti ChatGPT telah membuka kemungkinan yang luas untuk generalisasi dan ekstraksi pengetahuan. Namun, alih-alih mempelajari kemampuan AI untuk menganalisis informasi masa lalu, para peneliti memutuskan untuk menyelidiki apakah AI dapat memprediksi hasil eksperimen di masa mendatang.

"Kemajuan ilmiah sering kali melibatkan uji coba, yang membutuhkan waktu dan sumber daya. Bahkan peneliti berpengalaman pun dapat melewatkan detail penting dalam literatur. Pekerjaan kami menunjukkan bahwa LLM dapat mendeteksi pola dan memprediksi hasil eksperimen," kata Dr. Lo.


BrainBench: AI dan Pengujian Pakar

Untuk menguji kemampuan LLM, para peneliti menciptakan alat yang disebut BrainBench, yang mencakup pasangan abstrak ilmiah dari ilmu saraf:

  • Satu abstrak berisi hasil penelitian yang sebenarnya.
  • Yang kedua adalah hasil yang dimodifikasi tetapi masuk akal yang dibuat oleh para ahli.

Sebanyak 15 model bahasa dan 171 pakar ilmu saraf diuji kemampuannya untuk membedakan hasil nyata dari hasil palsu. Hasilnya sangat mengesankan:

  • AI menunjukkan akurasi rata-rata 81%, sementara para ahli hanya mendapat skor 63%.
  • Bahkan spesialis dengan penilaian diri pengetahuan tertinggi hanya mencapai 66%.

Model dan perspektif yang ditingkatkan

Para ilmuwan juga mengadaptasi LLM sumber terbuka (versi Mistral), melatihnya pada literatur ilmiah tentang ilmu saraf. Model yang dihasilkan, yang disebut BrainGPT, menunjukkan akurasi yang lebih tinggi — 86%.

"Pekerjaan kami menunjukkan bahwa AI dapat menjadi bagian integral dari proses desain eksperimental, tidak hanya membuat pekerjaan lebih cepat, tetapi juga lebih efisien," kata Profesor Bradley Love (UCL).


Peluang dan Tantangan

Para peneliti menyarankan bahwa pendekatan mereka dapat disesuaikan dengan berbagai disiplin ilmu. Namun, hasil studi tersebut menimbulkan pertanyaan penting: apakah penelitian ilmiah modern cukup inovatif? Akurasi AI yang tinggi dalam peramalan menunjukkan bahwa banyak temuan ilmiah konsisten dengan pola yang ada.

"Kami sedang membangun peralatan AI yang akan membantu ilmuwan merancang eksperimen dan memprediksi kemungkinan hasil, mempercepat iterasi, dan membuat keputusan yang lebih tepat," tambah Dr. Lo.

Terobosan dalam penggunaan AI ini menjanjikan percepatan penemuan ilmiah dan peningkatan efisiensi penelitian di seluruh dunia.

You are reporting a typo in the following text:
Simply click the "Send typo report" button to complete the report. You can also include a comment.