789BNi
Aplikasi Game Terbesar di Indonesia
DOWNLOAD APP

Pendekatan AI generatif baru untuk memprediksi reaksi kimia

Pendekatan AI generatif baru untuk memprediksi reaksi kimia



Banyak upaya telah dilakukan untuk memanfaatkan kekuatan kecerdasan buatan baru dan model bahasa besar (LLM) untuk mencoba memprediksi hasil reaksi kimia baru. Ini memiliki keberhasilan yang terbatas, sebagian karena sampai sekarang mereka belum didasarkan pada pemahaman tentang prinsip -prinsip fisik mendasar, seperti hukum konservasi massa. Sekarang, tim peneliti di MIT telah menghasilkan cara untuk menggabungkan kendala fisik ini pada model prediksi reaksi, dan dengan demikian sangat meningkatkan keakuratan dan keandalan outputnya.

Pekerjaan baru dilaporkan 20 Agustus di jurnal Alamdalam sebuah makalah oleh Postdoc Joonyoung Joung baru -baru ini (sekarang menjadi asisten profesor di Universitas Kookmin, Korea Selatan); mantan insinyur perangkat lunak Mun Hong Fong (sekarang di Universitas Duke); Mahasiswa Pascasarjana Teknik Kimia Nicholas Casetti; Postdoc Jordan Liles; Mahasiswa sarjana fisika NE Dassanayake; dan penulis senior Connor Coley, yang merupakan kelas tahun 1957 Profesor Pengembangan Karir di Departemen MIT Teknik Kimia dan Teknik Listrik dan Ilmu Komputer.

“Prediksi hasil reaksi adalah tugas yang sangat penting,” Joung menjelaskan. Misalnya, jika Anda ingin membuat obat baru, “Anda perlu tahu bagaimana membuatnya. Jadi, ini mengharuskan kami untuk mengetahui produk apa yang mungkin terjadi” untuk menghasilkan input kimia yang diberikan ke suatu reaksi. Tetapi sebagian besar upaya sebelumnya untuk melakukan prediksi seperti itu hanya melihat satu set input dan satu set output, tanpa melihat langkah -langkah perantara atau mempertimbangkan kendala memastikan bahwa tidak ada massa yang diperoleh atau hilang dalam proses, yang tidak mungkin terjadi dalam reaksi aktual.

Joung menunjukkan bahwa sementara model bahasa besar seperti ChatGPT telah sangat berhasil di banyak bidang penelitian, model -model ini tidak memberikan cara untuk membatasi output mereka pada kemungkinan yang realistis secara fisik, seperti dengan mengharuskan mereka untuk mematuhi konservasi massa. Model -model ini menggunakan “token” komputasi, yang dalam hal ini mewakili atom individu, tetapi “jika Anda tidak menghemat token, model LLM mulai membuat atom baru, atau menghapus atom dalam reaksi.” Alih -alih didasarkan pada pemahaman ilmiah yang nyata, “ini seperti alkimia,” katanya. Sementara banyak upaya prediksi reaksi hanya melihat produk akhir, “kami ingin melacak semua bahan kimia, dan bagaimana bahan kimia diubah” di seluruh proses reaksi dari awal hingga akhir, katanya.

Untuk mengatasi masalah tersebut, tim menggunakan metode yang dikembangkan kembali pada tahun 1970-an oleh ahli kimia Ivar UGI, yang menggunakan matriks ikatan-elektron untuk mewakili elektron dalam suatu reaksi. Mereka menggunakan sistem ini sebagai dasar untuk program baru mereka, yang disebut bunga (pencocokan aliran untuk redistribusi elektron), yang memungkinkan mereka untuk secara eksplisit melacak semua elektron dalam reaksi untuk memastikan bahwa tidak ada yang ditambahkan secara palsu atau dihapus dalam proses.

Sistem ini menggunakan matriks untuk mewakili elektron dalam suatu reaksi, dan menggunakan nilai bukan nol untuk mewakili ikatan atau pasangan elektron tunggal dan nol untuk mewakili kekurangannya. “Itu membantu kita melestarikan atom dan elektron pada saat yang sama,” kata Fong. Representasi ini, katanya, adalah salah satu elemen kunci untuk memasukkan konservasi massal dalam sistem prediksi mereka.

Sistem yang mereka kembangkan masih pada tahap awal, kata Coley. “Sistem yang berdiri adalah demonstrasi – bukti konsep bahwa pendekatan generatif pencocokan aliran ini sangat cocok untuk tugas prediksi reaksi kimia.” Sementara tim bersemangat tentang pendekatan yang menjanjikan ini, ia berkata, “Kami sadar bahwa ia memiliki keterbatasan spesifik sejauh luas dari berbagai bahan kimia yang terlihat.” Meskipun model ini dilatih menggunakan data pada lebih dari satu juta reaksi kimia, yang diperoleh dari database kantor paten AS, data tersebut tidak termasuk logam tertentu dan beberapa jenis reaksi katalitik, katanya.

“Kami sangat bersemangat tentang fakta bahwa kami bisa mendapatkan prediksi mekanisme kimia yang dapat diandalkan” dari sistem yang ada, katanya. “Ini melestarikan massa, melestarikan elektron, tetapi kami tentu saja mengakui bahwa ada lebih banyak ekspansi dan ketahanan untuk dikerjakan di tahun -tahun mendatang juga.”

Tetapi bahkan dalam bentuknya saat ini, yang tersedia secara bebas melalui platform online GitHub, “kami pikir itu akan membuat prediksi yang akurat dan bermanfaat sebagai alat untuk menilai reaktivitas dan memetakan jalur reaksi,” kata Coley. “Jika kita melihat ke masa depan benar -benar memajukan keadaan seni pemahaman mekanistik dan membantu menciptakan reaksi baru, kita tidak cukup di sana. Tapi kami berharap ini akan menjadi batu loncatan menuju itu.”

“Semuanya open source,” kata Fong. “Model, data, semuanya ada di sana,” termasuk dataset sebelumnya yang dikembangkan oleh Joung yang secara mendalam mencantumkan langkah -langkah mekanistik dari reaksi yang diketahui. “Saya pikir kami adalah salah satu kelompok perintis yang membuat dataset ini, dan membuatnya tersedia open-source, dan membuat ini dapat digunakan untuk semua orang,” katanya.

Model bunga cocok dengan atau mengungguli pendekatan yang ada dalam menemukan jalur mekanistik standar, kata tim, dan memungkinkan untuk menggeneralisasi ke jenis reaksi yang sebelumnya tidak terlihat. Mereka mengatakan model ini berpotensi relevan untuk memprediksi reaksi untuk kimia obat, penemuan bahan, pembakaran, kimia atmosfer, dan sistem elektrokimia.

Dalam perbandingan mereka dengan sistem prediksi reaksi yang ada, Coley mengatakan, “Menggunakan pilihan arsitektur yang telah kami buat, kami mendapatkan peningkatan besar -besaran dalam validitas dan konservasi, dan kami mendapatkan kecocokan atau sedikit akurasi yang lebih baik dalam hal kinerja.”

Dia menambahkan bahwa “apa yang unik tentang pendekatan kami adalah bahwa ketika kami menggunakan pemahaman buku teks ini tentang mekanisme untuk menghasilkan dataset ini, kami menjangkar reaktan dan produk dari keseluruhan reaksi dalam data yang divalidasi secara eksperimental dari literatur paten.” Mereka menyimpulkan mekanisme yang mendasarinya, katanya, daripada hanya mengada -ada. “Kami menghambat mereka dari data eksperimental, dan itu bukan sesuatu yang telah dilakukan dan dibagikan pada skala semacam ini sebelumnya.”

Langkah selanjutnya, katanya, adalah “kami cukup tertarik untuk memperluas pemahaman model tentang logam dan siklus katalitik. Kami baru saja menggaruk permukaan dalam makalah pertama ini,” dan sebagian besar reaksi yang termasuk sejauh ini tidak termasuk logam atau katalis, “jadi itu arah yang kami cukup tertarik.”

Dalam jangka panjang, katanya, “banyak kegembiraan dalam menggunakan sistem semacam ini untuk membantu menemukan reaksi kompleks baru dan membantu menjelaskan mekanisme baru. Saya pikir dampak potensial jangka panjangnya besar, tetapi ini tentu saja hanya langkah pertama.”

Pekerjaan ini didukung oleh pembelajaran mesin untuk penemuan farmasi dan konsorsium sintesis dan National Science Foundation.


Previous Article

FIVB dan Abhinav Bindra Foundation Trust meluncurkan program voli peluncuran dengan mitra di India

Next Article

10 Cara Mengelola Stres di Keseharian dan Tempat Kerja Kamu

Write a Comment

Leave a Comment

Your email address will not be published. Required fields are marked *

Subscribe to our Newsletter

Subscribe to our email newsletter to get the latest posts delivered right to your email.
Pure inspiration, zero spam ✨