789BNi
Aplikasi Game Terbesar di Indonesia
DOWNLOAD APP

Model baru memprediksi bagaimana molekul akan larut dalam pelarut yang berbeda

Model baru memprediksi bagaimana molekul akan larut dalam pelarut yang berbeda



Menggunakan pembelajaran mesin, insinyur kimia MIT telah menciptakan model komputasi yang dapat memprediksi seberapa baik setiap molekul yang diberikan akan larut dalam pelarut organik – langkah kunci dalam sintesis hampir semua farmasi. Jenis prediksi ini dapat membuatnya lebih mudah untuk mengembangkan cara baru untuk menghasilkan obat dan molekul yang bermanfaat lainnya.

Model baru, yang memprediksi seberapa banyak zat terlarut akan larut dalam pelarut tertentu, harus membantu ahli kimia untuk memilih pelarut yang tepat untuk setiap reaksi yang diberikan dalam sintesis mereka, kata para peneliti. Pelarut organik umum termasuk etanol dan aseton, dan ada ratusan lainnya yang juga dapat digunakan dalam reaksi kimia.

“Memprediksi kelarutan benar-benar merupakan langkah pembatas tingkat dalam perencanaan sintetis dan pembuatan bahan kimia, terutama obat-obatan, jadi ada minat yang sudah lama ada untuk membuat prediksi kelarutan yang lebih baik,” kata Lucas Attia, seorang mahasiswa pascasarjana MIT dan salah satu penulis utama dari studi baru ini.

Para peneliti telah membuat model mereka tersedia secara bebas, dan banyak perusahaan dan laboratorium sudah mulai menggunakannya. Model ini bisa sangat berguna untuk mengidentifikasi pelarut yang kurang berbahaya daripada beberapa pelarut industri yang paling umum digunakan, kata para peneliti.

“Ada beberapa pelarut yang diketahui membubarkan sebagian besar hal. Mereka benar -benar berguna, tetapi mereka merusak lingkungan, dan mereka merusak orang, begitu banyak perusahaan mengharuskan Anda harus meminimalkan jumlah pelarut yang Anda gunakan,” kata Jackson Burns, seorang mahasiswa pascasarjana MIT yang juga merupakan penulis utama kertas. “Model kami sangat berguna untuk dapat mengidentifikasi pelarut terbaik berikutnya, yang diharapkan jauh lebih tidak merusak lingkungan.”

William Green, profesor Hoyt Hottel dari Teknik Kimia dan Direktur MIT Energy Initiative, adalah penulis senior penelitian, yang muncul hari ini di Komunikasi Alam. Patrick Doyle, Profesor Teknik Kimia Robert T. Haslam, juga merupakan penulis makalah ini.

Memecahkan kelarutan

Model baru ini tumbuh dari proyek yang dikerjakan Attia dan Burns bersama dalam kursus MIT tentang penerapan pembelajaran mesin untuk masalah rekayasa kimia. Secara tradisional, ahli kimia telah meramalkan kelarutan dengan alat yang dikenal sebagai model solvasi Abraham, yang dapat digunakan untuk memperkirakan kelarutan keseluruhan molekul dengan menambahkan kontribusi struktur kimia dalam molekul. Meskipun prediksi ini berguna, akurasinya terbatas.

Dalam beberapa tahun terakhir, para peneliti telah mulai menggunakan pembelajaran mesin untuk mencoba membuat prediksi kelarutan yang lebih akurat. Sebelum Burns dan Attia mulai mengerjakan model baru mereka, model canggih untuk memprediksi kelarutan adalah model yang dikembangkan di Green’s Lab pada tahun 2022.

Model itu, yang dikenal sebagai Solprop, bekerja dengan memprediksi serangkaian sifat terkait dan menggabungkannya, menggunakan termodinamika, untuk akhirnya memprediksi kelarutan. Namun, model ini mengalami kesulitan memprediksi kelarutan untuk zat terlarut yang belum pernah dilihat sebelumnya.

“Untuk obat -obatan penemuan obat dan bahan kimia di mana Anda mengembangkan molekul baru, Anda ingin dapat memprediksi sebelumnya seperti apa kelarutannya,” kata Attia.

Bagian dari alasan bahwa model kelarutan yang ada tidak berhasil dengan baik adalah karena tidak ada dataset komprehensif untuk melatihnya. Namun, pada tahun 2023 dataset baru yang disebut BigSoldB dirilis, yang mengumpulkan data dari hampir 800 makalah yang diterbitkan, termasuk informasi tentang kelarutan untuk sekitar 800 molekul yang dilarutkan sekitar lebih dari 100 pelarut organik yang biasanya digunakan dalam kimia sintetis.

Attia dan Burns memutuskan untuk mencoba melatih dua jenis model yang berbeda pada data ini. Kedua model ini mewakili struktur kimia molekul menggunakan representasi numerik yang dikenal sebagai embeddings, yang menggabungkan informasi seperti jumlah atom dalam molekul dan atom mana yang terikat pada atom lainnya. Model kemudian dapat menggunakan representasi ini untuk memprediksi berbagai sifat kimia.

Salah satu model yang digunakan dalam penelitian ini, yang dikenal sebagai FastProp dan dikembangkan oleh Burns dan lainnya di Green’s Lab, menggabungkan “embedding statis.” Ini berarti bahwa model sudah mengetahui embedding untuk setiap molekul sebelum mulai melakukan analisis apa pun.

Model lain, ChemProp, mempelajari embedding untuk setiap molekul selama pelatihan, pada saat yang sama ia belajar mengaitkan fitur -fitur penyematan dengan sifat seperti kelarutan. Model ini, yang dikembangkan di beberapa laboratorium MIT, telah digunakan untuk tugas -tugas seperti penemuan antibiotik, desain nanopartikel lipid, dan memprediksi laju reaksi kimia.

Para peneliti melatih kedua jenis model pada lebih dari 40.000 titik data dari BigSoldB, termasuk informasi tentang efek suhu, yang memainkan peran penting dalam kelarutan. Kemudian, mereka menguji model sekitar 1.000 zat terlarut yang telah ditahan dari data pelatihan. Mereka menemukan bahwa prediksi model adalah dua hingga tiga kali lebih akurat daripada solprop, model terbaik sebelumnya, dan model baru sangat akurat dalam memprediksi variasi kelarutan karena suhu.

“Mampu mereproduksi secara akurat variasi kecil dalam kelarutan karena suhu, bahkan ketika kebisingan eksperimental yang menyeluruh sangat besar, adalah tanda yang sangat positif bahwa jaringan telah dengan benar mempelajari fungsi prediksi kelarutan yang mendasarinya,” kata Burns.

Prediksi yang akurat

Para peneliti berharap bahwa model berdasarkan ChemProp, yang dapat mempelajari representasi baru seiring berjalannya waktu, akan dapat membuat prediksi yang lebih akurat. Namun, yang mengejutkan mereka, mereka menemukan bahwa kedua model itu pada dasarnya melakukan hal yang sama. Itu menunjukkan bahwa batasan utama pada kinerja mereka adalah kualitas data, dan bahwa model berkinerja serta secara teoritis mungkin berdasarkan data yang mereka gunakan, kata para peneliti.

“ChemProp harus selalu mengungguli embedding statis ketika Anda memiliki data yang cukup,” kata Burns. “Kami terpesona untuk melihat bahwa embeddings yang statis dan terpelajar secara statistik tidak dapat dibedakan dalam kinerja di semua himpunan bagian yang berbeda, yang menunjukkan kepada kami bahwa keterbatasan data yang ada dalam ruang ini mendominasi kinerja model.”

Model -model tersebut bisa menjadi lebih akurat, para peneliti mengatakan, jika data pelatihan dan pengujian yang lebih baik tersedia – idealnya, data yang diperoleh oleh satu orang atau sekelompok orang yang semuanya dilatih untuk melakukan eksperimen dengan cara yang sama.

“Salah satu keterbatasan besar menggunakan jenis kumpulan data yang dikompilasi ini adalah bahwa laboratorium yang berbeda menggunakan metode yang berbeda dan kondisi eksperimental ketika mereka melakukan tes kelarutan. Itu berkontribusi pada variabilitas ini antara set data yang berbeda,” kata Attia.

Karena model yang didasarkan pada FastProp membuat prediksi lebih cepat dan memiliki kode yang lebih mudah bagi pengguna lain untuk beradaptasi, para peneliti memutuskan untuk membuatnya, yang dikenal sebagai FastSolv, tersedia untuk umum. Beberapa perusahaan farmasi sudah mulai menggunakannya.

“Ada aplikasi di seluruh pipa penemuan obat,” kata Burns. “Kami juga senang melihat, di luar formulasi dan penemuan obat, di mana orang dapat menggunakan model ini.”

Penelitian ini didanai, sebagian, oleh Departemen Energi AS.


Previous Article

Hong Kong, China Edge Mongolia dalam film thriller lima set untuk mengklaim kemenangan pertama di Kejuaraan Wanita Zonal Asia Timur

Next Article

Tips Menemukan Tempat Badminton Terdekat di Jakarta

Write a Comment

Leave a Comment

Your email address will not be published. Required fields are marked *

Subscribe to our Newsletter

Subscribe to our email newsletter to get the latest posts delivered right to your email.
Pure inspiration, zero spam ✨