
Departemen MIT Peneliti Matematika David Roe ’06 dan Andrew Sutherland ’90, PhD ’07 adalah di antara penerima perdana dari filantropi Renaissance dan XTX ‘AI untuk hibah matematika.
Empat alumni MIT tambahan – Anshula Gandhi ’19, Viktor Kunčak SM ’01, PhD ’07; Greaja Ranade ’07; dan Damiiano Testa PhD ’05 – juga diasah untuk proyek penyelesaian.
29 proyek pemenang pertama akan mendukung ahli matematika dan peneliti di universitas dan organisasi yang bekerja untuk mengembangkan sistem kecerdasan buatan yang membantu memajukan penemuan dan penelitian matematika di beberapa tugas utama.
Roe dan Sutherland, bersama dengan Chris Birkbeck dari University of East Anglia, akan menggunakan hibah mereka untuk meningkatkan pembuktian teorema otomatis dengan membangun koneksi antara fungsi-L dan basis data bentuk modular (LMFDB) dan LEAN4 Mathematics Library (Mathlib).
“Provers teorema otomatis secara teknis terlibat, tetapi perkembangan mereka kurang sumber daya,” kata Sutherland. Dengan teknologi AI seperti model bahasa besar (LLM), penghalang untuk masuk untuk alat formal ini turun dengan cepat, membuat kerangka kerja verifikasi formal dapat diakses oleh ahli matematika yang bekerja.
Mathlib adalah perpustakaan matematika besar yang digerakkan oleh masyarakat untuk Lean Theorem Prover, sistem formal yang memverifikasi kebenaran setiap langkah dalam suatu bukti. Mathlib saat ini berisi urutan 105 Hasil matematika (seperti lemma, proposisi, dan teorema). LMFDB, sumber daring kolaboratif yang besar dan kolaboratif yang berfungsi sebagai semacam “ensiklopedia” dari teori bilangan modern, berisi lebih dari 109 pernyataan konkret. Sutherland dan Roe mengelola editor LMFDB.
Hibah Roe dan Sutherland akan digunakan untuk proyek yang bertujuan untuk menambah kedua sistem, membuat hasil LMFDB tersedia dalam Mathlib sebagai pernyataan yang belum terbukti secara formal, dan memberikan definisi formal yang tepat dari data numerik yang disimpan dalam LMFDB. Jembatan ini akan menguntungkan ahli matematika manusia dan agen AI, dan menyediakan kerangka kerja untuk menghubungkan basis data matematika lainnya dengan sistem pembuktian teorema formal.
Hambatan utama untuk mengotomatisasi penemuan dan bukti matematika adalah terbatasnya jumlah pengetahuan matematika formal, biaya tinggi dari formalisasi hasil kompleks, dan kesenjangan antara apa yang dapat diakses secara komputasi dan apa yang layak untuk formal.
Untuk mengatasi hambatan ini, para peneliti akan menggunakan dana untuk membangun alat untuk mengakses LMFDB dari Mathlib, membuat database besar pengetahuan matematika yang tidak diformalkan dapat diakses oleh sistem bukti formal. Pendekatan ini memungkinkan asisten bukti untuk mengidentifikasi target spesifik untuk formalisasi tanpa perlu memformalkan seluruh corpus LMFDB terlebih dahulu.
“Membuat database besar dari fakta-fakta-teoretis yang tidak diformalkan yang tersedia dalam Mathlib akan memberikan teknik yang kuat untuk penemuan matematika, karena serangkaian fakta yang mungkin ingin dipertimbangkan oleh agen saat mencari teorema atau bukti secara eksponensial lebih besar daripada rangkaian fakta yang pada akhirnya perlu diformalkan dalam benar-benar membuktikan teorema,” kata Roe.
Para peneliti mencatat bahwa membuktikan teorema baru di perbatasan pengetahuan matematika sering melibatkan langkah -langkah yang bergantung pada perhitungan nontrivial. Misalnya, bukti Andrew Wiles tentang teorema terakhir Fermat menggunakan apa yang dikenal sebagai “trik 3-5” pada titik penting dalam bukti.
“Trik ini tergantung pada fakta bahwa kurva modular x_0 (15) hanya memiliki banyak titik rasional, dan tidak satu pun dari titik-titik rasional yang sesuai dengan kurva elips semi-stabil,” menurut Sutherland. “Fakta ini dikenal jauh sebelum bekerja Wiles, dan mudah diverifikasi menggunakan alat komputasi yang tersedia dalam sistem aljabar komputer modern, tetapi itu bukan sesuatu yang secara realistis dapat membuktikan menggunakan pensil dan kertas, juga tidak mudah untuk dimuling.”
Sementara provers teorema formal sedang terhubung ke sistem aljabar komputer untuk verifikasi yang lebih efisien, memanfaatkan output komputasi dalam database matematika yang ada menawarkan beberapa manfaat lain.
Menggunakan hasil yang tersimpan memanfaatkan ribuan waktu perhitungan CPU yang sudah dihabiskan untuk menciptakan LMFDB, menghemat uang yang diperlukan untuk mengulang perhitungan ini. Memiliki informasi yang sudah terduga yang tersedia juga memungkinkan untuk mencari contoh atau contoh tandingan tanpa mengetahui sebelumnya seberapa luas pencarian itu. Selain itu, database matematika adalah repositori yang dikuratori, bukan sekadar kumpulan fakta acak.
“Fakta bahwa para ahli teori angka menekankan peran konduktor dalam database kurva elips telah terbukti sangat penting bagi satu penemuan matematika penting yang dibuat menggunakan alat pembelajaran mesin: murmurasi,” kata Sutherland.
“Langkah kami selanjutnya adalah membangun tim, terlibat dengan komunitas LMFDB dan Mathlib, mulai memformalkan definisi yang mendukung kurva elips, bidang angka, dan bagian bentuk modular dari LMFDB, dan memungkinkan untuk menjalankan pencarian LMFDB dari dalam Mathlib,” kata ROE. “Jika Anda seorang siswa MIT yang tertarik untuk terlibat, jangan ragu untuk menjangkau!”