
AI generatif dan robotika semakin mendekatkan kita pada hari di mana kita dapat meminta suatu objek dan membuatnya dalam beberapa menit. Faktanya, para peneliti MIT telah mengembangkan sistem ucapan-ke-realitas, sebuah alur kerja berbasis AI yang memungkinkan mereka memberikan masukan ke lengan robot dan “mengucapkan objek menjadi ada”, menciptakan benda-benda seperti furnitur hanya dalam lima menit.
Dengan sistem ucapan-ke-realitas, lengan robot yang dipasang di atas meja dapat menerima masukan lisan dari manusia, seperti “Saya ingin bangku sederhana,” dan kemudian membuat objek dari komponen modular. Hingga saat ini, para peneliti telah menggunakan sistem tersebut untuk membuat bangku, rak, kursi, meja kecil, dan bahkan barang-barang dekoratif seperti patung anjing.
“Kami menghubungkan pemrosesan bahasa alami, AI generatif 3D, dan perakitan robot,” kata Alexander Htet Kyaw, mahasiswa pascasarjana MIT dan rekan Morningside Academy for Design (MAD). “Ini adalah bidang penelitian yang berkembang pesat dan belum pernah dilakukan sebelumnya sehingga Anda dapat membuat objek fisik hanya dari perintah ucapan sederhana.”
Idenya dimulai ketika Kyaw – seorang mahasiswa pascasarjana di departemen Arsitektur dan Teknik Elektro serta Ilmu Komputer – mengambil kursus Profesor Neil Gershenfeld, “Cara Membuat Hampir Apa Pun.” Di kelas itu, dia membangun sistem ucapan-ke-realitas. Dia terus mengerjakan proyek di MIT Center for Bits and Atoms (CBA), disutradarai oleh Gershenfeld, berkolaborasi dengan mahasiswa pascasarjana Se Hwan Jeon dari Departemen Teknik Mesin dan Miana Smith dari CBA.
Sistem ucapan-ke-realitas dimulai dengan pengenalan suara yang memproses permintaan pengguna menggunakan model bahasa besar, diikuti oleh AI generatif 3D yang membuat representasi mesh digital dari objek, dan algoritma voxelisasi yang memecah mesh 3D menjadi komponen perakitan.
Setelah itu, pemrosesan geometrik memodifikasi perakitan yang dihasilkan AI untuk memperhitungkan fabrikasi dan batasan fisik yang terkait dengan dunia nyata, seperti jumlah komponen, overhang, dan konektivitas geometri. Hal ini diikuti dengan pembuatan urutan perakitan yang layak dan perencanaan jalur otomatis untuk lengan robot untuk merakit objek fisik berdasarkan perintah pengguna.
Dengan memanfaatkan bahasa alami, sistem ini membuat desain dan manufaktur lebih mudah diakses oleh orang-orang yang tidak memiliki keahlian dalam pemodelan 3D atau pemrograman robotik. Dan, tidak seperti pencetakan 3D, yang dapat memakan waktu berjam-jam atau berhari-hari, sistem ini dibuat dalam hitungan menit.
“Proyek ini merupakan antarmuka antara manusia, AI, dan robot untuk bersama-sama menciptakan dunia di sekitar kita,” kata Kyaw. “Bayangkan sebuah skenario di mana Anda mengatakan ‘Saya ingin kursi’, dan dalam waktu lima menit sebuah kursi fisik muncul di depan Anda.”
Tim tersebut memiliki rencana segera untuk meningkatkan kemampuan menahan beban furnitur dengan mengubah cara menyambung kubus dari magnet ke sambungan yang lebih kuat.
“Kami juga telah mengembangkan jalur pipa untuk mengubah struktur voxel menjadi rangkaian perakitan yang layak untuk robot bergerak kecil yang terdistribusi, yang dapat membantu menerjemahkan pekerjaan ini ke struktur pada skala ukuran apa pun,” kata Smith.
Tujuan penggunaan komponen modular adalah untuk menghilangkan pemborosan yang digunakan dalam pembuatan benda fisik dengan cara membongkar lalu merakitnya kembali menjadi sesuatu yang berbeda, misalnya mengubah sofa menjadi tempat tidur saat Anda tidak lagi membutuhkan sofa tersebut.
Karena Kyaw juga memiliki pengalaman menggunakan pengenalan isyarat dan augmented reality untuk berinteraksi dengan robot dalam proses fabrikasi, dia saat ini berupaya menggabungkan kontrol ucapan dan isyarat ke dalam sistem ucapan-ke-realitas.
Bersandar pada ingatannya tentang replikator dalam franchise “Star Trek” dan robot dalam film animasi “Big Hero 6,” Kyaw menjelaskan visinya.
“Saya ingin meningkatkan akses masyarakat untuk membuat objek fisik dengan cepat, mudah diakses, dan berkelanjutan,” ujarnya. “Saya berupaya mewujudkan masa depan di mana esensi materi benar-benar berada dalam kendali Anda. Masa depan di mana realitas dapat dihasilkan sesuai permintaan.”
Tim mempresentasikan makalah mereka “Speech to Reality: On-Demand Production using Natural Language, 3D Generative AI, and Discrete Robotic Assembly” di Simposium Association for Computing Machinery (ACM) on Computational Fabrication (SCF ’25) yang diadakan di MIT pada 21 November.