
Sebuah drone otonom yang membawa air untuk membantu memadamkan api di Sierra Nevada mungkin menghadapi memutar -mutar angin Santa Ana yang mengancam untuk mendorongnya keluar jalur. Beradaptasi dengan cepat dengan gangguan yang tidak diketahui ini menghadirkan tantangan besar untuk sistem kontrol penerbangan drone.
Untuk membantu drone seperti itu tetap tepat sasaran, para peneliti MIT mengembangkan algoritma kontrol adaptif berbasis pembelajaran mesin baru yang dapat meminimalkan penyimpangannya dari lintasan yang dimaksudkan dalam menghadapi kekuatan yang tidak terduga seperti angin kencang.
Tidak seperti pendekatan standar, teknik baru ini tidak mengharuskan orang yang memprogram drone otonom untuk mengetahui sesuatu sebelumnya tentang struktur gangguan yang tidak pasti ini. Sebaliknya, model kecerdasan buatan sistem kontrol mempelajari semua yang perlu diketahui dari sejumlah kecil data pengamatan yang dikumpulkan dari 15 menit waktu penerbangan.
Yang penting, teknik ini secara otomatis menentukan algoritma optimasi mana yang harus digunakan untuk beradaptasi dengan gangguan, yang meningkatkan kinerja pelacakan. Ini memilih algoritma yang paling sesuai dengan geometri gangguan spesifik yang dihadapi drone ini.
Para peneliti melatih sistem kontrol mereka untuk melakukan kedua hal secara bersamaan menggunakan teknik yang disebut meta-learning, yang mengajarkan sistem cara beradaptasi dengan berbagai jenis gangguan.
Secara keseluruhan, bahan -bahan ini memungkinkan sistem kontrol adaptif mereka untuk mencapai kesalahan pelacakan lintasan 50 persen lebih sedikit daripada metode awal dalam simulasi dan berkinerja lebih baik dengan kecepatan angin baru yang tidak dilihatnya selama pelatihan.
Di masa depan, sistem kontrol adaptif ini dapat membantu drone otonom secara lebih efisien memberikan paket berat meskipun angin kencang atau memantau area yang rawan api di taman nasional.
“The concurrent learning of these components is what gives our method its strength. By leveraging meta-learning, our controller can automatically make choices that will be best for quick adaptation,” says Navid Azizan, who is the Esther and Harold E. Edgerton Assistant Professor in the MIT Department of Mechanical Engineering and the Institute for Data, Systems, and Society (IDSS), a principal investigator of the Laboratory for Information and Decision Systems (Tutup), dan penulis senior makalah tentang sistem kontrol ini.
Azizan bergabung di atas kertas oleh penulis utama Sunbochen Tang, seorang mahasiswa pascasarjana di Departemen Aeronautika dan Astronotika, dan Haoyuan Sun, seorang mahasiswa pascasarjana di Departemen Teknik Listrik dan Ilmu Komputer. Penelitian ini baru -baru ini dipresentasikan di The Learning for Dynamics and Control Conference.
Menemukan algoritma yang tepat
Biasanya, sistem kontrol menggabungkan fungsi yang memodelkan drone dan lingkungannya, dan mencakup beberapa informasi yang ada tentang struktur potensi gangguan. Tetapi di dunia nyata yang dipenuhi dengan kondisi yang tidak pasti, seringkali tidak mungkin untuk merancang tangan struktur ini terlebih dahulu.
Banyak sistem kontrol menggunakan metode adaptasi berdasarkan algoritma optimasi populer, yang dikenal sebagai keturunan gradien, untuk memperkirakan bagian -bagian masalah yang tidak diketahui dan menentukan bagaimana menjaga drone sedekat mungkin dengan lintasan target selama penerbangan. Namun, keturunan gradien hanyalah satu algoritma dalam keluarga algoritma yang lebih besar yang tersedia untuk dipilih, yang dikenal sebagai keturunan cermin.
“Descent Mirror adalah keluarga umum algoritma, dan untuk masalah apa pun, salah satu algoritma ini bisa lebih cocok daripada yang lain. Nama permainan ini adalah bagaimana memilih algoritma tertentu yang tepat untuk masalah Anda. Dalam metode kami, kami mengotomatiskan pilihan ini,” kata Azizan.
Dalam sistem kontrol mereka, para peneliti mengganti fungsi yang berisi beberapa struktur gangguan potensial dengan model jaringan saraf yang belajar mendekati mereka dari data. Dengan cara ini, mereka tidak perlu memiliki struktur apriori dari kecepatan angin yang bisa ditemui drone ini terlebih dahulu.
Metode mereka juga menggunakan algoritma untuk secara otomatis memilih fungsi cermin-descent yang tepat sambil mempelajari model jaringan saraf dari data, daripada mengasumsikan pengguna memiliki fungsi ideal yang sudah dipilih. Para peneliti memberikan algoritma ini berbagai fungsi untuk dipilih, dan menemukan salah satu yang paling sesuai dengan masalah yang dihadapi.
“Memilih fungsi penghasil jarak yang baik untuk membangun adaptasi adaptasi cermin yang tepat sangat penting dalam mendapatkan algoritma yang tepat untuk mengurangi kesalahan pelacakan,” tambah Tang.
Belajar beradaptasi
Sementara kecepatan angin yang mungkin ditemui drone dapat berubah setiap kali diterbangkan, jaringan saraf pengontrol dan fungsi cermin harus tetap sama sehingga mereka tidak perlu dihitung ulang setiap kali.
Untuk membuat pengontrol mereka lebih fleksibel, para peneliti menggunakan meta-learning, mengajarkannya untuk beradaptasi dengan menunjukkan berbagai keluarga kecepatan angin selama pelatihan.
“Metode kami dapat mengatasi tujuan yang berbeda karena, menggunakan meta-belajar, kami dapat mempelajari representasi bersama melalui berbagai skenario secara efisien dari data,” jelas Tang.
Pada akhirnya, pengguna memberi makan sistem kontrol lintasan target dan terus menghitung ulang, secara real-time, bagaimana drone harus menghasilkan dorongan untuk membuatnya sedekat mungkin dengan lintasan itu sambil mengakomodasi gangguan yang tidak pasti yang ditemui.
Dalam simulasi dan percobaan dunia nyata, para peneliti menunjukkan bahwa metode mereka menyebabkan kesalahan pelacakan lintasan yang lebih sedikit daripada pendekatan dasar dengan setiap kecepatan angin yang mereka uji.
“Bahkan jika gangguan angin jauh lebih kuat dari yang kita lihat selama pelatihan, teknik kami menunjukkan bahwa itu masih dapat menanganinya dengan sukses,” tambah Azizan.
Selain itu, margin dimana metode mereka mengungguli garis dasar tumbuh saat kecepatan angin semakin intensif, menunjukkan bahwa ia dapat beradaptasi dengan lingkungan yang menantang.
Tim sekarang melakukan eksperimen perangkat keras untuk menguji sistem kontrol mereka pada drone nyata dengan berbagai kondisi angin dan gangguan lainnya.
Mereka juga ingin memperluas metode mereka sehingga dapat menangani gangguan dari berbagai sumber sekaligus. Misalnya, mengubah kecepatan angin dapat menyebabkan berat paket yang dibawa drone untuk bergeser dalam penerbangan, terutama ketika drone membawa muatan sloshing.
Mereka juga ingin mengeksplorasi pembelajaran terus -menerus, sehingga drone dapat beradaptasi dengan gangguan baru tanpa perlu juga dilatih kembali pada data yang telah dilihatnya sejauh ini.
Navid dan kolaboratornya telah mengembangkan pekerjaan terobosan yang menggabungkan meta-belajar dengan kontrol adaptif konvensional untuk mempelajari fitur nonlinier dan undang-undang adaptasi yang sesuai dari data. Kunci untuk pendekatan mereka adalah penggunaan teknik keturunan cermin yang mengeksploitasi sistem yang mendasari, hal-hal yang tidak ada dalam sistem yang tidak beroperasi, yang secara otomatis. Mose dan Lillian S. Bohn Profesor Teknik Listrik dan Komputasi dan Ilmu Matematika di Caltech, yang tidak terlibat dengan pekerjaan ini.
Penelitian ini didukung, sebagian, oleh MathWorks, MIT-IBM Watson AI Lab, MIT-Amazon Science Hub, dan program MIT-Google untuk menghitung inovasi.