Pusat Inovasi Data baru-baru ini berbicara dengan Aga Kopytko, salah satu pendiri Pelacursebuah perusahaan yang berbasis di Polandia yang mengembangkan platform yang membantu model bahasa besar (LLM) memberikan jawaban yang lebih akurat dan menghindari menghasilkan informasi yang salah. Kopytko menjelaskan bagaimana hal ini memungkinkan organisasi memperoleh wawasan yang andal dan dapat ditelusuri dari kumpulan besar dokumen dan data, sehingga meningkatkan pengambilan keputusan di berbagai bidang seperti ilmu hayati dan manufaktur.
David Kertai: Apa yang mengilhami kreasi Smabbler?
Aga Kopytko: Banyak organisasi yang hanya mengandalkan kumpulan informasi dalam bentuk dokumen, laporan, email, dan makalah penelitian. Ketika mereka mencoba menggunakan model bahasa yang besar untuk memahami materi ini, mereka sering kali menemui keterbatasan utama: model bahasa menghasilkan teks yang lancar, namun tidak membangun pemahaman yang dapat diandalkan tentang fakta-fakta yang mendasarinya.
Smabbler mengisi kesenjangan tersebut dengan mengubah informasi yang tidak terstruktur menjadi basis pengetahuan yang terstruktur dan dapat dinavigasi. Tim mengunggah dokumen mereka, dan platform mengatur kontennya, mengidentifikasi bagaimana ide terhubung, dan membangun peta fakta dan hubungan yang terverifikasi. Para peneliti, analis, tim kepatuhan, dan insinyur dapat menggunakan pengetahuan terstruktur ini untuk mencari, menganalisis, dan membuat keputusan dengan lebih percaya diri dibandingkan dengan alat pembuat teks saja.
Di dalam platform, Galaxia menyediakan lapisan penalaran. Ini memeriksa fakta terstruktur yang dibuat Smabbler dan menerapkan logika untuk menghubungkannya, memeriksa konsistensi, dan menjelaskan bagaimana kesimpulan dicapai. Singkatnya, Smabbler mengatur pengetahuannya, dan Galaxia berpikir dengannya. Bersama-sama, mereka membantu organisasi beralih dari AI yang dapat menebak ke AI yang dapat menjelaskan dari mana jawabannya berasal, mendukung pekerjaan di bidang penelitian, kepatuhan, teknik, dan bidang lain yang mengutamakan akurasi dan ketertelusuran.
Waktu: Keterbatasan apa dalam LLM saat ini yang dirancang untuk ditingkatkan oleh Galaxia?
Kopytko: Pertama, LLM dapat berhalusinasi, yang berarti mereka dapat menghasilkan pernyataan yang terdengar masuk akal namun sebenarnya salah, karena mereka memilih kata-kata berdasarkan pola dalam data pelatihan mereka daripada memeriksa kata-kata tersebut berdasarkan fakta yang terverifikasi atau aturan logis. Untuk mengatasi hal ini, platform ini menambahkan lapisan penalaran deterministik dan berbasis aturan yang memverifikasi informasi berdasarkan grafik pengetahuan terstruktur, membantu memastikan kesimpulan didasarkan pada fakta aktual dan bukan perkiraan statistik.
Kedua, LLM beroperasi dalam jendela konteks terbatas, yang membatasi berapa banyak informasi yang dapat mereka pertimbangkan sekaligus. Ketika permintaan menjadi terlalu besar, detail sebelumnya tidak dapat dicakup, dan model tidak dapat mempertahankan kesinambungan di seluruh dokumen atau kumpulan data yang panjang. Galaxia mengatasi hal ini dengan menyimpan informasi dalam struktur memori jangka panjang, memungkinkannya mempertahankan konteks dari waktu ke waktu dan alasan di seluruh kumpulan data yang besar tanpa kehilangan jejak detail sebelumnya.
Ketiga, sistem pembuatan augmented pengambilan (retrieval-augmented generation system)—model AI yang menggabungkan penelusuran dengan pembuatan bahasa—dapat melampirkan dokumen ke perintah, namun sering kali tidak benar-benar menghubungkan makna di seluruh dokumen tersebut. Mereka mengambil teks, namun tidak membangun representasi terstruktur tentang bagaimana ide-ide berhubungan. Dengan menerapkan logika simbolik untuk memetakan hubungan antar konsep, Galaxia menciptakan model pengetahuan yang terorganisir dan saling berhubungan yang mendukung penalaran yang lebih dalam dan akurat.
Waktu: Bagaimana Galaxia memungkinkan model untuk berpikir secara berbeda?
Menerjang: Sebagian besar model bahasa menghasilkan teks satu per satu dan mengoptimalkan masuk akal linguistik. Mereka tidak menciptakan representasi pengetahuan yang bertahan lama. Setelah sesi berakhir, strukturnya menghilang. Galaxia membangun model pengetahuan persisten dari dokumen dan data yang diprosesnya. Alih-alih memprediksi kemungkinan kata, ini memetakan konsep dan hubungan dari waktu ke waktu. Kemudian menerapkan penalaran simbolik, menggunakan aturan logika eksplisit untuk menyimpulkan hubungan baru dari pengetahuan yang ada.
Smabbler mendukung model AI dengan mendasarkan keluarannya pada penalaran terstruktur. Ini bukan chatbot; sebaliknya, tim menggunakannya di belakang layar untuk menghubungkan respons yang dihasilkan AI dengan pengetahuan terverifikasi dan dokumen sumber. Hal ini memungkinkan organisasi memvalidasi, mengaudit, dan menggunakan AI dengan percaya diri dalam alur kerja nyata. Dengan kemajuan dalam arsitektur AI hibrid dan infrastruktur yang dapat diskalakan, platform ini dapat memproses ribuan halaman dan kumpulan data dengan cepat sambil menjaga konsistensi.
Waktu: Apa itu hipergraf semantik, dan apa perannya dalam platform Anda?
Kopytko: Hipergraf semantik adalah cara untuk merepresentasikan hubungan yang kompleks. Berbeda dengan grafik standar yang menghubungkan dua item sekaligus, hipergraf dapat menghubungkan beberapa elemen dalam satu hubungan. Hal ini membuatnya berguna untuk memodelkan hal-hal seperti klaim ilmiah, proses multi-langkah, atau aturan dengan berbagai kondisi.
Galaxia menggunakan hipergraf semantik sebagai memori jangka panjangnya. Ini mengatur informasi di seluruh dokumen, menyelesaikan istilah-istilah yang ambigu, menjaga konteks, dan melacak sumber setiap klaim. Struktur yang terhubung ini memungkinkan sistem mempertimbangkan seluruh data dibandingkan menyimpan fakta yang terisolasi.
Waktu: Bisakah Anda membagikan contoh penggunaan Smabbler di dunia nyata?
Kopytko: Dalam ilmu kehidupan, platform ini menganalisis ribuan halaman penelitian klinis dan memetakan hubungan antara pengobatan dan efek samping yang umum. Dengan menyusun informasi ini ke dalam grafik pengetahuan yang terhubung, hal ini membantu peneliti mengidentifikasi pola dan kesenjangan dengan lebih efisien.
Di bidang jasa keuangan, Smabbler mengubah teks peraturan yang padat menjadi model kepatuhan terstruktur dengan kemampuan penelusuran yang jelas ke dokumen sumber. Pendekatan ini mengurangi waktu peninjauan, meningkatkan kesiapan audit, dan memungkinkan tim untuk fokus pada analisis tingkat yang lebih tinggi daripada verifikasi manual.
Dalam bidang manufaktur dan desain produk, platform ini menyatukan catatan teknik, spesifikasi, data harga, dan persyaratan ke dalam satu sistem yang terhubung. Tim mendeteksi inkonsistensi lebih awal, memahami ketergantungan silang dengan lebih jelas, dan membuat keputusan dengan lebih percaya diri karena mereka dapat menelusuri setiap kesimpulan kembali ke data aslinya.