789BNi
Aplikasi Game Terbesar di Indonesia
DOWNLOAD APP

Vana membiarkan pengguna memiliki sepotong model AI yang dilatih pada data mereka

Vana membiarkan pengguna memiliki sepotong model AI yang dilatih pada data mereka



Pada bulan Februari 2024, Reddit mencapai kesepakatan $ 60 juta dengan Google untuk membiarkan raksasa pencarian menggunakan data pada platform untuk melatih model kecerdasan buatannya. Khususnya absen dari diskusi adalah pengguna Reddit, yang datanya dijual.

Kesepakatan itu mencerminkan realitas internet modern: perusahaan teknologi besar memiliki hampir semua data online kami dan memutuskan apa yang harus dilakukan dengan data itu. Tidak mengherankan, banyak platform memonetisasi data mereka, dan cara yang tumbuh paling cepat untuk mencapainya adalah dengan menjualnya kepada perusahaan AI, yang merupakan perusahaan teknologi besar menggunakan data untuk melatih model yang lebih kuat.

Platform terdesentralisasi Vana, yang dimulai sebagai proyek kelas di MIT, sedang dalam misi untuk mengembalikan kekuatan kepada pengguna. Perusahaan telah membuat jaringan yang sepenuhnya dimiliki pengguna yang memungkinkan individu untuk mengunggah data mereka dan mengatur bagaimana mereka digunakan. Pengembang AI dapat melempar pengguna pada ide -ide untuk model baru, dan jika pengguna setuju untuk menyumbangkan data mereka untuk pelatihan, mereka mendapatkan kepemilikan proporsional dalam model.

Idenya adalah untuk memberi semua orang saham dalam sistem AI yang akan semakin membentuk masyarakat kita sambil juga membuka kumpulan data baru untuk memajukan teknologi.

“Data ini diperlukan untuk membuat sistem AI yang lebih baik,” kata salah satu pendiri VANA, Anna Kazlauskas ’19. “Kami telah membuat sistem yang terdesentralisasi untuk mendapatkan data yang lebih baik – yang berada di dalam perusahaan teknologi besar saat ini – sambil tetap membiarkan pengguna mempertahankan kepemilikan tertinggi.”

Dari ekonomi ke blockchain

Banyak siswa sekolah menengah memiliki foto bintang pop atau atlet di dinding kamar mereka. Kazlauskas memiliki foto mantan Menteri Keuangan AS Janet Yellen.

Kazlauskas datang untuk yakin dia akan menjadi seorang ekonom, tetapi dia akhirnya menjadi satu dari lima siswa untuk bergabung dengan MIT Bitcoin Club pada 2015, dan pengalaman itu membawanya ke dunia blockchain dan cryptocurrency.

Dari kamar asramanya di MacGregor House, ia mulai menambang Cryptocurrency Ethereum. Dia bahkan sesekali menjelajahi tempat sampah kampus untuk mencari chip komputer yang dibuang.

“Itu membuat saya tertarik pada segala hal di sekitar ilmu komputer dan jaringan,” kata Kazlauskas. “Itu melibatkan, dari perspektif blockchain, sistem terdistribusi dan bagaimana mereka dapat menggeser kekuatan ekonomi ke individu, serta kecerdasan buatan dan ekonometrik.”

Kazlauskas bertemu Art Abal, yang kemudian kuliah di Universitas Harvard, di bekas kelas laboratorium media, dan pasangan itu memutuskan untuk bekerja pada cara -cara baru untuk mendapatkan data untuk melatih sistem AI.

“Pertanyaan kami adalah: Bagaimana Anda bisa memiliki sejumlah besar orang yang berkontribusi pada sistem AI ini menggunakan lebih banyak jaringan terdistribusi?” Kazlauskas mengenang.

Kazlauskas dan Abal berusaha mengatasi status quo, di mana sebagian besar model dilatih dengan mengikis data publik di internet. Perusahaan teknologi besar sering juga membeli set data besar dari perusahaan lain.

Pendekatan pendiri berkembang selama bertahun -tahun dan diinformasikan oleh pengalaman Kazlauskas yang bekerja di perusahaan blockchain keuangan Celo setelah lulus. Tapi Kazlauskas memuji waktunya di MIT dengan membantunya memikirkan masalah ini, dan instruktur untuk usaha yang muncul, Ramesh Raskar, masih membantu Vana memikirkan pertanyaan penelitian AI saat ini.

“Sangat menyenangkan memiliki kesempatan terbuka untuk hanya membangun, meretas, dan mengeksplorasi,” kata Kazlauskas. “Saya pikir etos di MIT sangat penting. Ini hanya tentang membangun sesuatu, melihat apa yang berhasil, dan terus mengulangi.”

Hari ini Vana mengambil keuntungan dari undang-undang yang sedikit diketahui yang memungkinkan pengguna sebagian besar platform teknologi besar untuk mengekspor data mereka secara langsung. Pengguna dapat mengunggah informasi itu ke dompet digital terenkripsi di Vana dan mencairkannya untuk melatih model sesuai keinginan mereka.

Insinyur AI dapat menyarankan ide untuk model sumber terbuka baru, dan orang dapat mengumpulkan data mereka untuk membantu melatih model. Di dunia blockchain, kumpulan data disebut data DAO, yang merupakan singkatan dari organisasi otonom terdesentralisasi. Data juga dapat digunakan untuk membuat model dan agen AI yang dipersonalisasi.

Di VANA, data digunakan dengan cara yang menjaga privasi pengguna karena sistem tidak mengekspos informasi yang dapat diidentifikasi. Setelah model dibuat, pengguna mempertahankan kepemilikan sehingga setiap kali digunakan, mereka dihargai secara proporsional berdasarkan seberapa banyak data mereka membantu melatihnya.

“Dari perspektif pengembang, sekarang Anda dapat membangun aplikasi kesehatan yang sangat dipersonalisasi ini yang memperhitungkan apa yang Anda makan, bagaimana Anda tidur, bagaimana Anda berolahraga,” kata Kazlauskas. “Aplikasi itu tidak mungkin hari ini karena taman -taman bertembok perusahaan teknologi besar.”

AI crowdsourced, milik pengguna

Tahun lalu, seorang insinyur pembelajaran mesin yang diusulkan menggunakan data pengguna VANA untuk melatih model AI yang dapat menghasilkan posting Reddit. Lebih dari 140.000 pengguna VANA menyumbangkan data Reddit mereka, yang berisi posting, komentar, pesan, dan banyak lagi. Pengguna memutuskan persyaratan di mana model dapat digunakan, dan mereka mempertahankan kepemilikan model setelah dibuat.

VANA telah mengaktifkan inisiatif serupa dengan data yang dikontribusikan pengguna dari platform media sosial X; Data tidur dari sumber seperti cincin Our; dan lebih banyak lagi. Ada juga kolaborasi yang menggabungkan kumpulan data untuk membuat aplikasi AI yang lebih luas.

“Katakanlah pengguna memiliki data spotify, data reddit, dan data fashion,” Kazlauskas menjelaskan. “Biasanya, Spotify tidak akan berkolaborasi dengan jenis perusahaan itu, dan sebenarnya ada peraturan yang menentangnya. Tetapi pengguna dapat melakukannya jika mereka memberikan akses, sehingga kumpulan data lintas platform ini dapat digunakan untuk membuat model yang sangat kuat.”

Vana memiliki lebih dari 1 juta pengguna dan lebih dari 20 DAO data langsung. Lebih dari 300 kumpulan data tambahan telah diusulkan oleh pengguna pada sistem Vana, dan Kazlauskas mengatakan banyak yang akan diproduksi tahun ini.

“Saya pikir ada banyak janji dalam model AI umum, obat yang dipersonalisasi, dan aplikasi konsumen baru, karena sulit untuk menggabungkan semua data itu atau mendapatkan akses ke tempat pertama,” kata Kazlauskas.

Pool data memungkinkan kelompok pengguna untuk mencapai sesuatu yang bahkan perusahaan teknologi paling kuat kesulitan saat ini.

“Hari ini, perusahaan teknologi besar telah membangun parit data ini, sehingga dataset terbaik tidak tersedia bagi siapa pun,” kata Kazlauskas. Ini adalah masalah aksi kolektif, di mana data saya sendiri tidak berharga, tetapi kumpulan data dengan puluhan ribu atau jutaan orang benar-benar berharga. Vana memungkinkan kumpulan itu dibangun. Ini adalah win-win: pengguna mendapatkan manfaat dari kebangkitan AI karena mereka memiliki model. Lalu Anda tidak berakhir dalam skenario di mana Anda tidak memiliki perusahaan yang dikendalikan.


Previous Article

Semua orang membuat kacamata pintar sekarang - slashdot

Next Article

Ikuti! Kode (September 2025) - IGN

Write a Comment

Leave a Comment

Your email address will not be published. Required fields are marked *

Subscribe to our Newsletter

Subscribe to our email newsletter to get the latest posts delivered right to your email.
Pure inspiration, zero spam ✨