
Data harus mendorong setiap keputusan yang dibuat oleh bisnis modern. Tetapi sebagian besar bisnis memiliki titik buta besar: mereka tidak tahu apa yang terjadi dalam data visual mereka.
Koaktif berupaya mengubahnya. Perusahaan, didirikan oleh Cody Coleman ’13, Meng ’15 dan William Gaviria Rojas ’13, telah menciptakan platform bertenaga kecerdasan buatan yang dapat memahami data seperti gambar, audio, dan video untuk membuka wawasan baru.
Platform CoActive dapat secara instan mencari, mengatur, dan menganalisis konten visual yang tidak terstruktur untuk membantu bisnis membuat keputusan yang lebih cepat dan lebih baik.
“Dalam revolusi data besar pertama, bisnis menjadi lebih baik dalam mendapatkan nilai dari data terstruktur mereka,” kata Coleman, merujuk pada data dari tabel dan spreadsheet. “Tapi sekarang, sekitar 80 hingga 90 persen dari data di dunia tidak terstruktur. Dalam bab berikutnya dari data besar, perusahaan harus memproses data seperti gambar, video, dan audio pada skala, dan AI adalah bagian penting dari membuka kunci kemampuan itu.”
CoActive sudah bekerja dengan beberapa perusahaan media dan ritel besar untuk membantu mereka memahami konten visual mereka tanpa mengandalkan penyortiran dan penandaan manual. Itu membantu mereka mendapatkan konten yang tepat untuk pengguna lebih cepat, menghapus konten eksplisit dari platform mereka, dan mengungkap bagaimana konten spesifik memengaruhi perilaku pengguna.
Secara lebih luas, para pendiri percaya koaktif berfungsi sebagai contoh bagaimana AI dapat memberdayakan manusia untuk bekerja lebih efisien dan memecahkan masalah baru.
“Kata koaktif berarti bekerja sama secara bersamaan, dan itulah visi besar kami: membantu manusia dan mesin bekerja bersama,” kata Coleman. “Kami percaya bahwa visi lebih penting sekarang daripada sebelumnya karena AI dapat menarik kami atau menyatukan kami. Kami ingin koaktif menjadi agen yang menarik kami bersama dan memberi manusia set negara adidaya baru.”
Memberikan visi komputer
Coleman bertemu Gaviria Rojas di musim panas sebelum tahun pertama mereka melewati program MIT Interphase Edge. Keduanya akan menjadi jurusan Teknik Listrik dan Ilmu Komputer dan berupaya membawa konten MIT OpencourSeware ke universitas -universitas Meksiko, di antara proyek -proyek lainnya.
“Itu adalah contoh yang bagus dari kewirausahaan,” kenang Coleman dari proyek OpenCourSeware. “Sangat memberdayakan untuk bertanggung jawab atas bisnis dan pengembangan perangkat lunak. Ini membuat saya memulai bisnis pengembangan web kecil saya sendiri sesudahnya, dan untuk mengambil [the MIT course] Perjalanan Pendiri. “
Coleman pertama kali mengeksplorasi kekuatan AI di MIT saat bekerja sebagai peneliti pascasarjana dengan Kantor Pembelajaran Digital (sekarang MIT Open Learning), di mana ia menggunakan pembelajaran mesin untuk mempelajari bagaimana manusia belajar di MITX, yang menjadi tuan rumah kursus online besar dan terbuka yang dibuat oleh fakultas dan instruktur MIT.
“Sungguh menakjubkan bagi saya bahwa Anda dapat mendemokratisasi perjalanan transformasional yang saya lalui di MIT dengan pembelajaran digital – dan bahwa Anda dapat menerapkan AI dan pembelajaran mesin untuk menciptakan sistem adaptif yang tidak hanya membantu kami memahami bagaimana manusia belajar, tetapi juga memberikan pengalaman belajar yang lebih personal kepada orang -orang di seluruh dunia,” kata Coleman tentang MITX. “Itu juga pertama kalinya saya menjelajahi konten video dan menerapkan AI untuk itu.”
Setelah MIT, Coleman pergi ke Universitas Stanford untuk PhD -nya, di mana ia bekerja menurunkan hambatan untuk menggunakan AI. Penelitian ini membuatnya bekerja dengan perusahaan seperti Pinterest dan Meta pada aplikasi AI dan pembelajaran mesin.
“Di situlah saya dapat melihat sekitar sudut ke masa depan apa yang ingin dilakukan orang dengan AI dan konten mereka,” kenang Coleman. “Saya melihat bagaimana perusahaan terkemuka menggunakan AI untuk mendorong nilai bisnis, dan dari situlah percikan awal untuk koaktif berasal. Saya berpikir, ‘Bagaimana jika kita membuat sistem operasi kelas perusahaan untuk konten dan AI multimodal untuk membuatnya mudah?'”
Sementara itu, Gaviria Rojas pindah ke Bay Area pada tahun 2020 dan mulai bekerja sebagai seorang ilmuwan data di eBay. Sebagai bagian dari langkah itu, ia membutuhkan bantuan untuk mengangkut sofa, dan Coleman adalah teman yang beruntung yang ia panggil.
“Dalam perjalanan mobil, kami menyadari kami berdua melihat ledakan terjadi di sekitar data dan AI,” kata Gaviria Rojas. “Di MIT, kami mendapat kursi baris depan untuk revolusi data besar, dan kami melihat orang -orang menciptakan teknologi untuk membuka nilai dari data itu pada skala. Cody dan saya menyadari bahwa kami memiliki tong bubuk lain yang akan meledak dengan perusahaan yang mengumpulkan data dalam jumlah yang luar biasa, tetapi kali ini adalah skala multimoda seperti gambar, video, audio, dan teks. Ada teknologi yang hilang.
Platform para pendiri terus membangun – apa yang digambarkan Coleman sebagai “sistem operasi AI” – adalah model agnostik, yang berarti perusahaan dapat menukar sistem AI di bawah kap saat model terus meningkat. Platform CoActive mencakup aplikasi prebuilt yang dapat digunakan pelanggan bisnis untuk melakukan hal -hal seperti pencarian melalui konten mereka, menghasilkan metadata, dan melakukan analitik untuk mengekstraksi wawasan.
“Sebelum AI, komputer akan melihat dunia melalui byte, sedangkan manusia akan melihat dunia melalui visi,” kata Coleman. “Sekarang dengan AI, mesin akhirnya bisa melihat dunia seperti kita, dan itu akan menyebabkan dunia digital dan fisik kabur.”
Meningkatkan antarmuka manusia-komputer
Basis data gambar Reuters memasok jurnalis dunia dengan jutaan foto. Sebelum koaktif, perusahaan mengandalkan wartawan memasukkan tag secara manual dengan setiap foto sehingga gambar yang tepat akan muncul ketika jurnalis mencari subjek tertentu.
“Sungguh luar biasa lambat dan mahal untuk melewati semua aset mentah ini, jadi orang tidak menambahkan tag,” kata Coleman. “Itu berarti ketika Anda mencari hal -hal, ada hasil yang terbatas bahkan jika foto yang relevan ada dalam database.”
Sekarang, ketika jurnalis di situs web Reuters ‘pilih’ Aktifkan pencarian AI, ‘CoActive dapat menarik konten yang relevan berdasarkan pemahaman sistem AI tentang detail di setiap gambar dan video.
“Ini sangat meningkatkan kualitas hasil bagi wartawan, yang memungkinkan mereka untuk menceritakan kisah yang lebih baik dan lebih akurat daripada sebelumnya,” kata Coleman.
Reuters tidak sendirian dalam berjuang untuk mengelola semua isinya. Digital Asset Management adalah komponen besar dari banyak perusahaan media dan ritel, yang saat ini sering mengandalkan metadata yang dimasukkan secara manual untuk menyortir dan mencari melalui konten itu.
Pelanggan koaktif lainnya adalah Fandom, yang merupakan salah satu platform terbesar di dunia untuk informasi di sekitar acara TV, videogame, dan film dengan lebih dari 300 juta pengguna aktif bulanan. Fandom menggunakan koaktif untuk memahami data visual di komunitas online mereka dan membantu menghilangkan gore yang berlebihan dan konten seksual.
“Dulu butuh 24 hingga 48 jam untuk fandom untuk meninjau setiap konten baru,” kata Coleman. “Sekarang dengan koaktif, mereka telah mengkodifikasi pedoman komunitas mereka dan dapat menghasilkan informasi yang lebih halus dalam rata-rata sekitar 500 milidetik.”
Dengan setiap kasus penggunaan, para pendiri melihat koaktif sebagai memungkinkan paradigma baru dalam cara manusia bekerja dengan mesin.
“Sepanjang sejarah interaksi manusia-komputer, kami harus membungkuk keyboard dan mouse untuk memasukkan informasi dengan cara yang dapat dipahami oleh mesin,” kata Coleman. “Sekarang, untuk pertama kalinya, kita dapat berbicara secara alami, kita dapat berbagi gambar dan video dengan AI, dan itu dapat memahami konten itu. Itu adalah perubahan mendasar dalam cara kita berpikir tentang interaksi komputer manusia. Visi inti koaktif adalah karena perubahan itu, kita membutuhkan sistem operasi baru dan cara kerja baru dengan konten dan ai.