
Startup suara AI, WellSaid Labs, menggandakan pangsa pasarnya dalam hal pelanggan korporat dan industri teregulasi – dengan harapan bahwa pendekatan yang lebih bijaksana dan dilakukan di balik layar akan memberikan hasil bagi bisnisnya dalam jangka panjang bahkan ketika pesaing yang lebih mencolok menarik perhatian dan kontroversi yang luas.
Perusahaan, yang berbasis di Bellevue, Washington, meluncurkan versi baru platform suara AI text-to-speech pada hari Senin dengan perangkat lunak Studio yang didesain ulang dan model suara Caruso generasi berikutnya, menjanjikan alur kerja yang lebih baik, kualitas audio yang lebih baik, dan kontrol yang disempurnakan, di antara fitur-fitur lainnya.
Tidak seperti model pembuatan suara terbuka yang mengambil data publik, sistem WellSaid dilatih secara eksklusif pada rekaman aktor suara berlisensi, sebuah pendekatan model tertutup yang dikatakan menghormati kekayaan intelektual dan menarik bagi sektor-sektor seperti layanan kesehatan, hukum, dan keuangan.
Rilis terbaru WellSaid adalah momen penting bagi perusahaan — hasil penelitian internal selama bertahun-tahun kini hadir di pasar dalam bentuk yang menyempurnakan fokusnya pada pengguna bisnis dan institusi, kata Chris Johnson, kepala produk dan teknologi WellSaid, dalam sebuah wawancara.

“Kami berkomitmen untuk menjadi solusi terbaik bagi perusahaan di pasar,” kata Johnson. “Banyak dari inovasi ini yang mewujudkan hal tersebut bagi kami.”
WellSaid, yang merupakan bagian dari Inkubator AI2 Seattle pada tahun 2019, bekerja dengan pelanggan perusahaan besar termasuk LinkedIn, T-Mobile, ServiceNow, dan Accenture.
Perusahaan membuat kesan pada publik pada tahun 2023 ketika NPR’s Uang Planet menggunakan teknologi WellSaid untuk membuat versi sintetis dari suara mantan pembawa acara Robert Smith — replika yang hampir sempurna yang mengejutkan pendengar dan menunjukkan janji dan potensi tantangan audio AI yang realistis.
Namun WellSaid terkadang kesulitan untuk masuk ke dalam perbincangan industri yang lebih besar. Tantangan ini dipertegas dengan tidak adanya startup voice-AI terkemuka dalam peta pasar CB Insights – yang diunggulkan oleh ElevenLabs, yang telah menjadi pusat kontroversi mengenai penggunaan teknologinya untuk membuat suara AI palsu dari tokoh masyarakat dan lainnya.
Para eksekutif WellSaid mengatakan mereka berharap untuk memperbaiki pengawasan khusus tersebut, namun tantangan tersebut mencerminkan pola yang lebih luas di antara perusahaan-perusahaan AI, khususnya yang berada di wilayah Seattle – yang sering kali menekankan kepercayaan, tata kelola, dan skenario peraturan dalam budaya teknologi yang masih terpikat oleh eksperimen dan aplikasi konsumen Silicon Valley yang menjadi berita utama.
Perusahaan ini mempekerjakan sekitar 70 orang, turun sedikit dari tahun lalu, menurut data LinkedIn.
WellSaid telah mengalami beberapa pergantian di jajaran eksekutifnya, termasuk tiga CEO dalam waktu kurang dari dua tahun – dimulai dengan pendiri Matt Hocking, kemudian Brian Cook, dan sekarang Benjamin Dorr, yang menggantikan Cook awal tahun ini setelah menjabat sebagai chief financial officer.
“Setiap suara terhubung dengan orang sungguhan, dan orang tersebut menerima royalti dari pendapatan yang dihasilkan di WellSaid,” kata Dorr dalam episode terbaru podcast Master Move. “Saya pikir hal-hal yang kami lakukan dengan benar oleh pengisi suara kami memungkinkan kami melakukan hal yang benar oleh perusahaan yang memilih kami, dan saya rasa tidak semua orang bisa mengatakan hal yang sama.”