Microsoft menarik postingan blog berusia satu tahun minggu ini setelah thread Hacker News menandai bahwa mereka telah mendorong pengembang untuk mengunduh ketujuh buku Harry Potter dari kumpulan data Kaggle — yang salah ditandai sebagai domain publik — dan menggunakannya untuk melatih model AI pada platform Azure milik perusahaan. Blog tersebut, yang ditulis pada November 2024 oleh manajer produk senior Pooja Kamath, memandu pengguna dalam membangun sistem Tanya Jawab dan membuat fiksi penggemar menggunakan teks berhak cipta, dan bahkan menyertakan gambar AI Harry Potter bermerek Microsoft. Pengunggah kumpulan data Kaggle, ilmuwan data Shubham Maindola, mengatakan kepada Ars Technica bahwa label domain publik adalah “sebuah kesalahan” dan menghapus kumpulan data tersebut setelah outlet tersebut menghubunginya.
Baca lebih lanjut cerita ini di Slashdot.