
Kepala Penelusuran Google memperingatkan pengadilan federal bahwa memaksa perusahaan untuk membagikan indeks pencarian, data peringkat, dan hasil langsungnya kepada pesaing akan menyebabkan “kerugian langsung dan tidak dapat diperbaiki” bagi Google, penggunanya, dan web terbuka.
Peringatan tersebut muncul dalam pernyataan tertulis yang diajukan oleh Elizabeth Reid, wakil presiden Google dan kepala Penelusuran, yang diajukan bersamaan dengan mosi Google untuk menghentikan sementara upaya hukum antimonopoli utama sambil mengajukan banding atas keputusan akhir dalam kasus monopoli penelusuran DOJ.
Pengajuan tersebut menjelaskan apa yang dianggap Google sebagai aset Penelusuran paling sensitif dan mengapa membagikannya akan mengekspos sistem kepemilikan, memungkinkan rekayasa balik, dan memicu spam.
Pengungkapan indeks pencarian web Google
Pertarungan: Bagian IV dari keputusan akhir akan memaksa Google untuk memberikan “pesaing yang memenuhi syarat” satu kali pembuangan data indeks web inti dengan biaya marjinal. Data tersebut mencakup:
- Setiap URL di indeks pencarian web Google
- Peta DocID-ke-URL
- Data waktu perayapan
- Skor spam
- Bendera jenis perangkat
Argumen Google: Hal ini akan memberikan pesaing hasil dan akumulasi wawasan selama lebih dari 25 tahun pekerjaan pengindeksan.
Reid menggambarkan indeks ini sebagai produk dari sistem perayapan, anotasi, dan tingkatan kepemilikan yang menentukan laman mana yang masuk ke Google Penelusuran:
- “Pemilihan halaman web dalam indeks pencarian Google adalah hasil dari investasi berkelanjutan dan upaya rekayasa yang mendalam selama lebih dari dua puluh lima tahun.”
Dia memperingatkan bahwa hanya dengan mengetahui URL mana yang diindeks Google akan memungkinkan pesaing untuk melewatkan sebagian besar perayapan dan analisis sekaligus:
- “Menerima daftar URL di indeks Google akan memungkinkan Pesaing yang Memenuhi Syarat untuk tidak melakukan perayapan dan menganalisis web yang lebih besar, dan sebaliknya memfokuskan upaya mereka untuk merayapi hanya sebagian kecil halaman yang telah disertakan Google dalam indeksnya.”
Metadata seperti frekuensi perayapan akan mengungkapkan bagaimana Google memprioritaskan kesegaran dan permintaan, tambahnya:
- “Informasi mengenai jadwal perayapan Google akan memberikan pesaing wawasan tentang sinyal kesegaran milik Google dan struktur tingkatan indeks.”
Dalam pernyataan tertulis tersebut terdapat gambar, “Proses Perayapan dan Pengindeksan Web Google: Hasil”, yang menunjukkan bahwa Google memberi label pada sebagian besar laman web sebagai “Spam, Duplikat, & Laman Berkualitas Rendah.”

- Google telah merayapi triliunan halaman yang telah disunting. Pada tahun 2020, indeks Google berisi sekitar 400 miliar dokumen, menurut kesaksian Pandu Nayak, seorang eksekutif Google.
Risiko spam, penyalahgunaan, dan kerusakan reputasi
Kekhawatirannya: Google berpendapat bahwa mengekspos skor spam, bahkan secara tidak langsung, akan melemahkan kemampuannya melawan webspam.
Pemberantasan spam yang efektif bergantung pada kerahasiaan, Reid menekankan:
- “Memerangi spam bergantung pada ketidakjelasan, karena pengetahuan eksternal tentang mekanisme atau sinyal pemberantasan spam menghilangkan nilai dari mekanisme dan sinyal tersebut.”
Jika skor spam bocor atau dilanggar, pelaku kejahatan dapat menggunakannya untuk menerobos pertahanan Google, Reid memperingatkan:
- “Para pelaku spam … dapat menerobos teknologi deteksi spam Google dan menghambat upaya Google memerangi spam.”
Hal ini akan mendorong lebih banyak konten berkualitas rendah dan menyesatkan ke dalam hasil pencarian, sehingga pengguna akhirnya menyalahkan Google:
- “Pengungkapan yang dipaksakan kemungkinan akan menyebabkan lebih banyak spam dan konten menyesatkan muncul sebagai respons terhadap pertanyaan pengguna, sehingga membahayakan keselamatan pengguna dan merusak reputasi Google sebagai mesin pencari yang dapat dipercaya.”
Pengungkapan data pencarian sisi pengguna (Glue dan RankEmbed)
Hal-hal yang diperlukan dalam penghakiman: Berbagi “data sisi pengguna” yang digunakan untuk menjalankan model Glue dan RankEmbed Google. Reid mengatakan bahwa data meliputi:
- Pertanyaan
- Lokasi
- Waktu pencarian
- Klik, hover, dan interaksi lainnya
- Setiap hasil dan fitur pencarian yang ditampilkan, beserta urutannya
Glue menangkap catatan pencarian AS selama 13 bulan, menurut pernyataan tertulis.
Argumen Google: Hal ini berarti pengungkapan hasil pemeringkatan Google secara besar-besaran dan berkelanjutan dalam skala besar.
- “Pengungkapan data pelatihan Glue sama dengan pengungkapan kekayaan intelektual Google, karena data tersebut mengungkapkan keluaran teknologi Penelusuran Google sebagai respons terhadap setiap kueri yang dikeluarkan oleh pengguna yang berlokasi di Amerika Serikat selama periode 13 bulan.”
Ia juga mengingatkan agar data tersebut bisa langsung digunakan kembali.
- “Pesaing yang Memenuhi Syarat juga dapat dengan mudah menggunakan data Glue dan RankEmbed yang diungkapkan sebagai data pelatihan untuk model bahasa besar.”
Mengenai privasi, Reid menekankan bahwa Google tidak akan mengontrol keputusan akhir anonimisasi.
- “Google tidak akan memiliki otoritas pengambilan keputusan akhir atas teknik anonimisasi dan peningkatan privasi yang akan diterapkan pada data pengguna sebelum dibagikan.”
Pengguna akan tetap menganggap Google bertanggung jawab atas dampak apa pun, prediksi Reid.
- “Meskipun demikian, pengguna Google cenderung menyalahkan Google atas masalah privasi atau keamanan apa pun yang timbul dari pengungkapan data.”
Sindikasi hasil dan fitur pencarian Google
Apa yang diperlukan: Bagian V akan memaksa Google untuk melisensikan dan mensindikasikan hasil pencarian inti kepada pesaing hingga lima tahun, termasuk:
- Hasil web organik (“sepuluh tautan biru”)
- Penulisan ulang kueri
- Panel Lokal, Peta, Gambar, Video, dan Pengetahuan
Peringatan Google: Hal ini akan mengekspos keluaran langsung dari sistem pencariannya kepada pesaing—dan seterusnya.
- “Hasil pencarian dan fitur yang diperlukan untuk disindikasikan ke Pesaing Berkualitas adalah produk dari upaya rekayasa dan inovasi berkelanjutan selama beberapa dekade dan investasi bernilai miliaran dolar.”
Bahkan dengan batasan kontrak, Google akan kehilangan kendali, kata Reid:
- “Google tidak memiliki kemampuan (seperti yang terjadi pada umumnya) untuk menolak sindikat ke Pesaing yang Memenuhi Syarat.”
Pesaing dapat menyimpan, menganalisis, atau membocorkan data – dan pihak ketiga juga dapat menghapusnya, Reid memperingatkan.
- “Pihak ketiga mana pun dapat ‘mengikis’ hasil dan fitur sindikasi dari situs Pesaing Berkualitas dan dengan demikian juga memanfaatkan hasil dan fitur Google.”
Dokumen itu. Baca di sini.
- Apa itu: Surat Pernyataan Elizabeth Reid (Dokumen #1471, Lampiran #2)
- Diarsipkan: 16 Januari pukul 15:46 ET
- Kasus: Amerika Serikat v. Google LLC, No. 1:20-cv-03010 (DDC)
- Tujuan: Mendukung mosi Google untuk menghentikan sebagian upaya hukum antimonopoli sambil menunggu banding
Reid memberikan kesaksian sebelumnya pada sidang penyelesaian dan mengatakan pernyataan tertulis tersebut mencerminkan pengetahuan pribadinya sebagai eksekutif yang bertanggung jawab atas seluruh Google Penelusuran.