789BNi
Aplikasi Game Terbesar di Indonesia
DOWNLOAD APP

AI Progress Stalls untuk tugas SEO meskipun gelombang model baru

AI Progress Stalls untuk tugas SEO meskipun gelombang model baru


AI Progress Stalls untuk tugas SEO meskipun gelombang model baru

Rilis model AI terbaru di paruh kedua tahun 2025 belum membaik dalam melakukan tugas terkait SEO.

TL; DR: Apa yang Perlu Anda Ketahui Tentang Benchmark LLM

  • Claude Opus 4.1 tetap menjadi model bahasa terbaik untuk melakukan tugas-tugas terkait SEO seperti SEO teknis, lokalisasi, strategi SEO, dan optimasi di halaman.
  • ChatGPT-5 telah meningkat dalam tolok ukur kami meskipun reaksi negatif publik terhadap rilis awalnya.
  • Copilot, yang memanfaatkan GPT-5, sama dengan model Openai. Ini adalah peningkatan besar karena sebelumnya berkinerja buruk.
  • Gemini 2.5 Pro adalah opsi ketiga yang kuat. Ini memiliki dampak paling potensial untuk SEO dan pemasar karena integrasi produk dasar (Gmail, lembaran, slide, dokumen) dan modalitas yang berfokus pada AI yang mendorong utilitasnya lebih jauh (Opal, notebooklm).

Benchmark AI SEO

Pada bulan April, Previsible meluncurkan tolok ukur AI SEO, upaya terstruktur untuk mengevaluasi seberapa efektif model bahasa besar (LLM) dapat melakukan tugas SEO dunia nyata. Penelitian ini difokuskan pada menjawab dua pertanyaan inti:

  1. Bisakah AI andal melakukan tugas SEO di tingkat ahli?
  2. Ketika model -model ini meningkat, apakah utilitas mereka akan mengubah bagaimana pemasar harus melakukan sumber daya untuk tugas SEO dan geo?

Untuk menjawab ini, kami mengkuratori serangkaian pertanyaan komprehensif di berbagai disiplin ilmu, strategi konten, optimasi di halaman, pembangunan tautan, dan SEO teknis. Pertanyaan -pertanyaan ini dikembangkan oleh tim profesional SEO berpengalaman dengan pengalaman 10+ tahun dalam spesialisasi masing -masing.

Kami kemudian menjalankan LLMS terkemuka melalui baterai pertanyaan ini, mencetak tanggapan mereka dari 100. Pendekatan tolok ukur ini mencerminkan bagaimana kinerja AI diuji di bidang seperti pengembangan perangkat lunak, penalaran matematika, dan tugas berbasis logika.

Temuan awal

Benchmark pertama kami di bulan April memberikan hasil yang mengesankan, meskipun tidak mengejutkan,:

  • LLMS berkinerja baik di seluruh tugas SEO yang berfokus pada konten seperti strategi kata kunci dan pembuatan metadata.
  • Namun, LLMS berjuang dengan SEO teknis, di mana presisi dan pemikiran yang dapat diprediksi sangat penting.

Gelombang model baru

Sejak itu, lanskap telah berubah secara dramatis. Hampir setiap penyedia AI utama telah merilis model baru (dengan pengecualian Meta’s Llama). Dengan masuknya kemampuan yang diperbarui ini, kami telah menjalankan kembali tolok ukur dan menyegarkan papan peringkat.

Jadi bagaimana model terbaru menumpuk? Dan apa artinya ini untuk bagaimana tim SEO mengalokasikan waktu, alat, dan bakat?

Dalam angsuran berikutnya, kami akan membagikan skor yang diperbarui, kerusakan kinerja oleh SEO Disiplin, dan implikasi bagi pemasar.

Banyak yang telah berubah sejak April, jadi mari kita lihat papan peringkat sekarang karena hampir semua perusahaan AI besar telah merilis model baru (kecuali untuk Llama).

Benchmark AI SEO

Benchmark telah melihat beberapa gerakan tetapi belum menembus langit -langit apa yang mungkin terjadi pada bulan April.

Jika Anda bukan SEO terlatih, saya akan sangat berhati -hati tentang mempercayai LLMS untuk melakukan tugas SEO.

Dalam meneliti posting ini, kami menjangkau komunitas SEO untuk contoh AI Run Amok.

Berikut beberapa contoh:

  • Ketika saya pertama kali mulai menggunakan AI untuk SEO, ia menemukan 404 kesalahan untuk URL yang tidak ada, yang diklaim AI memiliki backlink. Saya mempresentasikan temuan ini kepada tim pengembang dan manajemen sebagai semacam “menang” besar.
  • Saya perlu melakukan analisis penurunan peringkat untuk situs besar dengan waktu turnaround yang singkat. Saya menjalankan analisis melalui chatgpt dan terkesan dengan kategorisasi dan wawasan. Tim bersemangat dan ingin menyelam mendalam, analisis lebih lanjut, dan presentasi temuan. Ketika saya menggali sedikit lebih dalam, semua “analisis” yang mendasarinya ternyata sangat bermakna, dan saya harus memulai dari awal dan tampak bodoh.
  • Llms tidak mematuhi wordcounts; Mereka bahkan tidak mengerti mereka, jadi saya dituntun untuk percaya. Jadi, saya menjalankan skrip yang mengotomatiskan beberapa ribu halaman pengeditan HTML dan hasilnya adalah paragraf penuh konten dan esai dalam tag judul (karakter maksimal biasa 160!) Yang juga harganya lebih mahal daripada yang ingin saya bayar!

Ini adalah pengalaman anekdotal, tetapi mereka berasal dari SEO profesional. Jika Anda seorang eksekutif yang peduli dengan pencarian, Anda masih membutuhkan SEO terlatih yang dapat memanfaatkan LLMS dengan benar.

Apakah kemajuan AI melambat?

Bagi mereka yang tidak “pillen,” Anda mungkin memperhatikan laju perubahan moderat tahun ini. Ada gangguan, tetapi sebagian besar memengaruhi gelembung hype, dengan chatgpt-5 terutama berkinerja buruk setelah debutnya.

Itu tidak mengejutkan berdasarkan apa yang dikatakan Ilya Sutskiver kepada Reuters tahun lalu tentang “meningkatkan pra-pelatihan-fase pelatihan model AI yang menggunakan sejumlah besar data yang tidak berlabel untuk memahami pola dan struktur bahasa-memiliki dataran tinggi.”

AI akan terus maju. Benchmark ini berfokus pada bisnis utilitas saat ini.

Jika alat -alat ini tidak memberikan nilai atau efisiensi dalam alur kerja kami saat ini, apa gunanya mereka? Google telah membuat keuntungan di area itu.

Google adalah kuda hitam

Setahun yang lalu, saya telah menghapuskan model Gemini awal Google. Sebagai pengguna awal, pengalaman itu mengecewakan dan, terus terang, tidak dapat digunakan. Namun, perspektif saya telah sepenuhnya bergeser dengan rilis Gemini 2.5 Pro.

Gemini 2.5 tidak hanya berkinerja mengesankan dalam tolok ukur kami, tetapi juga sangat terintegrasi di seluruh ekosistem Google. Di situlah letak keuntungan sebenarnya.

Saya sekarang dapat menyusun email yang secara otomatis memahami konteks dokumen yang telah saya buat di Google Drive, Referensi Rapat dari Kalender, atau menarik wawasan dari Google Documents dan Sheets, semuanya dalam satu antarmuka. Itu adalah utilitas yang nyata dan mulus yang saat ini tidak ditawarkan LLM lain pada skala.

Sementara banyak LLMs berjuang untuk membangun parit yang berkelanjutan, Google sudah memiliki satu: integrasi data di mana -mana. Kemampuan untuk mengambil dan bertindak berdasarkan informasi yang relevan di semua produk Google adalah keuntungan strategis yang sulit ditiru.

Apakah itu sempurna? Belum. Namun, jika laju peningkatan produk berlanjut, Google diam -diam menjadi pemain paling dominan di AI terapan.

Menerapkan Benchmark: Di mana AI berdiri hari ini

Kami membangun tolok ukur ini untuk menjadi alat hidup, sesuatu yang akan terus kami perbarui saat model baru dirilis dan kemampuan berkembang. Jadi di mana semuanya berdiri pada bulan September 2025?

Bisakah AI andal melakukan tugas SEO di tingkat ahli?

TIDAK. Terlepas dari kemajuan besar di LLMS, sebagian besar masih kekurangan eksekusi tingkat ahli, terutama di bidang-bidang yang membutuhkan strategi yang bernuansa, ketepatan teknis, atau pemikiran sistem.

Akankah peningkatan model mengubah bagaimana pemasar sumber daya SEO dan fungsi geo?

Tidak bermakna. Kami melihat keuntungan bertahap dalam kecepatan dan dukungan untuk tugas -tugas tertentu, tetapi tidak cukup untuk menjamin perubahan penuh dalam struktur tim atau strategi investasi. Utilitas terletak pada keuntungan efisiensi, bukan otomatisasi pada skala.

Singkatnya, jangan berharap Chatgpt atau Gemini menggantikan tim SEO Anda. Harapkan mereka untuk meningkatkannya saat digunakan dengan bijak.

AI masih mengecewakan pada tugas -tugas kompleks. Tapi kesenjangan itu tutup.

Nantikan tolok ukurnya. Lebih penting lagi, mulailah memanfaatkan alat -alat ini sebelum pesaing Anda melakukannya. Adopsi awal bukan hanya peningkatan produktivitas – ini adalah keuntungan strategis.


Previous Article

NASA memesan dengan Origin Biru untuk bekerja mengirim Viper Rover ke Kutub Selatan Moon

Next Article

Acara Apple Mengungkapkan Arknights: Endfield Set untuk rilis awal 2026, Gryphline's Popucom juga datang ke Switch - IGN

Write a Comment

Leave a Comment

Your email address will not be published. Required fields are marked *

Subscribe to our Newsletter

Subscribe to our email newsletter to get the latest posts delivered right to your email.
Pure inspiration, zero spam ✨