İnternetin önde gelen güvenlik ve hız sağlayıcılarından Cloudflare, müşterilerinin web sitelerini tarayarak büyük dil modelleri eğitmek için içerik çeken yapay zeka şirketlerinin botlarını engellemek için yeni bir ücretsiz araç yayınladı. Bu aracı, ücretsiz planları da dahil olmak üzere tüm müşteri tabanına sunan bulut hizmet sağlayıcısı, "Bu özellik, webi model eğitimi için geniş çapta içerik çeken botların yeni parmak izlerini tespit ettiğimizde otomatik olarak güncellenecektir" açıklamasında bulundu.
Bu güncelleme duyurusuyla birlikte Cloudflare'ın ekibi, müşterilerinin genelleyici yapay zeka modellerini eğitmek için içerik çeken botların artışına nasıl yanıt verdiklerine dair bazı verileri paylaştı. Şirketin iç verilerine göre müşterilerin %85.2'si, kendilerini doğru bir şekilde tanımlayan yapay zeka botlarını dahi sitelerine erişimlerini engellemeyi tercih etmişlerdir.
Cloudflare ayrıca geçen yılın en etkin botlarını belirledi. Bytedance'a ait Bytespider botu, Cloudflare'ın denetimi altındaki web sitelerinin %40'ına erişmeye çalışmış, OpenAI'in GPTBot'u ise %35'inde denemelerde bulunmuş. Bunlar, Cloudflare'ın ağındaki istek sayısına göre en etkin dört yapay zeka botunun yarısını oluşturmuşlar diğer ikisi ise Amazonbot ve ClaudeBot olmuş.
İçeriğe tamamen ve sürekli olarak erişmeye çalışan yapay zeka botlarını tamamen engellemek oldukça zor bir hal almış durumda. Modelleri daha hızlı oluşturma yarışı, şirketlerin mevcut kuraları atlatma ya da tamamen ihlal etmelerine yol açmış durumda. Perplexity AI, son zamanlarda gerekli izinleri almadan web sitelerinden içerik çekmekle suçlanmıştı. Ancak Cloudflare gibi ölçekte bir arka plan şirketinin, bu davranışa son vermeye çalışmaya ciddi bir şekilde odaklanması bazı sonuçlara yol açabilir.
"İçerik erişimi için kuralları atlamaya çalışan bazı yapay zeka şirketlerinin, bot tespitini atlatma amacıyla sürekli olarak uyum sağlayacağından endişe duyuyoruz," şirket açıklamasında bulundu. "Biz, internetin içerik oluşturucuların gelişmelerine izin verebileceği ve içeriklerinin hangi modellerde eğitildiğini veya çıkarımların hangi modellerde çalıştırıldığını tamamen denetleyebilecekleri bir yer olmaya devam etmek ve bunun için AI Scraper ve Crawler kurallarımıza daha fazla bot engeli eklemeye ve makine öğrenme modellerimizi geliştirmeye devam edeceğiz."
Bu adımlarla, Cloudflare'ın yaptığı bu gelişmelerin internetin geleceği açısından önemli bir adım olduğunu söylemek mümkün. Yapay zeka botlarının erişimine karşı mücadelede atılan bu tür adımların, içerik oluşturucuların haklarına ve internetin sağlıklı bir şekilde gelişmesine katkı sağlayacağına inanıyoruz.