KFN HABERLERİ | Yapay Zeka Veri Savaşları Başladı: Reddit, 'Veri Hırsızlığı' Gerekçesiyle Perplexity'ye Dava Açtı!
Yapay zeka devriminin merkezinde yatan "veri" petrolü, teknoloji dünyasının en büyük yasal savaşlarından birini ateşledi. Sosyal medya devi Reddit, popüler yapay zeka "cevap motoru" Perplexity AI'a karşı "endüstriyel ölçekte, yasa dışı" veri hırsızlığı iddiasıyla New York federal mahkemesinde dev bir dava açtı.Bu dava, sadece iki şirket arasındaki bir anlaşmazlık değil; yapay zekanın internetteki "kamuya açık" bilgileri nasıl kullandığı, bu kullanımın etik ve yasal sınırlarının ne olduğu konusunda bir emsal teşkil etme potansiyeline sahip. Reddit, Perplexity'nin yanı sıra, bu veri hırsızlığına aracılık ettiğini iddia ettiği üç veri kazıma (scraping) şirketini de (Litvanya merkezli Oxylabs, Teksas merkezli SerpApi ve "eski bir Rus botnet" olarak tanımlanan AWMProxy) davalı sandalyesine oturttu.
KFN Haberleri olarak, bu davanın perde arkasını, tarafların iddialarını ve internetin geleceği için ne anlama geldiğini detaylıca araştırdık.
Ana İddia: "Veri Aklama Ekonomisi"
Reddit'in davasının temelinde, yapay zeka modellerini eğitmek için gereken devasa miktardaki insan konuşmasına duyulan "açlık" yatıyor. Reddit, platformunun, milyonlarca kullanıcının oluşturduğu bu değerli sohbet arşivi için birincil hedef olduğunu belirtiyor.Şirket, Google ve OpenAI gibi devlerle milyonlarca dolarlık yasal lisans anlaşmaları imzalayarak verilerini kullanıma açmıştı. Ancak Reddit'in iddiasına göre Perplexity, bu yasal ve ücretli yolu seçmek yerine, "çalıntı verileri satın almayı" tercih etti.
Reddit'in baş hukuk sorumlusu Ben Lee, yaptığı açıklamada, "Yapay zeka şirketleri kaliteli insan içeriği için bir silahlanma yarışı içinde ve bu baskı, endüstriyel ölçekte bir 'veri aklama' ekonomisi yarattı," dedi. Dava dosyasına göre Perplexity, Reddit'in kendi sistemindeki veri kazıma karşıtı önlemleri aşmak için bu aracı şirketleri kullandı.
"Suçüstü" Yöntemi: Reddit'in Google Tuzağı
Davanın en çarpıcı detaylarından biri, Reddit'in Perplexity'yi nasıl "tuzağa düşürdüğünü" iddia etmesi.Reddit, platformundaki korumaları aşmanın zor olduğunu bilen Perplexity'nin, dolaylı bir yol geliştirdiğini öne sürüyor: Doğrudan Reddit'i değil, Reddit içeriklerini indexleyen Google arama sonuçlarını kazımak.
Bunu kanıtlamak için Reddit, platformunda sadece Google'ın tarayıcıları tarafından görülebilen, başka hiçbir yerde erişilemeyen gizli bir "test gönderisi" (trap post) oluşturdu. Reddit'in iddiasına göre, bu gizli gönderideki bilgiler kısa bir süre sonra Perplexity'nin yapay zeka cevaplarında ortaya çıktı. Reddit'e göre bu, Perplexity'nin Google arama sonuçlarını yasa dışı bir şekilde kazıdığının ve bu verileri "çaldığının" reddedilemez bir kanıtıydı.
Dahası, Reddit geçen yıl Perplexity'ye bir "durdurma ve vazgeçme" (cease-and-desist) mektubu gönderdikten sonra, Perplexity'nin cevaplarında Reddit kaynaklarına yapılan atıfların "kırk kat" arttığını iddia ediyor.
Perplexity'nin Savunması: "Açık İnternet ve Kamu Bilgisi"
Perplexity AI ise iddiaları şiddetle reddediyor ve Reddit'i "zorbalık taktikleri" uygulamakla suçluyor.Perplexity'den yapılan açıklamada, şirketin bir "uygulama katmanı" şirketi olduğu ve yapay zeka modellerini içerik üzerinde eğitmediği belirtildi. Bu nedenle, Reddit'in talep ettiği gibi bir "eğitim lisansı" imzalamalarının "imkansız" olduğunu savundular.
Perplexity'nin savunması şu temel üzerine kurulu: "Biz, tıpkı insanların birbirleriyle link paylaşması gibi, Reddit tartışmalarını özetliyor ve Reddit başlıklarına atıfta bulunuyoruz."
Şirket, Reddit'in bu dava ile "açık internetin" tam tersi bir yönde hareket ettiğini ve kamuya açık bilgiyi duvarlar arkasına almaya çalıştığını iddia ediyor. Perplexity, "kullanıcıların kamu bilgisine özgürce ve adil bir şekilde erişim hakları için her zaman şiddetle savaşacağını" belirtti.
Sadece Bir Başlangıç: Diğer Davalılar Ne Diyor?
Bu dava, Reddit'in yapay zekaya karşı açtığı ilk savaş değil. Şirket, Haziran ayında da benzer gerekçelerle yapay zeka firması Anthropic'e dava açmıştı. Ancak bu yeni dava, doğrudan "veri kazıma" işini yapan aracıları da hedef almasıyla çok daha geniş kapsamlı.Davalı olan diğer şirketler de iddiaları reddetti:
- Oxylabs: Reddit'in kendileriyle doğrudan temasa geçmemesine "şok olduklarını" belirterek, "Hiçbir şirket, kendisine ait olmayan kamu verileri üzerinde sahiplik iddia etmemelidir," açıklamasını yaptı ve Reddit'i "aynı kamu verilerini şişirilmiş bir fiyata satmaya çalışmakla" suçladı.
- SerpApi: İddiaları "şiddetle reddettiklerini" ve mahkemede kendilerini savunacaklarını bildirdi.
Gelecek Ne Getirecek?
Reddit, bu davada belirsiz bir miktarda parasal tazminat ve Perplexity ile diğer şirketlerin Reddit verilerini izinsiz kullanımını kalıcı olarak engelleyecek bir mahkeme emri talep ediyor.Bu davanın sonucu, "internette kamuya açık" olan bilginin mülkiyetinin kime ait olduğu sorusunu yeniden tanımlayabilir. Bir web sitesinde yayınlanan içeriği özetlemek ve atıfta bulunmak "adil kullanım" mıdır, yoksa bu içeriği kullanarak ticari bir yapay zeka ürünü yaratmak "hırsızlık" mıdır? Mahkemenin vereceği karar, yapay zekanın gelecekteki gelişim rotasını doğrudan etkileyecek.
Peki Siz Bu Konuda Ne Düşünüyorsunuz?