Anthropic’in “Project Panama” diye adlandırılan planı kapsamında milyonlarca kitap fiziksel olarak satın alındı ve yapay zeka eğitiminde kullanıldıktan sonra parçalandı.
Yapay zeka girişimi Anthropic’in 2024 başında başlattığı ve kamuoyundan gizli tutmaya çalıştığı kapsamlı proje, bir telif hakkı davası kapsamında kamuoyuna açılan belgelerle gün yüzüne çıktı.
Şirketin iç yazışmalarında “Project Panama” diye adlandırılan plan, dünya üzerindeki kitapların büyük bölümünü fiziksel olarak taramayı hedefliyordu.
Geçen hafta mahkeme kayıtlarının gizlilikten çıkarılmasıyla ortaya çıkan bir iç planlama belgesinde şu ifade yer aldı: “Project Panama, dünyadaki tüm kitapları yıkıcı biçimde tarama çabamızdır. Bu proje üzerinde çalıştığımızın bilinmesini istemiyoruz.”
MİLYONLARCA DOLAR HARCANDI
Washington Post’un yayınladığı mahkeme belgelerine göre Anthropic, yaklaşık bir yıl içinde milyonlarca dolar harcayarak milyonlarca kitabı satın aldı, kitapların ciltlerini kesti ve sayfalarını tarayarak Claude dil modellerini eğitmek için kullandı.
Daha önce kamuoyuna yansımayan Project Panama’ya ilişkin ayrıntılar, kitap yazarlarının Anthropic’e açtığı telif hakkı davasında yer alan 4 bin sayfalık belgede ortaya çıktı. Yatırımcılar tarafından 183 milyar dolar değer biçilen şirket, ağustos ayında davayı 1,5 milyar dolar ödeyerek uzlaşmayla sonuçlandırmıştı. Ancak geçen hafta bir federal yargıcın dosyaları gizlilikten çıkarması, Anthropic’in kitaplara yönelik agresif veri toplama çabasını ayrıntılarıyla ortaya koydu.
Bu belgeler, Meta, Google ve OpenAI gibi diğer büyük teknoloji şirketlerine açılan benzer davalardaki kayıtlarla birlikte, yapay zeka şirketlerinin yazılımlarını “eğitmek” için devasa veri yığınlarını elde etmek uğruna ne kadar ileri gittiklerini gösteriyor.
“KİTAPLAR ALTIN MADENİYDİ”
Mahkeme kayıtlarına göre kitaplar, yapay zeka şirketleri için kritik bir kaynak olarak değerlendiriliyordu. Ocak 2023 tarihli bir belgede Anthropic’in kurucu ortaklarından biri, kitaplarla eğitilen modellerin “düşük kaliteli internet dili”ni taklit etmek yerine “iyi yazmayı öğrenebileceğini” savundu.
Meta içinden 2024’te gönderilen bir e-postada ise dijital kitap arşivlerine erişim, rakip yapay zeka şirketleriyle rekabet edebilmek için “hayati” olarak nitelendirilmişti.
Ancak belgeler, şirketlerin yayıncılardan ve yazarlardan doğrudan izin almayı pratik bulmadığını gösteriyor. Davalara göre Anthropic, Meta ve diğerleri, kitapları yazarların bilgisi olmadan toplu şekilde elde etmenin yollarını aradı; buna korsan kopyaların indirilmesi de dahil.
Meta çalışanlarının, milyonlarca kitabın izinsiz indirilmesinin telif hakkı ihlali olabileceğine dair çalışanları defalarca uyardığı da belgelerde yer aldı. Aralık 2023 tarihli bir e-postada, bu uygulamanın “MZ’ye yapılan bir eskalasyonun ardından” onaylandığı belirtildi. “MZ”nin Meta CEO’su Mark Zuckerberg’e atıf olduğu düşünülüyor.
LIBGEN İNDİRMELERİ
Yeni açıklanan bir mahkeme belgesine göre Anthropic kurucu ortağı Ben Mann, Haziran 2021’de LibGen adlı korsan kütüphaneden 11 gün boyunca kurgu ve kurgu dışı kitaplar indirdi. Dosyalara giren ekran görüntülerinde Mann’ın dosya paylaşım yazılımı kullandığı görülüyor.
Anthropic ise mahkemeye sunduğu savunmada, LibGen verilerinin gelir getiren ticari modellerin eğitiminde kullanılmadığını belirtti.
MAHKEMELER NE DİYOR?
Google, Microsoft ve OpenAI da benzer telif hakkı davalarıyla karşı karşıya. Davaların çoğu sürerken, iki erken kararda yargıçlar, kitapların yapay zeka eğitimi için kullanılmasının bazı durumlarda telif hukukundaki “adil kullanım” kapsamında yasal olabileceğine hükmetti.
Haziran ayında Yargıç William Alsup, Anthropic’in kitapları “dönüştürücü” biçimde kullandığını belirterek, süreci öğretmenlerin öğrencilere yazı öğretmesine benzetti. Aynı dönemde Meta davasına bakan Yargıç Vince Chhabria, yazarların Meta’nın yapay zeka modellerinin kitap satışlarına zarar verdiğini kanıtlayamadığına hükmetmişti.
Ancak şirketler, kitapları nasıl edindikleri tartışması nedeniyle yine de suçlamalarla karşı karşıya kalabiliyor. Anthropic’in milyonlarca korsan kitabı ücretsiz indirerek saklamasının telif ihlali oluşturabileceğine karar verildi.
Bu nedenle yargıç, Anthropic’in LibGen gibi gölge kütüphanelerden indirdiği kitaplar için yazarların toplu dava açmasına izin verdi. Şirket ise suçu kabul etmeksizin 1,5 milyar dolar ödeme yapmayı kabul etti. Yazarlar, kitap başına yaklaşık 3 bin dolar talep edebilecek.
O KADAR KİTABI NASIL ALDILAR?
Belgelere göre şirket, kitapları kütüphanelerden veya ikinci el kitapçılardan temin etmeyi değerlendirdi. Belgelerde New York’taki ünlü Strand Kitabevi’nin de seçenekler arasında olduğu görülüyor, ancak Strand kitap satışı yapılmadığını açıkladı.
Anthropic sonunda milyonlarca kitabı, genellikle on binlerce kitaplık partiler hâlinde satın aldı. Tarama sürecinde kitapların hidrolik makinelerle kesildiği, sayfaların yüksek hızlı tarayıcılarla dijitalleştirildiği ve ardından kitapların geri dönüşüme gönderildiği belirtiliyor.