Tumblr ve WordPress, kullanıcı verilerini yapay zeka şirketleri OpenAI ve Midjourney'e satmak üzere anlaşmalar yapmaya hazırlanıyor. 404 Media'nın raporuna göre, bu platformların ana şirketi Automattic, AI şirketlerinin modellerini eğitmek için veri sağlama konusunda bir anlaşmayı tamamlamak üzere. Hangi verilerin dahil edileceği net olmasa da, rapor Automattic'in başlangıçta öngörülenden fazlasını sunmaya hazır olduğunu öne sürüyor. Tumblr ürün yöneticisi Cyle Gage'den sızdırıldığı iddia edilen bir iç gönderi, Automattic'in anlaşmada yer almaması gereken özel veya ortakla ilgili verileri göndermeye hazırlandığını öneriyor. Tartışmalı içerikler arasında, kamu blog gönderilerindeki özel gönderiler, silinmiş veya askıya alınmış bloglar, cevaplanmamış (dolayısıyla kamuoyuna açıklanmamış) sorular, özel yanıtlar, açık olarak işaretlenmiş gönderiler ve premium ortak bloglarından (örneğin Apple'ın eski müzik sitesi gibi) içerikler yer alıyor.
İç gönderi, Automattic mühendislerinin dışlanması gereken gönderi kimliklerinin bir listesini hazırladığını öne sürüyor. Verilerin AI şirketlerine zaten gönderilip gönderilmediği net değil.
Engadget, rapor hakkında yorum istemek için Automattic'e e-posta gönderdi. Şirket, yayımlanan bir açıklamayla yanıt verdi ve "WordPress.com ve Tumblr'da barındırılan sadece kamu içeriğini, çıkmayı seçmeyen sitelerden paylaşacağız" dedi. Açıklama, yasal düzenlemelerin şu anda AI şirketlerinin web tarayıcılarının kullanıcıların çıkma tercihlerine uymasını gerektirmediğini belirtiyor.
Automattic'in açıklamasının son satırı, rapor edilen anlaşmalarla uyumlu görünüyor. "Seçilmiş AI şirketleriyle, topluluğumuzun önemsediği şeylerle - atıf, çıkma seçenekleri ve kontrol - planları uyumlu olduğu sürece doğrudan çalışıyoruz," diye yazdı Automattic. "Ortaklıklarımız tüm çıkma ayarlarına saygı gösterecek. Ayrıca, yeni çıkan kişileri düzenli olarak ortaklarımıza güncelleyerek geçmiş kaynaklardan ve gelecekteki eğitimlerden içeriklerinin çıkarılmasını talep edeceğiz."
Şirketin Çarşamba günü kullanıcıların verilerinin AI şirketleri dahil üçüncü taraflar tarafından eğitimde kullanılmasını engellemeyi vaat eden yeni bir çıkma aracı başlatmayı planladığı bildiriliyor. 404 Media, araç için Automattic tarafından hazırlanan iddia edilen bir iç SSS'yi inceledi ve "Başlangıçta çıkarsanız, sitenizi yasaklı listeye ekleyerek tarayıcıların içeriğinize erişimini engelleyeceğiz. Fikrinizi daha sonra değiştirirseniz, yeni çıkan kişileri de güncelleyerek geçmiş kaynaklardan ve gelecekteki eğitimlerden içeriklerinin çıkarılmasını ortaklarımızdan talep edeceğiz" yanıtını içeriyor.
AI şirketlerinden verilerin kaldırılmasını "istemek" olarak tanımlayan ifadeleme dikkat çekiyor.
Automattic'in AI başkanı Andrew Spittle'in, aracı kullanırken veri silme güvenceleri hakkında bir personel sorusuna yanıt olarak hazırladığı iddia edilen bir iç belge, "Mevcut ortaklarımızı düzenli aralıklarla çıkan herkes hakkında bilgilendireceğiz. Bu sürecin, mevcut tercihlere dayanarak geçmiş içeriğin dışlanması için düzenli olarak savunma yapmamızı sağlayan sürekli bir süreç olmasını istiyorum. İçeriğin silinmesini ve gelecekteki eğitim çalışmalarından çıkarılmasını talep edeceğiz. Şu ana kadar yaptığımız görüşmelere dayanarak ortaklarımızın bunu onurlandıracağına inanıyorum. Bunu saklamalarının onlara genel olarak çok şey kazandırmayacağını düşünüyorum."
Yani, bir Tumblr veya WordPress kullanıcısı AI eğitiminden çıkmayı talep ederse, Automattic "isteyecek" ve "savunacak". Ve şirketin AI şefi, AI şirketlerinin "şu ana kadarki konuşmalarımıza dayanarak" bunun kendi çıkarlarına uygun olduğunu düşünüyor. (Bu ne kadar güvence!)
AI veri eğitim anlaşmaları, bugünkü kaygan çevrimiçi yayıncılık manzarasında suda yüzmeye çalışan web siteleri için kazançlı bir fırsat haline geldi. (Tumblr'ın personeli, 2023'ün sonlarında iddia edildiği üzere bir iskelet ekibine indirildi.) Geçen hafta, Google, platformun geniş kullanıcı oluşturulan içerik bilgi tabanında eğitim yapmak üzere Reddit ile (sonraki halka arzından önce) bir anlaşma yaptı. Bu arada, OpenAI geçen yıl AI modellerini eğitmek için üçüncü taraflardan veri setleri toplamak üzere bir ortaklık programı başlattı.
Güncelleme, 29 Şubat 2024: Bu haber, WordPress ve Tumblr'ın ana şirketi Automattic'ten alınan bir açıklama eklenerek güncellendi.