İnternet’te bot, robot kelimesinin kısaltması ve “bir kullanıcı veya başka bir
program için aracı olarak çalışan veya bir insan faaliyetini simüle eden bir
bilgisayar programı” anlamında kullanılıyor. Bu botlar sürüngen gibi sessiz sedasız
gidip, İnternet sitelerinden veri topluyorlar.
Google’un, Microsoft’un ve diğer arama motorlarının tarayıcıları var ve bu
tarayıcılar sitelerin zaman içinde web sitelerinin bağlantılarını tarayarak, hangi
sitenin daha popüler olduğunu bir indeks ile belirliyor. Diğer bir deyişle, İnternet’te
arama motorları için veri toplanması, bir anlamda İnternet’in çalışması için gerekli.
Bu olmazsa, İnternet’te reklamın kimlere verilmesinin yararlı olacağı veya reklama
ne ödeneceği gibi konuların belirlenmesi mümkün değil.
Ama bir de tarayıcılar, botlar, büyük dil modellerinin eğitimleri için veri
topluyorlar. The New York Times’ın ve bazı yazarların hani dava açıp, “ Biz bunları
(örneğin, bu makaleleri) emek ve para harcayarak üretiyoruz. Siz bizden izin
almadan kullanıyorsunuz?” sorusunu sordukları davalar işte bu yüzden açılan
davalar.
CCBot, en büyük yapay zeka veri kümelerinden biri olan Common Crawl’ı besliyor.
Muhtemelen Google’un Bard ve Gemini gibi büyük dil modelleri ön eğitimde
kullanacakları veriyi buradan sağladı. GPTbot ise, ChatGPT ve şu anda en güçlü
yapay zeka modeli olan GPT-4’ün arkasındaki şirket olan OpenAI’ye veri sağlıyor.
Kısaca botlar ile büyük teknoloji şirketlerinin büyük dil modelleri besleniyor. İçerik
oluşturanlar ise, büyük dil modellerinin gıdasını, veriyi oluşturup havasını alıyor.
Büyük teknoloji çok güçlü ve içerik sağlayanların sesleri şimdilik çok cılız çıkıyor.
İsterseniz 2023 Aralık ayı sonunda Başkan Biden’ın yayınladığı, Amerika’nın yapay
zekanın (AI) vaatlerini gerçekleştirmede ve risklerini yönetmede öncülük etmesini
sağlamak için çıkardığı Yönetici Kararnamesi’ne bakın.
Amerika’nın yapay zekada liderliği, bizim gibi yazılar yazan içerik sağlayıcılar
tarafından mı, yoksa anlı şanlı büyük teknoloji şirketleri tarafından mı sağlanabilir…

Elbette bu konuda 2024’de de tartışmalar çıkacak, davalar sürecektir ama daha
önce “Dava Mava” adlı yazımızda da belirttiğimiz gibi, bu yıl turbun büyüğünün
heybede olacağını sanmıyoruz.
Onun için biz de bir içerik sağlayıcısı olduğumuz halde, yazımızın başlığı bu.