Yapay Zeka Sistemlerinin Eğitiminde YouTube Videolarının Kullanımı
Yapay zeka teknolojisinde son dönemde önemli gelişmeler yaşanmaktadır. Bilgisayarlar her geçen gün daha akıllı hale gelmekte ve insanlar gibi düşünebilme yeteneği kazanmaktadır. Ancak bu dinamik gelişim süreci, yapay zeka sistemlerinin büyük veri kaynaklarıyla beslenmesini zorunlu kılmaktadır.
Haberde bahsedildiği üzere bazı teknoloji şirketleri, yapay zeka sistemlerini eğitmek için YouTube videolarından faydalanmış. Dünyanın en büyük video paylaşım platformu olan YouTube, aynı zamanda bol miktarda veriye de ev sahipliği yapıyor. Ancak firmların bu verileri izinsiz alması, YouTube kullanıcılarının gizlilik haklarını ihlal ediyor olabilir.
YouTube’un zengin videoları ve altyazıları, yapay zeka modellerinin doğal dil işleme ve görüntü analizi yeteneklerini geliştirmelerine katkı sağlasa da, veri erişim yöntemlerinin daha şeffaf ve izin temelli olması gerekiyor. Aksi takdirde etik sorunlar yaşanabileceği endişeleri de artıyor.
YouTube İzin Vermediği Halde Videoların Altyazılarının Toplanması
Haberde yer aldığı üzere bazı teknoloji şirketleri, yapay zeka sistemlerini eğitmek için geniş çapta YouTube videolarından alınan altyazıları kullanmış. Araştırmaya göre toplanan veri setinde 170 binin üzerinde video ve 48 binin üzerinde YouTube kanalına ait içerikler olduğu ortaya çıkmıştır.
Ancak YouTube yönetimi, platformdaki videoların izinsiz biçimde altyazılarının toplanmasına sert tepki göstermiştir. Şirketin CEO’su bu uygulamanın güvenlik ve kullanıcı mahremiyetini ihlal eden bir davranış olduğunu ifade etmiştir. Hal böyle olunca firma ve platform arasında etik sorunlar yaşanmış gibi görünüyor.
Verilerin niteliği ve çeşitliliği göz önüne alındığında, firma yöneticilerinin YouTube’dan izin almadan bu kadar büyük çapta içerik toplayıp kullanmaları ciddi bir hataydı. İlerleyen dönemde daha şeffaf ve düzenli yöntemler geliştirilmelidir.
Veri Setindeki Videolar ve Kanalların Profillendirilmesi
Araştırmacılar, toplanan veri setinde yer alan videoların ve kanalların niteliklerini detaylı biçimde incelemişler. İlk izlenimlere göre videolar arasında popüler youtuber’lar ile tanınmış medya kuruluşlarına ait içeriklerin yoğunlukta olduğu fark edilmiştir.
Özellikle MrBeast ve Marques Brownlee isimli youtuber’ların videolarından örneklerin alındığı görülmüştür. Ayrıca uluslararası büyük medya kuruluşları olan ABC News, BBC ve The New York Times’a ait içeriklerinde veri setinde yer aldığı belirlenmiştir.
Araştırmacılar tarafından YouTube üzerinden derlenen verilerin detaylı bir profil çıkarımı yapılarak incelenmesi, firmanın video seçim yöntemlerinin anlaşılmasına yardımcı oldu. Fakat firmanın bu içerikleri izinsiz kullanması, YouTube’un kurallarına aykırılıktı. İleride daha şeffaf yöntemler gerekiyor.
YouTube’un Hizmet Koşullarına Aykırılık İddiaları
Firmanın YouTube videolarından izinsiz olarak büyük miktarda veri toplaması, platformun hizmet koşullarını ihlal ettiği yönünde endişeleri de beraberinde getirmiştir. Nitekim YouTube CEO’su Neal Mohan önceki açıklamalarında, içerik sahiplerinin onayı olmadan videoların kullanılmasının kabul edilemez olduğunu ifade etmiştir.
Platformun gizlilik ilkeleri de veri paylaşımının şeffaf ve izin temelli gerçekleşmesi gerektiği yönündedir. Ancak firmanın yöntemi gizlilik kurallarına uygun değildi. Tüm bunlar düşünüldüğünde, firmanın hareketlerinin YouTube’un hizmet koşullarını ihlal ettiği yönündeki iddialar mahkemede ispatlanabilir nitelikte görünüyor. Bundan sonra daha dikkatli ve şeffaf yaklaşımlar gerekmektedir.
Kullanıcıların ve YouTuber’ların Etkilendiği Araştırmalar
Araştırmanın bir parçası olarak Proof News, bu veri ihlali konusunda kullanıcıların farkındalığını artırmak amacıyla interaktif bir arama aracı geliştirmiştir. Bu araç sayesinde YouTube kullanıcıları ve youtuber’lar, kendi içeriklerinin firma tarafından toplanıp kullanılıp kullanılmadığını kontrol edebilmektedir.
Arama motoru şimdiye kadar binlerce kişi tarafından kullanılmış ve veri setinde onlarca içerik sahibinin yer aldığı anlaşılmıştır. Bu durum hem youtuber’ların hem de basit kullanıcıların mağduriyetlerine dikkat çekmiştir. Firmanın şeffaf olmaması sebebiyle, izinsiz kullanılan içerik yaratıcıları bilgilendirilememişti.
İlerleyen dönemde yapay zeka geliştiricilerinin, tüm tarafların hak ve menfaatlerini göz önünde bulunduran yaklaşımlara ihtiyacı olduğu anlaşılmaktadır.