Basit bir istatistik bilgisi ve veri analizi ile Wordle oyununda hile yapılıp yapılmadığını tespit edebilir misiniz? James Dilger sadece bir olasılık hesabı ile Wordle oyunundaki hilecileri yakaladı bizim için de istatistiğin gerçek hayatta nasıl kullanılacağına dair güzel bir örnek oluşturmuş.
Öncelikle Wordle nedir hatırlayalım. 2021 yılında bir Galli yazılım mühendisi tarafından ailesi ve arkadaşları için geliştirildi ve oyunculara, önceki tahminlerdeki doğru harfleri gösteren renk kodlu ipuçları kullanarak altı tahminde beş harflik bir kelime bulma görevi veriyor.
Oyun, Kasım 2021’de yaklaşık doksan oyuncuya sahipti, ardından yıl sonuna gelindiğinde 300,000’e ulaştı ve Ocak 2022’nin ikinci haftasında iki milyonun üzerine çıktı. Ayın sonuna gelindiğinde ise oyun, New York Times tarafından satın alındı ve gazete bu oyunu web sitesinde ücretsiz oynamaya devam ettirdi.
Times, oyunu anlamalarına yardımcı olacak ilginç analizler sunarak kullanıcıların oyunu keşfetmelerini, taktikleri incelemelerini ve diğer oyunculara karşı nasıl performans gösterdiklerini ve gazetenin kendi iç Wordle bilgisayarı olan Wordlebot’a karşı nasıl bir performans sergilediklerini görmelerine yardımcı oldu.
New York Stony Brook Üniversitesi’nden James Dilger, bu analiz sayfasının gösterilen veriden çok daha fazlasını ortaya çıkardığını söylüyor. Birkaç ay boyunca bu verileri inceleyen Dilger, oyuna dair çeşitli içgörüler sunuyor ve bu içgörüler arasında en dikkat çekeni, yaklaşık 10,000 oyuncunun hile yaptığıdır.
Bu sonuçlar, tesadüfi bir keşif sayesinde ortaya çıktı. Her gün, Wordlebot, oyuncuların ilk tahminleri için kullandıkları en popüler kelimeleri gösteriyor, Dilger ise bu verileri zaman içinde analiz etmenin ilginç içgörüler sunabileceğini düşündü ve bunları bir Excel’e kopyalayıp yapıştırdı.
Bu verileri 3 Mayıs ile 31 Ağustos 2023 tarihleri arasında topladı ve ardından ortaya çıkan trendleri analiz etti.
Oyunda 2315 adet kelime bulunuyor (5 yıl boyunca). Bu kelime dağarcığında oyuncunun ilk tahmininde bilme ihtimali 1/2315 yani %0.043. Hatta gerçek olasılık daha düşüktür çünkü çoğu kullanıcı bu kelime listesinin içeriğini tam olarak bilmez gerçek hayatta bundan çok daha fazla kelime vardır.
Ancak Dilger’ın verileri, ilk denemelerinde doğru tahminde bulunan oyuncuların yüzdesinin asla %0.2’nin altına düşmediğini gösteriyor, ki bu da 4000 oyuncuya denk gelir. “Bazı günler %0.5’e kadar çıkıyor (10,000 oyuncu),” diye yakınıyor.
İstatiksel olarak ortalama %0.043 (en fazla) çıkması beklenen sonucun %0.02 yani 5 katı gelmesi hile yapıldığının oldukça net bir göstergesi oluyor.
Bu gruptaki bazı insanların ilk tahmin kelimeleriyle ilgili tuhaf tercihlere dikkat çekiyor: “Hangi ciddi Wordle oyuncusu NANNY’yi (dadı) ilk tahmin olarak seçer ki? Sadece 2 ünlü ve 1 ünsüzü test ediyorsunuz! Ve IGLOO(eskimo kulübesi)? Gerçekten mi?”
Bu çalışma, kelime oyunlarının incelenmesini eğlenceli hale taşıyan ilginç bir çalışmadır. Dilger, “Bu çalışma, Wordle’da hile yapma konusundaki sağlam, nicel kanıtları sunmak için sosyal medya gönderileri, anketler ve Google Trends’in ötesine geçen ilk çalışmadır” diyor ve istatistik ve kelime oyunlarına olan meraklı eğilimini vurguluyor.
Dilger bu analizi manuel bir şekilde en çok tercih edilen kelimeleri kendi excel’ine alarak yapmış. Aslında çok basit bir temele dayanan oldukça kuvvetli ve keyifli bir analiz olmuş. İstatistik ve olasılığın kullanımına da güncel konular üzerinden güzel bir örnek oluşturmuş.