Olasılık ya da Yapay Zekanın Matematiksel Temelleri – I

Modern yapay zeka dalgasının tamamının altında yatan teorik çerçeve istatistiksel öğrenme, dolayısıyla da olasılıktır. Veri bilimi dediklerine pek bakmayın, bir zamanlar “recursion theory” diye bilinen alanın adının “computability” diye değiştirilerek daha geniş kitlelere pazarlanması gibi, bildiğiniz istatistiği boyayıp veri bilimi diye satıyorlar. Bu işler böyle.

İstatistiksel öğrenme kabaca, geçmiş gözlemlere dayanarak çıkarım yapmaktır. Mesela adına $x$ ve $y$ dediğimiz iki sayı olsun ve diyelim ki bu sayılarla ilgili aşağıdaki gözlemleri yaptık:

  • $x=2$ iken $y=7.1$ oluyor,
  • $x=3$ iken $y=9.9$ oluyor,
  • $x=4$ iken $y=13.05$ oluyor,
  • $x=5$ iken $y=16.03$ oluyor.

Şimdi de soruyoruz, eğer $x=7$ olursa $y$ kaç olur? Gözlemlediğimiz verilere bakacak olursa bu iki sayı arasında neredeyse $$y=3x+1$$ gibi bir ilişki var. Bu bazen biraz eksik, bazen biraz fazla ama gözlemlerimizle oldukça uyumlu. Burada sayılara şöyle bir bakarak bulduğumuz şeyin adı tahmin modeli. Sonlu sayıda gözleme bakıp, geriye kalan sonsuz durum hakkında bir tahminde bulunmaya çalışmak nafile bir çaba sanki ama varamasak da yolunda ölürüz diyerek devam edelim.

Geçmişe ait gözlemlerimiz yukarıdaki gibi 4 tanecik değil de 400,000 tane olsaydı, ve aynen yukarıdaki gibi az buçuk farklarla $y=3x+1$ ilişkisini görseydik, bu modele epeyce güvenirdik herhalde. Temel sorular kendiliğinden ortaya çıkıveriyor. Bir tahmin modeline ne kadar güvenebiliriz? Ya $x$ ile $y$ arasındaki ilişki bir yerden sonra sapıtıyorsa? Ya da sapıtmasa bile, tahminimiz bazen biraz az biraz fazla oluyor, bir tahminde bulunduğumuzda yaklaşık ne kadar yanılmayı beklemeliyiz? Bizim ilk bakışta gördüğümüz $y=3x+1$ ilişkisinden daha iyi bir tahmin modeli var mıdır? Ama zaten daha iyi bir tahmin modeli ne demek ki?

Umutsuzca zor bir tahmin sorusu üzerinden yukarıdaki soruları düşünmeye calışalım:

  • İçinde $1, 2, \dots, N$ olarak numaralandırılmış $N$ tane top olan bir torbadan rastgele bir top çektik, 15 numara çıktı. Torbada kaç top vardır?

Soru gerçekten umutsuz, kesin olarak söyleyebileceğimiz tek şey torbada en az 15 top olduğu, doğru cevap 14’ten büyük herhangi bir tamsayı olabilir. Yine de bu soruyu karşısında hemen herkes sağduyulu bir cevap veriyor gördüğüm kadarıyla, 30. En matematik bilmeyenin bile sağduyusu arka planda şu hesabı yapıyor, torbada 30 top olsaydı rastgele çektiğimiz bir topun sayısı ortalamada 15 olurdu. Fikir doğru ama hesapta ufak bir hata var, çünkü $1$’den $30$’a kadar sayıların ortalaması $$\frac{1+ 2 + 3 \dots + 30}{30}=15.5$$ ediyor. Onun yerine torbada 29 top olsaydı bunların ortalaması $$\frac{1+ 2 + 3 \dots + 29}{29}=15$$ olurdu. Sağduyumuzu bu ufak hesapla revize edersek 29 gerçekten oldukça makul bir tahmin. Şimdi bir adım daha atıp bu fikri genelleştirelim:

  • Torbada $N$ tane top olsaydı bunların ortalaması $$\frac{1+ 2 + 3 \dots + N}{N}$$ olurdu. Gauss’a atfedilen meşhur bir hikayeden bildiğimiz gibi $1$’den $N$’ye kadar sayıların toplamı $N(N+1)/2$ olur, demek ki ortalama $(N+1)/2$’dir. Demek ki $k$ numaralı topu çektiysek bu ortalamada $(N+1)/2$ olacağından, $N=2k-1$ tahmininde bulunabiliriz.

Yine bir tahmin modeli bulduk, oldukça da makul görünüyor. Öte yandan bu soruya bambaşka bir şekilde makul olarak yaklaşmak da mümkün:

  • Diyelim 15 numaralı topu çektik. Torbada 15 top olsaydı, 15 numaralı topu çekme ihtimalimiz $1/15$ olurdu. Torbada 16 top olsaydı 15 numaralı topu çekme ihtimalimiz $1/16$ olurdu, ve top sayısı arttıkça bu ihtimaller azalırdı. Demek ki 15 numaralı topu çektiysek torbada 15 top vardır demek gerekir. Genelleştirirsek $k$ numaralı topu çektiysek tahminimiz $N=k$ olmalı.

Buyrun iki tane oldukça makul akıl yürütmelere dayanan iki farklı tahmin modeli. Böyle içinde kaç top olduğu belli olmayan torbadan top çekme gibi saçmalıklar sadece matematikçilerin saçmalıklar diyarında olur, gerçek hayatta ne işimize yarayacak demeyin, bu soru Alman tank problemi olarak bilinir ve 2. Dünya Savaşı’nda ortaya çıkmış gerçek bir sorudur. Diyelim savaşta bir tank ele geçirdiniz üzerindeki seri numarasından hangi fabrikada, hangi ayda üretilen kaçıncı tank olduğunu okuyabiliyorsunuz. Bu fabrikada ayda kaç tank üretiliyordur? Bu soru birebir torbadan top çekme sorusuyla aynıdır, cevabı istatistikçiler bulmuştur, bu da bir sonraki yazının başlangıç noktası olsun.

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*

Şu HTML etiketlerini ve özelliklerini kullanabilirsiniz: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>