Olasılık ya da Yapay Zekanın Matematiksel Temelleri – 4

Bir önceki yazının linki şöyle dursun.

Tahmin modellerimizin hikayesinde şu ana kadar $T_2(k)=k$ modeli, $T_1(k)=2k-1$ modelini iki kez yendi. Şimdi ne yapıp edip $T_1$’i kazandırmam lazım yoksa hikaye heyecanını yitirmeye başlayacak.

 

Soruya bir de şöyle bakalım: Modellerimizin yaptığı tahminler, üstünde bir kontrolümüzün olmadığı rastgele bir sürece (torbadan çektiğimiz topun numarası) bağlı olarak değişiyor. Dolayısıyla bu sürece dayanarak ürettikleri sonuçların ortalamasına bakıp, bu ortalamalardan hangisi gerçek sonuca yakınsa modelleri buna gerçeğe yakınlıkla karşılaştırabiliriz. Daha evvel hataların ortalamalarına bakmıştık, şimdi de ortalama tahminlerin hatasına bakacağız. Diyelim $N=10$, yapalım tablomuzu.

k Torbadan k çekme ihtimali T1 T2
1 1 / 10 1 1
2 1 / 10 3 2
3 1 / 10 5 3
4 1 / 10 7 4
5 1 / 10 9 5
6 1 / 10 11 6
7 1 / 10 13 7
8 1 / 10 15 8
9 1 / 10 17 9
10 1 / 10 19 10
Ortama Tahmin 10 5,5

Torbadan çıkacak sonuçların hepsi (1’den 10’a kadar sayılar) $1/10$ olasılıkla gerçekleşiyor. Demek ki ortalama tahminleri $T_1$ ve $T_2$ için sırasıyla $$1\frac{1}{10}+3\frac{1}{10}+\cdots+19\frac{1}{10}=10, \\ 1\frac{1}{10}+2\frac{1}{10}+\cdots+10\frac{1}{10}=5,5$$ olarak buluruz. Aha! $T_1$’in tahminlerinin ortalaması tam da gerçeğe eşit çıkarken ama $T_2$’nin ortalaması gerçekten çok daha küçük çıktı.

 

Bu hesap sadece $N=10$ durumunda değil her zaman böyle olur. Hesap kitabı bu yazı dizisine uymaz ama konuyu daha iyi anlamak için önemlidir. İstatistiğin en merkezi kavramlarından birisi sonucu rastgele sayılar olan bir sürecin ortalama değeri desem abartmış olmam. Mesela zar attık, sonuç ortalama kaç gelir? Aynı yukarıdaki hesaplar gibi, her bir sonucu gelme ihtimaliyle çarpıp toplarsak $$ 1\frac{1}{6}+2\frac{1}{6}+\cdots+6\frac{1}{6}=3,5$$ olarak buluruz. Hatırlayın MSE (ortalama hata kareleri toplamı) hesabı yaparken de, hata karelerini, bu hatanın oluşması ihtimaliyle çarpıp toplamıştık.

Artık dördüncü yazıya geldik, adını koyalım. Sonuçlarını kesin değil bir olasılıklar silsilesi olarak bildiğimiz sayısal değişkenlere rastgele değişken denir. Misal, bir zar atma deneyinin sonucu rastgele bir değişkendir. Her bir sonuç $1/6$ olasılıkla gerçekleşir. Ama illa böyle olacak diye bir şey yok, belki benim zarım hileli ve

  • 0.1 ihtimalle 1 geliyor,
  • 0.1 ihtimalle 2 geliyor,
  • 0.1 ihtimalle 3 geliyor,
  • 0.2 ihtimalle 4 geliyor,
  • 0.2 ihtimalle 5 geliyor,
  • 0.3 ihtimalle 6 geliyor.

Bu zarı atma deneyinini sonucu da bir rastgele değişken. Bu rastgele değişkenin aldığı ortalama değer normal zardan tabii ki farklı çünkü sonuçların olasılıkları farklı: $$ 1(0.1)+2(0.1)+3(0.1)+4(0.2)+5(0.2)+6(0.3)= \\ 0.1 + 0.2 + 0.3 + 0.8 + 1 + 1.8= 4.2$$

Bir rastgele değiken alalım, $X$ olsun. Bu değişkenin alabileceği değerler $x_1, x_2, \dots, x_n$ ve bu sırasıyla bu değerlerin çıkma olasılıkları $p_1, p_2, \dots, p_n$ olsun, buna da bir olasılık dağılımı denir. Bu sonuçları, gerçekleşmesi olasılıklarıyla çarpıp toplayarak ortalama değerini buluruz. Buna bazen değişkenin beklentisi de denir. İngilizceleri, mean ve expected value. Nerede kullandığımıza, ve ne kadar havalı görünmek istediğimize bağlı olarak aşağıdaki gibi gösterilir ve hesaplanır:

$$E(X)= x_1p_1+x_2p_2+\cdots+x_np_n \\ \mu_X= \sum_{i=1}^nx_ip_i$$

Bizim soruya dönecek olursak, rastgele değişkenimiz

  • $X=$ Torbadan çektiğimiz topun numarası.

Bu değişkenin olası sonuçları, torbada $N$ top varken $1$’den $N$’ye kadar sayılar ve her bir sonucun olasılığı $1/N$. Bu dizinin önceki yazılarından birisinde aslında hesabını yapmıştık $E(X)=(N+1)/2$ olur. Tabii, bizim bir de tahmin modellerimiz var, bu modeller girdiye bağlı olarak net sonuçlar veriyor ama girdiler rastgele. Dolayısıyla $X$’e bağlı olarak yaptığımız tahminler de birer rastgele değişken. Biz yukarıda aslında bu iki rastgele değişkenin beklentisini hesapladık: $$ E(T_1(X))=N, \\ E(T_2(X))=\frac{N+1}{2}$$ oluyor, ve buradan $T_1$ gerçeği daha iyi biliyor diyebiliriz.

Azıcık çıtlatıp gerisini getirmediğim Alman Tankı hikayesine doğru gidiyoruz, geleceğiz de, ama sanırım bir yazı daha var arada.

 

 

 

 

Bir Cevap Yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir

*

Şu HTML etiketlerini ve özelliklerini kullanabilirsiniz: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>