{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# AST416 Astronomide Sayısal Çözümleme - II #\n", "## Ders - 05 Model Karşılaştırması ve En İyi Modelin Seçimi ##" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Doç. Dr. Özgür Baştürk
\n", "Ankara Üniversitesi, Astronomi ve Uzay Bilimleri Bölümü
\n", "obasturk at ankara.edu.tr
\n", "http://ozgur.astrotux.org" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Bu derste neler öğreneceksiniz?#\n", "## Model Karşılaştırması ve En İyi Modelin Seçimi ##\n", "\n", "* [Merkezi Limit Teoremi](#Merkezi-Limit-Teoremi)\n", "* [Hipotez Testi](#Hipotez-Testi)\n", " * [Örnek: CoVid 19 aşısı](#Örnek:-CoVid-19-aşısı)\n", " * [Güven Aralığı ve Güven Düzeyi](#Güven-Aralığı-ve-Güven-Düzeyi)\n", " * [Örnek: Gaia Paralaksları](#Örnek:-Gaia-Paralaksları)\n", " * [p Değeri](#p-Değeri)\n", " * [Örnek:-p Değeri](#Örnek:-p-Değeri)\n", " * [Hipotez Testinde Tip I ve Tip II Hataları](#Hipotez-Testinde-Tip-I-ve-Tip-II-Hataları)\n", " * [İstatistiksel Anlamlılık Seviyesi](#İstatistiksel-Anlamlılık-Seviyesi)\n", "* [t Dağılımı](#t-Dağılımı)\n", " * [Örnek:-Gaia Paralaksları-t-dağılımı-Yaklaşımı](#Örnek:-Gaia-Paralaksları-t-dağılımı-Yaklaşımı)\n", "* [Serbestlik Derecesi](#Serbestlik-Derecesi)\n", "* [Model ve Artıkları](#Model-ve-Artıkları)\n", " * [Artıklarda Değişen Varyans](#Artıklarda-Değişen-Varyans)\n", "* [Bir Modelin Başarımına İlişkin Parametreler](#Bir-Modelin-Başarımına-İlişkin-Parametreler)\n", " * [Gecikme Grafikleri](#Gecikme-Grafikleri)\n", " * [Gecikme Grafikleriyle Model Uygunluğu Testi](#Gecikme-Grafikleriyle-Model-Uygunluğu-Testi)\n", " * [Çapraz Korelasyon ve Otokorelasyon](#Çapraz-Korelasyon-ve-Otokorelasyon)\n", " * [Verinin Rastgeleliğinin Testi](#Verinin-Rastgeleliğinin-Testi)\n", " * [Dönemli Değişimlerin Gecikme Grafikleri](#Dönemli-Değişimlerin-Gecikme-Grafikleri)\n", " * [Gecikme Grafiklerinde Aykırı Değer Yakalama](#Gecikme-Grafiklerinde-Aykırı-Değer-Yakalama)\n", "* [Durbin Watson İstatistiği İle Model Başarımı Testi](#Durbin-Watson-İstatistiği-İle-Model-Başarımı-Testi)\n", "* [$\\chi^2$ Dağılımı ve $\\chi^2$ Testi](#$\\chi^2$-Dağılımı-ve-$\\chi^2$-Testi)\n", " * [Örnek: $\\chi^2$ Testi](#Örnek:-$\\chi^2$-Testi)\n", " * [$\\chi^2$ Testinin İki Örnek Dağılımın Aynı Dağılımdan Türeyip Türemediğinin Kontrolü için Kullanılışı](#$\\chi^2$-Testinin-İki-Örnek-Dağılımın-Aynı-Dağılımdan-Türeyip-Türemediğinin-Kontrolü-için-Kullanılışı) \n", " * [Özet: $\\chi^2$ Testi](#Özet:-$\\chi^2$-Testi)\n", " * [Testin Uygulanışı](#Testin-Uygulanışı)\n", " * [Örnek: Doğru Uyumlama](#Örnek:-Doğru-Uyumlama)\n", "* [F Dağılımı ve F Testi](#F-Dağılımı-ve-F-Testi)\n", " * [Örnek 1: F Testi](#Örnek-1:-F-Testi)\n", " * [Örnek 2: Model Karşılaştırması İçin F Testi](#Örnek-2:-Model-Karşılaştırması-İçin-F-Testi)\n", "* [Varyans Analizi ANOVA](#Varyans-Analizi-ANOVA)\n", " * [Örnek Varyans Analizi](#Örnek-Varyans-Analizi)\n", "* [Akaike Bilgi Kriteri](#Akaike-Bilgi-Kriteri)\n", " * [Örnek: Akaike Bilgi Kriteriyle Model Karşılaştırması](#Örnek:-Akaike-Bilgi-Kriteriyle-Model-Karşılaştırması)\n", "* [Bayesian Bilgi Kriteri](#Bayesian-Bilgi-Kriteri)\n", "* [Kaynaklar](#Kaynaklar)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Merkezi Limit Teoremi #\n", "\n", "Olasılık teorisinde, Merkezi Limit Teoremi (ing. Central Limit Theorem, CLT), herhangi bir rastgele değişenin kendisi normal dağılıyor olması dahi, o rastgele değişenin olası tüm değerlerinden oluşturulan çok sayıdıa örnekleminin ortalamalarının (bu örneklemlerin kendisi de normal dağılmak zorunda değildir) normal dağılacağını söyler. Teorem olasılık teorisinde büyük önem taşır. Çünkü teoremden normal dağılımlar için geçerli olasılıksal ve istatistiksel yöntemlerin diğer dağılım türlerini de içeren birçok probleme uygulanabileceği sonucu çıkarılabilir. Diyelim ki seçilmiş 1000 Sefeid türü değişenin zonklama dönemleri normal dağılmıyor olabilir. Ancak çok sayıda (örneğin 100'er tane) Sefeid içeren çok sayıda örneklemin (örneğin 100 küresel kümenin) ortalama zonklama dönemlerinin dağılımına bakıldığında normal dağılım gösterdikleri görülür. Normal dağılım ve örnek için [bkz.](http://ozgur.astrotux.org/ast416/Ders_02/Ders02b_Temel_Istatistiksel_Kavramlar_Dagilimlar.html#Normal-Da%C4%9F%C4%B1l%C4%B1m-ve-Gauss-Fonksiyonu)\n", "\n", "Bir örnekle merkezi limit teoremini görselleştirerek anlamaya çalışalım. Pek çok sınıfa aynı anda uygulanan bir sınav düşünelim. Sınavda alınan notların sınıflar içinde ve sınıflarının ortalamasının da genelde nasıl dağıldığına bakalım. Öncelikle 50 öğrenciden oluşan bir sınıf için `numpy.randint()` fonksiyonuyla rastgele belirlenmiş sınav notlarından oluşan bir örneklem oluşturalım." ] }, { "cell_type": "code", "execution_count": 1, "metadata": { "scrolled": true }, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[45 51 52 48 49 51 45 55 40 56 41 52 47 53 68 46 65 58 60 45 58 60 51 68\n", " 50 68 69 54 58 44 63 63 49 57 63 40 62 53 49 49 47 69 62 65 41 40 68 57\n", " 48 64]\n", "Sinif ortalamasi: 54.32\n", "Standart sapmasi: 8.65\n" ] } ], "source": [ "import numpy as np\n", "# rastgele sinav notunu ayni degerleri verecek sekilde\n", "# ayarlayalim (seed edelim)\n", "np.random.seed(1)\n", "# notlarin tamsayi oldugunu varsayarak 50 rastgele\n", "# notu 40 ile 70 arasinda olusturalim. \n", "notlar = np.random.randint(40, 70, 50)\n", "print(notlar)\n", "print('Sinif ortalamasi: {:.2f}'.format(notlar.mean()))\n", "print('Standart sapmasi: {:.2f}'.format(notlar.std()))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Sınıf içindeki not dağılımını yukarıda gördük; bir de histogramına bakalım." ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "from matplotlib import pyplot as plt\n", "# sinif ici not dagilimi\n", "plt.hist(notlar)\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Hiç de normal dağılıyormuş gibi görünmüyor. Nitekim [`numpy.random.randint()`](https://docs.scipy.org/doc/numpy-1.15.0/reference/generated/numpy.random.randint.html) sınırları verilen (örneğimizde 40 ve 70) bir tekdüze dağılımdan istenen büyüklükte (örneğimizde 50) bir rastgele örneklem oluşturur. Şimdi örneklem sayısını 1 sınıftan 1000 sınıfa çıkaralım ve sınıfların ortalamasının nasıl dağıldığna bakalım." ] }, { "cell_type": "code", "execution_count": 3, "metadata": {}, "outputs": [ { "data": { "image/png": "iVBORw0KGgoAAAANSUhEUgAAAXoAAAD8CAYAAAB5Pm/hAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADl0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uIDMuMC4zLCBodHRwOi8vbWF0cGxvdGxpYi5vcmcvnQurowAADydJREFUeJzt3WuMXHd9xvHvA4ZUCregOK7rWHVUmUv6ooZuUyRKG0oFubR1UlQrEQJzUU3bpAUpFXWoBKlQJCNuKlUbZEREqCCQKkmJ5JQmRKSIF0nYoBCchAgXHMXGsU25BaGC7Pz6Yk7I4Ozs7M7u5Oz+8/1IoznzP+fMeTyeffbMmTOzqSokSe16Rt8BJEnTZdFLUuMseklqnEUvSY2z6CWpcRa9JDVubNEn2ZjkS0nuT3Jfknd041ckOZjknu5y3tA6lyfZl+TBJK+b5j9AkjS/jDuPPsl6YH1VfS3Jc4G7gQuAbcBPquqDJyx/JnAtcBbwa8AXgRdV1fEp5JckjTF2j76qDlXV17rpR4EHgA3zrLIV+GxV/ayqvgPsY1D6kqQerFnMwkk2AS8D7gReCVya5E3ALHBZVf2AwS+BO4ZWO8AcvxiS7AB2AJx88sm//ZKXvGSC+JL09HX33Xd/r6rWjltuwUWf5DnA9cA7q+rHSa4C3gdUd/0h4K0Lvb+q2g3sBpiZmanZ2dmFripJApI8tJDlFnTWTZJnMSj5T1fVDQBVdbiqjlfVY8DHeeLwzEFg49Dqp3djkqQeLOSsmwCfAB6oqg8Pja8fWuxCYG83fRNwUZKTkpwBbAbuWr7IkqTFWMihm1cCbwS+keSebuzdwMVJtjA4dLMfeDtAVd2X5DrgfuAYcIln3EhSf8YWfVV9Bcgcs26eZ50rgSuXkEuStEz8ZKwkNc6il6TGWfSS1DiLXpIaZ9FLUuMW9RUI0tPRpp17etnu/l3n97Jdtcc9eklqnEUvSY2z6CWpcRa9JDXOopekxln0ktQ4i16SGmfRS1LjLHpJapxFL0mNs+glqXEWvSQ1zqKXpMZZ9JLUOItekhpn0UtS4yx6SWqcRS9JjbPoJalxFr0kNc6il6TGWfSS1DiLXpIaZ9FLUuMseklqnEUvSY2z6CWpcRa9JDXOopekxo0t+iQbk3wpyf1J7kvyjm78hUluTfKt7vqUbjxJPppkX5J7k7x82v8ISdJoC9mjPwZcVlVnAq8ALklyJrATuK2qNgO3dbcBzgU2d5cdwFXLnlqStGBrxi1QVYeAQ930o0keADYAW4Gzu8WuAW4H/r4b/1RVFXBHkhckWd/djzSRTTv39B1BWrUWdYw+ySbgZcCdwLqh8n4EWNdNbwAeHlrtQDd24n3tSDKbZPbo0aOLjC1JWqgFF32S5wDXA++sqh8Pz+v23msxG66q3VU1U1Uza9euXcyqkqRFWFDRJ3kWg5L/dFXd0A0fTrK+m78eONKNHwQ2Dq1+ejcmSerBQs66CfAJ4IGq+vDQrJuA7d30duDzQ+Nv6s6+eQXwI4/PS1J/xr4ZC7wSeCPwjST3dGPvBnYB1yV5G/AQsK2bdzNwHrAP+CnwlmVNLElalIWcdfMVICNmv2aO5Qu4ZIm5JEnLxE/GSlLjLHpJapxFL0mNs+glqXEWvSQ1zqKXpMZZ9JLUOItekhpn0UtS4yx6SWqcRS9JjbPoJalxFr0kNc6il6TGWfSS1DiLXpIaZ9FLUuMseklqnEUvSY2z6CWpcRa9JDXOopekxln0ktQ4i16SGrem7wCS5rZp555etrt/1/m9bFfT4x69JDXOopekxln0ktQ4i16SGmfRS1LjLHpJapxFL0mNs+glqXEWvSQ1bmzRJ7k6yZEke4fGrkhyMMk93eW8oXmXJ9mX5MEkr5tWcEnSwixkj/6TwDlzjH+kqrZ0l5sBkpwJXAT8ZrfOvyZ55nKFlSQt3tiir6ovA99f4P1tBT5bVT+rqu8A+4CzlpBPkrRESzlGf2mSe7tDO6d0YxuAh4eWOdCNPUmSHUlmk8wePXp0CTEkSfOZtOivAn4D2AIcAj602Duoqt1VNVNVM2vXrp0whiRpnImKvqoOV9XxqnoM+DhPHJ45CGwcWvT0bkyS1JOJij7J+qGbFwKPn5FzE3BRkpOSnAFsBu5aWkRJ0lKM/cMjSa4FzgZOTXIAeC9wdpItQAH7gbcDVNV9Sa4D7geOAZdU1fHpRJckLcTYoq+qi+cY/sQ8y18JXLmUUJKk5eMnYyWpcRa9JDXOopekxln0ktQ4i16SGmfRS1LjLHpJapxFL0mNs+glqXEWvSQ1buxXIEjDNu3c03cESYvkHr0kNc6il6TGWfSS1DiLXpIaZ9FLUuMseklqnEUvSY2z6CWpcRa9JDXOopekxln0ktQ4i16SGmfRS1LjLHpJapxFL0mNs+glqXEWvSQ1zqKXpMZZ9JLUOItekhpn0UtS4yx6SWqcRS9JjbPoJalxY4s+ydVJjiTZOzT2wiS3JvlWd31KN54kH02yL8m9SV4+zfCSpPEWskf/SeCcE8Z2ArdV1Wbgtu42wLnA5u6yA7hqeWJKkiY1tuir6svA908Y3gpc001fA1wwNP6pGrgDeEGS9csVVpK0eJMeo19XVYe66UeAdd30BuDhoeUOdGNPkmRHktkks0ePHp0whiRpnCW/GVtVBdQE6+2uqpmqmlm7du1SY0iSRlgz4XqHk6yvqkPdoZkj3fhBYOPQcqd3Y5JWiU079/S27f27zu9t2y2bdI/+JmB7N70d+PzQ+Ju6s29eAfxo6BCPJKkHY/fok1wLnA2cmuQA8F5gF3BdkrcBDwHbusVvBs4D9gE/Bd4yhcySpEUYW/RVdfGIWa+ZY9kCLllqKEnS8vGTsZLUOItekhpn0UtS4yx6SWqcRS9JjbPoJalxFr0kNc6il6TGWfSS1DiLXpIaZ9FLUuMseklqnEUvSY2z6CWpcRa9JDVu0j8lqB71+afeJK0+7tFLUuMseklqnEUvSY2z6CWpcRa9JDXOopekxln0ktQ4i16SGmfRS1LjLHpJapxFL0mNs+glqXEWvSQ1zqKXpMZZ9JLUOItekhpn0UtS4yx6SWrckv6UYJL9wKPAceBYVc0keSHwOWATsB/YVlU/WFpMSdKklmOP/tVVtaWqZrrbO4HbqmozcFt3W5LUk2kcutkKXNNNXwNcMIVtSJIWaKlFX8AtSe5OsqMbW1dVh7rpR4B1c62YZEeS2SSzR48eXWIMSdIoSzpGD/xeVR1Mchpwa5JvDs+sqkpSc61YVbuB3QAzMzNzLiPp6WXTzj29bHf/rvN72e5TZUl79FV1sLs+AtwInAUcTrIeoLs+stSQkqTJTVz0SU5O8tzHp4HXAnuBm4Dt3WLbgc8vNaQkaXJLOXSzDrgxyeP385mq+kKSrwLXJXkb8BCwbekxJUmTmrjoq+rbwG/NMf6/wGuWEkqStHz8ZKwkNc6il6TGWfSS1DiLXpIaZ9FLUuMseklqnEUvSY2z6CWpcRa9JDXOopekxln0ktQ4i16SGmfRS1LjLHpJapxFL0mNs+glqXEWvSQ1zqKXpMZZ9JLUOItekho38R8HF2zauafvCJI0lnv0ktQ4i16SGmfRS1LjPEYv6Wmvz/fb9u86f+rbcI9ekhpn0UtS4yx6SWqcRS9JjbPoJalxFr0kNc6il6TGWfSS1LhV/4Epv1hMkubnHr0kNW5qRZ/knCQPJtmXZOe0tiNJmt9Uij7JM4F/Ac4FzgQuTnLmNLYlSZrftPbozwL2VdW3q+rnwGeBrVPaliRpHtN6M3YD8PDQ7QPA7w4vkGQHsKO7+ZMkD04py6nA96Z038ttNWWF1ZXXrNOxmrLCCsyb94+ctZCsv76QbfR21k1V7QZ2T3s7SWaramba21kOqykrrK68Zp2O1ZQVVlfe5cw6rUM3B4GNQ7dP78YkSU+xaRX9V4HNSc5I8mzgIuCmKW1LkjSPqRy6qapjSS4F/gt4JnB1Vd03jW0twNQPDy2j1ZQVVldes07HasoKqyvvsmVNVS3XfUmSViA/GStJjbPoJalxq/5LzU6UZD/wKHAcOFZVM0n+HLgCeClwVlXN9pfwCSOyfgD4E+DnwP8Ab6mqH/aXcmBE1vcx+CDcY8AR4M1V9d3+Ug7MlXVo3mXAB4G1VbUizqce8dheAfwFcLRb7N1VdXM/CZ8w6rFN8jfAJd34nqp6V28hOyMe188BL+4WeQHww6ra0lPEXxiRdQvwMeBXgGPAX1fVXRNtoKqaugD7gVNPGHspg//c24GZvjOOyfpaYE03/X7g/X3nnCfr84am/xb4WN85R2XtxjcyOEHgobnmr6S8DHZM/q7vbAvM+mrgi8BJ3e3T+s453/NgaP6HgPf0nXOex/UW4Nxu+jzg9knv/2lx6KaqHqiqaX3ydllV1S1Vday7eQeDzyCsSFX146GbJwMr/Z39jwDvYuXnXG3+CthVVT8DqKojPecZK0mAbcC1fWeZRwHP66afD0z8arnFoi/gliR3d1+zsJKNy/pW4D+f4kyjzJk1yZVJHgbeALynt3S/7ElZk2wFDlbV1/uNNqdRz4NLk9yb5Ookp/QV7gRzZX0R8Kokdyb57yS/02O+YfP9fL0KOFxV3+oh11zmyvpO4APdz9cHgcsnv/cV8LJlmV8CbeiuTwO+Dvz+0LzbWVmHbubL+g/AjXSnwPZ9mS9rN3458I995xyVFbgTeH43vp+VdehmrrzrGHwG5RnAlQw+i7JSs+4F/hkIgy80/M5KeN6O+fm6Cris74xjHtePAq/vxrcBX5z0/pvbo6+qg931EQZFeVa/iUYblTXJm4E/Bt5Q3f9y3xbwuH4aeP1TnWsuc2T9A+AM4Ovdm16nA19L8qu9hRwy12NbVYer6nhVPQZ8nBXyPB7xPDgA3FADdzF4c/7U/lIOzPPztQb4M+Bz/aX7ZSOybgdu6Bb5d5bwHGiq6JOcnOS5j08zeGNzb7+p5jYqa5JzGBxH/tOq+mmfGR83T9bNQ4ttBb7ZR75hI7J+tapOq6pNVbWJQTG9vKoe6TEqMO9ju35osQtZAc/jeX6+/oPBG7IkeRHwbHr+hsgxXfBHwDer6kBf+YbNk/W7DHZSAP4QmPgwU2unV64Dbhy8z8Ia4DNV9YUkFzJ4abkW2JPknqp6XY85YXTWfcBJwK3dvDuq6i/7iwmMznp9khcz2IN7COg7J4zI2m+keY16bP+tO72uGBxqent/EX9hVNZnA1cn2cvgtODtK+CV6HzPg4tYWW/CjnpcfwL8U/cK5P944mvdF82vQJCkxjV16EaS9GQWvSQ1zqKXpMZZ9JLUOItekhpn0UtS4yx6SWrc/wM4fdmyMmOXNwAAAABJRU5ErkJggg==\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" }, { "name": "stdout", "output_type": "stream", "text": [ "Sinif ortalamlarinin ortalamasi 54.54\n", "Sinif ortalamlarinin standart sapmasi 1.21\n" ] } ], "source": [ "import matplotlib.pyplot as plt\n", "# yine ayni sekilde istikrarli bir orneklem icin\n", "# rastgele tam sayi ureticisini seed edelim.\n", "np.random.seed(1)\n", "# Yine 40 ile 70 arasindaki notlar icin\n", "# bu kez 1000 siniftan olusan orneklemimizdeki\n", "# her bir sinifin ortalamasini alip sinif_ortalamalari\n", "# degiskenine alalim\n", "sinif_ortalamalari = [np.mean(np.random.randint(40, 70, 50)) for i in range(1000)]\n", "# dagilimi bir histogramla gosterelim.\n", "plt.hist(sinif_ortalamalari)\n", "plt.show()\n", "print('Sinif ortalamlarinin ortalamasi {:.2f}'.format(np.mean(sinif_ortalamalari)))\n", "print('Sinif ortalamlarinin standart sapmasi {:.2f}'.format(np.std(sinif_ortalamalari)))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Her ne kadar tek bir sınıf içindeki not dağılımı normal değil tekdüze (uniform) olsa da 1000 sınıfın ortalamaları normal dağılmaktadır. Bir sınıf içinde 8.65 olan standart sapma değerinin de 1000 örenklemin ortalamaları söz konusu olduğunda 1.21'e kadar düştüğünü görüyoruz.\n", "\n", "Örneklem Dağılımı (ing. Sampling Distribution): Bu şekilde normal dağılmıyor olsa dahi örneklemlerin ortalamalarının dağılımı örneklem dağılımı adını alır.\n", "\n", "Ortalamanın Beklenen Değeri (ing. Expected Value of the Mean): Örneklem dağılımının ortalama değeri popülasyonun ortalaması için beklenen değerdir. Bir başka deyişle, bir popülasyondan rastgele seçilen örneklemlerin ortalamalarının dağılımının ortalaması o popülasyonun ortalamasının beklenen değeridir.\n", "\n", "Standart Hata (ing. Standard Error): Örneklem dağılımının ortalama değerinin standart sapmasıdır. Dolayısı ile popülasyon ortalamasının standart sapmasının da beklenen değeridir. Tıpkı standart sapmanın herhangi bir ölçümün ortalamadan sapmasının bir ölçütü (tüm sapmaların ortalaması) olduğu gibi, standart hata da bireysel örneklemlerin ortalamalarının, örnek dağılımının ortalamasından sapmasının ölçütüdür. Bu nedenle de standart hatadır çünkü ortalamaların dağıımının (örneklem dağılımının) ortalamasının popülasyonun ortalamasını ne kadar temsil ettiğine olan güvenimizin bir ölçütüdür. \n", "\n", "Örneklemlerin ortalamasının bir dağılımı olduğu gibi diğer istatistiklerin de (standart sapma, korelasyon katsayısı, $\\chi^2$, ...) birer dağılımı vardır. Aynı şekilde ortalamaların ortalamasının bir standart hatası olduğu gibi diğer istatistiklerin de standart hataları vardır." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Hipotez Testi #\n", "\n", "Peki Merkezi Limit Teoremi bize nasıl yardımcı olacak? Teorem, ele alınan bir örneğin karşılaştırma yapılan bir popülasyonu temsil edip etmediği hipotezini test etmemizi, bunun için normal dağılımın parametrelerini kullanmamıza sağlar. Bunun için örneğin ortalama değerini belirleyip, bu örneğin karşılaştırma yapılan popülasyondan gelip gelmediğini tahmin etmek için örneklem dağılımı ile karşılaştırabiliriz. Hipotez testinin belirli kuralları olup, öncelikle testin temellerini anlamaya ihtiyaç vardır. \n", "\n", "Herhangi bir bilimsel problemin çözümünde öncelikle bir hipotez geliştirilir. Hipotez, bir problemin çözümüne elde az sayıda kanıt ve çalışma varken yapılan ve daha ileri araştırma için bir başlangıç noktası oluşturan öneridir. \n", "\n", "Sıfır hipotezi ($H_0$), bir öneriyi test etmek üzere, gözlenen bir olayın sadece rastgele süreçler ile oluştuğunu, örnekleme ya da deneysel hatalardan kaynaklandığını öne süren hipotezdir. Gözleme ilişkin alternatif hipotezin ($H_1$) yani gözlenen olgunun rastgele süreçlerle oluşmadığının ve olgunun parametreleri arasında bir korelasyon bulunduğu fikrinin geçerliliğinin test edilmesi için kullanılır.\n", "\n", "Sıfır hipotezinin yanlışlanamaması durumunda gözlenen olayın sadece rastgele süreçlerden kaynaklandığı (ya da sıfır hipotezinin geçerli olduğu) kabul edilir. Sıfır hipotezinin yanlışlanması durumunda ise alternatif hipotezin doğruluğu kanıtlanmış olmaz. Ancak gözlenen olgunun sadece rastgele süreçlerden (ya da sıfır hipotezinin öngördüğü süreçlerden) kaynaklanmadığı sonucuna varılır.\n", "\n", "Sıfır hipotezinin yanlışlanması için, alternatif hipotezin gerçekleşebilme olasılığının, rastgele süreçler ile gerçekleşme ya da sıfır hipotezinin ilgilendiği dağılıma göre benzer bir olayın gözlenebilme olalsılığından anlamlı bir mertebede yüksek olması gerekir. Örneğin; bir bitkiyi sulamanın, bitkinin büyüme hızıyla ilişkili olduğunu söyleyen bir alternatif hipotezin kabul edilebilmesi için, bitkinin büyüme hızıyla sulama arasında bir ilişki olmadığını söyleyen sıfır hipotezinin yanlışlanması gerekir. Daha radikal bir örnek olarak; piramitleri uzaylıların inşa ettiğini iddia eden alternatif hipotezin kabul edilebilmesi için öncelikle, piramitleri uzaylıların inşa etmediğini iddia eden sıfır hipotezinin yanlışlanması gerekir. Tabi ki bu durumda piramitleri uzaylılıarın inşa ettiğine ilişkin doğrudan bir kanıtın da bulunması icap eder. \n", "\n", "## Örnek: CoVid 19 aşısı ##\n", "\n", "Diyelim ki CoVid-19 hastalığı için bir aşı önerisi var. Aşının başarısını test etmek için $n$ bireyi rastgele seçerek bir örneklem oluşturuyor ve bu bireyleri aşıyla enjekte ediyoruz. Diyelim ki bu $n$ bireyin $k$ tanesinin bir süre sonra (örneğin 1 yıl) yapılan testleri (ve diğer klinikleri) negatif sonuç veriyor ve bu $k$ bireyi \"sağlıklı\" olarak değerlendiriyoruz. Şimdi aşının işe yarayıp yaramadığına yönelik hipotez testinin nasıl yapılacağına bakalım.\n", "\n", "$H_0$ (Sıfır hipotezi): Aşının hiçbir etkisi yoktur ve sağlıklı olan $k$ birey hiçbir şey yapılmasa da hastalığı belirlenen sürede (1 yıl) kapmayacak bireylerdir.\n", "\n", "$H_1$ (Alternatif hipotez): Aşı bireylerin hastalıktan etkilenmesini engellemektedir.\n", "\n", "Test edilmesi gereken hipotez $H_0$ hipotezidir. Eğer bu hipotez doğruysa, aşılanan $n$ bireydeki $k$ negatif sayısının (örneklem büyüklüğüne oranının), tüm toplumdaki $K$ negatif sayısına (popülasyona oranına) benzer olması gerekir.\n", "\n", "Diyelim ki hastalığı kapma olasılığı aşı vs. gibi bir engelleyici olmadan %25 olsun (p = 0.25). Bu durumda da kapmama olasılığı (q = 1 - p = 0.75) %75 olur ve bu deney iki olasılığın olduğu bir Bernoulli deneyidir ve dağılım da [Bernoulli Dağılımı'na](http://ozgur.astrotux.org/ast416/Ders_02/Ders02b_Temel_Istatistiksel_Kavramlar_Dagilimlar.html#Bernoulli-Da%C4%9F%C4%B1l%C4%B1m%C4%B1) uyar. \n", "\n", "Diyelim ki örneklemimiz 10000 hasta ile sınırlı (n = 10000). Bu durumda sağlıklı birey $k$ sayısı 1 yıl sonra 10000 x 0.75 = 7500 çıkarsa (Bernoulli dağılımının ortalama değeri) bunun tamamen rastgele olduğunu, aşının bir etkisi olmadığını söyleyebiliriz. Zira hiçbir şey yapılmasa da hastalığı kapmama olasılığı %75'tir. Ancak bu durumda hangi sayıda sağlıklı birey bulursak $H_0$ hipotezini reddetmeliyiz (aşının etkisi olmadığı sonucuna varmalıyız) gibi bir seçimle karşılaşırız. Zira 7500 değil de 7440 sağlıklı birey (%74.4) ya da 7590 (%75.9) sağlıklı birey bulmamız sadece örneklemimizin küçüklüğünden kaynaklanıyor olabilir mi? \n", "\n", "Burada 7500'ün her iki tarafından belirli bir standart sapma ($\\sigma$) değerini belirleyip, eğer deneydeki sağlıklı birey sayısı ortalamanın (7500) örneğin $2~\\sigma$ ya da $2.5~\\sigma$ içinde kalıyorsa $H_0$'ı kabul etmek, aksi takdirde reddetmek iyi bir fikir olabilir. İşte burada merkezi limit teoreminin temel yaklaşımını hatırlayabiliriz. Her ne kadar ilgilendiğimiz dağılım bir Bernoulli dağılımıysa da yeterince büyük örneklemlerle çalışıldığı vakit bu dağılımın normal dağılıma yakınsayacağını biliyoruz. Dolayısı ile normal dağılımın parametreleri ve yaklaşımıyla hareket edebiliriz!\n", "\n", "Bir Bernoulli dağılımının standart sapması $\\sigma = \\sqrt{n~p~q}$ ile verilir. Bu durumda örneğimiz için standart sapma değeri $\\sigma = \\sqrt{10000~0.25~0.75} = 43.30$ olarak bulunur. Burada iki konuya değinmek gerekir:\n", "\n", "1) Çalışmamızın daha \"güvenilir\" olması için ortalamadan kaç standart sapma ($\\sigma$) uzaklığı $H_0$'ı red ya da kabul etmek için kriter yapmalıyız?
\n", "2) \"Yeterince büyük örneklem\" nedir, bir ölçüsü var mıdır?\n", "\n", "Önceliklle ikinci sorunun cevabının popülasyonun büyüklüğüne bağlı olduğunu, örneklemin bazı problemlerde sadece niceliğinin (büyüklüğünün) değil de aynı zamanda niteliğinin (içerdiği örneklerin popülasyon niteliğini ne kadar yansıtıyor olduğunun) de dikkate alınması gerektiğini söylemek gerekir.\n", "\n", "Birinci sorunun cevabı ise \"Güven Aralığı\" (ing. Confidence Interval) ya da \"Güven Düzeyi\" (ing. Confidence Level) kavramlarıyla verildiğini belirterek bu kavramları açmak gerekir." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Güven Aralığı ve Güven Düzeyi ##\n", "\n", "Güven aralığı, bir örnek dağılımın ortalama değerinin, ana dağılımın ortalama değerinden hangi olasılık mertebesi dahilinde uzak olduğunu gösteren aralıktır. Doğa bilimlerinde belirsizlik ölçütü olarak genellikle standart sapmayı kullanmak yeterlidir. Ekonomi ve siyaset bilimi gibi bazı başka disiplinlerde standart sapmayı vermek yerine güven aralığı (ing. confidence interval) ya da genellikle yüzde biriminde ifade edilen güven düzeyi (ing. confidence level) vermek tercih edilir. \n", "\n", "Örneğin bir parametre için yapılan bir dizi ölçümün sonucu $101.25 \\pm 0.01$ olarak verilmiş olsun. Aksi söylenmediği (örneğin bu hatanın ölçüm aletinin limiti olduğu gibi) sürece bir doğa bilimci bu belirsilziiği bir standart sapma olarak yorumlar ($\\sigma = 0.01$). Ancak 2 standart sapma ($2~\\sigma$) kullanarak ölçümün $\\% 95$ güven düzeyinde $101.25$ sonucunu verdiğini söylemek de aynı içeriği taşır. Zira normal olduğu kabul edilen bir dağılımda %95 güven düzeyi de yaklaşık olarak $\\pm 2\\sigma$’ya (daha yaklaşık bir değer olarak $1.96~\\sigma$) karşılık gelir. Benzer şekilde ölçüm sonucunun $(101.23 , 101.27)$ %95’lik güven aralığında olduğu da söylenebilir.\n", "\n", "%95’lik güven aralığı, deney/gözlem tekrarlanmaya devam edilirse tekrarların %95’inde, gözlenen değerlerin bulunan güven aralığında çıkacağı anlamına gelir.\n", "\n", "## Örnek: CoVid-19 aşısı ##\n", "\n", "CoVid-19 aşı önerisi örneğinde standart sapmayı Bernoulli Dağılımı'ndan hareketle belirlemiştik. Aşının hiçbir etki yapmadığı, aşı uygulamasının 1. yılı sonunda sağlıklı bireylerin tamamen rastlantısal olarak sağlıklı kaldıklarını ifade eden $H_0$ sıfır hipotezini reddetmek için $\\%95$'lik bir güven düzeyi belirlemiş olalım. Bu durumda \n", "\n", "$$ \\mu \\pm 2~\\sigma = 7500 \\pm 2 x 43.30 = 7500 \\pm 86.60 $$\n", "\n", "dahilinde bir güven aralığı oluşturabiliriz. 1 yıl sonunda sağlıklı birey sayısını 7587'den büyük bulursak $H_0$'ı reddedebiliriz. Yani \"aşının hiçbir etkisi yoktur\" önerisini reddetmiş oluruz! Bu alternatif hipotezi kabul ettiğimiz (yani aşının etkili olduğu) anlamına gelmez ama onu destekleyici bir kanıt oluşturur. " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Örnek: Gaia Paralaksları ##\n", "\n", "[Gaia uzay teleskobu](https://sci.esa.int/web/gaia) gökcisimlerinin hassas konum ölçümlerini yapmak üzere uzaya gönderilmiştir. Teleskop, galaksimiz içindeki yıldızların da paralaks ölçümlerini defalarca yaparak uzaklıklarının hassas bir şekilde belirlenmesini sağlamaktadır. \n", "\n", "Bir yıldızın paralaks ölçümü 1000 defa yapılıyor ve uzaklğı parsek cinsinden hesaplandığında elde edilen ortalama uzaklık değeri ($\\mu_d$) ve belirsizliği ($\\sigma_d$) $d = 210 \\pm 5$ pc olarak veriliyor. %95 güven seviyesine karşılık gelen aralığı bulunuz. Problemi hem temel istatistik bilgimizden hareketle, hem de genelleştirmek üzere Python dili ve ekstra paketlerin olanaklarıyla çözelim.\n", "\n", "Çözüm: %95’lik güvenilirlik seviyesine karşılık gelen $z$ değeri için standart normal dağılım tablolarına ya da grafiklerine bakılır. Bu değer `scipy.stats.norm.interval` fonksiyonuyla doğrudan elde edilebilir ya da $p = 0.95$ için aşağıdaki formülden yararlanılarak hesaplanan $z$ değeri tablodan alınabilir. Daha sonra,\n", "\n", "$$ z = \\frac{|x - \\mu|}{\\sigma} $$\n", "\n", "ifadesinden hareketle $x$ değişkeninin %95 olasılıkla içinde bulunduğu güven aralığı tesis edilir." ] }, { "cell_type": "code", "execution_count": 4, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "%95.00 olasiliga karsilik gelen z-değeri: 1.96 'dir.\n" ] } ], "source": [ "from scipy import stats as st\n", "p = 0.95\n", "z = st.norm.interval(p)\n", "print(\"%{:.2f} olasiliga karsilik gelen z-değeri: {:.2f} 'dir.\".\n", " format(p*100, z[1]))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Görüldüğü üzere $z$-değeri %95'lik güven aralığı için 1.96 olarak verilmektedir. Bu durumda güven aralığı aşağıdaki şekilde tesis edilebilir.\n", "\n", "$$ z = \\frac{|x - \\mu|}{\\sigma} \\Rightarrow x = \\mu \\pm z~\\sigma \\Rightarrow x = 210 \\pm 1.96~x~5.0 = 210 \\pm 9.8~pc$$\n", "\n", "Bir başka deyişle, 1000 kez paralaks ölçümü yapılan bu yıldızın uzaklığı %95 güven düzeyinde $(200.2 , 219.8)$ pc aralığındadır. \n", "\n", "Aynı sonuca `scipy.stats.norm.interval` fonksiyonunu aşağıdaki şekilde kullanarak da ulaşılabilir." ] }, { "cell_type": "code", "execution_count": 5, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Yildizin uzakligi icin %95.00'lik guven araligi (200.20, 219.80) pc'tir.\n" ] } ], "source": [ "from scipy import stats as st\n", "p = 0.95\n", "mu = 210.0\n", "sigma = 5.0\n", "aralik = st.norm.interval(p,loc=mu, scale=sigma)\n", "print(\"Yildizin uzakligi icin %{:.2f}'lik guven araligi ({:.2f}, {:.2f}) pc'tir.\".\\\n", " format(p*100, aralik[0], aralik[1]))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Görüldüğü üzere yeterince fazla ölçüm yapıldığında ölçüm sonuçlarının normal dağıldığını varsayarak, normal dağılımın parametreleriyle (ortalama ve standart sapma) bir güven aralığı oluşturulmuştur. Oysa ki tek bir ölçüm (ya da az sayıda ölçüm) söz konusu olduğunda ölçüm hataları normal (ya da Gaussyen) dağılmaz, Poisson Dağılımı'na (ya da genelleştirilmiş hali olan Drichlet Dağılımı'na) uyar. Ancak Merkezi Limit Teoremi gereğince yeterince büyük bir örneklem söz konusu olduğunda, rastgele bir değişkenin değerinin dağılımı Normal Dağılım'a yakınsar. Bu durumda da normal dağılım yaklaşımından hareketle analiz yapılabilir.\n", "\n", "Diyelim ki bu yıldızın uzaklığı bir başka yöntemle (örneğin çift yıldız gözlemleriyle oluşturulan kalibrasyondan hareketle ya da [HIPPARCOS uzay teleskobu](https://www.cosmos.esa.int/web/hipparcos) ölçümleriyle) belirlenmiş olsun. Bu ölçümlerin hangi güvenilirlik düzeyinde eşit kabul edileceğine karar verildikten sonra sıfır hipotezi ($H_0$) ve alternatif hipotez ($H_1$) aşağıdaki şekilde oluşturulabilir.\n", "\n", "$H_0$: Yildizin Gaia uzakligi cift yildiz gozlemlerinden belilrlenen kalibrasyonla uyumlu degildir.
\n", "$H_1$: Yildizin Gaia uzakligi cift yildiz gozlemlerinden belilrlenen kalibrasyonla uyumludur.\n", "\n", "Bu tür bir karşılaştırmanın nasıl yapılacağını biraz sonraya bırakarak hipotez testlerinde yapılabilecek olası hataları görelim." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Hipotez Testinde Tip I ve Tip II Hataları ##\n", "\n", "Tip-I Hata (ing. Type-I Error): Sıfır hipotezinin ($H_0$) doğru olmasına karşın reddedilmesiyle oluşan hatadır. Özellikle örnek sayısının azlığından kaynaklanabilir.\n", "\n", "Tip-II Hata (ing. Type-II Error): Sıfır hipotezini ($H_0$) yanlışlığına rağmen kabul edilmesiyle oluşan hatadır.\n", "\n", "
\n", " \"Hipotez\n", "
" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## İstatistiksel Anlamlılık Seviyesi ##\n", "\n", "İstatistiksel anlamlılık, bir örneklemden türetilen bir istatistiğin o örneklemin alındığı popülasyondaki bir olguyu ne düzeyde (hangi olasılıkla) temsil ettiğinin ölçüsüdür. Örneğin \"Bir popülasyondan alınan bir örneğin ortalamasının, o örneğin popülasyonu temsil etmediği ve şans eseri oluştuğu (örneklem hatası) kanısına bu iki ortalamada hangi düzeyde bir fark olursa varılmalıdır?\" sorusunun cevabı araştırmacı tarafından belirlenen istatistiki anlamlılık seviyesiyle karşılaştırma yapılarak verilir. Eğer ulaşılan sonucun (örneğin iki ortalama arası farkın) olasılığı seçilen anlamlılık seviyesinden küçükse bu sonucun istatistiksel olarak anlamlı olduğu ve şans eseri (örneklem hatası nedeniyle) oluşma ihtimalinin istatistiksel anlamlılık seviyesiyle izin verilen daha küçük olduğu sonucu çıkar.\n", "\n", "Gözlenen olayın rastgele süreçlerden meydana gelip gelmediği test edilmek istendiği için, olayın gerçekleşme ihtimali bir normal dağılım kullanılarak incelenir. Eğer olaya ilişkin dağılımın rastgele dağılım olmadığı biliniyorsa ilgili dağılım kullanlabilir. Ancak yeterli sayıda örnek dağılım elemanı bulunuyorsa merkezi limit teoremi gereğince normal dağılım varsayımı, bulunmuyorsa normal dağılım yerine, düşük serbestlik derecelerine daha duyarlı olan t-dağılımı varsayımı yapılabilir.\n", "\n", "Istatistiksel anlamlılığın belirlenebilmesi için kullanılan kritik değer $\\alpha$, bir olasılık değeri anlamındadır. Farklı bilim dallarında farklı değerler kabul görebilmektedir. Gözlenen olgunun rastgeleliğinin büyük oranda beklenir olduğu durumda daha küçük olasılık değerleri verilmesi uygun olur.\n", "\n", "İstatistiki anlamlılık seviyesi (ing. statistical significance), toplam olasılık olan $1$’den güven seviyesinin farkıdır.\n", "\n", "Sıfır hipotezi ($H_0$) doğru ise ve gözlemsel verinin ya da ilgili parametrenin normal dağılım sergilemesi bekleniyorsa, normal dağılımca beklenen en olası değer ortalama değerdir. Bu durumda kritik olasılık değeri ($\\alpha$) belirlendiği takdirde, kritik değere göre ortalamaya daha yakın olan toplam olasılık değerleri sıfır hipotezinin reddedilememesi anlamına gelir. Bu durumda sıfır hipotezi $1- \\alpha$ güven aralığında reddedilememiş olur.\n", "\n", "[CoVid-19 aşısı](#Örnek:-CoVid-19-aşısı) örneğinde güven düzeyinin %95 olarak belirlenmesi durumunda istatistik anlamlılık seviyesi $\\alpha = 1 - 0.95 = 0.05$ 'tir. 1 yıl süren aşılama sürecinin sonunda bu düzeyin üzerinde bir iyileşme (ki bunun 7587 hastaya denk geldiğini görmüştük) istatistiki olarak anlamlı bir sonuç bulunduğu değerlendirmesi yapılabilir. Bu da alternatif hipotez $H_1$ için istatistiki olarak anlamlı bir kanıta ulaşıldığı anlamına gelir. Ancak bu $H_1$'in kabul edildiği anlamına da gelmez.\n", "\n", "[Gaia paralaksları](#Örnek:-Gaia-Paralaksları) örneğinde; \n", "\n", "$H_0$: Gözlenmiş çift yıldızlar üzerinden belirlediğiniz bir korelasyon %95 güven düzeyinde Gaia ölçümüyle ($\\mu = 210~pc$) uyumludur.\n", "\n", "şeklinde ifade edilen bir sıfır hipotezini yanlışlamanız için kalibrasyonunuzun $\\alpha = 1 - 0.95 = 0.05$ istatistiki anlamlılık seviyesinin karşılık geldiği $9.8~pc$ değerinin ötesinde bir değer (200.2 pc'ten küçük ya da 219.8 pc'ten büyük) bir uzaklık vermesi gerekir. Bu durumda kalibrasyonunuzun Gaia ölçümleriyle uyumlu olmadığını ifade eden $H_1$ alternatif hipotezine ilişkin bir kanıta ulaşmış olursunuz. " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## p Değeri ##\n", "\n", "p-değeri (ing. probability value: p-value), sıfır hipotezinin ($H_0$) doğru kabul edilmesi durumunda rastgele seçilen bir örneklemin ortalamasının belirli bir değerden büyük ya da ona eşit olması olasılığıdır. Sıfır hipotezinin ($H_0$) doğru olması durumundaki olasılık belirlendiği için koşullu bir olasılıktır. Özünde bu değer bir hipotezin doğru olduğu kabulü altında herhangi bir istatistiğin tamamen şans eseri olarak elde edilmesi olasılığını verir. Burada şanstan kasıt, rastgele seçimle örneklem oluşturulurken bu sonucu verecek örneklerin (verilerin) seçilmiş olmasıdır (örneklem hatası, ing. sampling error).\n", "\n", "p-değeri belirlenen bir istatistiki anlamlılık derecesinden (ing. statistical significance: $\\alpha$) daha küçükse sıfır hipotezi ($H_0$) reddedilir. Çünkü elde edilen sonuç belirlenen düzeyde istatistiksel olarak anlamlıdır. Sıfır hipotezi doğru iken bu sonucun elde edilmesi tamamen şans eseri de (örnekleme hatasıyla) olasıdır. Ancak bu olasılık istatistiksel anlamlılıkla izin verilenden daha azdır. Bu durumda alternatif hipotez ($H_1$) için bir kanıt elde edilmiş olunur. Eğer p-değeri belirlenen istatistiki anlamlılılk derecesinden büyükse $H_0$ reddedilemez (bu kabul edildiği anlamına gelmez!). Çünkü sonuç belirlenen düzeyde istatistiksel olarak anlamlı değildir. Bu sonucun sıfır hipotezinin doğru olması durumunda şans eseri elde edilmiş olma ihtimali belirlenen istatistiksel anlamlılık seviyesinden büyüktür ki zaten sıfır hipotezi rastgele seçilen bir örneğin doğrulaması üzerine kuruludur.\n", "\n", "Örneğin p-değeri $0.03$ olarak hesaplanıyor ancak belirlenen istatistiksel anlamlılık değeri $\\alpha = 0.05$ ise, bu $H_0$'ın doğru olması durumunda elde edilen sonucun tamamen şans eseri elde edilme olasılığının $\\%5$’ten küçük bir olasılığa sahip olduğu ($\\%3$) anlamına gelir. Bu nedenle $H_0$ reddedilir. Bir başka deyişle, hesaplanan değer gözlenen olgunun örneklem hatasıyla oluşma ihtimalini $\\%3$ olarak belirlediği için $H_0$ reddedilir. Ancak p-değeri (örneğin biraz sonra göreceğimiz t-testi ile) 0.1 olarak hesaplanırsa bu böyle bir örneklemin $H_0$’ın doğru olması durumunda $\\%10$ ($> \\alpha = 0.05$) ihtimalle rastgele herhangi bir örneklem için elde edilebileceğni gösterir ki bu durumda $H_0$ reddedilemez. \n", "\n", "### Örnek: p Değeri ###\n", "\n", "Diyelim ki açık yıldız kümelerinin içerdiği yıldızların %25’inin G tayf türünden daha sıcak yıldızları içerdiği gibi bir iddia var ve biz de bir açık yıldız kümesi gözleyerek bu iddiayı test etmek istiyoruz. \n", "\n", "Bu durumda sıfır hipotezimiz \n", "\n", "* $H_0$: $\\mu = 0.25$, \n", "\n", "alternatif hipotezimiz ise \n", "\n", "* $H_1$: $\\mu \\neq 0.25$ \n", "\n", "olarak belirlenebilir.\n", "\n", "Şimdi yapmamız gereken gözlediğimiz kümedeki G tayf türünden daha sıcak yıldızları saymak (diyelim ki 120 yıldızdan 40’ı böyle yıldızlar olsun) ve $H_0$ ‘ın doğru olduğu kabulü altında bu gözlem sonucunun tamamen şans eseri elde edilip, edilemeyeceğini bulmak!\n", "\n", "Bu deney yine bir Bernoulli deneyidir. Zira kümdede ele alınan bir yıldız ya G tayf türünden daha sıcaktır. ya da değildir. Bu durumda standart sapma $\\sigma = \\sqrt{n p q} = \\sqrt{120~0.25~(1-0.25)} = 4.74$ olarak bulunur. %25 G tayf türünden daha sıcak yıldız bulma olasılığı ise $\\mu = 0.25~x~120 = 30$ yıldıza karşılık gelir. \n", "\n", "$$ z = \\frac{x - \\mu}{\\sigma} = \\frac{40 - 30}{120~0.25~0.75} = 2.108 \\sim 2.11$$\n", "\n", "Şimdi iş bu z-değerinin karşılık geldiği p-değerini hesaplamaktır. Bu değer bir standart normal dağılımı tablosundan (z-tablosu) alınabileceği gibi `scipy.stats.norm` fonksiyonlarıdan `cdf()` da bu amçla kullanılabilir. Ancak `cdf()` (1 - p) değerini vereceği için, doğrudan p-değerini veren `sf()` fonksiyonu (ing. survival function) da tercih edilebilir." ] }, { "cell_type": "code", "execution_count": 6, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "z = 2.11 degeri p-degeri = 0.0175'e karsilik gelir\n", "z = 2.11 degerinin karsilik geldigi olasilik = %98.25'tir.\n" ] } ], "source": [ "from scipy import stats as st\n", "z = 2.108\n", "p = st.norm.sf(z)\n", "print(\"z = {:.2f} degeri p-degeri = {:.4f}'e karsilik gelir\".\\\n", " format(z, p))\n", "olasilik = st.norm.cdf(z)\n", "print(\"z = {:.2f} degerinin karsilik geldigi olasilik = %{:.2f}'tir.\".\\\n", " format(z, 100*olasilik))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "$z = 2.11$’e karşılık gelen p-değeri $p = 0.0175$ bulunur. Yani bu örneğin bu popülasyondan örnekleme hatasıyla türetilmiş olma olasılığı %1.75 olup istatistiksel anlamlılığın $\\alpha = 0.05$ seçilmesi durumunda $p = 0.0175 < \\alpha$ olduğu için $H_0$ reddedilir. Yani, ele alınan örnek iddianın doğru kabul edilmesi durumunda istatistiksel anlamlılık seviyesi dahilinde tüm açık yıldız kümeleri popülasyonlarından rastgele bir seçimle türetilmiş olabilir ama bu ihtimal \"göreli olarak (istatistiksel olarak anlamlı sayılacak düzeye göre) düşüktür\". Bu nedenle de elimizdeki yıldız grubu (örneklem) tüm açık yıldız kümelerindeki G-tayf türünden yıldızların (popülasyon) oranının $\\%25$ olduğu iddiasıyla çelişmektedir! Ama biz evrendeki tüm açık yıldız kümelerini gözleyemeyiz ve hiçbir zaman da gözleyemeyeceğiz! O yüzden, $H_1$ kabul edilmiş de değildir ama o yönde bir kanıt elde edilmiştir. Bu sonuç daha fazla örnekle ya da istatistiksel anlamlılık seviyesi değiştirilerek, daha yüksek bir güven düzeyinde konuşmak istendiğinde yanlışlanabilir. Dolayısı ile bu güven düzeyinde $H_0$'ı reddetmiş olmakla şöyle bir yanlış yapıyor olabiliriz: Çok küçük bir ihtimalle de olsa bu veri $H_0$ (tüm yıldızların %25'inin G-tayf türünden sıcak yıldızlar olduğu) doğru olduğu halde örnekleme hatasıyla (\"talihsizlik!\") oluşmuş da olabilir! Yani 120 yıldızlık örneğimizde 40 yıldızın G-tayf türünden olması bu önerme doğru olduğu halde örneklem hatası (şans kaynaklı) nedeniyle düşük ihtimaldir! Bu durumda Tip-I Hatası yapılmış olur. \n", "\n", "Ancak %99'luk güvenlik düzeyine denk gelen $\\alpha = 0.01$ seçilseydi $p > \\alpha$ olduğu için $H_0$ reddedilemezdi. Bir başka deyişle, elimizdeki örnek açık yıldız kümelerindeki yıldızların %25’inin G tayf türünden daha sıcak yıldızları barındırdığı iddiasını $\\alpha = 0.01$ istatistiksel anlamlılık ya da $\\%99$ güven seviyesinde reddetmez; çünkü bu örneklem, $H_0$'ın doğru olması durumunda, istediğimiz ya da izin verdiğimiz anlamlılık seviyesinden (%1) daha yüksek bir olasılığa (%1.75) sahiptir. Yine benzer şekilde, bu önermeyi reddetmemekle bir hata yapıyor olabiliriz. Yani $H_0$ hipotezi reddedilmediği halde, onun örneklemimiz için öngördüğü sayıya ($30$) istatistiksel anlamlılığın izin verdiği kadar yakın sayıda sıcak yıldız içeren bir açık kümeyi tamamen şans eseri (örneklem hatası sonucu) seçmiş de olabiliriz. Yani $H_0$ doğru olmayabilir ama talihsizlik eseri seçtiğimiz örnek onun öngördüğüne yakın bir sonuç vermiştir. Bu durumda da Tip-II Hatası yapılmış olur. \n", "\n", "Şimdi seçtiğimiz istatistiksel anlamlılık seviyesinin ($\\alpha = \\%1 = 0.01$)'in karşılık geldiği yıldız sayılarına bakalım. Elimizdeki örnekte kaç yıldızdan daha az ya da daha çok sayıda G-tayf türünden daha sıcak yıldız olması $H_0$'ı reddetmemize yol açar, çünkü belirlediğimiz istatistiksel anlamlılık seviyesinde $H_0$'ın öngördüğünden daha az ya da daha çok G-tayt türünden sıcak yıldız içerir? Bu iki yönlü bir testtir. İstatistiksel anlamlılık nihayetinde bir olasılık olasılık olduğu ve belirleyeceğimiz yıldız sayılarından az ve çok yıldız içerme olasılıkları toplanacağı için, bu olasılık, eğrinin altında ortalamadan ($30$) her iki yönde belirlemek istediğimiz sayıların dışında kalan alandır. Bu sayıları `scipy.stats.norm.interval()` fonksiyonu ile belirleyebiliriz. Ancak bu fonksiyonun eğrinin $H_0$'ın kabul edildiği alanı veren uç değerleri döndürdüğüne dikkat edilmelidir. Bu nedenle istenen $\\alpha$ değerinin karşılık geldiği uç noktalar için, o olasılığın 1'den farkı alınarak `interval()` fonksiyonuna sağlanması gerekir. Bu değer aynı zamanda güven düzeyini ifade eder." ] }, { "cell_type": "code", "execution_count": 7, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "alpha = 0.01 degerinin karsilik geldigi yildiz sayilari 17.79 ve 42.21'dir.\n" ] } ], "source": [ "### Secilen istatistiksel anlam seviyesinin karsilik geldigi\n", "# yildiz sayilari\n", "alpha = 0.01\n", "olasilik = 1-alpha\n", "sayi = st.norm.interval(olasilik,loc=30,scale=4.74)\n", "print(\"alpha = {:.2f} degerinin karsilik geldigi yildiz sayilari {:.2f} ve {:.2f}'dir.\".\\\n", " format(alpha, sayi[0], sayi[1]))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Görüldüğü gibi, açık yıldız kümemizin, $H_0$ doğru iken belirlediğimiz istatistiksel anlamlılık seviyesinde (%1) 42.21'den fazla, 17.79'dan az sayıda G-tayf türünden sıcak yıldızı şans eseri (örnekleme hatasıyla) içerme olasılığı %1'in altında olmalıdır. Eğer sözgelimi bizim incelediğimiz kümede 45 böyle yıldız olsaydı, \"rastgele bir seçimde bu kadar yıldız içeren bir kümeye denk gelme olasılığımız %1'in altında o nedenle $H_0$ doğru olamaz!\" derdik. Oysa ki bizim kümemizde 40 tane bu tür yıldız var. O nedenle $H_0$ bu anlamlılık seviyesinde reddedilemez!\n", "\n", "Oysa ki $H_0$'ı reddettiğimiz ilk anlamlılık seviyesi olan $\\alpha = \\%5 = 0.05$ için bu sayıları hesaplasak;" ] }, { "cell_type": "code", "execution_count": 8, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "alpha = 0.05 degerinin karsilik geldigi yildiz sayilari 20.71 ve 39.29'dir.\n" ] } ], "source": [ "### Secilen istatistiksel anlam seviyesinin karsilik geldigi\n", "# yildiz sayilari\n", "alpha = 0.05\n", "olasilik = 1-alpha\n", "sayi = st.norm.interval(olasilik,loc=30,scale=4.74)\n", "print(\"alpha = {:.2f} degerinin karsilik geldigi yildiz sayilari {:.2f} ve {:.2f}'dir.\".\\\n", " format(alpha, sayi[0], sayi[1]))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "elde ederdik. Görüldüğü gibi bu anlamlılık seviyesinde $39.29$'dan daha fazla sıcak yıldız içeren bir açık kümeyi tamamen şans eseri oluşturma olasılığı $\\%5$. Yani $H_0$ doğruyken rastgele seçtiğimiz bir kümenin 40 yıldız içeren bir küme olma olasılığı bundan daha az." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# t Dağılımı #\n", "\n", "Tüm parametrelerin değerleri Gaussian olasılık dağılımına uygun dağılmayabilir. Bazı parametreler, Gaussian dağılımına uyuyor gibi görünse de ortalamadan uzak değerlerinin olaslıkları Gaussian dağılımla öngörülenden yüksek bulunablir. Önemli bir başka durum yeterince örnek sayısının olmadığı durumdur ki bu durumda ortalama ve standart sapma çok iyi belirlenmememiş olabilir. Bu durumlarda parametre değerlerinin olasılık dağılımı için t-dağılımını (ing. Student's t-distribution) kullanmak daha iyi bir seçenektir.\n", "\n", "$t$-istatistiği, $x$ değerinin, örneğin ortalama değeri olan $\\bar{x}$ değerinden kaç standart sapma ($s$) uzaklıkta olduğunu belirler ve aşağıdaki şekilde ifade edilir.\n", "\n", "$$ t = \\frac{|x - \\bar{x}|}{s} $$\n", "\n", "Bu durumda $t$-istatistiği için olasılık dağılımı\n", "\n", "$$ P(t,\\nu) = \\frac{1}{\\sqrt{\\nu~\\pi}} \\frac{\\Gamma[(\\nu + 1) / 2]}{\\Gamma(\\nu / 2)} (1 + \\frac{t^2}{\\nu})^{-(\\nu + 1)/2} $$\n", "\n", "dir. Burada $\\nu$ serbestlik derecesini gösterir ve $\\bar{x}$ $N$ bağımsız ölçümün ortalamasıysa $\\nu = N - 1$ ile verilir.\n", "\n", "Aşağıdaki görselde, serbestlik derecesinin değişmesi ile t-dağılımının değişimi görülmektedir. Mavi ile gösterilen eğri standart normal dağılımdır. 1 serbestlik derecesine sahip olan t-dağılımında görüleceği üzere, $t$-dağılımı, daha geniş kanatlara sahiptir. Bu normal dağılımın ortalama değerinden daha uzakta ortalama değerlerin bulunma olasılığının normal dağılıma göre daha fazla olduğunu göstermektedir; ki az sayıda ölçüm söz konusu olduğunda bu yaklaşım daha gerçekçidir. Her bir serbestlik derecesi için verilen dağılımda önceki serbestlik dereceleri için t-dağılımı yeşille, verilen serbestlik derecesi için kırmızıyla gösterilmektedir.\n", "\n", "Serbestlik derecesi arttıkça ya da başka bir deyişle örneklem büyüdükçe, t-dağılımı da normal dağılıma yakınsamaktadır. Bunun sonucu olarak, örneklemdeki eleman sayısının az olması durumunda t-dağılımının kullanılması, normal dağılımın kullanılmasından daha uygun olmaktadır.\n", "\n", "
\n", " \"t-dagilimi\"\n", "
" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Örnek: Gaia Paralaksları t dağılımı Yaklaşımı ##\n", "\n", "Henüz Gaia görevinin ancak belirli bir bölümünü (DR-2) tamamlamış durumdadır ve aynı yıldızın paralaks ölçümünü belirli kez yapabilmiştir. Daha önceki örnekte gördüğümüz yıldızın 9 paralaks ölçümü yapılmış ve uzaklğı parsek cinsinden hesaplandığında elde edilen ortalama uzaklık değeri ($\\bar{x}$) ve belirsizliği ($s$) $210 \\pm 5 ~pc$ olarak veriliyor olsun. %95 güven seviyesine karşılık gelen aralığı bu kez $t- dağılımı$ kullanarak bulalım.\n", "\n", "Bu kez ölçüm sayısı çok az olduğu ($N = 9$) için serbestlik derecesini dikkate alan t-dağılımı üzerinden bir güven aralığı tesis etmek istiyoruz. t-dağılımı için verilen kümülatif olasılık tablosundan %95 güven seviyesine $ν = 9 – 1 = 9 – 1 = 8$ serbestlik derecesi için karşılık gelen $t-istatistiği$ değeri $t = 2.3$’tür. Bu durumda;\n", "\n", "$$ t = \\frac{|x - \\bar{x}|}{s} = 2.3 $$\n", "$$ t = \\frac{|x - \\bar{x}|}{s} = 2.3 \\Rightarrow x = \\bar{x} \\pm t~s \\Rightarrow x = 210 \\pm 2.3~x~5 = 210 \\pm 11.5~pc$$\n", "\n", "Bu durumda %95 güven seviyesine karşılık gelen aralık:\n", "\n", "$$ x = (210 – 11.5, 210 + 11.5) = (198.5, 221.5) $$\n", "\n", "aralığıdır.\n", "\n", "Aynı güven seviyesi için çok daha geniş olarak bulunan güven aralığı, t-dağılımının, Gaussyen (normal) dağılımın azımsadığı (ing. underestimate) uç değerlerin olasılıklarını daha büyük bulmasından kaynaklanmaktadır. Örnek sayısı az olduğu vakit, uç değerlerin olasılıklarının daha yüksek olması beklenebilir. Örnek sayısı artıp, serbestlik derecesi buna bağlı olarak yükseldikçe dağılım, Gaussyen’e yaklaşacaktır. Örneğin $\\nu = 50$ serbestlik derecesi için $t \\sim 2.0$ iken normal dağılımda güven aralığının hesaplanması için kullanılan $z$ parametresi de $z \\sim 1.95$ değerini almaktadır. Oysa $N = 9$ olan örneğimizde $t = 2.3$ iken aynı güven aralığında $z = 1.96$’dır." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Aynı örneği Python'da `scipy` paketi fonksiyonlarından t-dağılımına ilişkin araçlar sunan `scipy.stats.t()` ile çözmeye çalışalım. Fonksiyon `scipy` kütüphanesinde yer alan, [Ders-2b Dağılım Fonksiyonları'nda](http://ozgur.astrotux.org/ast416/Ders_02/Ders02b_Temel_Istatistiksel_Kavramlar_Dagilimlar.html) gördüğünüz diğer dağılım fonksiyonlarına benzer şekilde çalışır ve benzer metotlarla parametrelere sahiptir. t-dağılımı sürekli bir fonksiyondur bu nedenle süreksiz fonksiyonlardaki Olasılık Kütle Fonkskiyonu'nun (ing. Probability Mass Function, PMF) yerini Olasılık Yoğunluk Fonksiyonu (ing. Probability Density Function, PDF) alır. Aynı şekilde kümülatif olasılıklar da yoğunluk fonksiyonu (ing. Cumulative Density Function, CDF) ile ifade edilir.\n", "\n", "Öncelikle problemimizin parametreleriyle %95'lik bir güven düzeyi için güven aralığı oluşturalım. Bu amaçla güven düzeyini (0.95) `alpha` parametresine (bu parametreinin ismi istatistiksel anlamlılığı simgeleyen $\\alpha$ ile aynı olsa da güvenlik düzeyini doğrudan vermek gerektiğine dikkat ediniz), serbestlik derecesini ($\\nu = N - 1 = 9 - 1 = 8$) `stats.t` fonksiyonunun `df` parametresine, ölçümlerin ortalamasını ($\\mu = 210~pc$) `loc` parametresine, standart sapmasını ise `scale` parametresine vermeliyiz." ] }, { "cell_type": "code", "execution_count": 9, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "%95.0'lik guven araligi 198.5 ile 221.5 arasidir.\n" ] } ], "source": [ "from scipy import stats as st\n", "N = 9\n", "xbar = 210 # pc\n", "s = 5 # pc\n", "gd = 0.95 # %95\n", "guven_araligi = st.t.interval(alpha=gd, df=N-1, loc=xbar, scale=s)\n", "print(\"%{:.1f}'lik guven araligi {:.1f} ile {:.1f} arasidir.\".\\\n", " format(100*gd, guven_araligi[0], guven_araligi[1]))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "t-dağılımına uyan bireysel ölçümleri (örneklemi) oluşturabilmek için `rvs()` fonksiyonunu kullanalım. Bunun için örneklem büyüklüğümüzü `size` parametresi ile $N = 9$'a, serbestlik derecesini `df` parametresi ile $\\bar{x} = N - 1 = 8$'e, ortalama değeri `loc` parametresinden $\\mu = 210~pc$ ve standart sapmayı da `scale` parametresinden $s = 5~pc$'e ayarlayalım." ] }, { "cell_type": "code", "execution_count": 10, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[210.81468564 219.52037648 207.65015958 204.85143631 209.25520927\n", " 214.67993464 222.28252076 212.85434966 208.72133607]\n" ] } ], "source": [ "from scipy import stats as sta\n", "import numpy as np\n", "# Ornegi tekrar ayni degerlerle uretebilmek icin\n", "# seed edelim.\n", "np.random.seed(53)\n", "N = 9\n", "xbar = 210 # pc\n", "s = 5 # pc\n", "paralakslar = st.t.rvs(df=N-1, loc=xbar, scale=s, size=N)\n", "print(paralakslar)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Bir t-dağılımından verilen bu parametrelerle üretilen paralaks ölçümleri için doğal olarak ortalama ve standart sapma değerleri verilenlerle birebir aynı olmayacaktır. Zira işin içine rastgelelik katılmıştır. Ancak bu örnekte bireysel Gaia ölçümleri ürettiğimiz veri setimizi ($paralakslar$) kullanabiliriz. İstediğimiz parametrelerle bir t-dağılımından rastgele örneklem seçerek oluşturduğumuz bu t-dağılımına en iyi uyan olasılık yoğunluğu fonksiyonunu `stats.t.fit` fonksiyonuyla bulmaya çalışalım." ] }, { "cell_type": "code", "execution_count": 11, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Ort: 212.29, St.Sapma: 5.37\n" ] } ], "source": [ "t_uyumlama = st.t.fit(paralakslar)\n", "print(\"Ort: {:.2f}, St.Sapma: {:.2f}\".\\\n", " format(t_uyumlama[1], t_uyumlama[2]))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "İstenirse bu uyumlama (fit) fonksiyonunun parametrelerine karşılık gelen bir olasılık yoğunluk fonksiyonu (PDF) `stats.t.pdf()` fonksiyonu ile çizdirilebilir (sürekli mavi eğri). Bu fonksiyonunun yanı sıra karşılaştırma için başlangıçtaki parametrelerimize ($\\mu = 210, \\sigma = 5$) karşılık gelen bir t-dağılımı çizdirelim (süreksiz mavi eğri). Ayrıca uyumlama fonksiyonu ile elde ettiğimiz parametrelere karşılık gelen bir normal dağılım için de bir olasılık yoğunluk fonksiyonu çizdirelim (turuncu sürekli eğri)." ] }, { "cell_type": "code", "execution_count": 12, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "from matplotlib import pyplot as plt\n", "import numpy as np\n", "%matplotlib inline\n", "xbar_fit = t_uyumlama[1]\n", "s_fit = t_uyumlama[2]\n", "# Daha cok sayida nokta iceren bir x-ekseni tanimlayalim\n", "x = np.linspace(200,225,50)\n", "pdf_fit = st.t.pdf(x, df=8, loc=xbar_fit, scale=s_fit)\n", "pdf_orj = st.t.pdf(x, df=8, loc=xbar, scale=s)\n", "pdf_gauss = st.norm.pdf(x, loc=xbar_fit, scale=s_fit)\n", "plt.hist(paralakslar, density=True, histtype='stepfilled', alpha=0.2)\n", "plt.plot(x, pdf_fit, 'b-', label=\"Uyumlama\")\n", "plt.plot(x, pdf_orj, 'b--', label=\"Orjinal\")\n", "plt.plot(x, pdf_gauss, c=\"orange\", ls=\"-\", label=\"Normal\")\n", "plt.legend(loc=\"best\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Serbestlik Derecesi #\n", "\n", "Şu ana kadar pek çok kez kullandığımız ve daha önce de tanımladığımız serbestlik derecesi kavramını bu noktada hatırlamakta yarar var. Serbestlik derecesi değiştikçe t-dağılımının şekli (ve doğal olarak olasılıklar değiştiği) için t-tablolarına (ya da t-dağılımına dayanan `scipy.stats.t` fonksiyonlarına) başvurulurken serbestlik derecesi girdi parametresidir. Serbestlik derecesi (ing. Degree of Freedom, df ya da dof) temel olarak, [formal tanımıyla](https://en.wikipedia.org/wiki/Degrees_of_freedom_(statistics)) dinamik bir sistemin, üzerinde herhangi bir kısıtlamayı ihlal etmeden hareket edebileceği bağımsız yolların sayısı olarak tanımlanır ve sistemin eksiksiz olarak tanımlanabileceği bağımsız koordinatların sayısıdır. Bu bağlamda, serbestlik derecesi özet olarak bir sistemde bağımsız şekilde değişebilen değerlerin ya da niceliklerinin sayısıdır. Serbestlik derecesi, öncelikli olarak örnek dağılımın eleman sayısına (örnek büyüklüğüne) bağlıdır. Eleman sayısının fazla olması serbest olarak değişebilecek değerlerin sayısının da fazla olması anlamına gelir. Bir örnek dağılım için serbestlik derecesi; $dof = N -1$ ile veriliir. Burada serbestlik derecesi $dof$, örneklem büyüklüğü ise $N$’dir. Örnek dağılım, bir ana dağılımdan üretilmekte olduğu için, örnek dağılımın ortalama değeri, ana dağılımın ortalamasını temsil etmelidir. Bu durum serbestlik derecesinin 1 azalması anlamına gelir; bu nedenle serbestlik derecesi $N - 1$ olmuştur. \n", "\n", "Aynı şekilde bir sistemin varyansı söz konusu olduğunda da serbestlik derecesi $dof = N - 1$'dir zira varyans, ortalamaya bağlı olarak hesaplanır. \n", "\n", "Eğri uyumlamasında ise; $dof = N – m$ ile verilir. Burada $m$, uyumlamada kullanılan parametre sayısıdır. Uyumlamada kullanılan parametre sayısının fazla olması serbest olarak değişebilen değerlerin sayısının parametre sayısı kadar azalması anlamına gelir." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Model ve Artıkları #\n", "\n", "Bir bilimsel model gerçek bir olgunun fiziksel, kavramsal ya da matemetiksel olarak temsilidir. Bir modelin amacı bir olguyu daha kolay anlaşılır, yorumlanır, tanımlanır, nitel hale getirilebilir, görselleştirilebilir ve simüle edilebilir hale getirmektedir. Böylece bir model üzerinden geleceğe ilişkin tahminler de yapılabilir (ekstrapolasyon). Geçen ders gördüğümüz eğri uyumlama da gözlemsel (ya da deneysel) bir veri setine yapılan analitik bir modeldir. \n", "\n", "Bir uyumlama işlemi sonunda, gözlemsel veri ile uyumlama eğrisinin değerleri arasındaki farklara artık (ing. residual) denir. Artıkların dağılımı ve gösterecekleri olası trendler, uyumlamada kullanılan yöntemin veya modelin ne kadar başarılı veya kabul edilebilir olduğunun bir ölçütü olarak kullanılabilir.\n", "\n", "Aşağıdaki grafiğin üst panelinde HW Virgo yıldızının minimum zamanlarının (veri noktaları) değişimine yapılan bir parabol uyumlaması (kesikli eğri) görülmektedir. CCD gözlemleriyle elde edilen minimum zamanları daha büyük simgelerle, birinci minimumlar içi dolu, ikinci minimumlar içi boş çemberlerle gösterilmiştir. Alt panelde parabolik bu modelden artıklar görünmektedir. Bu panelde $y = 0$ doğrusu (sürekli doğru) parabole karşılık gelmektedir. Uyumlanan parabolün iki ucundan tutulup yatay bir doğru haline getirildiğini; bu sırada veri noktalarının da bu parabol modele olan uzaklıklarının bozulmadan taşındığnı düşünebilirsiniz. Veri noktalarının alt panelde modele göre bu şekildeki konumları, bir başka deyişle modelden farkları, artıkları verir. Yakın zamanda yapılan CCD gözlemleriyle elde edilen minimum zamanlara yapılan parabol modelden artıkların sinüsoidal bir değişim gösterdiği düşünülmüş, artık (Kepleryan) ikinci bir modelle uyumlanmıştır (kesikli eğri).\n", "\n", "
\n", " \"HW\n", "
" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Artıklarda Değişen Varyans ##\n", "\n", "Artıkların bir grafiğe aktarılarak görsel olarak incelenmesi model başarısının görsel olarak anlaşılması anlamında önemlidir. HW Vir örneğinde bu türden bir inceleme araştırmacıya artıkların yakın tarihli olanlarının sinüsoidal bir değişim gösteriyor olabileceği fikrini vermiştir. Ancak burada artıkların varyansının, geçmişte görsel ve fotokatlandırıcı tüpler ve fotoğraf plakları gibi dedektörlerle yapılan gözlemlerin duyarlılık yetersizliklerine karşılık yakın zamanlı gözlemlerin duyarlı CCD gözlemleri olması nedeniyle zaman içinde değiştiği görülmektedir. Artıklarda aşağıdaki örneklerdeki gibi değişen bir varyans sorunu söz konusu olduğu bu tür durumlarada doğrudan modelden artıkları incelemek yerine, normalize artıkları incelemek daha anlamlı olabilir. \n", "\n", "Burada normalize artık, veri noktasının modele uzaklığının hatasına (ya da belirli bir bölümünün varyansına) bölümüyle tanımlanır. Böylece teknoloji yetersizlikleri, kötü hava koşulları gibi nedenlerle saçılması büyük olan veriyle daha ideal koşullarda, hatta uzaydan ya da kaliteli gözlem araçlarıyla ve büyük teleskoplarla yapılan gözlemleri birarada değerlendirmek mümkün olur. \n", "\n", "Normalize artık ($R_i$), $y_i$ ölçüm değerlerini, $\\hat{y}(x_i)$ o noktaya karşılık gelen model değerini, $\\alpha_i$ ölçüm hatalarını göstermek üzere aşağıdaki şekilde tanımlanır.\n", "\n", "$$ R_i = \\frac{y_i - \\hat{y}(x_i)}{\\alpha_i} $$\n", "\n", "
\n", "\"Degisken\n", "
" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Bir Modelin Başarımına İlişkin Parametreler # \n", "\n", "Eğri Uyumlama dersinde de değindiğimiz gibi bir modelin başarımı veri noktaları ile o noktalara modelde karşılık gelen değerler arasındaki fark, daha doğru ifadeyle bu farkların karelerin toplamı, üzerinden tanımlanır. Bu fark ne kadar küçükse model o kadar başarılı adledilir. Ancak bu Artık Kareler Toplamı (ing. Residual Sum of Squares) olarak tanımlanan ve aşağıdaki şekilde ifade edilen bu toplam doğrudan bir model başarımı göstergesi değildir. \n", "\n", "$$ S_r = \\sum_{i=1}^{n} (y_{i} - \\hat{y_i})^2 $$\n", "\n", "Kök Ortalama Kare Hatası/Sapması (ing. Root Mean Square Error/Deviation) ya da daha iyi bilinen adıyla \"RMS Hatası\" artıkların uyumlama etrafında ne kadar saçıldığını gösteren bir parametredir ve yine bir model başarımı göstergesi değildir.\n", "\n", "$$ RMSE = \\sqrt{\\frac{1}{n}\\sum_{i=1}^{n} (y_{i} - \\hat{y_i})^2} = \\sqrt{\\frac{S_r}{n}} $$\n", "\n", "RMSE yerine, ona çok benzer şekilde ancak fark kareler toplamının $n$ nokta üzerinden ortalaması yerine varyansa (ya da ölçüm hatalarının karesine) bölünmesiyle tanımlanan $\\chi^2$ ve onun serbestlik derecesine normalize edilmesiyle tanımlanan indirgenmiş $\\chi^2_{\\nu}$ parametresi daha sık kullanılır. Bu parametre adıyla bilinen $\\chi^2$-dağılımını göstermesi nedeniyle artıkların analizinde önemli bir avantaj sunar.\n", "\n", "$$ \\chi^2 = \\sum_{i=1}^{n} \\frac{(y - y_i)^2}{e_i^2} $$\n", "\n", "$$ \\chi^2_\\nu = \\frac{\\chi^2}{\\nu} $$\n", "\n", "Burada sistemin $\\nu$ serbestlik derecesi (dof, ing. degree of freedom), veri noktası sayısı ile model paramatreleri sayısı arasındaki farktır ($\\nu = n - m$).\n", "\n", "Ayrıca korelasyon katsayısı (ing. correlation coefficient, $r^2$) da model başarımını ifade etmek için zaman zaman kullanılsa da daha çok lineer ve polinom modeller için kullanılmaktadır. Hatırlatmak gerekirse; korelasyon katsayısı bir modelin ortalamaya oranla başarısını gösterir. Doğrusal ya da parabolik modelden daha karmaşık modelleri ortalamayla karşılaştırmak iyi bir fikir olmayacağı için bu ölçütün de kullanım alanı bu tür modellerle sınırlıdır. \n", "\n", "$\\chi^2$ dağılımı ve özelliklerine geçmeden önce artıkların incelenmesi için kullanılan başka bir yöntem olan gecikme grafiklerinden (ing. lag plot) bahsetmekte fayda vardır." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Gecikme Grafikleri ##\n", "\n", "Bir ölçümün değerlerindeki bağlı değişkenin, sırası değiştirilerek kendi değerlerine göre çizdirilen grafiklere gecikme grafikleri (ing. lag plot) adı verilir.\n", "\n", "Verinin bir sıra kaydırılarak çizilen gecikme grafiğine birinci dereceden gecikme grafiği adı verilir. Genellikle birinci dereceden gecikme grafikleri aşağıdaki amaçlarla kullanılmaktadır. \n", "\n", "* Model uygunluğu\n", "* Seri korelasyon/otokorelasyon ile kırmızı (korele) gürültünün tespiti\n", "* Verinin rastgeleliğinin testi\n", "* Dönemli (mevsimsel) dalgalanmalar\n", "* Aykırı değerlerin tespiti\n", "\n", "### Gecikme Grafikleriyle Model Uygunluğu Testi ###\n", "\n", "Örneğin aşağıdaki gibi ilk bakışta farkedilemeyen bir sinüsoidal bir değişimin, y-ekseninin bir kaydırılarak (`numpy.roll` fonksiyonu bu amaçla kullanılabilir) eski haline göre ($y_{lag,1} - y$) çizdirilmesi sonucunda elde edilen elipsoidal grafik $y$'nin $x$'le tek dönemli sinüsoidal yapıda değiştiğine ilişkin kuvvetli bir fikir vermektedir. " ] }, { "cell_type": "code", "execution_count": 13, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "import numpy as np\n", "from matplotlib import pyplot as plt\n", "%matplotlib inline\n", "np.random.seed(124)\n", "x = np.linspace(0,48*np.pi,1000)\n", "y = np.sin(x) + 0.1*np.random.rand(x.size)\n", "plt.plot(x,y,'r+')\n", "plt.xlabel(\"x\")\n", "plt.ylabel(\"y\")\n", "plt.show()" ] }, { "cell_type": "code", "execution_count": 14, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "# Gecikme grafigi\n", "ylag1 = np.roll(y,1)\n", "plt.plot(y, ylag1, 'r+')\n", "plt.xlabel(\"y\")\n", "plt.ylabel(\"$y_{lag,1}$\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Diğer taraftan aralarında bir ilişki bulunmayan parametrelerin gecikme grafikleri de rastgele (ing. random) yapıdadır. " ] }, { "cell_type": "code", "execution_count": 15, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "from matplotlib import pyplot as plt\n", "import numpy as np\n", "%matplotlib inline\n", "np.random.seed(758)\n", "x = np.linspace(0,10,100)\n", "y = np.random.rand(100)*10\n", "ylag1 = np.roll(y,1)\n", "plt.plot(x,y,'ro')\n", "plt.xlabel(\"x\")\n", "plt.ylabel(\"y\")\n", "plt.show()\n", "plt.plot(y,ylag1,'bo')\n", "plt.xlabel(\"y\")\n", "plt.ylabel(\"$y_{lag,1}$\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Çapraz Korelasyon ve Otokorelasyon ###\n", "\n", "Çapraz-Korelasyon işlemi (ing. cross-correlation) iki sinyal arasındaki benzerliğin hangi gecikme değeri ($\\tau$) için maksimum olduğunu belirlemek üzere astronomide de sıklıkla kullanılan matematiksel bir işlemdir ve aşağıdaki şekilde tanımlanır.\n", "\n", "$$ f \\star g~(\\tau) \\triangleq \\int_{-\\infty}^{+\\infty} \\overline{f(t)} g(t + \\tau) dt $$\n", "\n", "İstenirse $g$ fonksiyonu sabit tutulup $f$ ters yönde kaydırılarak da tanım yapılabilir.\n", "\n", "$$ f \\star g~(\\tau) \\triangleq \\int_{-\\infty}^{+\\infty} \\overline{f(t - \\tau)} g(t) dt $$\n", "\n", "Örneğin bir yıldızın tayfından dikine hızının elde etmek için geleneksel olarak çapraz korelasyon fonksiyonları kullanılır. Bunun için yıldızın bir sentetik tayfı ($g$) oluşturulduktan sonra, gözlemsel tayfla ($f$) çapraz korelasyona tabi tutulur. $g$ sentetik tayf fonksiyonunun her $\\tau$ kadar kaydırılması sonrası $g(\\lambda + \\tau) f(\\lambda)$ çarpımı elde edilir. Burada $\\lambda$ bir tayf fonksiyonunun temel parametresi olup dalgaboyunu göstermektedir. Bu çarpım hangi $\\tau$ için maksimum oluyorsa o değer iki fonksiyonun (sentetik ve gözlemsel tayflar) birbirine en çok \"benzediği\" (korelasyon gösterdiği) kayma değeridir. Tayflar için bu iki tayfın en iyi örtüştüğü Doppler kayması değeri olan $\\tau = \\Delta \\lambda$ değerini verir ve aşağıdaki şekilde ifade olunan klasik Doppler kayması denkleminden \n", "\n", "$$ \\frac{\\Delta \\lambda}{\\lambda} = \\frac{V_r}{c} $$\n", "\n", "yıldızın dikine hızı ($V_r$) elde edilmiş olur.\n", "\n", "Otokorelasyon (ing. autocorrelation) fonksiyonu bir sinyalin x-ekseninde kaydırılmış (geciktirilmiş) bir versiyonuyla çapraz-korelasyon işlemine tabi tutulmasıyla elde edilir.\n", "\n", "$$ f \\star f~(\\tau) = \\int_{-\\infty}^{+\\infty} \\bar{f(t)} f(t + \\tau) dt $$\n", "\n", "### Verinin Rastgeleliğinin Testi ###\n", "\n", "Rastgelelik gösterip göstermediği bir gecikme grafiğiyle araştırılmak istenen bir değişenin otokorelasyon göstermesi durumunda gecikme grafiği lineer yapıdadır. Bu durum birkaç sebepten kaynaklanabilir. Örneğin zamana bağlı bir sinyaldeki gürültü, bir veri noktasının bir öncekinden bağımsız olmasını engelleyen (korele) bir gürültü olabilir (ing. red noise). Ya da zamanla fiyat artışı, enflasyon gibi bir önceki veri noktasının değerine bağlı veri noktaları içeren değişkenler otokorelasyon gösterirler ve bu durum gecikme grafikleriyle ortaya konabilir." ] }, { "cell_type": "code", "execution_count": 16, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "import numpy as np\n", "from matplotlib import pyplot as plt\n", "%matplotlib inline \n", "np.random.seed(43)\n", "x = np.linspace(0,10,100)\n", "veri = 2*x + 5 + np.random.rand(100)*2\n", "plt.plot(x,veri,'ro')\n", "plt.xlabel(\"x\")\n", "plt.ylabel(\"y\")\n", "plt.show()" ] }, { "cell_type": "code", "execution_count": 17, "metadata": {}, "outputs": [ { "data": { "image/png": "iVBORw0KGgoAAAANSUhEUgAAAYQAAAEKCAYAAAASByJ7AAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADl0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uIDMuMC4zLCBodHRwOi8vbWF0cGxvdGxpYi5vcmcvnQurowAAGdBJREFUeJzt3X+IXWl9x/HPd2aTkjEBN5OwDYuZQRHBCu66U5EqRVsVzR9VKRVkdhl/EWW1ZIvQteYPt9KAFX90C3W3sa5ON7dCYdcfSJAuy7a2ItJJunWzG2iKzQSXuJlMtNmQLRuTb/845+7cOXPOuefce37e837BZeae++vhcjnf8zzf5/s85u4CAGCq7gYAAJqBgAAAkERAAACECAgAAEkEBABAiIAAAJBEQAAAhAgIAABJBAQAQOimuhuQx549e3x+fr7uZgBAq5w4ceKiu+8d9rxWBYT5+XmtrKzU3QwAaBUzW83yPIaMAACSCAgAgBABAQAgiYAAAAgREAAAkggIAFCaXk+an5empoK/vV7dLUrXqmmnANAWvZ508KB09Wpwf3U1uC9Ji4v1tSsNPQQAKMHhwxvBoO/q1eB4UxEQAKAE587lO94EBAQAKMH+/fmONwEBAQBKcOSINDOz+djMTHA8jyoT0wQEACjB4qJ09Kg0NyeZBX+PHs2XUO4npldXJfeNxHRZQYGAAAAlWVyUzp6VbtwIegaHD+e70q86Mc20UwAo2ahTUKtOTNNDAIAcRhnTH/VKv+rENAEBADIadUw/6Yp+dVXasye4xQWYohLTWZUeEMzsFWb2hJk9Y2ZPm9mh8Ph9ZvasmT0Z3g6U3RYAGEfRV/qStL4e3JICzI4dG//PzuZPTOdRRQ7h15I+5e4nzWyXpBNm9lj42Ffc/YsVtAEAxjbKmH6vJ125kv0zBgPMYN5Bkl54Ifv7jKL0HoK7n3f3k+H/z0s6LenWsj8XAIqWd0y/P8S0vp7vc86dq2fpi0pzCGY2L+l2ST8JD33SzH5qZg+Z2c0JrzloZitmtrK2tlZRSwFgq7xj+nEn9Sz2769n6YvKAoKZ7ZT0iKR73P2ypAckvUrSbZLOS/pS3Ovc/ai7L7j7wt69e6tqLgBskbfYbJSTdz/A1LH0RSV1CGa2TUEw6Ln7o5Lk7s8NPP41Sd+voi0AMI7FxexJ3f37g0Rx1OystHNnEDB27w6OXboUPP/IkY33j+YQypxhJFUzy8gkfV3SaXf/8sDxfQNPe5+kU2W3BQCqdOBA0JMYNDMj3X//RgXzxYvB7caN4Fg/GBSx9EVeVfQQ3izpLklPmdmT4bHPSPqAmd0mySWdlfSxCtoCAJXo9aTl5WA6aZ+ZtLSU/aSepzdShNIDgrv/mySLeeh42Z8NAHXo9YIT//Xrm4+7S8cbfOajUhkACtSfahoNBn1skAMAHTFsqikb5ABAR6T1AMqeJTQuAgKAiVPlLmNRST2A6enyZwmNi4AAYKJUvctYVFI18/Jys4OBREAA0GBV7j1QlDrqB4piPjhJtuEWFhZ8ZWWl7mYAqEB0lzEpuNIednKdmto897/PLCj+6iIzO+HuC8OeRw8BQCNVtctYnfmGpiEgAGikUVf7zLMiad35hqYhIABopFFX+8wzhl93vqFpCAgAGmmc/YQXFzcWjxtcMC6qjj0HmoyAAKCRRp2tkycnUMeeA01GQADQWFmv9PtBwEy6667sOYG8+YZJTz4TEAC02mBiWNo65TQtJ5C1F9KV5DN1CABq1esFJ+xz57buGJbF/Hz8rmSDxq1BSPqMubmg59J01CEAaLwirryzJICz5gSShoW6knwmIACoTRHTPoed7KM5gaSTflpw6krymYAAoDZJV9irq9kTt3GJ4f4+xtGcQNpJPy04jTMFtk0ICABqk3aFnXX4KC4x/PDDwQk/OjMp7aSfNizU5gXr8iCpDKA2cQvYRRWZuE1b+G7//nYnjtOQVAbQeINX3kmKTNym5QK6MiyUhoAAoFb94rOkoDBO4jaaQD5wIPmk35VhoTQEBACNUPQVelwCeXlZWlpKPulnrYyeVDfV3QAAkDZOvuMUqQ1KSiAfP97+nEBZ6CEAaIxxrtCjw0NJ1cuTVkxWJHoIAFovOltpdTUYEoqbUTRpxWRFoocAYGx1rAQ6+JlLS1uHh9w3CtT6ujZrKC8CAoCxjLMe0aiBJPqZ16/HP8+927OG8qIwDcBYRl0JNK4obWYm20k7ywqnWdrQFRSmAajEKCuB9nrxwzxZF7bLkhhmeCg/AgKAseRdCbTfM0ga5hlnOevpaYaHxkFAADCWvAVlcfUBg7LMAkr6zOXl7haVFYGAAGAseZd8SOsBZB3mYZmJcpBUBlCppITw9HRwhc9JvXgklQE0UtpwD8GgXgQEAEMVWXhWxHBPHYVwXcCQEYBU49QLdKE9bZB1yIiAACDVqIVnZWlae9qgMTkEM3uFmT1hZs+Y2dNmdig8vtvMHjOzM+Hfm8tuC4D8Rik8K1PT2jNJqsgh/FrSp9z9tZLeJOkTZvZaSZ+W9Li7v1rS4+F9AA2Tt/CsbE1rzyQpPSC4+3l3Pxn+/7yk05JulfQeScvh05YlvbfstgDIr8idzIpIBrP3cXkqnWVkZvOSbpf0E0m3uPv58KFfSLol4TUHzWzFzFbW1tYqaSeADUUVgY2zKmoZ7cFWlSWVzWynpH+RdMTdHzWzX7n7ywce/6W7p+YRSCoD7UUyuD6NSSqHjdkm6RFJPXd/NDz8nJntCx/fJ+lCFW0BUA+Swc1XxSwjk/R1Safd/csDD31P0lL4/5Kk75bdFgDFy5oXIBncfFX0EN4s6S5Jv2dmT4a3A5I+L+kdZnZG0tvD+wBq0utJe/YE4/Jmwf/Dxvfz5AVIBreAu7fmdscddziA/I4dc5+bczcL/h47tvXxbdvcg9P6xm379q3PHTQ3t/U1UnB8lHagHJJWPMM5lkplYIL0esF+A+fOBUMx/avvYUs9pG1JmZb0nZoKQkCUWbAvAZqBpSuAjkla42fHDml9fevzB0/0SSd2Kf3kzsyhdmjULCMA5Yvbiezq1fhgIG2e3ZOW2E17jLzAZCEgABMi7/TNwRP9kSPStm1bn7N9e/rJnSKxyUJAACZEnumb0av4xUXpox8NTup9O3dKDz00/OS+uBgMD7GXcfsREIAJETd8E2d6eutVfK8X7Fg2mEcgKdw9BARgQkSHb5LcuLH1Kj4p/3D4cPHtRHMREIAJMjh8MzcX/5zo0FKvlzzllGUluoWAAEyoLDOA+lNVk7CsRLcQEIAJlWUGUNxQUR/TR7uHgAA02LgbygybAZQ2JMT00e4hIAANlbZw3CgL0cVJGhKamyMYdBEBAWiopJk/hw5JH/rQ5grk9XXpwx/OHxSoNMYgAgLQUEnDOevr0rVrW4+/+OJo00R37Nj4f3aWoaIuIyAADTXKDJ8800T7Q1KDPY0XXsj/mZgcBASgoeKGc9IKzqR8QYRiNEQREICaDJtBNDhtVAqCwbDV6vOM/bPHMaIICEANsm492Z82Ojc3PBj0n58VexwjioAA1CDvcE2Wq/akpSqSMMMIUQQEoAZ5h2uGXbWPciJnLwNEERCAGuQdrklLMI9zImcvAwwiIAAViCaQDxzIP1wTrRd4+OEgr8CJHEUhIAAli0sgLy9LS0vZhmuoF0BVzLNMXWiIhYUFX1lZqbsZQC579sRvdD83F1zdDzM/H79fQdbXA2Z2wt0Xhj2PHgJQoOjQ0N13xwcDKX3m0OD7sHkNqjJyQDCze4tsCNB2cUNDDz6Y/PykBHL0ffK+HhjVTVmfaGb/OHhX0m2S/rLwFgEtFVdbkHZCT0ogp21a00e9AMqQOSBIuuzuH+3fMbMHSmgP0Fp5hnCmUvrmae9jFvQMjhxhZhGKl2fIKHo9whJYmAjj7krWlzSEE7cg3Y0b8UtVpL3P3Bz1AihX5oDg7v8TuX+p+OYA1cq6plAWSUtBfPzj0vT01ucnLVXBkhKoC7OM0GlFLgGdtBTEV78aXNnHiRseYkkJ1GXkOgQz+7Ckn7n7PxfaohTUIaBoU1PxiV+z5JP4KKglQJ1KqUMws5cP3P2+pN/I2zCgSapaApphILRB3iGj75jZI2b2N5L+QNITJbQJqExVJ2qGgdAGeQPCj9z9DyX9qaQ3SPqL4psEVKfKE3V0ZVGpmNlNQFHy1CFI0s1m9tuS/lPBcNHzxTcJqNbiYvVX6v3ZTf2Edn92U789QB3y9hDukfQ7kh6U9JikU4W3COgANrhHE+UNCPdKercklzTr7g8X3ySgXEmFaEUVqGXBBvdoorwBYVbSjxXkDl6T9UVm9pCZXTCzUwPH7jOzZ83syfB2IGdbgNySCtHuvnvr8TvvDJauLiMwsME9mihvQPilpGlJFyTlqVT+pqR3xRz/irvfFt6O52wLECvtSj9pqObo0fgF5dbXR69cTsM0VDRRroDg7n+uIH/w15L+N8frfqh8AQQYybClKJKGZK5fT37Pq1elQ4eKHU5iGiqaKHOlspl9Q9IVSScl/bukpz1HmbOZzUv6vru/Lrx/n6QPSrosaUXSp9z9l2nvQaUyhhlWEZz0+PR0elCImpnhBI72KLxS2d0/pKD+4L8kvV3S347ePEnSA5JepWBfhfOSvhT3JDM7aGYrZraytrY25kdi0g1L1iYN1Rw8uPV4mrgZQVUmpYFSuHvqTcH00tcPe16G95mXdCrvY4O3O+64w4E0c3PuwWDR5tvc3MZzjh0L7psFf48d2zg+Oxv/+rib2eb3nJnZ/PjMzMZ7A3WStOIZztNZegj3SvorM/uGme0rKhBF3ut9oqYBBciSrI1WDPeHfRYXpYsXpWPHNo/tz87Gf9bgjCDqCjAJhgYEdz/p7m9TsJjdD8zss2a2I8+HmNm3FExXfY2Z/dzMPiLpC2b2lJn9VNLbJP3JCO0HNikiWRsNGPffPzzIUFeASZApqWxmJum3JL1FQQ3C/0n6M6+4MI2kMurS6wVX++fOxW9hyfLWaLLCkspm9iNJz0r6iqRbFcwMequkN5rZ0fGaCeRXRfI2+hlS/DBTH3UFmARZFrc7KOkZ39qV+GMzO11Cm4BEVSwKN8pn9I+n9SKApht5xzRJMrNXuvvPCmxPKoaMkGVoZtjwThGfAbRJ1iGjvMtfb1JlMACk5CTt6urGidxsY1vMUXoQJIjRVXnXMgJqlbT4m9nGVX2005t3+icLz6GrCAholbjk7WCPIEmeq3sSxOgqAgIaI8vsobg6gyxpsDxX9yw8h64aK6lcNZLKkys6s0fKvoBcUhI47/sAk6rwxe2AMo2z9EPSMJKU/eqehemAMWcZAUUZZ2bPuDUAbHgPBBgyQiPUOfefugNMOoaM0CrjzOwZd7iHugMgQEBAI6TN7Ek74Q/bMjML6g6AAENGaLRhs4+KGO4ZZ4YT0AYMGWEiDJt9VMRwD3UHQIBZRmi0YSf8/fvjewh5h3sWFwkAAD0ENEo0X7B7d/zz+id8lpkAikNAQKXyJogvX5a2b9/8HoMnfIZ7gOIQEJDZuNM7h80IissXXLsm7dqVfsKP7oFMMABGwywjZFLETJxhM4KmpuIXqjMLTvYARsMsIxRqnLWG+rIkiONQDwBUg4CATIqY3jnshE+CGKgXAQGZFHH1PuyET4IYqBcBAZkUcfWe5YRPghioDwEBmyTNJCrq6p0TPtBcVCrjJcP2BaCaF5hs9BA6LNobOHQofibR0hI7iQFdQEDoqLgisfX1+Odev765kOzuu9luEphEDBl1TK8X1A6kbUqf5upV6cEHNwrI2G4SmBz0EDpksFcwjmg1cdYCNTayB5qNHkKHxFUbR83OSjt3BgVnU1PBcFEWwwrU2MgeaD56CB0y7KQ9MyPdf//GtNDl5a21B2bxrx1WoFbE0hcAykVA6JC0k3ZSkVi/9kCSpqfjF5/bvn14gRob2QPNR0DokKRq42PHkovEFhc3Xpc0fJRlwVwWrgOaj4DQIVmqjeMSv8NyD9euDR/6YeE6oPlIKndMWrVxUuJ3WCJayjb0s2PHxnvNzgb5ChLKQHMQEPCSpMTv9PTw2UZpQz9xm+u88MLo7QRQDoaM8JKkq/zr17cO9wwyC3oTSbUFzDAC2qGSgGBmD5nZBTM7NXBst5k9ZmZnwr83V9EWJEu6yu/nGvq5h9nZ4CYF96NVy9GgwAwjoB2q6iF8U9K7Isc+Lelxd3+1pMfD+6hRWuJ3cNnqixeD29xctqplZhgB7VBJQHD3H0q6FDn8HknL4f/Lkt5bRVuQLO+eB1mv/JlhBLRDnTmEW9z9fPj/LyTdUmNbEMqzgU3WK3+2xgTaoRFJZXd3SbHlTWZ20MxWzGxlbW2t4pYhTZ4rf3ZKA5qvzoDwnJntk6Tw74W4J7n7UXdfcPeFvXv3VtrAKrVxJVCu/IHJUmcdwvckLUn6fPj3uzW2pVZtXgmUbTWByVHVtNNvSfqxpNeY2c/N7CMKAsE7zOyMpLeH9zuJefoAmqCSHoK7fyDhod+v4vObjnn6AJqgEUnlrmOePoAmICA0QNJsnQMHNiea2dweQJlY3K4B+knZw4eDYaL9+4NgsLy8OdH8wAMbr2lT4hlAO9BDqMiwaaXRefrHjw9fdrqIxHMbp7sCKAc9hAqMMq00a0J5nMRzm6e7AiieeZb9DxtiYWHBV1ZW6m5GbvPzwck2am4u6A3keU2e9yijXQDax8xOuPvCsOcxZFSBUaaVxiWao8ZdII7prgAGERAqMMq00sFlIaRgaYhBZtLS0nhDO0x3BTCIgFCyXk+6cmXr8SxX9/1Ec9y+A+5B4nkcLEsNYBABoUT9pO36+ubjs7P5FoEra2iHxekADCKpXKKikrYkfwGMg6RyAyTNEsp7Zc/QDoAqEBBK0uttTQT35U3aMrQDoAoEhIL1K3/vvHNrIlgKTuhZr+wHq4gPHw5el7TjGBXHAMZFpXKBopW/cdyzXdnnqSKm4hhAEUgqFyhLdXHWRHCeRDJJZwBpSCoXIO8wzLBgkCcRnGeqKRXHAIpAQEjQH4ZZXQ2GefrDMGlBYXo6+bG8ieA8VcRUHAMoAgEhwSj7HF+/nvxYXCI4TZ6ppkxLBVAEAkKCUYZh+usOZT2eJs9UU6alAigCSeUEoyRq42YZzcxwcgZQL5LKYxplGIYrdQBtRh1Cgrh9jo8cGX5yX1wkAABoJ3oIKaL7HBd9oqe6GECT0EOoCdXFAJqGHkKJ0noAo0xrBYAydSIg1DE0M6ywjepiAE0z8QFhlIrjIgzrAVBdDKBpJj4g1DU0M6wHQHUxgKaZ+ICQd2imqOGlYT0AahYANM3EB4Q8QzNFDi9l6QGUPa0VAPKY+ICQZ2imyOElegAA2qYTaxn1etkqjqemkre9vHFjhAYDQAOwltGApKGZaL5g9+741zPzB0AXdLZSOa5SeNs2aft26cUXN57HzB8AXdGJHkKcuHzBtWvSrl2M+wPops72EJKmnV66JF28WG1bAKAJOttDSMoL7N7NCqQAuqn2gGBmZ83sKTN70syq2Q5N8dNRt2+XLl+ufpkLAGiC2gNC6G3ufluWaVFFiasT2LUryCMMYgVSAF3RlIBQi+h01EuX4p/HCqQAuqAJAcEl/ZOZnTCzg3U2hBVIAXRZEwLCW9z9DZLeLekTZva7gw+a2UEzWzGzlbW1tVIbwgqkALqs9oDg7s+Gfy9I+rakN0YeP+ruC+6+sHfv3lLbwvpDALqs1joEM3uZpCl3fz78/52SPldnmxYXCQAAuqnuwrRbJH3bzPpt+Qd3/0G9TQKAbqo1ILj7zyS9vs42AAACtecQAADNQEAAAEgiIAAAQq3aMc3M1iStxjy0RxJrlA7H95QN31M2fE/ZNOF7mnP3ofP2WxUQkpjZSpXrILUV31M2fE/Z8D1l06bviSEjAIAkAgIAIDQpAeFo3Q1oCb6nbPiesuF7yqY139NE5BAAAOOblB4CAGBMrQ4IdW2/2XRm9pCZXTCzUwPHdpvZY2Z2Jvx7c51tbIKE7+k+M3s2/E09aWYH6mxjE5jZK8zsCTN7xsyeNrND4XF+UwNSvqfW/KZaPWRkZmclLbh73XN8GyXcU+KKpL9399eFx74g6ZK7f97MPi3pZne/t8521i3he7pP0hV3/2KdbWsSM9snaZ+7nzSzXZJOSHqvpA+K39RLUr6n96slv6lW9xAQz91/KCm6Ieh7JC2H/y8r+KF2WsL3hAh3P+/uJ8P/n5d0WtKt4je1Scr31BptDwiN2X6zBW5x9/Ph/79QsPQ44n3SzH4aDil1ehgkyszmJd0u6SfiN5Uo8j1JLflNtT0gpG6/iXgejBO2d6ywXA9IepWk2ySdl/SlepvTHGa2U9Ijku5x98uDj/Gb2hDzPbXmN9XqgDBs+01s8lw4xtkf67xQc3sayd2fc/fr7n5D0tfEb0qSZGbbFJzkeu7+aHiY31RE3PfUpt9UawOCmb0sTNz0t+J8p6RT6a/qtO9JWgr/X5L03Rrb0lj9E1zofeI3JQu2NPy6pNPu/uWBh/hNDUj6ntr0m2rtLCMze6WCXoG0sf3mkRqb1Bhm9i1Jb1WwyuJzkj4r6TuS/lHSfgUrxr7f3TudUE34nt6qoGvvks5K+tjAOHknmdlbJP2rpKck3QgPf0bB+Di/qVDK9/QBteQ31dqAAAAoVmuHjAAAxSIgAAAkERAAACECAgBAEgEBABAiIAAAJBEQAAAhAgIwBjP7nJndM3D/SH8dfKBtKEwDxhCuavmou7/BzKYknZH0Rndfr7VhwAhuqrsBQJu5+1kzWzez2xUs//wfBAO0FQEBGN/fKdg97DclPVRvU4DRMWQEjMnMtitY0GybpFe7+/WamwSMhB4CMCZ3f9HMnpD0K4IB2oyAAIwpTCa/SdIf1d0WYBxMOwXGYGavlfTfkh539zN1twcYBzkEAIAkeggAgBABAQAgiYAAAAgREAAAkggIAIAQAQEAIEn6f57hTYmKw/FsAAAAAElFTkSuQmCC\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "veri_lag1 = np.roll(veri,1)\n", "plt.plot(veri[1:],veri_lag1[1:],'bo')\n", "plt.xlabel(\"y\")\n", "plt.ylabel(\"$y_{lag,1}$\")\n", "plt.show()" ] }, { "cell_type": "code", "execution_count": 18, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "veri_lag2 = np.roll(veri,2)\n", "plt.plot(veri[2:],veri_lag2[2:],'bo')\n", "plt.xlabel(\"y\")\n", "plt.ylabel(\"$y_{lag,2}$\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Dönemli Değişimlerin Gecikme Grafikleri ###\n", "\n", "Mevsimsel nitelik gösteren değişenler (sıaklık, nem, güneş lekesi sayısı vs.) için oluşturulan gecikme grafiklerinde bu türden çevrimli yapılar lineer yapılar olarak kendini gösterir." ] }, { "cell_type": "code", "execution_count": 19, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "import numpy as np\n", "from matplotlib import pyplot as plt\n", "%matplotlib inline \n", "np.random.seed(43)\n", "x = np.linspace(0,16*np.pi,200)\n", "donemli_veri = 2*np.cos(3*x) + 2*np.sin(2*x+np.pi/4) + np.random.rand(200)*2\n", "plt.plot(x,donemli_veri,'ro')\n", "plt.xlabel(\"x\")\n", "plt.ylabel(\"y\")\n", "plt.show()" ] }, { "cell_type": "code", "execution_count": 20, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "donemli_veri_lag1 = np.roll(donemli_veri,1)\n", "plt.plot(donemli_veri[1:],donemli_veri_lag1[1:],'bo')\n", "plt.xlabel(\"y\")\n", "plt.ylabel(\"$y_{lag,1}$\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Görüldüğü gibi dönemlilik içeren bu verinin birinci dereceden gecikme grafiği doğrusala yakın bir görüntüdedir. Ancak doğrusal değişimin başında varyansın artıp, ortasında maksimuma ulaşması, ardından da gecikme grafiğindeki değişimin sonuna doğru varyansın tekrar azalması, daha önce tek çevrimli bir sinüsün gecikme grafiğinde gördüğümüz elips yapısına da benzerlik göstermektedir. Sonuç olarak bu türden bir gecikme grafiği veride dönemlilik olabileceğini düşündürtür ve model aranırken dönemlilik içeren sinüs fonksiyonlarının lineer bileşimlerinin uyumlanması denenebilir." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "### Gecikme Grafiklerinde Aykırı Değer Yakalama ###\n", "\n", "Bir değişkenin değerindeki aykırılıklar kendisini gecikme grafiklerinde de gösterir. Bu nedenle gecikme grafikleri aykırı değer yakalamak için de kullanılabilirler. \n", "\n", "Örneğin son oluşturduğumuz dönemli değişim içeren donemli_veri veri dizimize birkaç aykırı nokta ekleyelim ve bunların gecikme grafiğinde ne şekilde davranacaklarına bakalım." ] }, { "cell_type": "code", "execution_count": 21, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "donemli_veri[::50] = [8, -6, 10, -7]\n", "plt.plot(x,donemli_veri,'ro')\n", "plt.xlabel(\"x\")\n", "plt.ylabel(\"y\")\n", "plt.show()\n", "donemli_veri_lag1 = np.roll(donemli_veri,1)\n", "plt.plot(donemli_veri[:],donemli_veri_lag1[:],'bo')\n", "plt.xlabel(\"y\")\n", "plt.ylabel(\"$y_{lag,1}$\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Durbin Watson İstatistiği İle Model Başarımı Testi #\n", "\n", "Durbin-Watson istatistiği, bir regresyon analizinden artıklarda birinci dereceden gecikme grafiğinde otokorelasyonun varlığını tespit etmek için kullanılan bir test istatistiğidir. Durbin-Watson istatistiği aşağıdaki şekilde tanımlanır ve bu istatistik hesaplanıp, kullanılarak model uyumlamanın başarısı test edilebilir.\n", "\n", "$$ \\mathcal{D} = \\frac{\\sum_{i=2}^{N} [R_{i} - R_{i-1}]^2}{\\sum_{i=1}^{N} [R_{i}]^2} $$\n", "\n", "Burada $\\mathcal{D}$, Durbin-Watson istatistiği, $R_i$, uyumlamadan (fitten) artıklar, $R_{i-1}$ ise artıkların $i-1$'den başlayarak dizilmesiyle oluşan artıklardır. $\\mathcal{D}$’nin alacağı değerlere göre aşağıdaki çıkarımlar yapılabilir:\n", "\n", "* $\\mathcal{D} = 0$: artıklar sistematik olarak korelasyon göstermektedir.\n", "* $\\mathcal{D} = 2$: artıklar normal dağılım göstermektedir.\n", "* $\\mathcal{D} = 4$: artıklar sistematik olarak antikorelasyona sahiptir.\n", "\n", "Örnek olarak Durbin-Watson istatistiğinin yanı sıra pek çok başka model istatistiği de veren bir paket olan [`statsmodel`](https://www.statsmodels.org/stable/index.html) paketi fonksiyonlarını modelleme için kullanalım. Durbin-Watson istatistiği yukarıdaki formülden kolayca hesaplanabilen bir istatistiktir. Dolayısıyla bu amaçla bir fonksiyon yazabilir ve modelleme işlemlerinizde `scipy` ya da `numpy` fonksiyonlarının yanı sıra bu yazdığınız fonksiyonu da kullanabilirsiniz. Ancak, burada hem bu fonksiyonu yazmayı size alıştırma olarak bırakmak hem de gelişmiş bir istatistiksel model paketini tanıtarak örneklemek açısından `statsmodel` ile bir modelleme örneği yapılacaktır. \n", "\n", "Öncelikle yine modellemek istediğimiz verimizi oluşturalım ve grafiğini çizdirelim." ] }, { "cell_type": "code", "execution_count": 22, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "import numpy as np\n", "from matplotlib import pyplot as plt\n", "%matplotlib inline \n", "np.random.seed(48)\n", "x = np.linspace(0,10,100)\n", "y = -3*x + 5 + np.random.rand(100)*10\n", "plt.plot(x,y,'ro')\n", "plt.xlabel(\"x\")\n", "plt.ylabel(\"y\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Şimdi bu değişimi modellemek üzere `statsmodel.api` fonksiyonlarından en küçük kareler yöntemiyle model uyumlaması yapan `OLS()` (ing. Ordinary Least Squares) fonksiyonunu kullanalım. Öncelikle uyumlanacak doğrunun y-ekseninde bir kayma terimi (sabit) de içerdiğini belirtmek ve bu terimi de uyumlamak için `statsmodel.api.add_constant` fonksiyonu kullanılmaktadır. Bu terim bağımsız parametreye 1'lerden oluşan bir sabit terim ekler ve fit sırasında bu parametre de uyumlanır ($y = m*x + n*1$). Bu nedenle \n", "\n", " X = sm.add_constant(x) \n", "\n", "ifadesiyle bir $X$ iki boyutlu dizisi oluşturulmuştur. Bu ifade bağımsız değişken $x$'i $X = [x,1] \\rightarrow y = m*x + n*1$ şeklinde ifade etmek ve uyumlama sırasında $m$ ve $n$ parametrelerinin bulunmasını sağlamaktadır.\n", "\n", "`OLS` fonksiyonuna önce argüman olarak verinin bağımlı değişkenini içeren $y$ dizisi, sonra bağımsız değişken $x$ ve sabit parametreyi (1) içeren iki boyutlu $X$ değerleri numpy dizisi olarak sağlanmaktadır. Daha sonra uygulanan `statsmodel.api.OLS()` fonksiyonu bir model nesnesi döndürmekte bu model nesnesi aşağıdaki kod parçasında $model$ değişkenine atanmaktadır. Eğri uyumlamada gördüğünüz `LMFIT` fonksiyonunda olduğu gibi model nesnesinin uyumlama için kullanılan bir `fit()` fonksiyonu bulunmakta; model sonuçları ise bir sonuç nesnesi ile birlikte bu fonksiyonla döndürülmektedir. Bu nesnenin `summary()` metodu aralarında Durbin-Watson istatistiğinin de bulunduğu model istatistiklerini görüntülemek için kullanılmaktadır." ] }, { "cell_type": "code", "execution_count": 23, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ " OLS Regression Results \n", "==============================================================================\n", "Dep. Variable: y R-squared: 0.900\n", "Model: OLS Adj. R-squared: 0.899\n", "Method: Least Squares F-statistic: 885.6\n", "Date: Tue, 19 May 2020 Prob (F-statistic): 7.05e-51\n", "Time: 16:49:31 Log-Likelihood: -246.38\n", "No. Observations: 100 AIC: 496.8\n", "Df Residuals: 98 BIC: 502.0\n", "Df Model: 1 \n", "Covariance Type: nonrobust \n", "==============================================================================\n", " coef std err t P>|t| [0.025 0.975]\n", "------------------------------------------------------------------------------\n", "const 9.2591 0.570 16.241 0.000 8.128 10.390\n", "x1 -2.9313 0.098 -29.760 0.000 -3.127 -2.736\n", "==============================================================================\n", "Omnibus: 19.617 Durbin-Watson: 2.058\n", "Prob(Omnibus): 0.000 Jarque-Bera (JB): 5.130\n", "Skew: 0.137 Prob(JB): 0.0769\n", "Kurtosis: 1.925 Cond. No. 11.7\n", "==============================================================================\n", "\n", "Warnings:\n", "[1] Standard Errors assume that the covariance matrix of the errors is correctly specified.\n" ] } ], "source": [ "import statsmodels.api as sm\n", "X = sm.add_constant(x)\n", "model = sm.OLS(y, X)\n", "sonuclar = model.fit()\n", "print(sonuclar.summary())" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "İstendiği takdirde modele ilişkin istatistiklerin bazıları sonuç nesnesinin metodları ile ayrı ayrı da görüntülenbilir. Yapılması gereken yukarıdaki istenen istatistiği veren metodu sonuç nesnesi üzerine uygulamaktır. Örneğin model parametreleri `params`, bu parametrelerin hataları `bse` ve korelasyon katsayısı ($r^2$) `rsquared` metodları ile aşağıdaki şekilde görüntülenebilir. " ] }, { "cell_type": "code", "execution_count": 24, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Parametreler: [ 9.25910957 -2.93131051]\n", "Standart hatalari: [0.57011759 0.09849884]\n", "r^2: 0.9003709173250201\n" ] } ], "source": [ "print('Parametreler: ', sonuclar.params)\n", "print('Standart hatalari: ', sonuclar.bse)\n", "print('r^2: ', sonuclar.rsquared)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "İstendiği takdirde uyumlanan fonksiyon yine bu nense üzerinden grafiğe aktarılabilir." ] }, { "cell_type": "code", "execution_count": 25, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "plt.plot(x,y,'ro', label='veri')\n", "plt.plot(x,sonuclar.params[0]+sonuclar.params[1]*x, 'b-', label='model')\n", "plt.xlabel(\"x\")\n", "plt.ylabel(\"y\")\n", "plt.legend(loc=\"best\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Oldukça gelişmiş model istatistikleri ve olanaklar sunan bu pakete daha ileri model örnekleri için tekrar döneceğiz. Ancak şu aşamada yaptığımız uyumlamanın Durbin-Watson İstatistiği'ne bakalım. $\\mathcal{D} = 2.058~\\sim~2$ bulunmuş olması artıkların normal dağılıma sahip olduğu iyi bir modele ulaşıldığını göstermektedir. " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# $\\chi^2$ Dağılımı ve $\\chi^2$ Testi #\n", "\n", "Serbestlik derecesi ($\\nu$) kadar bağımsız standart normal rastgele değişkenin toplamının dağılımıdır. Gamma dağılımının özel bir halidir. Hipotez testi, güven aralığı oluşturma (ing. confidence interval), uyum başarısı (ing. goodness of fit) gibi bir çok istatistiksel çıkarımda kullanılmaktadır. Nadiren Helmert dağılımı olarak da isimlendirilir.\n", "\n", "Diyelim ki, bir $x$ değişkenin $x_i$ ölçüm değerlerini, bir histogram oluşturmak üzere $1$ ile $n$ arasında $j$ tane gruba topluyor olalım ve $h(x_j)$ bu $j$ gruptan her birinin içerisine düşen $x_i$ ölçüm değerlerinin toplam frekansı olsun. Her bir ölçümün $x_j$ grubunda olma olasılığı $P(x_j)$ olsun. Bu durumda $N$ toplam ölçüm sayısını göstermek üzere $x_j$ aralığında olması beklenen ölçüm sayısı $y(x_j) = N~P(x_j)$ olacaktır. \n", "\n", "Her bir grupta gözlenen frekans $h(x_j)$ üzerinde de $\\sigma (h)$ kadar bir belirsizlik olacaktır. Bu belirsizlik, $\\mu$ ortalama değeri etrafında dağılan her bir $x_i$ ölçümünün sapmasını ifade eden $\\sigma_i$ değerinden farklıdır ve ifade ettiği şey her bir grubun frekansının ($h(x_j)$) grupların ortalama değeri $\\mu_j$ ‘den sapmasıdır. \n", "\n", "Her bir grubun frekansının olasılık dağılımını ayrı ayrı belirlemek üzere defalarca ölçüm yapsak her bir grup ($x_j$) için olasılık dağılımının $\\mu_j = y(x_j)$ ortalama değerine ve dolayısıyla $\\sigma_j = y(x_j)$ standart sapmasına sahip bir Poisson dağılımı olduğunu bulmamız gerekir. Dolayısıyla her bir $x_j$ değeri için $k.$ ölçüm denemesinde $hk(x_j)$ frekansını elde edebileceğimiz, $x_j$ için beklenen değerin $y(x_j)$ olduğu bir $P_j(y_k)$ olasılık dağılımı tanımlanabilir. \n", "\n", "Aşağıdaki birinci şekilde $\\sigma_j = \\sqrt{h_j}$, ikinci şekilde $\\sigma_j = \\sqrt{\\mu_j}$ standart sapmalı Poisson dağılımları için noktalı eğriler şeklinde her bir $x_j$ için verilen bu olasılık dağılımlarının standart sapmaları $\\sigma_j(h)$ ile ifade edilmektedir. \n", "\n", "
\n", " \"Chi^2\n", "
\n", " \n", "Ortalaması $\\mu = 5.0$, standart sapması $\\sigma = 1.0$ olan toplam $100$ ölçümden oluşturulmuş $n = 6$ gruba ilişkin histrogram ve bu histogramların oluşturulduğu $y(x_j) = P(x_j)$ ana dağılımı olan Gaussyen (büyük süreksiz eğri). Noktalı eğriler her bir bin içerisindeki x ölçümlerinin $h(x_j)$ frekansları merkezinde ve $\\sigma_j = \\sqrt{h_j}$ standart sapmalı Poisson olasılık dağıımlarını göstermektedir.\n", "\n", "
\n", " \"Chi^2\n", "
\n", "\n", "Bir önceki şekille aynı olup, noktalı eğriler her bir bin içerisindeki $x$ ölçümlerinin ana dağılımının veren $\\mu_j = y(x_j)$ ortalama değeri merkezinde , $\\sigma_j = \\sqrt{\\mu_j}$ standart sapmalı Poisson olasılık dağıımlarını göstermektedir. \n", "\n", "$n$ histogramdaki grup sayısı; $N$ toplam ölçüm sayısı; $x_j$ $j$ grubunu temsil eden ölçüm değeri; $h(x_j)$ $j$ grubundaki ölçümlerin frekansıİ $P(x_j)$ $j$ grubuna düşen ölçüm yapma olasılığı; $\\sigma_j$ $j$ grubundaki ölçümlerin ortalama değer etrafındaki saçılması (grubun iç standart sapması) olmak üzere $\\chi^2$ istatistiği aşağıdaki şekilde tanımlanır.\n", "\n", "$$ \\chi^2 = \\sum_{j=1}^{n} \\frac{[h(x_j) - N~P(x_j)]^2}{\\sigma_j(h)^2} $$\n", "\n", "Poisson dağılımı için varyans $\\sigma_j(h)^2$ dağılımın ortalama değerine eşit olduğundan ($\\mu_j = y(x_j)$) veriden çıkarılabilr. Çünkü, $\\sqrt{N}~P_j \\sim \\sqrt{h_j}$. Bu durumda $\\chi^2$ istatistiği aşağıdaki şekilde basitleştirilip veri üzerinden hesap edilebilir.\n", "\n", "$$ \\chi^2 \\sim \\sum_{j=1}^{n} \\frac{[h(x_j) - N~P(x_j)]^2}{N~P(x_j)} = \\sum_{j=1}^{n} \\frac{[h(x_j) - N~P(x_j)]^2}{h(x_j)}$$\n", "\n", "İfadeden de görülebileceği gibi $\\chi^2$ istatistiği gözlenen frekansların ($h(x_j)$) dağılımını beklenen frekanslar ($P(x_j$)) üzerinden ifade etmektedir. Gözlenen frekanslar ile beklenti birebir uyuşsa elde edilecek değer $\\chi^2 = 0$ olur ki bu deneysel (gözlemsel) çalışmalardan beklenen bir şey değildir. Mutlaka ölçüm hataları olacaktır. İfadenin paydası, gözlemlerin saçılmasını, payı ise beklenen saçılmayı ifade etmektedir.\n", "\n", "Beklenen dağılımla gözlenen dağılımın birbiriyle tutarlı olması için her bir gruptan $\\chi^2$ istatistiğine ~1 katkısı gelmelidir. Bu mantıklıdır çünkü her bir gözlemsel değer ortalamdan (ya da modelden bir başka deyişle beklentiden( $1~\\sigma$ uzakta olduğunda $\\chi^2$ istatistiğine $1$ katkı yapar. Ayrıca, bu toplamın da $n$ olacağı anlamına gelir ($\\chi^2 \\sim n$). Ancak $N~P(x_j)$ olasılık dağılmı üzerinden hesap edildiği için serbestlik derecesi de bir düşer ve $\\chi^2$ için beklenen değer $n - 1$ olur.\n", "\n", "$\\chi^2$ için beklenen değer; $n$ grup sayısını, $n_c$ parametre sayısını, $\\nu$ serbestlik derecesni göstermek üzere,\n", "\n", "$$ \\chi^2 = \\nu = n - n_c $$\n", "\n", "$\\chi^2$ için hesap edilen değerle verinin dağılımının uyumlu olması olasılığını test edebilmek için $\\chi^2$ 'nin nasıl dağıldığını bilmeye ihtiyaç duyulur. \n", "\n", "Doğrudan $\\chi^2$ değerini kullanmak yerine serbestlik derecesini de dikkate alacak şeklilde indirgenmiş $\\chi^2_{\\nu}$ parametresi tanımlanır ve $\\chi^2_{\\nu} = \\chi^2 / \\nu$ ile verilir. İndirgenmiş $\\chi^2$ parametresinin;\n", "\n", "* $1$'den çok büyük olması durumunda ($\\chi^2 >> 1$) varsayılan dağılımdan, yanlış ölçümler, belirsizlikler üzerindeki problemler ya da yanlış bir olasılık dağılımının kullanılması gibi nedenlerle büyük sapmalar gözlenir.\n", "\n", "* $\\chi^2$ parametresinin 1’den çok küçük olması da ($\\chi^2 << 1$) aynı şekilde problemlidir ve deneyin yanlış anlaşıldığını düşündürür. \n", "\n", "Tıpkı standart normal dağılım ya da t-dağılımı kullanarak yapılan testlerde değişkenin herhangi bir değeriinin ortalama değerden herhangi bir standart sapma uzakta olması olasılığının belirlenmesi durumunda olduğu gibi varsayılan olasılık dağılımını da dikkate alarak hesaplanan indirgenmiş $\\chi^2$ parametresi değerinin gözlenmiş olma olasılığı belirlenir. \n", "\n", "Olasılık $1$'e yakınsa seçilen olasılık dağılımı verinin dağılımını iyi temsil etmektedir. Eğer olasılık çok düşük çıkıyorsa, ya varsayılan olasılık dağılımı verinin dağılımına uygun değildir ya da örnek veri seti ana dağılımı temsil etmekten uzaktır. " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Örnek: $\\chi^2$ Testi ##\n", "\n", "Diyelim ki bir öğrenci bir topu yerden 2.00 metre yükseklikten 50 kez bırakıyor ve topun yere düşme süresini kaydediyor ve aşağıdaki şekilde verilen histogramı elde ediyor. Şekildeki her bir dikdörtgenin yüksekliği kısa kenarında verilen zaman aralığına düşen ölçüm sayısını göstermektedir. Kesiksiz eğri, ölçümlerin ortalaması $T_{ort} = 0.635~s$, standart sapması $s = 0.020~s$ için Gaussyen dağılımı, kesikli eğri ise örnek ölçümlerin alındığı $\\mu = 0.639~s$, $\\sigma = 0.020~s$) ortalama değer ve standart sapma için ana Gaussyen dağılımı göstermektedir.\n", "\n", "
\n", " \"Chi^2\n", "
\n", "\n", "Söz konusu örnek için elde edilen değerler aşağıdaki gibi olsun. Verinin birinci sütıununda histogramı oluşturan her bir grubun ortasındaki zaman değeri, ikinci sütunda o zaman aralığına denk gelen ölçüm sayısı, üçüncü sütunda $y_j = y(x_j) = N~P(x_j)$ her bir histogramın (1. sütunda verilen) $x_j$ değeri için ana dağılımın ortalama ve standart sapması kullanılarak hesaplanan olasılık fonksiyonu değerleri, altıncı sütunda ise bu kez ana dağılımın ortalama ve standart sapması kullanılarak hesaplanan olasılık fonksiyonu değerleri verilmektedir. 4 ve 7. sütunlarda verilen belirsizlikler o zaman aralığının ortasındaki zaman için hesaplanan olasılık fonksiyonu değerlerinin (3 ve 6. sütun) karekökleri (Poisson dağılım varsayımıyla) üzerinden hesaplanan sırasıyla ana dağılım ve örnek dağılım için belirsizliklerdir. Son olarak 5 ve 8. sütunlarda $\\chi^2$ istatistikleri (kareleri alınmadan) verilmiştir.\n", "\n", "
\n", " \"Chi^2\n", "
\n", "\n", "Sonuç olarak bu son sütunlardaki değerlerin kareleri alınarak toplanmış $\\chi^2$ değerleri ana dağılım için $13.03$, örnek dağılım için $7.85$ bulunmuştur. Ana dağılım için serbestlik derecesi, sadece toplam grup sayısı ($N$) üzerinden hesaplandığı için $\\nu = 11 – 1 = 10$, örnek dağılım için ise grup sayısıyla birlikte ortalama ve standart sapma da bilindiği için $\\nu = 11 – 3 = 8$’dir. Bu nedenle ana dağılım için indirgenmiş $\\chi^2_{\\nu} = 13.03 / 10 = 1.303$, örnek dağılım için ise $\\chi^2_{\\nu} = 7.85 / 8 = 0.98$ olarak bulunmuştur.\n", "\n", "Aşağıda sadece bir bölümü verilen $\\chi^2$-dağılımı olasılık tablosundan $\\nu = 10$ serbestlik derecesi için $\\chi^2_{\\nu} = 1.3$ değeri $1.1784$ ile $1.344$ arasında kalıp bu değerlerin olasılıkları sırasıyla $0.30$ ve $0.20$’dir. Yapılacak basit bir lineer interplasyon $\\chi^2_{\\nu} \\ge 1.3$ ‘ten daha büyük bir değer elde etme olasılığının $\\sim0.23$ (%23) olduğunu göstermektedir. Bir başka deyişle ana dağılımdan belilrlenen indirgenmiş $\\chi^2_{\\nu}$ değeri verinin saçılması ile ancak %23 güvenilirlik seviyesinde uyumludur. Benzer bir analiz için $\\nu = 8$ serbestlik derecesindeki örnek dağılım için yapıldığında $\\chi^2_{\\nu} \\ge 0.98$ olma olasılığının %45 civarında olduğu bulunur.\n", "\n", "
\n", "
\n", " \"Chi^2\n", "
\n", "\n", "Örnekte çoğu zaman mümkün olmayan bir durum (ana dağılımın bilinmesi durumu), üzerinden tüm hesaplamalar yapılmıştır. Oysa ki çoğu zaman ana dağılım bilinmez. Bu durumda belirsizlikleri Gaussyen varsayarak belirlemek yerine $h(x_j)$ frekanslarının (örnekte 2. sütun) doğrudan karekökünü almak gerekir.\n", "\n", "Örnekte olduğu gibi bazı gruplarda (binlerde) çok az sayıda ölçüm bulunması durumunda gruplar birleştirilerek daha büyük gruplar oluşturulabilir. Bu durumda yapılan istatistiksel testin de daha doğru sonuç vereceği değerlendirilmelidir. \n", "\n", "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)\n", "\n", "## $\\chi^2$ Testinin İki Örnek Dağılımın Aynı Dağılımdan Türeyip Türemediğinin Kontrolü için Kullanılışı ##\n", "\n", "$\\chi^2$ testinin önemli uygulamalarından biri iki örnek veri setinin aynı ana dağılımdan alınıp alınmadığının belirlenmesinde kullanılmasıdır. $g(x_j)$ ve $h(x_j)$, $x$ değişkeninin iki ayrı örnekteki dağılımları olsunlar. Bu iki dağılımın $P(x_j)$ ana dağılımından alınıp alınmadığını belirlemek için $\\chi^2$ testini her iki dağılıma ayrı ayrı uygulayıp hesaplanan $\\chi^2$ değerlerinin $P(x_j)$ ile uyumlu olup olmadığı belirlenebileceği gibi ana dağılımdan bağımsız bir $\\chi^2$ testi her iki dağılımın birden üzerine uygulanabilir. Bu durumda aşağıdaki ifadeden faydalanılır.\n", "\n", "$$ \\chi^2 = \\sum_{j=1}^{n} \\frac{[g(x_j) - h(x_j)]^2}{\\sigma^2(g) + \\sigma^2(h)} $$\n", "\n", "Her iki örnek dağılım, birbirlerinden tamamen bağımsız seçilirlerse serbestlik derecesi $\\nu = n$ olur. Dağılımlardan biri diğerine normalize ise bu durumda $\\nu = n - 1$ olmalıdır. İndirgenmiş $\\chi^2$ , eğer 1’den çok büyük bir değere karşılık geliyorsa (bu değere karşılık gelen olasılık küçükse) bu iki dağıımın farklı ana dağılımlardan türetildiği sonucuna varılır. \n", "\n", "Eğer $\\chi^2$ için bulunan değere karşılık gelen olasılık büyükse bu durumda bu iki dağılımın farklı ana dağılımlardan türetildiği sonucu çıkarılamaz. Bu durumda gerçekten birbirine çok yakın iki ayrı dağılımdan türetilmiş ve eldeki verinin hassasiyeti dahilinde bu fark belirlenemiyor da olabilir. " ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Özet: $\\chi^2$ Testi #\n", "\n", "Bir x değişkenin ölçüm değerleri $x_j$ ve üzerindeki belirsizlikler $\\sigma_j$ olmak üzere ağırlıklı ortalama:\n", "\n", "$$ \\bar{x} = \\frac{\\sum_{j = 1}^{n} (x_j / \\sigma_j^2)}{\\sum_{j = 1}^{n} (1 / \\sigma_j^2)} $$\n", "\n", "Tüm ölçümler üzerinde aynı belirsizlik bulunuyorsa ($\\sigma = \\sigma_i$) bu durumda ağırlıklandırmaya gerek olmadğından ortalama değer doğrudan elde edilir.\n", "\n", "$$ \\bar{x} = \\frac{(1 / \\sigma^2) \\sum_{j = 1}^{n} x_j}{(1 / \\sigma^2) \\sum_{j = 1}^{n} 1} = \\frac{1}{N} \\sum_{j = 1}^{n} x_j $$\n", "\n", "Ortalamanın Standart Sapması (ya da Varyansı) her bir veri noktasının hatası ($\\sigma_i$) ya da tüm verinin standart sapmasından ($\\sigma$) farklıdır:\n", "\n", "$$ \\sigma_{\\nu}^2 = \\frac{1}{\\sum_{j = 1}^{n} (1 / \\sigma_j^2)} $$\n", "\n", "Tüm ölçümler üzerinde aynı belirsizlik bulunuyor ya da verinin tamamının standart sapması biliniyor ise ($\\sigma = \\sigma_i$):\n", "\n", "$$ \\sigma_{\\nu}^2 = \\frac{\\sigma^2}{N} $$\n", "\n", "Ölçümün (ya da ölçüm aletinin) belirsizliği:\n", "\n", "$$ \\sigma^2 \\sim s^2 = \\frac {1}{N-1} \\Sigma_{j = 1}^n (x_j - \\bar{x})^2 $$\n", "\n", "Sınırlı sayıda ölçüm alabilmekten kaynaklanan istatistiksel dalgalanma (Poisson):\n", "\n", "$$ \\sigma^2 = \\nu \\sim \\bar{x} $$\n", "\n", "olmak üzere;\n", "\n", "$\\chi^2$-testi: $x_j$ olası değerleri için gözlenen bir frekans dağılımının $h(x_j)$, varsayılan bir olasılık dağılımına göre belirlenmiş olasılıklarını veren $N P(x_j)$ dağılımı ile karşılaştırılmasına dayanan testtir. Bu karşılaştırma için kullanılan $\\chi^2$-istatistiği:\n", "\n", "$$ \\chi^2 = \\sum_{j=1}^{n} \\frac{[h(x_j) - N~P(x_j)]^2}{\\sigma_j(h)^2} $$\n", "\n", "Serbestlik derecesi ($\\nu$): Veri sayısı (N) ile verilerden birbirlerinden bağımsız olarak belirlenen parametres sayısı (m) arasındaki farktır (N – m). \n", "\n", "İndirgenmiş $\\chi^2_{\\nu} = \\chi^2 / \\nu$: $1$’e yakınsa $h(x_j)$ dağılımı $N~P(x_j)$ dağılımı ile uyumludur. Serbestlik derecesine karşılık verilen indirgenmiş $\\chi^2_{\\nu}$ tablolarından rastgele seçilen bir veri setinin, ana dağılımdan türetilmiş olup olmadğının olasılığı bulunur.\n", "\n", "## Testin Uygulanışı ##\n", "\n", "$\\chi^2$-testi genellikle gözlemsel verinin, gözlenen olaya ilişkin teori ile tutarlılığının sınanması için kullanılır. Genellikle testte sıfır hipotezi ($H_0$) “teorik yaklaşım gözlem verisi ile tutarlıdır.” şeklinde seçilir.\n", "\n", "Sıfır hipotezi ($H_0$) doğru ise uyumlama sonrası artıkları, rastgele hatalardan kaynaklanır ve bu nedenle normal dağılım gösterir. Bu durumda her bir gözlem verisinin uyumlanan eğriden (ya da modelden) farklarının toplamı bir ki-kare dağılımı vereceğinden ki-kare testi uygulanabilir. \n", "\n", "Test adımları şu şekilde uygulanır:\n", "\n", "1. $\\chi^2$-değeri (Pearson test istatistiği, $\\chi^2$) aşağıda verilen en genel ifadeden (ya da daha önce verilen formüller kullanılarak) hesaplanır. Burada $O_i$: gözlenen değeri, $C_i$ modelden hesaplanan değeri, $\\sigma_i$ gözlemsel verinin hatasını (ölçüm hatası ya da standart sapmasını) göstermektedir: $ \\chi^2 = \\sum \\frac{(O_i - C_i)^2}{\\sigma_i^2} $\n", "\n", "2. Serbestlik derecesi ($\\nu = N - m$) hesaplanır. Burada $N$ ölçüm sayısını, $m$ modelin parametre sayısını göstermektedir.\n", "\n", "3. Sıfır hipotezi ($H_0$) kurgulanır. Sıfır hipotezi, model uyumlamalarında seçilen modelin veriyi uyumladığını ifade ederken, alternatif hipotez ise bunun tersini ifade eder. $\\chi^2$ testinde test edilen $H_0$ sıfır hipotezidir.\n", "\n", "4. Bir güven düzeyi seçilir.\n", "\n", "4. Ki-kare ($\\chi^2$) tablolarından ilgili serbestlik derecesi ve güven düzeyine karşılık gelen kritik $\\chi^2$ değeri, hesaplanan $\\chi^2$ ile karşılaştırılır. \n", "\n", "5. Hesaplanan $\\chi^2$ değeri, tablodaki kritik değerden küçük ise sıfır hipotezi (gözlem verisinin teori ya da model ile tutarlı olduğu) reddedilemez. Eğer büyük ise sıfır hipotezi reddedilir (teori ya da model gözlem ile tutarlı değildir görüşü için bir kanıt elde edilir).\n", "\n", "6. $\\chi^2$ testini verilen güven düzeyleri için kritik $\\chi^2$ değerlerini tablolardan okuyup hesaplanan $\\chi^2$ değeri ile karşılaştırarak yapmak yerine elde edilen $\\chi^2$ değeri için, $H_0$'ın doğru olması durumunda o değerden daha büyük bir $\\chi^2$ elde etme olasılığını veren p-değerini hesaplayıp ($p = P(\\chi^2 > \\chi^2_{hesap})| H_0$), bu değeri istatistiki anlamlılık seviyesi ile ($\\alpha$ = 1 - güven düzeyi) karşılaştırmak mümkündür. Eğer hesaplanan bu p-değeri ile istatistiksel anlamlılık seviyesinden ($\\alpha$) büyükse $H_0$ reddedilemez. Aksi durumda $H_0$ reddedilir. Bu durum $H_1$ için bir kanıt teşkil eder. \n", "\n", "7. $\\chi^2$ değeri aynı parametre sayısına sahip iki modelin doğrudan karşılaştırılması için bir gösterge olarak da kullanılabilir.\n", "\n", "8. Model uyumlamalarında serbestlik derecesi başına $\\chi^2$ değeri (\"indirgenmiş ki-kare\", $\\chi^2_\\nu = \\chi^2 / \\nu$) kullanılıyorsa modelin başarımı $\\chi^2_\\nu$ değeri 1 ile karşılaştırılarak belirlenir.\n", "\n", "9. $\\chi^2_{\\nu} = 1$ ise uyumlama gözlem verisinin üzerindeki hata mertebesinde iyi sonuç vermektedir. $\\chi^2_{\\nu} > 1$ ise uyumlama gözlem verisinin üzerindeki belirsizliği tam olarak modelleyememektedir. $\\chi^2_{\\nu} << 1$ ise uyumlama çok zayıftır. $\\chi^2_{\\nu} < 1$ gözlem verisi üzerindeki hata büyüktür sonuçlarına varılır." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Örnek: Doğru Uyumlama #\n", "\n", "$\\chi^2$-testinin nasıl uygulandığını görmek için iyi ve basit bir uygulama doğrusal bir modeli gözlemsel veri üzerine uyumlamaktaır. Bu dersle birlikte verilen [gözlemsel veriye](veri/model_karsilastirma_chi2.dat) bir doğru uyumlayalım ve Pearson $\\chi^2$-testiyle uyumun başarısını (ing. goodness of fit) görelim.\n", "\n", "Öncelikle veri setimizi inceleyelim." ] }, { "cell_type": "code", "execution_count": 26, "metadata": {}, "outputs": [ { "data": { "text/html": [ "Table length=10\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "\n", "
col1col2col3
float64float64float64
0.50.630.5
1.51.060.5
2.51.340.5
3.52.160.5
4.51.360.5
5.51.880.5
6.51.380.5
7.51.850.5
8.52.310.5
9.52.550.5
" ], "text/plain": [ "\n", " col1 col2 col3 \n", "float64 float64 float64\n", "------- ------- -------\n", " 0.5 0.63 0.5\n", " 1.5 1.06 0.5\n", " 2.5 1.34 0.5\n", " 3.5 2.16 0.5\n", " 4.5 1.36 0.5\n", " 5.5 1.88 0.5\n", " 6.5 1.38 0.5\n", " 7.5 1.85 0.5\n", " 8.5 2.31 0.5\n", " 9.5 2.55 0.5" ] }, "execution_count": 26, "metadata": {}, "output_type": "execute_result" } ], "source": [ "from astropy.io import ascii\n", "veri = ascii.read(\"veri/model_karsilastirma_chi2.dat\")\n", "veri" ] }, { "cell_type": "code", "execution_count": 27, "metadata": {}, "outputs": [ { "data": { "image/png": "iVBORw0KGgoAAAANSUhEUgAAAYUAAAEKCAYAAAD9xUlFAAAABHNCSVQICAgIfAhkiAAAAAlwSFlzAAALEgAACxIB0t1+/AAAADl0RVh0U29mdHdhcmUAbWF0cGxvdGxpYiB2ZXJzaW9uIDMuMC4zLCBodHRwOi8vbWF0cGxvdGxpYi5vcmcvnQurowAAEMBJREFUeJzt3X+IZWd9x/H3ZzdZo0Ym1gya5oe71NCishq7TTMGyuBWGq0YaBViqVGxLIg/i1RUSqRSWixFa40YliRtYlN/NIpsJdaGjYNKxzSTGFeTVVzcutk04pjoROuPdZ1v/5ibJ5txZmcTc+acyX2/4LL3nvPce797Yc7nPvec53lSVUiSBLCp7wIkScNhKEiSGkNBktQYCpKkxlCQJDWGgiSpMRQkSY2hIElqDAVJUnNS3wU8XKeffnpt3bq17zIkaUO59dZbv1dVk2u123ChsHXrVubm5vouQ5I2lCTfPpF2/nwkSWoMBUlSYyhIkhpDQZLUGAqSpMZQkCQ1hoIkqTEUJElNZ6GQ5JQk/53kK0nuSPJXK7R5XJKPJTmQ5OYkW7uqR5I2sunpaaanpzt/ny57Cj8DXlBVzwGeC1yU5IJlbV4LfL+qngG8D3hPh/VIktbQWSjUkh+NHp48utWyZhcD14zuXw/sTJKuapIkHV+n5xSSbE5yO/Bd4MaqunlZkzOBuwCq6iiwADyly5okSavrNBSq6hdV9VzgLOD8JM9+JK+TZFeSuSRz8/Pzj26RkqRmXa4+qqofAJ8DLlq2627gbIAkJwETwL0rPH93Ve2oqh2Tk2vO/CpJeoS6vPpoMslpo/uPB14IfH1Zsz3Aq0b3XwbcVFXLzztIktZJl+spnAFck2QzS+Hz8ar6dJJ3A3NVtQe4CvhwkgPAfcAlHdYjSVpDZ6FQVfuA81bYftkx938KvLyrGiRJD48jmiVJjaEgSWoMBUlSYyhIkhpDQZLUGAqSpMZQkCQ1hoIkHcd6rWMwFIaCJKkxFCRJjaEgSWoMBUlSYyhIkhpDQZLUGAqSpMZQkCQ1hoIkqTEUJEmNoaBejdsUAtLQGQqSpMZQkCQ1hoIkqTEUJEmNoSBJG8DCwgKHDh1idna20/cxFCRp4GZnZ9m3bx8HDx5k586dnQZDZ6GQ5Owkn0tyZ5I7krx5hTbTSRaS3D66XdZVPZK0Uc3MzLC4uAjAkSNHmJmZ6ey9TursleEo8Naqui3Jk4Bbk9xYVXcua/eFqnpJh3VI0oY2PT3Npk2bWFxcZMuWLZ2O7emsp1BV91TVbaP7PwT2A2d29X6S9Fg1NTXF9u3b2bZtG3v37mVqaqqz91qXcwpJtgLnATevsHsqyVeSfCbJs1Z5/q4kc0nm5ufnO6xUkoZpYmKCc845p9NAgHUIhSSnAp8A3lJV9y/bfRvw9Kp6DvAB4FMrvUZV7a6qHVW1Y3JystuCJWmMdRoKSU5mKRCuq6pPLt9fVfdX1Y9G928ATk5yepc1SZJW1+XVRwGuAvZX1XtXafO0UTuSnD+q596uapIkHV+XVx9dCLwS+GqS20fb3gmcA1BVVwAvA16X5CjwE+CSqqoOa5IkHUdnoVBVXwSyRpvLgcu7qkGS9PA4olmS1BgKkqTGUJAkNYaCNCAuT6q+GQqSpMZQkDRIQ+k1rdc6BkNhKEjSKtZzHYOhMBQkaRXruY7BUBgKkrSKB9YxADpfx2AoDAVJWsV6rmMwFF3OfSRJG97ExAQTExNjEQhgT0GSdAxDQZLUGAqSpMZQkCQ1hoJ6NW6jRaWhMxTUm3EcLSoNnaGg3ozjaFFp6AwF9WYcR4tKQ2coqDfjOFpUGjpHNKtX4zZaVBo6ewqSpMZQkCQ1hoIkqTEUJElNZyeak5wNXAs8FShgd1W9f1mbAO8HXgz8GHh1Vd3WVU2StFGt1zieLq8+Ogq8tapuS/Ik4NYkN1bVnce0eRFw7uj2u8CHRv9KknrQ2c9HVXXPA9/6q+qHwH7gzGXNLgaurSVfAk5LckZXNUmSjm9dzikk2QqcB9y8bNeZwF3HPD7MLwcHSXYlmUsyNz8/31WZkjT2Og+FJKcCnwDeUlX3P5LXqKrdVbWjqnZMTk4+ugVKkppOQyHJySwFwnVV9ckVmtwNnH3M47NG2yRJPegsFEZXFl0F7K+q967SbA9waZZcACxU1T1d1SRJOr4urz66EHgl8NUkt4+2vRM4B6CqrgBuYOly1AMsXZL6mg7rkSStobNQqKovAlmjTQGv76oGSdLD44hmaUBcnlR9MxSkgXB5Ug2BoSANxFCWJ52enh7EKnj2mvphKEgD4fKkD7LX1B9DQWIY345dnvRBQ+k1jSOX4xxTDxwA/WMbFpcnXfJAr2lxcXHse03rzZ6CpMGx19QfewqSBmkovaZx603bU5AkNYaCJKkxFCRJjaEgSWoMBUlSYyhIkhpDQZLUGAqSpMZQkCQ1jmhWr8ZttKg0dPYUJEmNoSBJatYMhSRvTPLk9ShGktSvE+kpPBW4JcnHk1yUJF0XJUnqx5qhUFV/CZwLXAW8Gvhmkr9J8hsd1yZJWmcndE6hqgr4zuh2FHgycH2Sv+uwNknSOlvzktQkbwYuBb4HXAn8RVX9PMkm4JvA27ot8bHFZTAlDdmJ9BR+DfijqvqDqvq3qvo5QFUtAi9Z7UlJrk7y3SRfW2X/dJKFJLePbpc9ov+BJOlRs2ZPoaredZx9+4/z1H8GLgeuPU6bL1TVqsEiSVpfnY1TqKrPA/d19fqSpEdf34PXppJ8JclnkjxrtUZJdiWZSzI3Pz+/nvVJ0ljpMxRuA55eVc8BPgB8arWGVbW7qnZU1Y7Jycl1K1CSxk1voVBV91fVj0b3bwBOTnJ6X/VIknoMhSRPe2B0dJLzR7Xc21c9kqQOp85O8hFgGjg9yWHgXcDJAFV1BfAy4HVJjgI/AS4ZDZKTJPWks1Coqlessf9yli5ZlSQNRN9XH0kamIWFBQ4dOsTs7GzfpagHhoKkZnZ2ln379nHw4EF27txpMIwhQ0FiON+OZ2Zmep0Xa2ZmhsXFRQCOHDniHF1jyFAYU0M5CA6B344fND09zaZNS4eFLVu2tAkcNT4MhTHkQfCh/Hb8oKmpKbZv3862bdvYu3cvU1NTvdXSd69pXBkKY8iD4EP57fihJiYmOOecc3oNBPXHUBhDHgQfakjfjqW+dTZOQcP1wEFwYWGB6667zoMgS9+OJyYm/Cw09gyFMeVBUNJK/PlIktQYCpKkxlCQJDWGgiSpMRQkSY2hIElqDAVJUmMoSJIaQ0GS1BgKkqRmbEJhenp67Cd+k6S1jE0oSJLWZihIkhpDYZ25DKakITMU1pHLYEoaus5CIcnVSb6b5Gur7E+Sf0xyIMm+JM/rqpahcBlMSUPXZU/hn4GLjrP/RcC5o9su4EMd1jIILoMpaeg6C4Wq+jxw33GaXAxcW0u+BJyW5Iyu6hkC1wKWNHR9Lsd5JnDXMY8Pj7bd008568NlMCUN2YY40ZxkV5K5JHPz8/N9lyNJj1l9hsLdwNnHPD5rtO2XVNXuqtpRVTsmJyfXpThJGkd9hsIe4NLRVUgXAAtV9Zj+6UiShq6zcwpJPgJMA6cnOQy8CzgZoKquAG4AXgwcAH4MvKarWiRJJ6azUKiqV6yxv4DXd/X+kqSHb0OcaJYkrQ9DQZLUGAqSpKbPwWuSBsg5ucaboSDhgVB6gD8fSZIaewpjym/GklZiT0GS1BgKkqTGUJAkNYaCJKkxFCRJjaEgSWoMBUlSYyhIkhpDQZLUGAqSpMZQkCQ1YxMKCwsLHDp0iNnZ2b5LkaTBGotQmJ2dZd++fRw8eJCdO3caDJK0irEIhZmZGRYXFwE4cuSIM4RK0irGIhSmp6fZtGnpv7plyxamp6f7LUiSBmosQmFqaort27ezbds29u7dy9TUVN8lSdIgjc0iOxMTE0xMTBgIknQcY9FTkCSdmE5DIclFSb6R5ECSt6+w/9VJ5pPcPrr9WZf1DMHMzIwnuiUNVmc/HyXZDHwQeCFwGLglyZ6qunNZ049V1Ru6qkOSdOK67CmcDxyoqm9V1RHgo8DFHb6fJOlX1GUonAncdczjw6Nty/1xkn1Jrk9ydof1SJLW0PeJ5n8HtlbVduBG4JqVGiXZlWQuydz8/Py6FihJ46TLULgbOPab/1mjbU1V3VtVPxs9vBL47ZVeqKp2V9WOqtoxOTnZSbGSpG5D4Rbg3CTbkmwBLgH2HNsgyRnHPHwpsL/DeiRJa+js6qOqOprkDcBngc3A1VV1R5J3A3NVtQd4U5KXAkeB+4BXd1WPJGltnY5orqobgBuWbbvsmPvvAN7RZQ2SpBPX94lmSdKAGAqSpMZQkCQ1hoIkqTEUJEmNoSBJagwFSVJjKEiSGkNBktQYCpKkxlCQJDWGgiSpMRQkSY2hIElqDAVJUmMoSJIaQ0GS1BgKkqTGUJAkNYaCJKk5qe8C1svMzEzfJUjS4NlTkCQ1hoIkqTEUJEmNoSBJajoNhSQXJflGkgNJ3r7C/scl+dho/81JtnZZjyTp+DoLhSSbgQ8CLwKeCbwiyTOXNXst8P2qegbwPuA9XdUjSVpblz2F84EDVfWtqjoCfBS4eFmbi4FrRvevB3YmSYc1SZKOo8tQOBO465jHh0fbVmxTVUeBBeApHdYkSTqODXGiOcmuJHNJ5ubn5/suR5Ies7oc0Xw3cPYxj88abVupzeEkJwETwL3LX6iqdgO7AZLMJ/l2JxVvLKcD3+u7iAHx83iQn8VD+XksefqJNOoyFG4Bzk2yjaWD/yXAnyxrswd4FTALvAy4qarqeC9aVZMd1LrhJJmrqh191zEUfh4P8rN4KD+Ph6ezUKiqo0neAHwW2AxcXVV3JHk3MFdVe4CrgA8nOQDcx1JwSJJ60umEeFV1A3DDsm2XHXP/p8DLu6xBknTiNsSJZq1od98FDIyfx4P8LB7Kz+NhyBo/4UuSxog9BUlSYyhsMEnOTvK5JHcmuSPJm/uuqW9JNif5cpJP911L35KcluT6JF9Psj/JVN819SnJn4/+Tr6W5CNJTum7pqEzFDaeo8Bbq+qZwAXA61eYU2rcvBnY33cRA/F+4D+q6reA5zDGn0uSM4E3ATuq6tksXQXpFY5rMBQ2mKq6p6puG93/IUt/9MunDxkbSc4C/hC4su9a+pZkAvg9li71pqqOVNUP+q2qdycBjx8Njn0C8L891zN4hsIGNppq/Dzg5n4r6dU/AG8DFvsuZAC2AfPAP41+TrsyyRP7LqovVXU38PfAIeAeYKGq/rPfqobPUNigkpwKfAJ4S1Xd33c9fUjyEuC7VXVr37UMxEnA84APVdV5wP8Bv7SOybhI8mSWZmLeBvw68MQkf9pvVcNnKGxASU5mKRCuq6pP9l1Pjy4EXprkf1iamv0FSf6l35J6dRg4XFUP9ByvZykkxtXvAwerar6qfg58Enh+zzUNnqGwwYzWm7gK2F9V7+27nj5V1Tuq6qyq2srSCcSbqmpsvwlW1XeAu5L85mjTTuDOHkvq2yHggiRPGP3d7GSMT7yfqE6nuVAnLgReCXw1ye2jbe8cTSkivRG4LskW4FvAa3qupzdVdXOS64HbWLpq78s4unlNjmiWJDX+fCRJagwFSVJjKEiSGkNBktQYCpKkxlCQJDWGgiSpMRSkX1GS30myL8kpSZ44mr//2X3XJT0SDl6THgVJ/ho4BXg8S/MP/W3PJUmPiKEgPQpG00rcAvwUeH5V/aLnkqRHxJ+PpEfHU4BTgSex1GOQNiR7CtKjIMkelqbv3gacUVVv6Lkk6RFxllTpV5TkUuDnVfWvSTYD/5XkBVV1U9+1SQ+XPQVJUuM5BUlSYyhIkhpDQZLUGAqSpMZQkCQ1hoIkqTEUJEmNoSBJav4feTg1Z0tbTbMAAAAASUVORK5CYII=\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "import numpy as np\n", "from matplotlib import pyplot as plt\n", "%matplotlib inline\n", "x = np.array(veri['col1'])\n", "y = np.array(veri['col2'])\n", "yhata = np.array(veri['col3'])\n", "plt.errorbar(x,y,yerr=yhata,fmt=\".\",c=\"k\")\n", "plt.xlabel(\"x\")\n", "plt.ylabel(\"y\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Öncelikle [Eğri Uyumlama](http://ozgur.astrotux.org/ast416/Ders_04/Ders04_Egri_Uyumlama.html) dersinde daha önce gördüğümüz herhangi bir yöntemle bu veri setine bir doğru uyumlayalım. Öncelikle basit bir model için doğrusal en küçük kareler yöntemini seçerek basit bir Python fonksiyonuyla doğrusal uyumlama yapalım. `numpy.polyfit()` fonksiyonu `deg=1` parametresiyle çalıştırıldığında bu amaca bizi ulaştıracaktır." ] }, { "cell_type": "code", "execution_count": 28, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Verilen veriye uyumlanan en iyi dogru: y = 0.1622x + 0.8411\n" ] }, { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "katsayilar = np.polyfit(x, y, deg = 1) # Sondaki 1 dogru uyumlamasini gosterir\n", "m = katsayilar[0]\n", "n = katsayilar[1]\n", "print(\"Verilen veriye uyumlanan en iyi dogru: y = {:.4f}x + {:.4f}\".format(m,n))\n", "ymodel = m*x + n\n", "plt.errorbar(x,y,yerr=yhata,fmt=\".\",c=\"k\", label=\"veri\")\n", "plt.plot(x,ymodel,'r-', label=\"model\")\n", "plt.xlabel(\"x\")\n", "plt.ylabel(\"y\")\n", "plt.legend(loc=\"upper left\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Şimdi $\\chi^2$ değerini kendi yazacağımız bir fonksiyonla hesaplayalım. Fonksiyonumuz $y$ ve $y_{hata}$ dizilerinin yanı sıra modelden hesaplanan $y_{model}$ değerlerini de gönderelim." ] }, { "cell_type": "code", "execution_count": 29, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Serbestlik derecesi: 8\n", "Chi^2 = 4.28, Indirgenmis Chi^2 = 0.54\n" ] } ], "source": [ "import numpy as np\n", "kikare = lambda y,ye,ymod : ((y - ymod)**2 / ye**2).sum()\n", "chi2 = kikare(y,yhata,ymodel)\n", "dof = len(y) - len(katsayilar) # serbestlik derecesi\n", "chi2_nu = chi2 / dof\n", "print(\"Serbestlik derecesi: \", dof)\n", "print(\"Chi^2 = {:.2f}, Indirgenmis Chi^2 = {:.2f}\".format(chi2,chi2_nu))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Gayet basit bir fonksiyonla hem $\\chi^2$, hem de $\\chi^2_{\\nu}$ istatistiklerini hesapladık. Şimdi bu istatistikleri kullanarak bir hipotez testi yapalım ve modelimizin başarısını bir hipotez testiyle test edelim. \n", "\n", "* $H_0$: Lineer model gözlemsel veri ile tutarlıdır.\n", "* $H_1$: Lineer model gözlemsel veri ile tutarlı değildir.\n", "\n", "Bunun için öncelikle bir istatistiksel anlam seviyesi seçmeliyiz. $\\chi^2$ testlerinde güven düzeyi yerine istatistiksel anlam ($\\alpha$) tercih edilir. Ancak biz istatistiksel anlamın güven düzeyinin 1'den farkı olduğunu biliyoruz. Bu örnek için güven düzeyini %90 ($0.90$) olarak belirlemiş olalım. Bu güven düzeyine karşılık gelen istatistiksel anlam seviyesi ($\\alpha$) ve $\\chi^2$ değerini kullanarak $H_0$'ı test edelim. Bu amaçla $\\chi^2$ dağılım tablolarını]kullanabilirsiniz. Böyle bir tablo kullanılırsa 0.10 istatistiksel anlam seviyesi için kritik $\\chi^2$ değerinin $13.36$ olduğu ve hesaplanan $\\chi^2 = 4.28 < 13.36$ olduğu görülebilir. Bu durumda lineer modelin gözlemsel veri ile %90 güven düzeyinde tutarlı olduğuna ilişkin $H_0$ hipotezinin reddedilmemesi gerekir. Bu durumda $H_0$ reddedilmez. Yani \"lineer modelin gözlemsel veri ile tutarlı olması durumunda bu veri setini şans eseri elde etme olasılığı belirlenen istatistiksel anlamlılık seviyesinden büyüktür!\". Aksi halde reddedilir ve bu da lineer modelin gözlemsel veriyle tutarlı olmadığını ifade eden $H_1$ için bir kanıt teşkil ederdi.\n", "\n", "
\n", " \"Chi^2\n", "
\n", "\n", "Python'da `scipy.stats` paketinin bu tür testler için geliştirilmiş fonksiyonlara sahip olduğunu daha önceki dağılımlar için yaptığımız uygulamalarda görmüştük. Yukarıda tablolarla yapılan test için `scipy.stats.chi2.ppf` fonksiyonunu da (ing. point percent function) kullanabiliriz. Ancak `ppf` fonksiyonuna verilen olasılık değerinin her zaman kritik değere kadarki ($\\chi^2 < \\chi^2_{kritik}$) olasılık olduğunu görmüştük. Dolayısı ile `ppf()` fonksiyonunun doğru kritik değeri verebilmesi için ona $\\alpha$ istatistiksel anlamlılık seviyesi yerine güven düzeyi sağlanmalıdır ($1 - \\alpha$)." ] }, { "cell_type": "code", "execution_count": 30, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Kritik Chi^2 degeri: 13.3616\n" ] } ], "source": [ "from scipy import stats as st\n", "alpha = 0.10\n", "chi2_kritik = st.chi2.ppf(1-alpha, df=dof)\n", "print(\"Kritik Chi^2 degeri: {:.4f}\".format(chi2_kritik))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Görüldüğü gibi kritik $\\chi^2$ değeri 13.3616'dır; Bu değer hesaplanan $\\chi^2$ değeri olan 4.28'den büyüktür. Bir başka deyişle ($\\chi^2 < \\chi^2_{kritik}$). Bu durumda $H_0$ reddedilemez. Yani lineer modelin veriyle uyumlu olduğuna ilişkin bir kanıt elde edilmiş olur. Belirlediğimiz istatisiksel anlam seviyesi olan %10, lineer modelin veriyle uyumlu olması durumunda rastgele seçilecek 100 veri setinin 10 tanesinde uyumladığımız doğrunun $13.3616$'dan büyük bir $chi^2$ değeri ($\\chi^2 > 13.3616$) verirken 90'ında bundan daha küçük bir $\\chi^2$ değeri elde edileceğini ortaya koymaktadır. \n", "\n", "$\\chi^2$ testini verilen güven düzeyleri için kritik $\\chi^2$ değerlerini tablolardan okuyup (ya da `scipy.stats.chi2.ppf` ile bulup) hesaplanan $\\chi^2$ değeri ile karşılaştırarak yapmak yerine elde edilen $\\chi^2$ değeri için, o değerden daha büyük bir $\\chi^2$ elde etme olasılığını veren p-değerini hesaplayıp, bu değeri istatistiki anlamlılık seviyesi ile de karşılaştırabiliriz. Hesaplayacağımız p-değeri, lineer modelimiz doğruysa ($H_0$) bulduğumuz $\\chi^2$ değeri'nden büyük bir artık değerini rastlantısal olarak elde etme ihtimalini verir $p = P(\\chi^2 \\ge 4.28 | H_0$). Eğer bulduğumuz p-değeri seçtiğimiz güven düzeyiyle belirlediğimiz istatistiksel anlamlılıktan ($\\alpha = 1 - 0.90 = 0.1$) küçük çıkarsa ($p < \\alpha$) $H_0$'ı reddederiz. Aksi halde $H_0$'ı reddedemeyiz.\n", "\n", "`scipy.stats.chi2.cdf()` fonksiyonu bize $\\nu = 8$ için $\\chi^2$'in 4.28'den küçük olma olasılığını verecektir. Eğer bunun yerine $\\chi^2$ ile karşılaştırmak istediğimiz p-değerini elde etmek istiyorsak ($P)\\chi^2 > 4.28~|~H_0$) bu durumda `scipy.stats.chi2.sf()` fonksiyonu kullanılmalıdır. " ] }, { "cell_type": "code", "execution_count": 31, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "8 serbestlik derecesi icin P(chi^2 > 4.28) = 0.8310\n" ] } ], "source": [ "olasilik = st.chi2.sf(chi2, df=dof)\n", "print(\"{:d} serbestlik derecesi icin P(chi^2 > {:.2f}) = {:.4f}\".\\\n", " format(dof, chi2, olasilik))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Sonuç olarak $\\chi^2 > 4.28$ olma olasılığnı %83.1 olarak bulmuş olduk. $p = 0.831$ olan bu değeri $\\alpha = 0.10$ ile karşılaştırdığımızda $p > \\alpha$ olduğunu görüyoruz. Bu durum $H_0$'ı reddetmememizi gerektirir (tablo çözümüyle aynı sonuca ulaştık)." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "p-değeri ($p = 0.831$) bize lineer model doğruysa ($H_0$) elde edilen $\\chi^2 = 4.28$) değerinden daha büyük bir $\\chi^2$ değeri verebilecek bir veri setini şans eseri türetme olasılığını verir.\n", "\n", "Peki bu bulduğumuz olasılık değeri (p = %83.10) ne anlama gelmektedir?\n", "\n", "* Belirlenen parametreleriyle bu lineer modelin doğru olması durumunda modelden en az bu kadar artık verebilecek (modelden en az bu kadar uzakta) bir gözlemsel (deneysel) veri seti elde etme (ölçme) olasılığımız %83.10'dur!\n", "\n", "* Bir başka deyişle, lineer modelin doğru olması durumunda bu modelden en fazla bu kadar artık verebilecek bir veri setini tamamen şans eseri üretme olasılığı %16.90'dır.\n", "\n", "Diğer taraftan bulduğumuz bu p-değeri şu anlamlara gelmez:\n", "\n", "* Lineer modelin doğru olma olasılığı %83.1'dir!\n", "* Lineer modelin yanlış olma olasılığı %16.9'dur!\n", "* Lineer modeli rededersek %16.9 ihtimalle yanılıyoruz demektir!\n", "\n", "Zira $\\chi^2$ testi aslında hiçbir modelin ne kadar olası olduğunu söylemez! Verilen güven düzeyinde ilgili modelle gözlenen artıklar kadar artık verebilecek bir veri setinin elde edilme olasılığını söyler!\n", "\n", "Örneğimizde lineer modelin çok başarılı olmadığı da ayrıca görülmektedir. Yukarıda kendi fonksiyonumuzu yazarak elde ettiğimiz bu istatistiki parametreleri `LMFIT` paketi fonksiyonlarıyla da elde edebiliriz. Bunun için öncelikle doğru modelinin parametrelerini tanımlamamız gerekir." ] }, { "cell_type": "code", "execution_count": 32, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "['egim', 'kesme']\n", "['x']\n" ] } ], "source": [ "import lmfit as lm\n", "dogru = lambda x,egim,kesme : egim*x + kesme\n", "dogru_modeli = lm.Model(dogru)\n", "print(dogru_modeli.param_names)\n", "print(dogru_modeli.independent_vars)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Daha sonra uyumlama için makul birer başlangıç değeri vermemiz gerekir. Bu değerleri verinin basit bir grafiğinden kabaca belirleyebiliriz. Ayrıca `weights` parametresini kullanarak ölçüm hatalarına göre bir ağırlıklandırma da sağlayabiliriz." ] }, { "cell_type": "code", "execution_count": 33, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "[[Model]]\n", " Model()\n", "[[Fit Statistics]]\n", " # fitting method = leastsq\n", " # function evals = 6\n", " # data points = 10\n", " # variables = 2\n", " chi-square = 4.28066909\n", " reduced chi-square = 0.53508364\n", " Akaike info crit = -4.48475766\n", " Bayesian info crit = -3.87958747\n", "[[Variables]]\n", " egim: 0.16218182 +/- 0.04026743 (24.83%) (init = 0.25)\n", " kesme: 0.84109091 +/- 0.23219330 (27.61%) (init = 1)\n", "[[Correlations]] (unreported correlations are < 0.100)\n", " C(egim, kesme) = -0.867\n" ] } ], "source": [ "sonuc = dogru_modeli.fit(y, x=x, egim=0.25, kesme=1.00, weights=1/yhata)\n", "print(sonuc.fit_report())" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Gördüğünüz gibi $\\chi^2$ ve $\\chi^2_{\\nu}$ değerleri bizim basit $kikare$ fonksiyonumuzla hesapladıklarımızla aynıdır. $\\chi^2 = 4.28$ değerini ve $dof = 10 - 2 = 8$ değerini `scipy.stats.chi2` fonksiyonlarında kullanarak bir $\\chi^2$ testi yapabileceğimiz gibi $\\chi^2_{\\nu} \\sim 0.54 < 1$ değerinden hareketle uyumlamanın çok başarısız olmamakla birlikte gözlemsel verideki hataların (ya da saçılmanın) modelin başarımınını etkileyecek düzeyde büyük olduğu sonucuna varabiliriz." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# F Dağılımı ve F Testi #\n", "\n", "F-Testi, bir gözlem verisine yapılan iki farklı model uyumlamasının karşılaştırılıp hangisinin istatistiksel olarak daha başarılı bir uyumlama olduğunun belirlenmesi için kullanılan sınamalardan birisidir.\n", "\n", "$F$ adı, varyans analizinin temellerini atan istatistikçi ve biyolog Ronald A. Fisher’a ithafen verilmiştir. Model seçimi için yapılan F-testinde takip edilmesi gereken temel adımları şöyledir:\n", "\n", "1. Öncelikle bir sıfır hipotezi ($H_0$) belirlenir. $H_0$, genellikle aralarında karşılaştırma yapılan iki varyansın (modelden ya da ortalamadan fark kareler toplamının serbestlik derecesine bölümü) eşit olduğunu ifade eder ($F = s_{1} / s_{2} = 1$). Alternatif hipotez ($H_1$) ise bunun tam tersidir. \n", "\n", "2. Karşılaştırılması istenen iki uyumlamanın artık kareler toplamı (ing. residual sum of squares, $S_r$) hesaplanır.\n", "\n", "3. Rakip uyumlamalar için serbestlik dereceleri hesaplanır.\n", "\n", "4. İstatistiksel anlamlılık derecesi $\\alpha$ belirlenir.\n", "\n", "5. $F$ değeri hesaplanır.\n", "\n", "6. $F$ ile $\\alpha$ karşılaştırılır ve $H_0$ bağlamında yorumlanır.\n", "\n", "\n", "$F$-değeri aşağıdaki şekilde hesap edilir. Burada $S_{r_i}$, i. uyumlamadan (modelden) artık kareler toplamını; $m_i$, i. modelde kullanılan parametre sayısını, $n$ ise gözlemsel veri sayısını göstermektedir.\n", "\n", "$$ F = \\frac{(\\frac{S_{r_1} - S_{r_2}}{m_2 - m_1})}{(\\frac{S_{r_2}}{n - m_2})} $$\n", "\n", "Eğer modellerin parametre sayıları aynı ($m_1 = m_2$) ise F değeri aşağıdaki şekilde hesaplanabilir.\n", "\n", "$$ F = \\frac{S_{r_1}}{S_{r_2}} $$\n", "\n", "Artık kareler toplamlarının serbestlik derecelerine oranı bir $\\chi^2$-dağılımı, $\\chi^2$-dağılımlarının oranları ise bir F-dağılımı verir.\n", "\n", "Böylece hesaplanan F değeri, bir F dağılımı üzerinde istatiksel anlamlılık derecesi ($\\alpha$) ile ifade edilen kritik bir olasılık değeri ile karşılaştırılabilir bir değer olur.\n", "\n", "F-testi için, karşılaştırılan artık ya da varyansların normal dağıldığı ve örneklemlerin birbirlerinden bağımsız olduğu varsayılır.\n", "\n", "
\n", " \"F\n", "
\n", "\n", "F dağılımı, bir olayın modellenmesinde kullanılan rakip modelin hangi güvenilirlik aralığı limitleri dahilinde birbirleri ile aynı başarımda olduğunun hesaplanmasında kullanılabilidiği gibi iki dağılımın karşılaştırılması temelindeki F-testinde, yani aynı ana dağılımdan seçilen iki örnek dağılımın standart sapmalarının belirli bir güven aralığı dahilinde karşılaştırılmasında da kullanılır. Bu testlerde kullanılan F-test istatistikleri F-dağılımına sahiptir. $U_i$ değerleri birer $\\chi^2$-dağılımı ve $df_i$ değeleri bu dağılımların serbestlik dereceleri, $s_i^2$ değerleri bir modelden ya da ortalamadan fark kare toplam değerlerinin serbestlik derecesine bölümü, $\\sigma_i^2$ ise ilgili normal süreçlerin standart sapmalarıd olmak üzere u test istatistikleri;\n", "\n", "$$ X = \\frac{U_1 / df_1}{U_2 / df_2} $$\n", "\n", "$$ X = \\frac{s_1^2 / \\sigma_1^2}{s_2^2 / \\sigma_2^2} $$\n", "\n", "$$ s_1^2 = \\frac{s_1^2}{df_1}, s_2^2 = \\frac{s_2^2}{df_2} $$\n", "\n", "$$ F(x; df_1, df_2) = \\frac{\\sqrt{\\frac{(df_1~x)^{df_2}~df_2^{df_2}}{(df_1~x + df_2)^{df_1 + df_2}}}}{x~B(\\frac{df_1}{2},\\frac{df_2}{2})} = \\frac{1}{B(\\frac{df_1}{2},\\frac{df_2}{2})} (\\frac{df_1}{df_2})^{\\frac{df_1}{2}} x^{\\frac{df_1}{2}-1}(1 + \\frac{df_1}{df_2}~x)^{-\\frac{df_1 + df_2}{2}}$$\n", "\n" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Örnek 1: F Testi ##\n", "\n", "Varyansları $s_1 = 109.63$ ve $s_2 = 65.99$, örnek sayıları sırasıyla $n_1 = 41$ ve $n_2 = 21$ olan iki örneklem olsun. Bu iki varyansın $\\alpha = 0.05$ güvenilirlik seviyesinde eşit olup olmadığını test etmek istiyor olalım.\n", "\n", "* Sıfır hipotezi ($H_0$): Bu iki varyans arasında fark yoktur ($s_1 = s_2$).\n", "* Alternatif hipotez ($H_1$) ise bu iki varyans eşit değildir ($s_1 \\neq s_2$).\n", "\n", "Çözüm : Bu örnek için F-istatistiği \n", "\n", "$$ F = \\frac{s_1}{s_2} = \\frac{109.63}{65.99} = 1.66 $$ \n", "\n", "şeklinde hesaplanır. Daha büyük olan varyansın bölünen, küçük olanın bölen olarak alındığına dikkat ediniz!\n", "\n", "Yine bu örnek için serbestlik dereceleri $df_1 = n_1 – 1 = 40$, $df_2 = n_2 – 1 = 20$ ‘dir.\n", "\n", "Bir sonraki adım F-tablolarından verilen güvenilirlik seviyesi $\\alpha = 0.05$ iki taraflı bir test için ikiye bölünerek $\\alpha / 2 = 0.025$ olanı seçilir. Zira burada bir varyansın diğerinden büyük (ya da küçük) olup olmaması değil, ikisinin eşit olup olmadığı test edilmektedir. Daha sonra $df_1 = 40$, $df_2 = 20$ serbestlik derecesi için verilen F-istatistiği değerine bakılır ($F = 2.287$). Biz bu değeri yine Python'da `scipy.stats.f` fonksiyonlarından `ppf()` fonksiyonunu kullanarak elde edebiliriz. Dikkat etmemiz gereken konu `ppf()` fonksiyonunun istatistiksel anlamlık ($\\alpha$) yerine onun 1'den farkı olan güven düzeyini ($1 - \\alpha$) argüman olarak aldığıdır. Fonksiyonun diğer parametreleri serbestlik dereceleridir ($df_1$ ve $df_2$)." ] }, { "cell_type": "code", "execution_count": 34, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Hesaplanan F-degeri = 1.661\n", "F-degeri = 2.287\n" ] } ], "source": [ "from scipy import stats as st\n", "alpha = 0.025\n", "n1 = 41; n2 = 21\n", "df1 = n1 - 1; df2 = n2 - 1\n", "s1 = 109.63; s2= 65.99\n", "F_hesap = s1 / s2\n", "F_degeri = st.f.ppf(1-alpha, df1, df2)\n", "print(\"Hesaplanan F-degeri = {:.3f}\".format(F_hesap))\n", "print(\"F-degeri = {:.3f}\".format(F_degeri))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Bu değer hesaplanan $F = 1.66$ ile karşılaştırılır. Değer F-tablosunda $2.287$ olarak verilen değerden daha küçük ($F_{hesap} < F_{tablo}$) olduğundan $H_0$ hipotezi reddedilemez. Açık ki bu iki varyans eşit değildir. Ancak örneklem büyüklüklerine (ing. sample sizes) bakıldığında verilen güven düzeyinde bunların birbirinden farklı olarak değerlendiriilmesi için sebep yoktur. " ] }, { "cell_type": "code", "execution_count": 35, "metadata": {}, "outputs": [ { "data": { "text/plain": [ "0.11218842540632593" ] }, "execution_count": 35, "metadata": {}, "output_type": "execute_result" } ], "source": [ "p_degeri = st.f.sf(F_hesap,df1,df2)\n", "p_degeri" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Örnek 2: Model Karşılaştırması İçin F Testi ##\n", "\n", "Aşağıdaki tabloda birinci sütundaki zaman değerlerine karşılık ikinci sütunda bir niceliğin ölçüm değerleri görülmektedir.\n", "\n", "
\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
$t_i$ $y_i$
2.510.07
2.811.07
5.414.59
6.520.75
9.227.94
9.531.50
11.038.04
13.349.90
14.660.72
16.475.57
\n", "\n", "Bu veri setini biri üstel ($y = A~e^{\\alpha~t}$), diğeri kuvvet yasasına uyan $y = B~t^{\\beta}$ iki ayrı modelle modelleyelim. Bu modellerden hangisinin veriyi daha iyi temsil edebildiğini doğrudan uyumlama eğrilerinden ya da artıklardan anlamamız her zaman mümkün olmaz. Uyumlamanın iyiliğini ölçebilecek istatistiksel yöntemlerin bazıları anlamlı bir seçim yapmaya yeterli olmayabilir. Örneğin en küçük kareler yöntemi ile bu veri setine yapılacak iki uyumlama için lineer korelasyon katsayılarını elde edelim.\n", "\n", "Uyumlamak istediğimiz her iki fonksiyon da parametreleri bağlamında lineerleştirilebilir olduğu için lineer en küçük kareler yöntemlerini kullanabiliriz. Öncelikle fonksiyonları doğrusal hale getirelim.\n", "\n", "$$ y_1 = A~e^{\\alpha~t} \\Rightarrow ln(y_1) = ln(A) + \\alpha~t $$\n", "$$ y_2 = B~t^{\\beta} \\Rightarrow ln(y_2) = ln(B) + \\beta~ln(t) $$\n", "\n", "Yukarıdaki fonksiyonları veriye uyumlamak için basit olması açısından `numpy.polyfit()` fonksiyonunu `deg = 1` parametresiyle doğrusal bir model yapmak için kullanabiliriz. Ancak veri setimizi yukarıdaki lineerleştirmeye uygun olacak şekilde düzenlemeliyiz." ] }, { "cell_type": "code", "execution_count": 36, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "y1 = 7.33 e^(0.15t)\n", "y2 = 3.32 t^1.04\n" ] } ], "source": [ "import numpy as np\n", "t = np.array([2.5, 2.8, 5.4, 6.5, 9.2, 9.5, 11.0, 13.3, 14.6, 16.4])\n", "y = np.array([10.07,11.07,14.59,20.70,27.94,31.50,38.04,49.90,60.72,75.57])\n", "lnt = np.log(t)\n", "lny = np.log(y)\n", "ks_y1 = np.polyfit(t,lny,deg=1)\n", "ks_y2 = np.polyfit(lnt,lny,deg=1)\n", "# Katsayilari donusturmeliyiz\n", "A = np.exp(ks_y1[1])\n", "alpha = ks_y1[0]\n", "B = np.exp(ks_y2[1])\n", "beta = ks_y2[0]\n", "# Fit fonksiyonlarini ekrana yazdiralim\n", "print(\"y1 = {:.2f} e^({:.2f}t)\".format(A,alpha))\n", "print(\"y2 = {:.2f} t^{:.2f}\".format(B,beta))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Fit fonksiyonlarını elde ettikten sonra bunları verimiz üzerine çizdirelim." ] }, { "cell_type": "code", "execution_count": 37, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "from matplotlib import pyplot as plt\n", "%matplotlib inline\n", "# Fit fonksiyonlarini biraz fazla nokta\n", "# kullanarak cizdirelim\n", "tyeni = np.linspace(t[0],t[-1])\n", "y1 = A*np.exp(alpha*tyeni)\n", "y2 = B*tyeni**(beta)\n", "plt.plot(t,y,'ro',label=\"veri\")\n", "plt.plot(tyeni,y1,'b-',label=\"Ustel model\")\n", "plt.plot(tyeni,y2,'g-',label=\"Kuvvet yasasi\")\n", "plt.xlabel(\"t\")\n", "plt.ylabel(\"y\")\n", "plt.legend(loc=\"upper left\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Her ne kadar üstel model (mavi sürekli eğri) veriyi daha iyi temsil ediyor görünse de bir istatistik kullanmamızda fayda var. Örneğin lineer korelasyon katsayısını bu amaçla kullanabiliriz. Ders 4. Eğri Uyumlama dersinde yazdığımız korelasyon katsayısı fonksiyonunu bu amaçla kullanabiliriz. Yalnız fonksiyonu daha sonra yapacağımız F-testinde kullanmak üzere artıkları da döndürecek şekilde değiştirelim." ] }, { "cell_type": "code", "execution_count": 38, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Ustel model icin lineer korelasyon katsayisi r^2 = 0.993\n", "Kuvvet yasasi icin lineer korelasyon katsayisi r^2 = 0.919\n" ] } ], "source": [ "import numpy as np\n", "def linkor_katsayi(x,y,ymod):\n", " n = y.shape\n", " St = np.sum((y - y.mean())**2)\n", " Sr = np.sum((y - ymod)**2)\n", " r2 = np.abs((St - Sr) / St)\n", " return(r2,Sr)\n", "# Gozlemsel zaman degerleri icin modeller ne ongoruyor?\n", "ymod1 = A*np.exp(alpha*t)\n", "ymod2 = B*t**(beta)\n", "r2_ustel,Sr_ustel = linkor_katsayi(t,y,ymod1)\n", "r2_kuvvet,Sr_kuvvet = linkor_katsayi(t,y,ymod2)\n", "print(\"Ustel model icin lineer korelasyon katsayisi r^2 = {:.3f}\".format(r2_ustel))\n", "print(\"Kuvvet yasasi icin lineer korelasyon katsayisi r^2 = {:.3f}\".format(r2_kuvvet))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Görüldüğü gibi üstel model gerçekten de $1$'e daha yakın bir lineer korelasyon katsayısı vermiştir. Yine de bu modelleri karşılaştırmak için bir de F-testine başvuralım. Çünkü lineer korelasyon katsayıları birbirine yakındır. Bunun için yine bir hipotez testi yapacağız. Bu amaçla sıfır ve alternatif hipotezlerimizi probleme uyun şekilde oluşturalım.\n", "\n", "* Sıfır hipotezi ($H_0$): \"1. model (üstel), istatistiksel olarak 2. modele (kuvvet yasası) göre daha iyi bir uyumlamadır\".\n", "* Alternatif hipotez ($H_1$): \"1. model 2. modele göre istatistiksel olarak daha iyi bir uyumlama değildir” \n", "\n", "Bu örnek için F-istatistiğini 1. modelden artıkları bölen, 2. modelden artıkları bölünen olarak almak suretiyle hesaplayalım. Test ettiğimiz sıfır hipotezi ($H_0$) 1. model daha iyi bir uyumlamadır şeklinde ifade edildiğine göre ondan artıkların daha küçük olmasını bekleriz. Dolayısı ile artıkları büyük olan 2. modeli bölümün üstüne almamız gerekir." ] }, { "cell_type": "code", "execution_count": 39, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Hesaplanan F-degeri = 0.089\n" ] } ], "source": [ "F_hesap = Sr_ustel/ Sr_kuvvet\n", "print(\"Hesaplanan F-degeri = {:.3f}\".format(F_hesap))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Yine bu örnek için her iki model de ikişer parametre ($(A,\\alpha)$, $(B,\\beta)$) ve aynı sayıda ölçüm ($n = 10$) içerdiğinden serbestlik dereceleri $df_1 = df_2 = n – 2 = 8$'dir.\n", "\n", "Bir sonraki adım F-tablolarından verilen istatistik anlam seviyesi için, önreğin $\\alpha = 0.01$ tek taraflı bir test için olanının seçilerek (çünkü biz bu iki modelden artıklar arasında büyük bir fark olup olmamasını değil, seçilimiş bir modelin diğerinden daha iyi olup olmadığını sorguluyoruz) $df_1 = df_2 = 8$ serbestlik derecesi için verilen F-istatistiğine bakmaktır. Daha önce yaptığımız gibi bunun için `scipy.stats.f.ppf()` fonksiyonunu kullanacağız." ] }, { "cell_type": "code", "execution_count": 40, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Tablodan elde edilen F-degeri: 6.029\n" ] } ], "source": [ "from scipy import stats as st\n", "n = 10\n", "df1 = df2 = n-2\n", "alfa = 0.01\n", "F_degeri = st.f.ppf(1-alfa, df1, df2)\n", "print(\"Tablodan elde edilen F-degeri: {:.3f}\".format(F_degeri))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Bu durumda $F_{hesap} = 0.089 < F_{tablo} = 6.029$ olduğundan $H_0$ hipotezi reddedilemez. %99 güven düzeyinde üstel modelin, kuvvet yasasıyla verilen modele üstün olduğu görülmektedir. Güven düzeyi %90’a ($\\alpha = 0.10$) düşürülse dahi ($F = 2.5893$) $H_0$ reddedilemez.\n", "\n", "Şimdi sıfır hipotezini ($H_0$): \"2. model (kuvvet yasası), 1. modele (üstel) göre istatistiksel olarak daha iyi bir uyumlamadır\", alternatif hipotezi ($H_1$) ise \"2. model 1. modele göre istatistiksel olarak daha iyi bir uyumlama değildir\" şekilnde değiştirelim ve sonuçta bir değişiklik olup olmayacağına bakalım.\n", "\n", "Bunun için öncelikle F-istatistiğini fark kareler toplamının bölümde yerini değiştirerek hesaplayalım." ] }, { "cell_type": "code", "execution_count": 41, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Hesaplanan F-degeri = 11.212\n" ] } ], "source": [ "F_hesap = Sr_kuvvet / Sr_ustel\n", "print(\"Hesaplanan F-degeri = {:.3f}\".format(F_hesap))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Yine aynı şekilde her iki model de ikişer parametre ($(A,\\alpha)$, $(B,\\beta)$) ve aynı sayıda ölçüm ($n = 10$) içerdiğinden serbestlik dereceleri $df_1 = df_2 = n – 2 = 8$'dir. Bu serbestlik derecesi için verilen F-istatistiğini `scipy.stats.f.ppf()` fonksiyonunu kullanarak hesaplamıştık. $F_{hesap} = 11.212 > F_{tablo} = 6.029$ olduğundan $H_0$ bu kez reddedilir. Ancak bu kez reddedilen sıfır hipotezi kuvvet yasasının üstel modele göre veriye daha uygun olduğunu ifade etmektedir. Bu durum alternatif hipotez için, yani kuvvet yasasının üstel modele göre veriye daha uygun olmadığına yönelik görüşe kanıt teşkil eder. Her iki test de elimizdeki veriyi uyumlamada bize üstel modelin kuvvet yasasına üstün olduğu konusunda kanıt sağlamaktadır." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Varyans Analizi ANOVA #\n", "\n", "Varyans analizi (ing. Analysis of Variance, ANOVA) ikiden fazla örneklem söz konusu olduğunda bu örneklemlerlin ortalamaları arasında istatistiksel olarak anlamlı bir farkın olup olmadığını belirlemek için yapılır. Sadece iki grup söz konusu olduğunda genellikle t-testi kullanılır ve ANOVA ile aynı sonucu verir. Grupların ortalamları karşılaştırılırken eşit olup olmadıklarına karar vermek için doğal olarak varyanslarına ve grup büyüklüklerine bakılmalıdır. \n", "\n", "Bir varyans analizi (ANOVA) yaparken aşağıdaki varsayımlar yapılır.\n", "\n", "* Örnek gruplar normal dağılım göstermektedir.\n", "* Gözlemlere ilişkin hatalar birbirlerinden bağımsızdır.\n", "* Aykırı gözlemler bulunmamaktadır ya da ayıklanmıştır.\n", "* Farklı örnek gruplarda, her bağımsız değişkene ilişkin varyans değerleri eşittir.\n", "\n", "Varyans analizi de bir hipotez testine dayanır. ANOVA’nın sıfır hipotezi, tüm örnek grupların ortalama değerlerinin birbirlerine eşit olduğudur. Alternatif hipotez ise, \"örnek grupların ortalama değerleri birbirlerine eşit değildir\" şeklinde ifade edilir.\n", "\n", "Test edilen olguya ilişkin ortalama değeri değiştirebilecek tek bir etkinin (faktörün) bulunması durumunda ana etken (ing. main effect) test edilmiş olur (ing. Factorial Analysis of Variance).\n", "\n", "Deneysel araştırma alanlarında (örn. biyoloji, tıp, kimya) kullanılabildiği gibi, deneysel olmayan araştırma alanlarında (örn. astronomi) de kullanılabilmektedir ancak pek yaygın değildir. Deneysel araştırmalara örnek olarak; bir ilacın farklı dozajlarının sonuç etkide değişime sebep olup olmadığı testi bir varyans analizi ile yapılabilir. Böyle bir testte, tek bir değişken (dozaj) bulunduğundan bu teste tek yönlü ANOVA (ing. one way ANOVA) denir. Eğer bu deneyde farklı dozajların farklı cinsiyetlere etkileri ve cinsiyetler arası bir farklılığın olup olmadığı test edilmek istenirse iki değişken olması sebebiyle (dozaj ve cinsiyet) bu teste iki yönlü ANOVA (ing. two way ANOVA) denir.\n", "\n", "Varyans analizinde diğer hipotez testlerine benzer olan aşağıdaki şematik yol takip edilir:\n", "\n", "* Sıfır ve alternatif hipotezler belirlenir,\n", "* Kritik olasılık değeri ($\\alpha$) tanımlanır,\n", "* Test istatistiği değeri belirlenir,\n", "* Test istatistiiğinin istatistiksel olarak anlamlı olup olmadığı saptanır,\n", "* Kritik değerler karşılaştırma sonucu $H_0$ bağlamında yorumlanır." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Örnek Varyans Analizi ##\n", "\n", "4 farklı yıldız kümesi çalışıyor olalım. Sadece az sayıda yıldızının yaşını belrileyebildğimiz bu kümelerin aynı yaşta olup olmadığını anlamaya çalışyoruz. Kümelerin dönme noktasını sadece 5 yıldızdan belirleyemeyeceğimiz için yapabileceğimiz en iyi şey her bir kümedeki yıldızların yaşları ortalamasının belirli bir istatistik anlamlılık seviyesinde birbirleriyle eşit olup olmadığını sorgulamaktır. Birden fazla grubu birbirleriyle tek bir değişken (yaş) çerçevesinde karşılaştıracağımız için bu bir varyans analizi problemidir ve ANOVA tabloları adı verilen tablolarla çözümü kolaylaşırılabilir.\n", "\n", "Öncelikle verimize bakalım.\n", "\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Küme 1 [Gyr] Küme 2 [Gyr] Küme 3 [Gyr] Küme 4 [Gyr]
6.82.43.22.9
5.54.35.42.8
6.23.54.11.7
7.65.12.01.9
3.11.03.03.2
\n", "\n", "Çözüm: Öncelikle sıfır ve alternatif hipotezleri tanımlayalım.\n", "\n", "* $H_0: \\mu_1 = \\mu_2 = \\mu_3 = \\mu_4$\n", "* $H_1:$ Ortalamalar eşit değildir!\n", "\n", "Öncelikle Python'ın sadece temel fonksiyonlarını hesaplamalar için kullanarak bir varyans analizi yaparak $H_O$ hipotezini test edelim. Bunun için öncelikle kümeleri birer `numpy` dizisi olarak tanımlayalım." ] }, { "cell_type": "code", "execution_count": 42, "metadata": {}, "outputs": [], "source": [ "import numpy as np\n", "kume1 = np.array([6.8,5.5,6.2,7.6,3.1])\n", "kume2 = np.array([2.4,4.3,3.5,5.1,1.0])\n", "kume3 = np.array([3.2,5.4,4.1,2.0,3.0])\n", "kume4 = np.array([2.9,2.8,1.7,1.9,3.2])" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Şimdi serbestlik derecelerini (grup sayıları $k = 4$, toplam örnek sayısı $N = 20$ olmak üzere) hesaplayalım." ] }, { "cell_type": "code", "execution_count": 43, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Birinci serbestlik derecesi: 3, ikinci serbestlik derecesi: 16\n" ] } ], "source": [ "k = 4\n", "n = 5\n", "N = n*k\n", "df1 = k - 1\n", "df2 = N - k\n", "print(\"Birinci serbestlik derecesi: {:d}, ikinci serbestlik derecesi: {:d}\".\\\n", " format(df1,df2))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Şimdi bir istatistiki anlam seviyesi tanımlayalım. %95 güven düzeyi ($\\sim2\\sigma$) için istatistiki anlamlılık seviyesi $\\alpha = 0.05$ seçilmiş olsun. Her ne kadar $\\alpha = 0.05$ için aşağıdaki gibi verilen F-tablosunu kullanabilirsek de biz `scipy.stats.f` alt modülü fonksiyonlarını kullanarak F-değerini hesaplayalım. \n", "\n", "\"F-tablosu\"\n", "\n", "Bu değeri (tüm diğer istatistiklerin kritik değerleri gibi) `ppf()` (point percent function) fonksiyonuyla hesaplayabileceğimizi ve bu fonksiyona kritik değerin sol tarafındaki alanı verecek olan $\\alpha$ yerine sağ tarafındaki alanı verecek olan $1 - \\alpha$ değerini vermemiz gerektiğini biliyoruz." ] }, { "cell_type": "code", "execution_count": 44, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "alpha = 0.05, df1 = 3, df2 = 16 icin F-kritik = 3.24\n" ] } ], "source": [ "from scipy import stats as s\n", "alpha = 0.05\n", "F_kritik = st.f.ppf(1-alpha, df1, df2)\n", "print(\"alpha = {:.2f}, df1 = {:d}, df2 = {:d} icin F-kritik = {:.2f}\".\\\n", " format(alpha,df1,df2,F_kritik))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Kritik değeri $F_kritik = 3.24$ bulduğumuza göre şimdi veriden F-değerini hesaplayıp bu değerle karşılaştırmalıyız. Bunun için bize grupların ortalamasıyla, bütün verinin ortalaması gerekir. Öncelikle her bir kümedeki yıldızların yaşlarının kümenin ortalamasından farklarının karelerini toplayarak SSE değerini aşağıdaki şekilde edelim.\n", "\n", "$$ SSE_i = \\sum_{j=1}^n (x_j - \\bar{x_i})^2 $$\n", "$$ SSE = \\sum_{i=1}^k \\sum_{j=1}^n (x_j - \\bar{x_i})^2 $$" ] }, { "cell_type": "code", "execution_count": 45, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "SSE = 30.44\n" ] } ], "source": [ "SSE_1 = np.sum((kume1 - kume1.mean())**2)\n", "SSE_2 = np.sum((kume2 - kume2.mean())**2)\n", "SSE_3 = np.sum((kume3 - kume3.mean())**2)\n", "SSE_4 = np.sum((kume4 - kume4.mean())**2)\n", "SSE = SSE_1 + SSE_2 + SSE_3 + SSE_4\n", "print(\"SSE = {:.2f}\".format(SSE))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Şimdi F-değerini hesaplamakta kullanacağımız ve grup ortalamlarının genel ortalamadan uzaklığını veren $SSB$ değerini aşağıdaki şekilde hesaplayalım.\n", "\n", "$$ SSB = \\sum_{i=1}^{k} n_i~(\\bar{x_i} - \\bar{x})^2 $$" ] }, { "cell_type": "code", "execution_count": 46, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "SSB = 31.05\n" ] } ], "source": [ "yildizlar = np.concatenate((kume1,kume2,kume3,kume4))\n", "yildizlar_ort = yildizlar.mean()\n", "SSB = len(kume1)*(yildizlar_ort - kume1.mean())**2 + len(kume2)*(yildizlar_ort - kume2.mean())**2 + \\\n", "len(kume3)*(yildizlar_ort - kume3.mean())**2 + len(kume4)*(yildizlar_ort - kume4.mean())**2\n", "print(\"SSB = {:.2f}\".format(SSB))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Görüldüğü gibi SSE aslında her bir yıldızın kendi grubunun ortalamasından sapmaları üzerinden hesaplanan grup içi varyansı, SSB ise her bir grubun ortalamasının genel ortalamadan farkına dayanan gruplar arası varyansı verdiği için aşağıdaki şekilde tanımlanan F-değeri, özünde grup-içi varyansın gruplar-arası varyansa oranıdır.\n", "\n", "$$ s_1 = \\frac{SSB}{df1} $$\n", "$$ s_2 = \\frac{SSE}{df2} $$\n", "$$ F = \\frac{s_1}{s_2} $$\n", "\n", "ANOVA analizlerinde genellikle aşağıdaki gibi bir tablo hazırlanır ve hesaplarda bu tablodan yararlanılır.\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Fark Kareler Serbestlik Dereceleri Ortalama Fark Kareler F
Kümeler ArasıSSB = 31.05$df_1$ = 4 - 1 = 3SSB / $df_1$ = 10.3510.35 / 1.66 = 5.44
Küme İçiSSE = 30.44$df_2$ = 20 - 4 = 16SSE / $df_2$ = 1.66
ToplamSSB + SSE = 61.49$df_1 + df_2$ = 19
" ] }, { "cell_type": "code", "execution_count": 47, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Hesaplanan F-degeri = 5.44\n" ] } ], "source": [ "s_1 = SSB / df1\n", "s_2 = SSE / df2\n", "F_hesaplanan = s_1 / s_2\n", "print(\"Hesaplanan F-degeri = {:.2f}\".format(F_hesaplanan))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Sonuç olarak elde edilen $F_{hesaplanan} = 5.44$, serbestlik derecelerine ve istatistiki anlam seviyesine karşılık tablolardan elde edilen $F_{kritik} = 3.24$ değeri ile karşılaştırıldığında ondan büyük olduğu görülür ($F_{hesaplanan} > F_{kritik}$). Bu nedenle sıfır hipotezi ($H_0$) reddedilir. Bu durumda incelenen kümelerdeki yıldızların ortalama yaşları arasında bir fark olduğu yönünde $\\alpha = 0.05$ anlamlılık seviyesinde bir fark olduğuna dair istatistiki bir kanıt elde edilmiş olunur.\n", "\n", "Seçilen istattistiki anlamlılık $\\alpha = 0.001$ olsaydı, " ] }, { "cell_type": "code", "execution_count": 48, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "alpha = 0.00, df1 = 3, df2 = 16 icin F-kritik = 9.01\n" ] } ], "source": [ "from scipy import stats as s\n", "alpha = 0.001\n", "F_kritik = st.f.ppf(1-alpha, df1, df2)\n", "print(\"alpha = {:.2f}, df1 = {:d}, df2 = {:d} icin F-kritik = {:.2f}\".\\\n", " format(alpha,df1,df2,F_kritik))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "$F_{kritik} = 9.01$ olur, bu durumda da $F_{hesaplanan} = 5.44 < F_{kritik}$ olacağından sıfır hipotezi ($H_0$) reddedilemezdi. Bir başka deyişle, bu düzeyde bu kümelerin yaşlarının farklı olduğu iddia edilemez, bu durum incelenen kümelerin yaşlarının eşit olduğuna bir kanıt teşkil ederdi.\n", "\n", "Alternatif Çözüm: `scipy.stats.f_oneway()` fonksiyonu bir yönlü ANOVA analizi yapılmasına olanak sağlayan fonksiyonlara sahiptir. Çözümümüzü bu kez bu fonksiyonları kullanarak yapalım." ] }, { "cell_type": "code", "execution_count": 49, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "F_onewayResult(statistic=5.440837604591055, pvalue=0.008998274604144726)\n" ] } ], "source": [ "from scipy import stats as st\n", "print(st.f_oneway(kume1, kume2, kume3, kume4))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Görüldüğü gibi `f_oneway()` sadece kritik F-değerini değil aynı zamanda daha önce de ne kadar kullanışılı olduğunu gördüğümüz Pearson p-değerini de vermektedir. Bu p-değerini kolaylıkla seçeceğiniz istatistiki anlamlılık seviyesiyle ($\\alpha$) karşılaştırarak F-testi uyguylayabilirsiniz. Örneğin $\\alpha = 0.01$ için $p < \\alpha$ olacağı için kümelerin ortalamasının eşit olduğunu öne süre $H_0$ hipotezinin reddedilmesi gerekirken $\\alpha = 0.001$ için $p > \\alpha$ olduğundan $H_0$ reddedilemez. p-değeri yalnız başına da bir anlam taşır ve verdiği mesaj; bu kümelerin yaşlarının eşit olduğu hipotezinin en az $\\sim0.009$’luk bir istatistik anlamlılık seviyesinde iddia edilebileceğidir. Bundan daha büyük istatistiki anlamlılık seviyelerinin tümünde $H_0$ reddedilir. Sonuç olarak bu kümelerin yaşlarının eşit kabul edilmesi ($H_0$) durumunda elimizdeki veri setinin örneklem hatasıyla şans eseri türemiş olma olasılığı %0.9'dur. Bu oran seçtiğimiz istatistik anlam seviyesinin $\\alpha = 0.01$ olması durumunda $H_0$'ı reddetmememiz için yeterli değildir. \n", "\n", "p-değerini `scipy.stats.f.sf` (ing. survival function) ile de hesaplayabilirdik." ] }, { "cell_type": "code", "execution_count": 50, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "F = 5.44 degerine karsilik gelen p-degeri = 0.008998\n" ] } ], "source": [ "from scipy import stats as st\n", "p_degeri = st.f.sf(F_hesaplanan,df1,df2)\n", "print(\"F = {:.2f} degerine karsilik gelen p-degeri = {:.6f}\".\\\n", " format(F_hesaplanan, p_degeri))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Akaike Bilgi Kriteri #\n", "\n", "Akaike Bilgi Kriteri (ing. Akaika Information Criterion,AIC), bir modelin başarısını veren ölçütlerden biridir. Doğrudan bir modelin başarısını verebildiği gibi, farklı modellerin karşılaştırılabilmesinde de olanak sağlar. Bir sıfır hipotezinin testine dayanan bir değerlendirme yapılmadığı için bir modelin doğruluğunun hangi istatistiksel anlamlılık seviyesinde reddedilip edilmeyeceğiyle ilgili bir bilgi vermez. Dolayısıyla ilgilenilen modellerin tamamının veriye uyum sağlayıp sağlamamalarının bir göstergesi olmayıp, sadece bir karşılaştırmalarıdır. \n", "\n", "Akaike Bilgi Kriteri (AIC) aşağıdaki şekilde tanımlanır ve $AIC$ değeri küçük olan modelin başarısı daha yüksektir.\n", "\n", "$$ AIC = 2~k - 2~ln(\\hat{L}) $$\n", "\n", "Burada $k$, modelde kullanılan parametrelerin sayısıdır. $\\hat{L}$ ise modelin doğruluğu durumunda gözlem verisinin olabilirlik fonksiyonudur (ing. likelihood function).\n", "\n", "Olabilirlik fonksiyonu, bir modelin önerdiği olasılık dağılımına göre tüm verilerin bu model ile oluşabilme olasılıklarının çarpımıdır. $AIC$ ya da bir çok hesapta olabilirlik fonksiyonunun kendisi kullanılabildiği gibi, kolay hesaplanabilirliği sebebiyle logaritması da kullanılmaktadır.\n", "\n", "Görüldüğü gibi parametre sayısının artması durmunda $AIC$ değeri artar. Yani modelde kullanılan parametre sayısının fazlalığı, modelin gerçek değişimden çok gürültü modellemeye doğru eğilimde bulunacağı kabulu yapılır. Dolayısıyla daha az parametre sayısına sahip (daha basit) modellerin seçilmesi yönünde bir denge sağlamış olur.\n", "\n", "Eğer uyumlama yapılmak istenen veri sayısı çok az ise $AIC$ daha fazla parametreye sahip olan modelin seçilmesine sebep olur. Bu sebep ile AIC düzeltmesi (AIC correction, $AICc$) tanımı yapılmıştır. \n", "\n", "$$ AICc = AIC + \\frac{2k~(k+1)}{n - k -1} $$\n", "\n", "Düzeltme terimindeki $n$, gözlem verisi sayısı; $k$ ise parametre sayısıdır.\n", "\n", "$AIC$ ya da $AICc$ kullanımı için sınır koşul olarak $n/k > 40$ kullanılır. Yani gözlem verisi sayısı, modeldeki parametre sayısından en az 40 kat büyük ise $AIC$ kullanılabilir. Bu durumda parametre sayısı fazlalığının etkisi ihmal edilebilecek kadar küçük kalır. Eğer bu oran 40’tan daha küçük ise mutlaka $AICc$ kullanılmalıdır.\n", "\n", "$AIC$ ya da $AICc$ değeri pozitif ya da negatif olabilir. Başarılı model her zaman daha küçük değere sahip olandır. $AIC$, farklı sayıda veriye sahip uyumlama işlemlerinde kullanılamaz. $AIC$, bir sıfır hipotezi sınaması olmadığı için sonuçta anlamlılık düzeyi, hipotez reddi gibi ifadeler kullanılmamalıdır.\n", "\n", "Model uyumlamada AIC hesabı aşağıdaki şekilde yapılabilir.\n", "\n", "$$ AIC = n~ln~(\\frac{S_r}{n}) + 2k $$\n", "\n", "Daha önce de tanımlandığı gibi $S_r$ gözlemsel verinin modelden fark kareler toplamını ifade eder. $n$ gözlem verisi sayısı, $k$ modelin parametre sayısıdır.\n", "\n", "Model seçimi durumunda: \n", "\n", "* Modellerin tamamının $AIC$ değerleri yukarıdaki ifadeden hesaplanır. \n", "* En düşük $AIC$ değerine ($AIC_{min}$) sahip olan model baz alınarak $AIC$ farkları ($Delta_i$) hesaplanır.\n", "* Her bir modelin olabilirlik fonksiyonu değeri, o modelin $AIC$ değerinin minimum AIC değerine sahip modelden ($AIC_{min}$) farknın üstel bir ifadesi ile orantılıdır.\n", "* Ardından modellerin Akaike ağırlıkları ($w_i$) hesaplanır. Bu değer, her bir model için bulunan olabilirlik fonksiyonunun karşılaştırma yapılan tüm modellerin toplam olabilirliklerine oranıdır.\n", "\n", "$$ \\Delta_i = AIC_i - AIC_{min} $$ olmak üzere,\n", "\n", "$$ \\mathcal{L}(g_i~|~y)~\\alpha~e^{-\\frac{1}{2} \\Delta_i} $$\n", "\n", "$$ w_i = \\frac{e^{-\\frac{1}{2} \\Delta_i}}{\\sum_{r=1}^r e^{-\\frac{1}{2} \\Delta_r}} $$" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-dersten-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "## Örnek: Akaike Bilgi Kriteriyle Model Karşılaştırması ##\n", "\n", "F-Testi ile model karşılaştırması için yaptığımız örneğe geri dönelim. Örneğimizin verisi aşağıdaki tabloda birinci sütunda verilen zaman değerlerine karşılık ikinci sütundaki bir niceliğin ölçüm değerlerinden oluşmaktaydı.\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
$t_i$ $y_i$
2.510.07
2.811.07
5.414.59
6.520.75
9.227.94
9.531.50
11.038.04
13.349.90
14.660.72
16.475.57
\n", "\n", "Bu veri setini biri üstel ($y = A~e^{\\alpha~t}$), diğeri kuvvet yasasına uyan $y = B~t^{\\beta}$ iki ayrı modelle modellemiş ve bu iki modeli F-testi ile karşılaştırmıştık. Bu kez bir de doğru modeli tanımlayalım ve bu modellerden hangisinin veriyi daha iyi temsil edebildiğini Akaike Bilgi Kriteri ($AIC$) kullanarak belirleyelim.\n", "\n", "Uyumlamak istediğimiz her iki fonksiyon parametreleri bağlamında lineerleştirilebilirdi. Eklediğimiz son model de zaten lineer bir model olsun.\n", "\n", "$$ y_1 = a_0 + a_1*t $$\n", "$$ y_2 = A~e^{\\alpha~t} \\Rightarrow ln(y_2) = ln(A) + \\alpha~t $$\n", "$$ y_3 = B~t^{\\beta} \\Rightarrow ln(y_3) = ln(B) + \\beta~ln(t) $$\n", "\n", "Yine `numpy.polyfit()` gibi basit bir fonksiyon kullanarak bu modelleri verimize uyumlayabiliriz ve bu modellerden verimizin fark kareleri toplamı, veri sayısı ve parametre sayısını dikkate alarak Akaike Bilgi Kriteri'ni ($AIC$), kritierin veri sayımız az olduğu için düzeltilmiş değerini ($AICc$) kendi yazabileceğiniz bir Python fonksiyonuyla hesaplayıp, model karşılaştırması yapabiliriz. Yine önce verimizi tanımlayalım ve uyumlamalarımızı yapıp veri üzerinde görerek başlayalım." ] }, { "cell_type": "code", "execution_count": 51, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "y1 = -6.73 + 4.47t)\n", "y2 = 7.33 e^(0.15t)\n", "y3 = 3.32 t^1.04\n" ] } ], "source": [ "import numpy as np\n", "t = np.array([2.5, 2.8, 5.4, 6.5, 9.2, 9.5, 11.0, 13.3, 14.6, 16.4])\n", "y = np.array([10.07,11.07,14.59,20.70,27.94,31.50,38.04,49.90,60.72,75.57])\n", "lnt = np.log(t)\n", "lny = np.log(y)\n", "ks_y1 = np.polyfit(t,y,deg=1)\n", "ks_y2 = np.polyfit(t,lny,deg=1)\n", "ks_y3 = np.polyfit(lnt,lny,deg=1)\n", "# Katsayilari donusturmeliyiz\n", "a0 = ks_y1[1]\n", "a1 = ks_y1[0]\n", "A = np.exp(ks_y2[1])\n", "alpha = ks_y2[0]\n", "B = np.exp(ks_y3[1])\n", "beta = ks_y3[0]\n", "# Fit fonksiyonlarini ekrana yazdiralim\n", "print(\"y1 = {:.2f} + {:.2f}t)\".format(a0,a1))\n", "print(\"y2 = {:.2f} e^({:.2f}t)\".format(A,alpha))\n", "print(\"y3 = {:.2f} t^{:.2f}\".format(B,beta))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Fit fonksiyonlarını elde ettikten sonra bunları verimiz üzerine çizdirelim." ] }, { "cell_type": "code", "execution_count": 52, "metadata": {}, "outputs": [ { "data": { "image/png": "\n", "text/plain": [ "
" ] }, "metadata": {}, "output_type": "display_data" } ], "source": [ "from matplotlib import pyplot as plt\n", "%matplotlib inline\n", "# Fit fonksiyonlarini biraz fazla nokta\n", "# kullanarak cizdirelim\n", "tyeni = np.linspace(t[0],t[-1])\n", "y1 = a0 + a1*tyeni\n", "y2 = A*np.exp(alpha*tyeni)\n", "y3 = B*tyeni**(beta)\n", "plt.plot(t,y,'ro',label=\"veri\")\n", "plt.plot(tyeni,y1,'m-',label=\"Dogrusal model\")\n", "plt.plot(tyeni,y2,'b-',label=\"Ustel model\")\n", "plt.plot(tyeni,y3,'g-',label=\"Kuvvet yasasi\")\n", "plt.xlabel(\"t\")\n", "plt.ylabel(\"y\")\n", "plt.legend(loc=\"upper left\")\n", "plt.show()" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Şimdi modellerimiz için $AIC$ ve $AICc$ değerlerini hesaplamak üzere basit bir fonksiyon yazalım ve verilerimiz ile modelimizi bu fonksiyona gönderereek $AIC$ ve $AICc$ değerlerini hesaplayalım" ] }, { "cell_type": "code", "execution_count": 53, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Dogrusal model icin AIC=35.89, AICc = 37.61\n", "Ustel model icin AIC=15.57, AICc = 17.28\n", "Kuvvet yasasi modeli icin AIC=39.74, AICc = 41.45\n" ] } ], "source": [ "import numpy as np\n", "def aic(y,ymodel,katsayilar):\n", " Sr = np.sum((y - ymodel)**2)\n", " n = len(y)\n", " k = len(katsayilar)\n", " AIC = n*np.log(Sr / n) + 2*k\n", " AICc = AIC + (2*k*(k+1)) / (n - k - 1)\n", " return(AIC,AICc,Sr)\n", "AIC_1,AICc_1,Sr1 = aic(y,a0+a1*t,(a0,a1))\n", "AIC_2,AICc_2,Sr2 = aic(y,A*np.exp(alpha*t),(A,alpha))\n", "AIC_3,AICc_3,Sr3 = aic(y,B*t**beta,(B,beta))\n", "print(\"Dogrusal model icin AIC={:.2f}, AICc = {:.2f}\".\\\n", " format(AIC_1, AICc_1))\n", "print(\"Ustel model icin AIC={:.2f}, AICc = {:.2f}\".\\\n", " format(AIC_2, AICc_2))\n", "print(\"Kuvvet yasasi modeli icin AIC={:.2f}, AICc = {:.2f}\".\\\n", " format(AIC_3, AICc_3))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Her üç modelin parametre sayısı ve veri noktası sayısı da aynı olduğu için karşılaştırma doğrudan düzeltilmiş Akaika Bilgi Kriteri ($AICc$) üzerinden de yapılabilir. Böyle bir karşılaştırma üstel modelin diğer iki modele göre üstün olduğunu göstermektedir. Ancak öğretici olması açısından yukarıdaki şemaya bağlı kalarak bir tablo hazırlayyalım. Bunun için yukarıda tanımlanan $\\Delta_i$ ve $w_i$ değerlerini de hesaplamamız gerekir. Bu hesaplar için gerekli bütün parametrelere sahibiz. " ] }, { "cell_type": "code", "execution_count": 54, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Sr_i: (242.68495233015116, 31.792195082352833, 356.4389414714982)\n", "Delta_i: [20.32543288 0. 24.16942131]\n", "w_i: [3.85806129e-05 9.99955774e-01 5.64491803e-06]\n" ] } ], "source": [ "AICc = np.array([AICc_1,AICc_2,AICc_3])\n", "AICc_min = np.min(AICc)\n", "Delta = np.array([aicc-AICc_min for aicc in AICc])\n", "expDelta = np.exp(-0.5*Delta)\n", "wi = expDelta / np.sum(expDelta)\n", "print(\"Sr_i: \", (Sr1,Sr2,Sr3))\n", "print(\"Delta_i: \", Delta)\n", "print(\"w_i: \", wi)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Bu değerleri bir tablo şeklinde ifade edelim\n", "\n", "\n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", " \n", "
Model k Sr AICc $\\Delta_i$ $w_i$
Dogrusal2 242.68 37.61 20.33 0.000039
Ustel2 31.79 17.28 0.00 0.999558
Kuvvet2 356.44 41.45 24.17 0.000006
\n", "\n", "Bu değerlerden hareketle artık modelleri birbirleriyle karşılaştırmak mümkündür. Bunun için model ağırlıklarını birbirlerine bölerek, bir modelin diğerine göre \"olabilirliğinin\" ($\\mathcal{L}$) ne kadar daha yüksek (olası) olduğunu belirlemeliyiz." ] }, { "cell_type": "code", "execution_count": 55, "metadata": {}, "outputs": [ { "name": "stdout", "output_type": "stream", "text": [ "Ustel model dogrusal modele gore 25918.61 kat daha yuksek olabilirlige sahiptir\n", "Ustel model kuvvet yasasi modeline gore 177142.66 kat daha yuksek olabilirlige sahiptir\n", "Dogrusal model kuvvet yasasi modeline gore 6.83 kat daha yuksek olabilirlige sahiptir\n" ] } ], "source": [ "L2_1 = wi[1] / wi[0]\n", "L2_3 = wi[1] / wi[2]\n", "L1_3 = wi[0] / wi[2]\n", "print(\"Ustel model dogrusal modele gore {:.2f} kat daha yuksek olabilirlige sahiptir\".\\\n", " format(L2_1))\n", "print(\"Ustel model kuvvet yasasi modeline gore {:.2f} kat daha yuksek olabilirlige sahiptir\".\\\n", " format(L2_3))\n", "print(\"Dogrusal model kuvvet yasasi modeline gore {:.2f} kat daha yuksek olabilirlige sahiptir\".\\\n", " format(L1_3))" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "Sonuç olarak bu üç modelden üstel modelin eldeki gözlemsel veriyi modellemek konusunda başarımı en yüksek model olduğu tüm ölçütlerde görülmektedir. Aslında bu anlamda fark-karelere bakmak bile yaterli olabilirdi. Ancak buradaki üçüncü karşılaştırma anlamlıdır. Veriyi uyumlamak anlamında başarımı yakın iki modelden doğrusal modelin kuvvet yasası modeline göre 6.83 kat daha olası olduğu Akaike Bilgi Kritieri kullanılarak ortaya konmuş durumdadır. $AIC$ `statsmodels` ve `LMFIT` gibi gelişmiş model paketleri tarafından da verilen bir çıktı parametresidir. Yukarıdaki örneği bu modüllerden en az birini kullanarak çözmeyi deneyiniz. Bu modüllerin asıl avantajının parametreleri açısından örneğimizdeki gibi lineer modeller değil lineer-olmayan (nonlinear) söz konusu olduğunda ortaya çıktığını belirtmekte yarar vardır." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Bayesian Bilgi Kriteri #\n", "\n", "Bayesian Bilgi Kriteri (ing. Bayesian Information Criterion, BIC) de bir modelin başarısını veren bir başka bir ölçüttür. $AIC$ ile yakından ilişkilidir. Ancak ilave parametrelere daha hassastır ve temel olarak aşağıdaki şekilde tanımlanır.\n", "\n", "$$ BIC = ln~(n)~k - 2~ln~(\\mathcal{L}) $$\n", "\n", "Burada $n$, gözlem sayısı, $k$, modelde kullanılan parametrelerin sayısıdır. $L$ ise modelin doğruluğu durumunda gözlem verisinin olabilirlik fonksiyonudur (ing. likelihood function).\n", "\n", "Tıpkı $AIC$ 'de olduğu gibi $BIC$ değerinin küçük olduğu modeller veriyi uyumlamada daha başarılıdır denilebilir. Eğri uyumlama işleminde kriter, aşağıdaki şekilde kullanılabilir. Burada $S_r$, yine modelden fark kareler toplamını ifade etmektedir.\n", "\n", "$$ BIC = n~ln~(\\frac{S_r}{n}) + k~ln~(n) $$\n", "\n", "Farklı modellerin $BIC$ değerleri arasındaki fark $\\Delta_{BIC}$ aşağıdaki şekilde yorumlanabilir.\n", "\n", "* $0 < \\Delta_{BIC} < 2$, yüksek $BIC$ değerli modele karşı güçlü bir kanıt yoktur.\n", "* $2 < \\Delta_{BIC} < 6$, yüksek $BIC$ değerli modele karşı \"pozitif\" bir kanıt vardır.\n", "* $6 < \\Delta_{BIC} < 10$, yüksek $BIC$ değerli modele karşı \"güçlü\" bir kanıt vardır.\n", "* $\\Delta_{BIC} > 10$, yüksek $BIC$ değerli modele karşı \"çok güçlü\" bir kanıt vardır.\n", "\n", "Kendiniz bir $BIC$ hesaplama fonksiyonu yazabileceğiniz gibi, `statsmodels` ve `LMFIT` gibi güçlü modülleri kullanarak $BIC$ değerlerini elde edebilir ve yukarıdaki şemayı kullanarak karşılaştırma da yapabilirsiniz." ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "# Kaynaklar #\n", "\n", "* Measurements and their Uncertainties, Ifan G. Hughes & Thomas P.A. Hase, Oxford University Press, 2010\n", "* Data Reduction and Error Analysis for the Physical Sciences, Philip R. Bevington & D. Keith Robinson, MC Graw Hill, 2003\n", "* [Gecikme Grafikleri - I](https://www.statisticshowto.com/lag-plot/)\n", "* [Gecikme Grafikleri - II](https://ncss-wpengine.netdna-ssl.com/wp-content/themes/ncss/pdf/Procedures/NCSS/Lag_Plots.pdf)\n", "* [Durbin-Watson İstatistiği](https://en.wikipedia.org/wiki/Durbin%E2%80%93Watson_statistic)\n", "* [scipy.stats Modülü Dokümantasyonu](https://docs.scipy.org/doc/scipy/reference/stats.html)\n", "* [numpy.random Modülü Dokümantasyonu](https://docs.scipy.org/doc/numpy-1.15.0/reference/routines.random.html)\n", "* [statsmodels Dokümantasyonu](https://www.statsmodels.org/stable/index.html)\n", "* [17 Statistical Hypothesis Tests in Python](https://machinelearningmastery.com/statistical-hypothesis-tests-in-python-cheat-sheet/)\n", "* [LMFIT Dokümantasyonu](https://lmfit.github.io/lmfit-py/)" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "[Başa Dön](#Bu-derste-neler-öğreneceksiniz?)" ] } ], "metadata": { "kernelspec": { "display_name": "Python 3", "language": "python", "name": "python3" }, "language_info": { "codemirror_mode": { "name": "ipython", "version": 3 }, "file_extension": ".py", "mimetype": "text/x-python", "name": "python", "nbconvert_exporter": "python", "pygments_lexer": "ipython3", "version": "3.6.9" } }, "nbformat": 4, "nbformat_minor": 2 }