{
"cells": [
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# AST415 Astronomide Sayısal Çözümleme - I #\n",
"## Ders - 07 Dosya Yönetimi, Metin (String) ve Sözlük Nesneleri ##"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Doç. Dr. Özgür Baştürk \n",
"Ankara Üniversitesi, Astronomi ve Uzay Bilimleri Bölümü \n",
"obasturk at ankara.edu.tr \n",
"http://ozgur.astrotux.org"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Bu derste neler öğreneceksiniz?#\n",
"## Dosyalar, Metinler ve Sözlükler ##\n",
"\n",
"* [Dosyalarla İşlemlere Giriş](#Dosyalarla-İşlemlere-Giriş)\n",
" * [Veri Dosyalarını Açmak](#Veri-Dosyalarını-Açmak)\n",
" * [Veri Dosyalarının İçeriğini Listelere Almak](#Veri-Dosyalarının-İçeriğini-Listelere-Almak)\n",
" * [Veri Dosyalarının İçeriğini Satır Satır Okumak](#Veri-Dosyalarının-İçeriğini-Satır-Satır-Okumak)\n",
" * [Metin ve Sayıların Birlikte Bulunduğu Dosyaları Okumak](#Metin-ve-Sayıların-Birlikte-Bulunduğu-Dosyaları-Okumak)\n",
"* [Sözlük Nesnesi: Dictionaries](#Sözlük-Nesnesi:-Dictionaries)\n",
" * [Sözlük Nedir?](#Sözlük-Nedir?)\n",
" * [Örnek 1: Tam Sayı Anahtarlar ve Polinomlar](#Örnek-1:-Tam-Sayı-Anahtarlar-ve-Polinomlar)\n",
" * [Örnek 2: Sözlük ve Dosya Verisi](#Örnek-2:-Sözlük-ve-Dosya-Verisi)\n",
" * [Örnek 3: İçiçe Sözlükler ve Dosya Verisi](#Örnek-3:-İçiçe-Sözlükler-ve-Dosya-Verisi)\n",
"* [Metin Nesnesi: Strings](#Metin-Nesnesi:-Strings)\n",
" * [Metin Nedir?](#Metin-Nedir?)\n",
" * [Örnek 1: Dosyadan Koordinat Okumak](#Örnek-1:-Dosyadan-Koordinat-Okumak)\n",
" * [Örnek 2: Dosyalara Metin Yazmak](#Örnek-2:-Dosyalara-Metin-Yazmak)\n",
"* [Alıştırmalar](#Alıştırmalar)\n",
"* [Örnek: WASP Gezegenleri](#Örnek:-WASP-gezegenleri)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"# Dosyalarla İşlemlere Giriş #\n",
"\n",
"Bu derse ilişkin tüm veri dosyalarını bu [linkten](http://ozgur.astrotux.org/ast415/Ders_07/veri_dosyalari.tar.gz) indirebilirsiniz. Dosyaları kodunuz ile aynı yerden çalıştırmaya, ya da dosyalarınızı başka bir klasörden çalıştırmak istiyorsanız $open$ ifadelerine dosyanın diskte bulunduğu yeri parantez içerisinde tam olarak ($path$) veriniz.\n",
"\n",
"## Veri Dosyalarını Açmak ##\n",
"\n",
"İlk olarak var olan basit bir veri dosyasındaki (data1.txt) verileri okuyup, ortalamasını alan bir program yazmaya çalışalım. Ancak öncelikle veri dosyamızın içeriğine bakalım. Bunu bir salt metin editörü (notepad, vi, nano, pico, emacs …) ile de yapabilirsiniz.\n",
"\n",
"12.3 \n",
"19.4 \n",
"21 \n",
"36 \n",
"13 \n",
"15.6 \n",
"\n",
"Amacımız bu dosyada bir sütunda verilen sayıları teker teker okumak, her bir sayıyı $sayi$ isimli bir değişkene almak, başlangıçta değerini $0$ olarak belirleyeceğimiz bir $toplam$ degiskenine $sayi$ değişkeninin değerini ekleyerek ilerlemek ve en sonda $toplam$ değişkeninin değerini okuduğumuz satır sayısına bölerek ortalama almak olsun."
]
},
{
"cell_type": "code",
"execution_count": 1,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"6 satirdaki verilerin ortalamasi 19.55 tir\n"
]
}
],
"source": [
"dosya = open('data1.txt', 'r')\n",
"toplam = 0\n",
"satir_sayisi = 0\n",
"for satir in dosya:\n",
" sayi = float(satir) # okunan deger tam sayi dahi olsa bir metin olarak alinir\n",
" toplam += sayi\n",
" satir_sayisi += 1\n",
"ortalama = toplam / satir_sayisi\n",
"print('{:d} satirdaki verilerin ortalamasi {:.2f} tir'.format(satir_sayisi,ortalama))"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Gördüğünüz gibi dosyayı okumak için $open$ fonksiyonu ile oluşturduğumuz dosya ($file$) nesnesine adını ($dosya$) verdikten sonra (eğer okuyacağınız dosya bu kodun bulunduğu klasörün altında değilse buraya tam yerini ($path$) vermelisiniz), \"r\" parametresiyle dosyayı sadece okuyacağımız ($read$) belirttik. Daha sonra $data1.txt$ dosyasını satır satır okumak için $for$ $satir$ $in$ $dosya$ döngüsünü çalıştırdık. Döngünün içerisinde dosyadan okuduğumuz her şey bir metindir ($string$). Bu nedenle matematiksel bir işlem yapmak istiyorsak aldığımız her sayıyı reel sayıya (float) dönüştürmeliyiz. Reel sayıya $float$ fonksiyonu ile kayan noktalı sayıya dönüştürdüğümüz her satırdaki değeri $sayi$ değişkenine aldıktan sonra, $toplam$ değişkenine bu değeri ekledik ve okuduğumuz satır sayısını tutan $satir\\_sayisi$ değişkeninin değerini de $1$ arttırdık. Döngü tamamlandıktan sonra da $toplam$ değişkeninde tuttuğumuz sayıların toplam değerini, satır (yani okuduğumuz sayı) sayısına böldük ve bu sayıların ortalamasını bularak $ortalama$ değişkenine aldık ve bu değişkenin değerini de ekrana formatlı olarak yazdırdık.\n",
"\n",
"[Başa Dön](#Dosyalar,-Metinler-ve-Sözlükler )"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Veri Dosyalarının İçeriğini Listelere Almak ##\n",
"\n",
"Her bir satırı tek tek okumak yerine tüm satırları tek bir kerede okuyup, bir listeye de alabiliriz. Bunun için $readlines()$ fonksiyonu kullanılır."
]
},
{
"cell_type": "code",
"execution_count": 2,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"['12.3\\n', '19.4\\n', '21\\n', '36\\n', '13\\n', '15.6\\n']\n"
]
}
],
"source": [
"dosya = open('data1.txt', 'r')\n",
"satirlar = dosya.readlines()\n",
"print(satirlar)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Bu yazımla, baştan bir liste oluşturup, dosyayı satır satır okurken her bir satırı bu listeye eklemek arasında bir fark yoktur. Bunun bir başka alternatifi de daha önce öğrendiğiniz hızlı liste özelliklerini (list comprehensions) kullanmaktır. (sayilar = \\[float(satir) for satir in dosya\\])"
]
},
{
"cell_type": "code",
"execution_count": 3,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"['12.3\\n', '19.4\\n', '21\\n', '36\\n', '13\\n', '15.6\\n']\n"
]
}
],
"source": [
"dosya = open('data1.txt', 'r')\n",
"satirlar = []\n",
"for satir in dosya:\n",
" satirlar.append(satir)\n",
"print(satirlar)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Ancak bu yazımlarda gördüğünüz gibi her bir liste elemanı sonunda satır sonu karakter dizisi ($\\\\n$) bulunan bir metin nesnesidir. Dolayısı ile bu nesnelerle matematiksel işlemler yapmak için mutlaka reel (ya da duruma göre tam) sayıya dönüşüme ihtiyaç duyulur."
]
},
{
"cell_type": "code",
"execution_count": 4,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"6 satirdaki verilerin ortalamasi 19.55 tir\n"
]
}
],
"source": [
"dosya = open('data1.txt', 'r')\n",
"sayilar = [float(satir) for satir in dosya.readlines()]\n",
"# artik dosyayla isimiz bittigine gore kapatabiliriz.\n",
"dosya.close() \n",
"# ortalama almak icin kolay bir yontem!\n",
"ortalama = sum(sayilar) / len(sayilar) \n",
"print('{:d} satirdaki verilerin ortalamasi {:.2f} tir'.format(satir_sayisi,ortalama))"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"[Başa Dön](#Dosyalar,-Metinler-ve-Sözlükler)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Veri Dosyalarının İçeriğini Satır Satır Okumak ##\n",
"\n",
"Her bir satırı tek tek okumanın bir başka yolu $readline()$ fonksiyonunu kullanmaktır. Bu fonksiyon dosyada bulunulan satırı okur ve içeriğini bir metin değişkenine aktarır. Aynı fonksiyon, satır atlamak istendiğinde de sonucu hiçbir değişkene almayarak kullanılabilir.\n",
"\n",
"Ortalama bu şekilde bütün dosya okunana kadar $while$ döngüsünün içinde de hesaplanabilir. Ancak bu kez dosya bittiği vakit döngüden çıkılması gerekir."
]
},
{
"cell_type": "code",
"execution_count": 5,
"metadata": {},
"outputs": [
{
"name": "stdout",
"output_type": "stream",
"text": [
"Dosya icindeki 6 sayinin ortalamasi 19.55 tir\n"
]
}
],
"source": [
"dosya = open('data1.txt', 'r')\n",
"ortalama = 0\n",
"n = 0\n",
"while True:\n",
" satir = dosya.readline()\n",
" if not satir:\n",
" break # satir olmadigi zaman dongu sonlandiriliyor\n",
" ortalama += float(satir)\n",
" n += 1\n",
"ortalama = ortalama/float(n)\n",
"print(\"Dosya icindeki {:d} sayinin ortalamasi {:.2f} tir\".format(n,ortalama))"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"Bu kodda $satir$ değişkeni değerini dosyanın ilk satırında alacağı için $while$ döngüsünün bir koşulu olmadan her durumda çalıştığına ($True$), ancak $satir$ değişkeni, dosyanin sonuna geldiğinde boş bir metin değeri (\"\") alacağı için $not$ $satir$ ifadesi $True$ değeri alacak ve $break$ komutu da bu koşul sağlandığı için döngüden çıkılmasını sağlayacaktır. Böylece dosya sonuna kadar okunmuş olur.\n",
"\n",
"[Başa Dön](#Dosyalar,-Metinler-ve-Sözlükler)"
]
},
{
"cell_type": "markdown",
"metadata": {},
"source": [
"## Metin ve Sayıların Birlikte Bulunduğu Dosyaları Okumak ##\n",
"\n",
"Şu ana kadarki örneklerde kullandığınız $data1.txt$ dosyası sadece sayı içerdiği için basit bir yapıya sahipti. Ancak çoğu kez dosyalar metin ve sayıları birlikte içerir. 1970 ile 1982 arasındaki yıllar için Ankara'ya düşen ortalama yağış miktarının $mm$ cinsinden aylara göre verildiği $yagisortalamsi.dat$ böyle bir dosyadir.\n",
"\n",
"Ankara icin 1970 ve 1982 yillari arasindaki ortalama yagis miktari (mm) \n",
"Oca 81.2 \n",
"Sub 63.2 \n",
"Mar 70.3 \n",
"Nis 55.7 \n",
"May 53.0 \n",
"Haz 36.4 \n",
"Tem 17.5 \n",
"Agu 27.5 \n",
"Eyl 60.9 \n",
"Eki 117.7 \n",
"Kas 111.0 \n",
"Ara 97.9 \n",
"Yil 792.9 \n",
"\n",
"Böyle bir dosyayı okumak ve aya göre ortalamaları grafik etmek için akla gelen ilk yol dosyayı satır satır okumak her bir satırdaki kelimeleri $split()$ fonksiyonunu kullanarak ayırmak, ikinci \"kelimeyi\" alıp $float()$ ile reel sayıya donüştürmek ve bir listede toplayıp, bu listedeki sayıları ay numarasına (Oca: 1, Şub: 2 …) göre çizdirmektir."
]
},
{
"cell_type": "code",
"execution_count": 6,
"metadata": {},
"outputs": [
{
"data": {
"image/png": "\n",
"text/plain": [
"