Hayvan sağlığı ve hayvansal ürün üretimi ile ilgili
• Veri toplama yöntem ve ilkelerini
• Verilerin ortalamasını ve dağılımını bulmayı
• Verilere dayalı grafik ve tablo yapmayı
• Veriler veya özellikler arasında farklılık olup
olmadığını
• Verilerin bugünkü durumu ve gelecekte
olabilecek değişiklikleri tahmin etmeyi
• Verilere dayalı yorum çıkarma ve fikir
üretmeyi
İstatistik Nedir?
Herhangi bir konu ile ilgili olarak veri toplama, bunları
analiz edip değerlendirme ve sonuç çıkarma olarak
tanımlanabilir.
Genel olarak küçük bir örnek incelenir ve o örneğin dahil
olduğu populasyon hakkında bilgi edinilir.
İhtimaller üzerinde durulur,
matematiksel işlemler yapılır, sonuçlar
kesin olarak değil belli ihtimallere göre
ilan edilir.
İstatistik Nedir?
İstatistik, bir bulgunun tesadüfler ile bağlantısını
araştırır;
olay tesadüf eseri mi öyledir yoksa değil midir?
Bilim dallarına göre farklı
isimler ile ifade edilir;
biyometri/biyoistatistik,
ekonometri, sosyometri gibi
İki kısımda incelenir;
Tanımlayıcı istatistik ve anlam çıkarma istatistiği.
6
İstatistik Nedir?
• “Veteriner fakültesini tercih eden
öğrencilerin %25’i kız öğrencidir”
• “Siyah alaca sığırlarda A
hastalığının görülme ihtimali
Esmer sığırlara göre daha
yüksektir”
• “Beslemenin süt verimine etkisi
vardır”
İstatistik analizle elde edilen bazı sonuçlar:
2
7
İstatistik Nedir?
• “Yapağı kalitesi ırklara göre
değişir”
• “Yumurta veriminde hayvanın
cüssesinin bir etkisi yoktur”
• “İnsanlarda boy ve kilo
arasında bir ilişki vardır”
• “Sigara içenlerin akciğer
kanserine yakalanma ihtimali
daha yüksektir”
İstatistik analizle elde edilen bazı sonuçlar:
8
İstatistiğin Önemi
Araştırmacı kimliği taşıyan
herkes, hangi bilimle
uğraşırsa uğraşsın, yaptığı
araştırmalarda istatistik
kullanmak zorundadır.
İstisnası çok azdır.
Bütün bilim dallarının kullandığı bir araçtır. Sağlık
bilimleri, sosyal bilimler ve fen bilimlerinin
hepsinde istatistik kullanılır.
9
İstatistiğin Önemi
İstatistik olmadan olayların kalıcı, devamlı ve
değişmez nitelikte olup olmadığı ortaya
konamaz.
Her konuda mevcut durumun ve gelecekte neler
olabileceğinin tespiti istatistik metotlarla
mümkündür.
Bilimsel makalelerde
yorumlar istatistik üzerine
bina edilir.
10
İstatistiğin Tarihçesi
• İstatistik ilk çağlardan beri, değişik düzeylerde de olsa,
kullanılmaktadır
• Devletler gelirlerini, askeri varlıklarını, vergilerini, mal ve arazi
varlıklarını belirlemek amacıyla istatistiği kullanmışlardır.
• İlk olarak basit istatistikleri toplayan toplumlar; Mısırlılar,
Çinliler, Asurlular, Babilliler, Yunanlılar ve Romalılardır.
• Osmanlılar nüfus ve toprak kayıtlarını askeri amaçlar için
tutmuşlardır.
Bugünkü anlamda İstatistik çalışmalar,
16. ve 17. yüzyıllarda yapılmış ve
probabilite (İhtimal) teorisi geliştirilmiştir.
11
İstatistiğin Tarihçesi
• Probabilite konusunda meşhur bilginler: Pascal,
Fermat, Bernoulli, Moivre, Laplace, Poisson, Gauss
• Quetelett, biyoloji, tıp ve sosyolojide istatistik metotları
kullanmış; ortalama kavramını geliştirmiştir.
Galton, biyolojide kalıtım,
variyasyon, regresyon ve
korelasyon konularına açıklık
getirmiştir.
Pearson ve Fisher biyoistatistiksel
genetik ve populasyon genetiği
alanında çalışmışlardır.
12
Bazı Kavramlar
Biyoistatistik: İstatistiğin, biyoloji, veteriner, tıp
gibi sağlık bilimlerindeki ismidir.
Populasyon (Kitle, Evren): Aynı özelliğe sahip
bireylerin ya da birimlerin tümü.
Örnek (Örneklem): Bir populasyonu temsil eden
küçük bir grup.
Örnekleme: Örneğin
populasyondan seçilmesi
işlemi.
3
13
Bazı Kavramlar
Araştırma: Bir konu ile ilgili problem oluşturma,
çözüm yollarını planlama, analiz, sonuç
çıkarma, tartışma ve yorumlama çalışmaları.
Ölçme: Araştırma konusu ile ilgili sayısal verileri
elde etme işlemi.
Ölçü (Ölçek): Verilerin elde
edilmesinde kullanılan araçgereç.
14
Bazı Kavramlar
Faktör: Canlının özellikleri üzerine etki yapan çevre
özellikleri (Sıcaklık, nem, cinsiyet, yaş)
Karakter (Özellik): Canlıların herhangi bir özelliği (kilo,
boy, süt verimi).
Denek (Variyant): Populasyon ya da örnekte yer alan
birey/birim.
Değişken: Canlıların veya çevrenin
bireyden bireye, çevreden çevreye az çok
değişebilen her bir özelliğidir (incelenen
faktör ve karakterler).
15
Bazı Kavramlar
Veri (Data): Deneklerden ölçüm ya da sayım ile elde
edilen değer.
Dağılım: Verilerin ortalamanın sağında ve solunda yer
alışları biçimi.
Parametre: Populasyonda incelenen bir özelliğin
ortalaması (μ), variyansı (σ2) ve standart sapması (σ).
İstatistik: Örnekte incelenen
bir özelliğin ortalaması (x) ve
variyansı (s2) ve standart
sapması (s).
16
Veri Tipleri
Sürekli veriler
Ölçümle elde edilirler, kantitatif (miktar/ nicelik belirten)
özelliklerdir. Normal dağılım gösterirler, kesin sınıflara
ayrılmazlar, birbirine geçişlidirler, çevre şartlarından
çok etkilenirler
canlı ağırlık, süt verimi,
yapağı çapı vb.verim
özellikleri gibi.
17
Veri Tipleri
Kesikli veriler
Sayılarak elde edilirler, kalitatif (kalite/nitelik belirten)
özelliklerdir. Normal dağılım göstermezler, kesin
sınıflara ayrılabilir, çevre şartlarından etkilenmezler
Erkek ve dişi sayısı, ikiz-tek sayısı,
laktasyon sayısı, iyileşeniyileşmeyen
sayısı gibi.
18
Veri toplama yöntem ve ilkeleri
Araştırma verilerinden
veya tutulan kayıtlardan
doğru ve güvenilir
sonuçlara ulaşılmalıdır.
Ham veri tam ve sağlam
olmalıdır.
Veriler nasıl olmalıdır?
4
19
Veri toplama yöntem ve ilkeleri
1- Veriler doğru ve güvenilir
olmalıdır (gerçeği
yansıtmalıdır, tekrarlarından
aynı sonuçlar alınmalıdır).
2- Veri eksiksiz olmalıdır.
3- Veriler kullanılabilir ve
ilgililerine yarayışlı olmalıdır.
20
Veri toplama yöntem ve ilkeleri
Veri kalitesini etkileyebilecek
faktörler nelerdir?
1- Veri toplayan kişi
Veri toplayan kişinin ehil olması gerekir.
2- Veri kaynağı, deneme düzeni ve ölçüm
araçları
Veri kaynağı sağlam olmalı, deneme
düzeni amaca uygun olmalı ve ölçüm
araçları doğru ve hassas ölçüm
yapmalıdır.
21
İstatistik Kaynakları
Kayıtlar
Büyük bir kısmı kanunen tutulması zorunlu
kayıtlardır. Nüfus, doğum, evlenme, boşanma,
hastane ve sigorta kayıtları gibi kayıtlar sayılabilir.
Araştırma Enstitüleri, Tarım
İşletmeleri, Fakülte Klinikleri, Tarım İl
Müdürlükleri gibi hayvancılıkla ilgili
kuruluşların tutmak zorunda olduğu
kayıtlar da bizim kullandığımız
kayıtlardır.
22
İstatistik Kaynakları
Sayımlar
Bütün ülke çapında yapılabileceği gibi belirli bir
bölgeyi veya şehri de içine alan sayımlar
yapılabilir (Tarım Sayımı, nüfus sayımı gibi).
Toplumun bütünü hakkında bilgi (sayısı,
yaşları, ağırlıkları gibi) toplamak amacı ile
yapılan sayıma genel sayım denir.
Toplumun bir kesimi hakkında bilgi toplamak
üzere yapılan sayıma özel sayım denir.
23
İstatistik Kaynakları
Populasyon üzerindeki araştırmalar geriye dönük (retrospektif) veya İleriye
yönelik (prospektif) araştırmalar şeklinde olabilir
Örnekler üzerinde deneysel araştırmalar yapılabilir Değişik
faktörlerin canlı özellikleri üzerine etkilerinin araştırıldığı;
genellikle deneme ve kontrol gruplarının bulunduğu
araştırmalardır.
Anketler düzenleyerek araştırma yapılabilir. İncelenecek konunun bütün
detaylarını kapsayan soruların yer aldığı formlar kullanılır ve gerekli bilgiler
elde edilmeye çalışılır
Araştırmalar
Populasyonda oluşan olayları gözlemek
amacıyla, populasyonun tamamını veya
seçilen örneği incelemek veya deney
düzenlemektir.
24
Örnekleme
Populasyondaki herhangi bir özelliğin incelenmesi
amacıyla, populasyondan sınırlı sayıda bir grup
elde edilmesi işlemine “örnekleme”, seçilen
gruba da “Örnek/örneklem” denir.
Popolasyonu incelemek çoğu zaman mümkün değildir. Mümkün olsa bile uzun
zaman alır, pahalıdır, çok fazla insan gücü gerektirir.
Araştırmalar örneklem üzerinde yapılır.
Az masrafla, az iş gücü ile kısa zamanda
gerçekçi sonuçlar alınabilir.
5
25
Örnekleme
Örnekleme niçin zorunlu?
• Para yetersizliği
• Zaman azlığı
• Kalifiye eleman yetersizliği
• Uzun süren veri toplama sürecinde deneklerin yok
olması veya incelenen deneklerin değerini kaybetme
olasılığı
• Populasyondaki örneklerin tümüne ulaşmanın
mümkün olmaması
• Yürütülen hizmetlerin veya devam eden üretimin
denetimi
26
Örnekleme Metotları
Olasılık Kurallarına Dayanmayan Örneklemeler
Kontenjan örneklemesi, Kota örneklemesi; Dilim örneklemesi
(Saha örneklemesi); Monografi; Populasyonu İkiye Ayırma vb.
Olasılıklı Örneklemeler
Piyango yöntemi, Torba yöntemi (İadeli/ İadesiz rasgele çekiliş),
Rasgele sayılar tablosu kullanma
Diğer yöntemler
Çok Kademeli Örnekleme, Tabakalı
(Bölümlü) Örnekleme, Küme
Örnekleme, Sistematik Örnekleme,
Büyüklüğe Orantılı Örnekleme vb.
FREKANS DAĞILIMLARI
Verilerin Sınıflandırılması:
Veri sayısı çok olduğu zaman onları sınıflandırmak yararlı olur
Sınıflandırma belli kurallar içerisinde yapılır.
Bazı tanımlar ve açıklamalar:
Sınıf sınırı: Bir sınıfın üst ve alt sınırıdır; 4-8 sınıfında 4 alt, 8 üst sınırdır.
Sınıf aralığı: İki sınıfın üst veya alt sınırları arasındaki farktır. (4-8), (9-13), …
sınıf aralığı 5 tir.
Sınıf ara değeri: Önceki sınıfın üst değeri ile sonraki sınıfın alt değeri
ortalamasıdır. Burada 8,5 dur.
Sınıf frekansı: Sınıfta kaç eleman olduğu.
Sınıf sayısı: Arka arkaya gelen sınıfların adedidir.
28
Sınıflandırma kuralları:
• Sınıf sınırları kesin olmalı, sınıflar birbirine
karışmamalıdır. Dizideki bir veri sadece bir
sınıfa ait olmalıdır. (4-8), (8-13),… olmaz
• Sınıflandırma bütün değerleri kapsamalıdır.
• Sınıf sayısı yeterli büyüklükte olmalıdır (10 ± 2
kadar).
Örnek: Merinos kuzuların doğum ağırlıklarının
sınıflandırılması
29
Merinos kuzuların doğum ağırlıkları
30
Sınıflandırmanın yapılışı:
• Önce, minimum ve maksimum değerler bulunur.
Örnekte Min.= 3,50 Max.= 4,34 tür.
• Range (dağılım aralığı) bulunur. Range=0,84
• Sınıf sayısının 10 olmasını istediğimizden Range 10’a
bölünür. Sonuç: 0,084.
• Buna göre, sınıf alt sınırı ile üst sınır arasındaki fark
0,08 olarak alabiliriz (80 g’lık aralıklar).
• Bu durumda örneğimizdeki veriler aşağıdaki gibi 10
sınıfta sınıflandırılabilir.
• Sonra her sınıftaki eleman sayısı (sınıf frekansı) tespit
edilir.
6
31
32
33
Kuzu doğum ağırlığına ait histogram grafiği
Histogram, frekans dağılımının sütunlarla gösterilmesidir
34
Frekans Dağılımlarını Tanımlayıcı
Ölçüler:
• 1-Yer gösteren ölçüler (merkez
ölçüleri, çeyrek ve yüzdelikler)
• 2-Yaygınlık ölçüleri (Varyans,
standart sapma, varyasyon
katsayısı, satandart hata, range
ve interquartil range)
35
MERKEZ ÖLÇÜLERİ
36
• aritmetik ortalama, ortanca, tepe değeri,
geometrik ortalama, harmonik ortalama ve
budanmış ortalamadır.
• Bir veri dizisindeki bütün değerler ortalama
etrafında (sağında ve solunda) yığılma eğilimi
gösterirler.
Ortalama, gruptaki bütün değerlerin (varyantların)
alması beklenen değerdir. Bu yüzden ortalama,
örneği (grubu) temsil eden değerdir.
7
37
1- Aritmetik Ortalama (Mean)
• En yaygın olarak kullanılan merkezi eğilim
ölçüsüdür
• Gözlemlerin toplanıp gözlem sayısına
bölünmesiyle elde edilir.
• Normal dağılım gösteren, kantitatif
değişkenlerde hesaplanır.
• Verilerden her biri x, veri sayısı da n olarak
ifade edilir.
AO = Σx / n
38
Örnek:
Bir koyunculuk işletmesinde 2004 yılında
doğan Merinos kuzulardan rasgele
seçilmiş 20 baş tek doğmuş erkek kuzuya
ait doğum ağırlıkları (kg) aşağıdaki gibi
ölçülmüş olsun.
Bu işletmedeki Merinos kuzularının doğum
ağırlığı ortalaması nedir?
39
Tablo 1: Merinos kuzuların doğum ağırlıkları (kg)
40
Ortalama almanın dezavantajları:
• Ortalama dizideki aşırı uçlardan olumsuz
etkilenir.
• Dağılım simetrik değilse, ortalama
gerçeği yansıtmaz.
• Eğer veriler sağa doğru yığılma
gösteriyorsa, ortalama yüksek; sola
doğru yığılma gösteriyorsa düşük
hesaplanır.
41
Ortalamanın bazı özellikleri:
• Ortalamadan sapmaların toplamı sıfırdır
Σ (x-X) = 0
• Bütün varyantlara A gibi sabit bir değer eklense,
bulunacak ortalama eskisinden A kadar fazladır (A
gibi bir değer çıkarı__________lırsa?).
• Varyantlar sabit bir C değeri ile çarpılsa, bulunacak
ortalama eskisinin C katıdır (C değeri ile bölünürse?).
42
2- Medyan (Ortanca)
• Ortalamadan sonra en çok kullanılan
merkezi eğilim ölçüsüdür.
• n adet verinin küçükten büyüğe doğru
sıralanışında ortadaki değerdir.
• Veriler yüzdelik dilimlere ayrıldığında
ikinci dörttebirlik veya %50. değerdir.
8
43
Avantajları:
• Veri dizisindeki aşırı değerlerden veya dağılımın
sağa veya sola çarpık olmasından etkilenmez.
• Dizideki değerlerin %50 si ortancadan küçük
veya ona eşit, %50 si ortancadan büyük veya
ona eşittir.
• Sağa doğru yığılma varsa medyan ortalamadan
küçüktür; sola yığılma gösterirse büyüktür.
• Dağılım simetrik ise ortanca ile ortalama bir
birine çok yakındır.
• Medyanın dezavantajı: Hesaplamada
gözlemlerin rakamsal değerlerinin
önemsenmemesi
44
Medyanın Kullanıldığı yerler ve durumlar:
• Örnekte + veya – yönde büyük
sapmalar varsa
• Bir veya iki ucu açık dağılımlarda
• Örneğe dahil bütün bireylerden veri
toplamak çok uzun zaman alacaksa
45
Nasıl hesaplanır?
1-Veriler küçükten büyüğe doğru sıralanır.
2-n tek sayı ise (n+1)/2. değer ortancadır.
n=9 ise ortanca 5. değerdir
3- n çift sayı ise medyan, sıralamadaki ortada
bulunan iki değerin ortalamasıdır. Yani n/2 ile
ondan sonraki değerin ortalamasıdır.
n=10 ise ortanca 5. ve 6. değerin ortalamasıdır
46
Örnek
Bir laboratuvarda yetiştirilen
kobaylardan rasgele seçilmiş 15
adedinin canlı ağırlıkları Tablo 2’deki
gibi bulunmuş olsun. Kobayların
ağırlık ortancası nedir?
47
48
3- Mod (Tepe Değeri)
• Eskiden beri bilinen ancak çok az kullanılan
bir yöntemdir. Bir veri dizisinde en çok
tekrarlanan değerdir. Değeri medyan ve
aritmetik ortalamadan farklıdır
• Şu nedenlerden pek tercih edilmez:
1- Gözlemlerin çoğu göz ardı edilir
2- Bazı dağılımların hiç modu olmazken
bazılarında birden fazla mod olabilir ( mod
birden fazla ise bu ölçü kullanılmamalıdır).
9
49
Aritmetik ortalama, medyan ve Tepe
değeri ilişkisi:
Dağılım simetrik ise her üç ölçü de yaklaşık
olarak aynıdır TD = Ortanca = X
50
Dağılım sağa çarpık ise, veriler sağa (bize göre sola) doğru
yığılma eğiliminde iseler Mod<Medyan<Ortalama
Dağılım sola çarpık ise, veriler bize göre sağa doğru yığılma
eğiliminde iseler ortalama<Medyan<Mod
51
4- Geometrik Ortalama
zamana bağlı olarak birbirinin katları şeklinde
çoğalan, geometrik artış gösteren değerlerde
(Nüfus artışı veya mikroorganizmaların çoğalması gibi) ortalama
hesaplamak gerektiğinde kullanılır
Hesaplanması:
n tane değerin birbirleriyle çarpımlarının n. kökü
alınarak hesaplanır.
52
Örnek:
Bir mikroorganizmanın uygun bir
besi yerinde 12 saat süre ile
çoğalmasına ait veriler Tablo
4’teki gibi bulunmuş olsun. Bu
mikroorganizmanın ortalama
çoğalma hızı ne kadardır?
53
GO: 119044
X = 1330250
54
5- Harmonik Ortalama (HO)
Belirli sayıdaki değerin harmonik ortalaması, bu
değerlerin terslerinin ortalamasının tersidir.
Bazı özel hallerde, farklı büyüklükteki pozitif sayıların
ortalamasını almada kullanılır. Örneğin varyans analizinin ardından
yapılan çoklu karşılaştırma testlerinde farklı n sayılarına sahip grupların n ortalamasını
bulmada kullanılır
HO = 1/((1/x1+1/x2+….1/xn)/n)
n, veri sayısı
Karşılaştırılacak grupların ortalama n hesabı için,
HO = 1 / ((1/n1+ 1/n2 + …. 1/nk)/k) k, grup sayısı
10
55
Örnek:
Yedi gruplu bir çoklu karşılaştırma testinde
grupların n sayıları 6, 8, 5, 10, 6, 8 ve 7
şeklindedir. Ortalama n sayısını bulunuz.
HO = 1 / ((1/6+ 1/8 +1/5 +1/10+1/6+ 1/8 +1/7)/7)
= 6,82
(Aynı değerlerin aritmetik ortalaması =7,14
n0’ı 7,09 dur.)
56
6- Budanmış Ortalama (Trimmed mean)
Veri dizisinde artı veya eksi yönde aşırı uçlar olduğu
anlaşılırsa, aritmetik ortalama hesaplamak gerçekçi
olmaz.
Medyanın ise aritmetik ortalama kadar değeri yoktur.
Halbuki böyle durumlarda verileri sıralayıp diziden en
küçük ve en büyük değerlere sahip %5’erlik bir
varyantı (toplam %10) dışarı atarak aritmetik ortalama
hesaplamak daha doğru olabilir.
Bu şekilde alınan ortalamaya budanmış ortalama
denmektedir.
[%5 lik kısım hesaplanırken en yakın tam sayıya yuvarlanarak işlem yapılır. %5 lik değer
0,5 ve aşağısı ise hesaplama yapılmaz. Bir başka deyişle veri sayısı 10 ve aşağı
olursa bu ortalama hesaplanmaz, en az 11 veri olmalıdır.]
57
Örnek:
Tablo 2.4’teki verilere göre bu hesaplamayı yapalım.
Burada veri sayısı 15 olup bunun %5’i 0,75 eder. Bu
değeri en yakın tam sayıya yuvarladığımızda 1 elde
ederiz.
Buna göre, en küçük ve en büyük değerlerden 1’er
tanesini (300 ve 1000) dizi dışına atılır.
Geriye kalan 13 tanenin ortalamasını aldığımızda
605,38 buluruz. Bu budanmış ortalamadır.
Bu dizinin medyanı 600 idi; aritmetik ortalaması ise
611’dir.
58
Çeyrek Ve Yüzdelikler
• Çeyrek ve yüzdelikler, dağılımın dörttebirlik yerlerini ve
herhangi bir yüzdelik dilimdeki yerini gösterirler.
• Birinci çeyrek (Q1; quartile 1) sıralamadaki %25.
değerdir. (n+1)/4. değer.
• İkinci çeyrek (Q2; quartile 2) %50. değerdir. 2(n+1)/4.
değer. Bu, aynı zamanda ortancadır.
• Üçüncü çeyrek (Q3; quartile 3) %75. değerdir.
3(n+1)/4. değer.
• İkinci çeyrek ortanca olup merkez ölçüleri içinde
geçer. Dolayısıyla, çeyrek ve yüzdeliklerde daha çok,
1. ve 3. çeyrek kullanılır.
59
Çeyrek ve yüzdelik hesaplaması
Merinos kuzuların doğum ağırlığı değerlerini
kullanabiliriz.
Veriler küçükten büyüğe doğru sıralanır
Birinci çeyrek (90+1)/4 = 22,75. sıradaki değerdir.
Bunun anlamı, Q1 22. sıradaki değerden büyük, 23.
sıradaki değerden küçüktür.
Üçüncü çeyrek ise 3(90+1)/4 = 68,25. sıradaki değerdir
(68 ile 69 arasındadır).
Bu rakamlar tam sayı değildir. Böyle durumlarda
çeyrekleri hesaplamak için interpolasyon denen
yöntem kullanılır.
60
Çeyrek ve yüzdelik hesaplaması
İnterpolasyon formülü (X2 küçük X3 büyük değer olmak üzere)
Q1 = X2+ 0.75 (X3 – X2) (0,75, 22,75’teki virgülden sonrasıdır)
Örneğimizde X2 22. sıradaki değer, X3 ise 23.
sıradaki değerdir; X2 = 3,83 X3 = 3.84
Buna göre Q1:
Q1 = 3,83 + 0.75 (3,84 – 3,83)
Q1 = 3,83 + 0.75 (0,01)
Q1 = 3,83 + 0.0075
Q1 = 3,8375 bulunur.
11
61
Çeyrek ve yüzdelik hesaplaması
Benzer şekilde Q3:
X2 68. sıradaki değer 4,11 ve X3 ise 69.
sıradaki değer olup o da 4,11 dir.
Buna göre Q3:
Q3= 4,11 + 0.25 (4,11 – 4,11)
Q3= 4,11 + 0
Q3= 4,11 bulunur.
62
Yaygınlık
Ölçüleri
63
1- Dağılım Aralığı (Range):
• Min. ile Max. arasındaki farktır.
• İncelenen örnekte;
Min=3,50 kg, Max.= 4,34 kg;
Dağılım Aralığı = 4,34 – 3,50 = 0.84
• Kantitatif veriler için, yaygınlığ_ _______øın basit bir
ölçüsüdür.
• Veri dizisinde aşırı uçlar varsa yaygınlık
olduğundan fazla çıkar.
64
2-İnterquartil Range:
• Sıralanmış gözlemlerin merkezde
bulunan %50’sinin range’dir. Q1 ile
Q3 arası farktır.
• Veri setindeki aşırı uçlardan ve örnek
büyüklüğünden etkilenmez;
kullanışlıdır.
• Bir çok gözlemin göz ardı edilmesi
dezavantajıdır.
65
3- Varyans:
• Gözlemlerin ortalamadan sapmalarıdır.
• Veriler ortalamadan uzaklaştıkça sapma artar
• Verilerin ortalamadan sapmalarının ortalaması, ortalama sapma
olarak kullanılabilir mi?
• Sapmalardaki negatif işaretin etkisi giderilmelidir. (Sapmaların
karelerinin alınması).
• Karesi alınmış bu sapmaların ortalaması varyansı verir.
• Ortalama bulmak için, kareler toplamını n yerine n-1’e bölünür
(Serbestlik Derecesi).
• Eğer tüm populasyon verilerinde çalışıyorsak bölen rakamı
doğrudan N olur
• Örnek varyansı S2, populasyon varyansı σ2 ile gösterilir.
Formül:
66
Varyans:
12
67
Varyans:
68
4-Standart Sapma, S
(Standart Deviation, SD):
• Varyansın kareköküdür
• Varyansın birimi kg2 şeklindedir.
• Standart sapmanın birimi gözlemlerin
orijinal birimiyle aynıdır
Formül:
S = √varyans S=√ ((Σ(x-)2 )/n-1)
İncelenen örnekte S= 0,528.
69
Standart sapmanın özellikleri:
• Veri setindeki bütün gözlemleri
hesaba katan bir ölçüdür.
• Gözlemlerin birimleriyle aynı birimde
ifade edilir.
• Normal dağılım gösteren verilerde
büyük kullanımı vardır.
• Normal dağılım gösteren verilerde S
nın yaklaşık 4 katı range i verir.
70
5-Varyasyon katsayısı (% V):
• Standart sapmayı ortalamanın yüzdesi olarak ifade etmektir.
%V = S / X * 100
• Ortalama büyüdükçe standart sapma büyür. Farklı büyüklükteki
verileri varyasyon bakımından karşılaştırmak S ile zordur,
yanıltıcıdır.
• Varyasyon katsayısı ortalamanın büyüklüğünden etkilenmez
71
6-Standart hata:
•Standart sapmanın örnek büyüklüğünün (n) kareköküne
bölünmesiyle elde edilir. Formül:
Sx = S / √n
• İncelenen bir örnekten hareketle Populasyon ortalamasını
tahmin etmek için kullanılır
•Bir ortalama ile populasyon hakkında bilgi veriliyorsa,
ortalamanın yanında verilmelidir.
X ± Sx şeklinde ifade edilir.
•Standart hata ile populasyon (evren) ortalaması güven sınırları
hesaplanır.
72
Populasyon ortalaması güven sınırları:
• Çoğu zaman populasyon ortalamasını
hesaplamak mümkün değildir.
• Seçilen bir örneğin ortalaması ve standart
hatası kullanılarak populasyon ortalaması
tahmin edilir.
• Populasyon ortalaması güven sınırları:
μ = x ± Sx x t
• μ: Populasyon ortalamasıdır
• t: t tablosundan alınan bir değerdir. Belirli bir
hata ile (α) n-1 serbestlik derecesinde tablo t
değeridir.
13
73
Örnek: (90 kuzuya ait doğum ağırlığı örneği)
• Hata payını %5 alalım (yani α=0,05
olsun).
• Bu seviyedeki ve 89 serbestlik
derecesindeki tablo t değeri 1,99 dur.
Sonuç:
μ =3,96 ± 0,020 x 1,99
3,92 < μ > 4,00
74
Tablo ve Grafikler
Tablo kuralları:
•Kısa, özlü ama kapsayıcı bilgi veren bir başlık
•Kolon ve satır için açıklayıcı başlık, ölçüm birimi (g,
cm, gün vb.)
•Oranlar ile ifade edilen sonuçlarda sayılar da verilmeli
•Özet ön bilgi verme amacında olan tablolarda
ortalama ve güven aralıkları
•Önem dereceleri uygun şekilde belirtilmelidir.
•Karmaşık ve çok detaylı olmamalı
Tablolar, frekans (çetele) tabloları ve çapraz tablolar olmak
üzere iki türlüdür.
75
Tablo 3.1: Merinos kuzuların doğum ağırlığı değerleri
(sınıflandırılmış, kg).
76
Çapraz Tablo:
• İki ya da üç değişkenin birbirlerine
göre durumları ve dağılımlarını
incelemek için yapılır
• Ki kare analizlerinde kullanılan
tablolar böyledir
• Çok faktörlü varyans analizi sonuçları
da bu şekil tablolar ile gösterilir.
77
Tablo 2: Kliniğe getirilen kedilerin yaş ve cinsiyete göre dağılımı
78
Tablo 4: Farklı rasyonlar ile beslenen iki sığır ırkının danalarında
günlük canlı ağırlık artışına ait ortalama ve standart sapmalar (g).
Tablo 3: İki koyun ırkının kuzularında doğum tipi dağılımı
14
79
Grafikler:
Grafik yapma kuralları:
• Grafik karmaşık olmamalı, basit olmalı, gereksiz
süsten kaçınılmalı
• Kısa, özlü ancak kapsayıcı bir başlık olmalı; başlık
kesin ve açık ifadeli olmalı
• Bütün eksenlerin, parçaların ve sütunların ismi veya
anlamı belirtilmeli
• Eksenler üzerinde ölçüm değerleri sade ve abartısız
şekilde verilmeli
• Ekstrem değerleri göstermek için grafikte kesme işareti
kullanılmalı
• Seçilen grafik çeşidi amaçlanan bilgiyi yeterince
sunacak nitelikte olmalı
Grafikte kesme işaretlerinin kullanılması
Kalitatif veriler:
Veriler kategorik olduğunda, her bir
gözlem, sınırları belirgin birkaç
kategori veya sınıftan birine ait olur
Böylece her bir sınıfa düşen bireylerin
sayı ve oranlarını belirleyebiliriz
Bu şekildeki bilgileri pay grafiği veya
bar grafiği ile gösteririz.
1- Bar (Sütun) Grafiği:
Değişkenin her kategorisi bir sütun ile gösterilir
Sabit kalınlıktaki her bir sütunun uzunluğu, kategorideki
bireylerin sayılarını gösterir
Grafik 1: Türkiye yıllık kırmızı et üretiminin türlere göre dağılımı; bar grafiği
2- Pay Grafiği:
• Kategoriler daire dilimleri şeklinde gösterilir
• Her dilim bir kategoriyi veya sınıfı gösterir
• Dilimlerin yanında veya içinde sınıf adı ve değeri
• Dairenin alanı toplam frekansı verir
• Yapılışında yüzdelik değerler 360’a göre oransal
artırılarak açı dereceleri bulunur (Yüzde 55, 360’ta kaç
eder?)
%55 değerine karşılık gelen açı derecesi, (360*55)/100
eşitliği ile 198
%35 için 126
%10 için 36 derece
Grafik 2: Türkiye yıllık kırmızı et üretiminin türlere göre dağılımı; pay grafiği
Grafik 3: Farklı koyun ırklarının doğum ve kısırlık oranları, yan yana sütun
Grafik 4: Farklı koyun ırklarının doğum ve kısırlık oranları, üst üste sütun
Kantitatif veriler:
• Ham verilerin tamamı bir nokta grafik
şeklinde gösterilebilir
• Histogram ile verilerin bir özeti sunulabilir
• Yapılan analizler sonucunda elde edilen
ortalama değerler grafikle gösterilebilir
• Bunlar için çeşitli grafik yöntemleri vardır
1-Nokta Grafiği (dotplot):
• Veri sayısı az olduğunda ham verilerin tamamının dağılımı
nokta grafikle sunulabilir
• Tek bir kantitatif değişken varsa gözlemler bir çizgi üzerinde
nokta şeklinde gösterilebilir
• İki veya daha fazla gruptaki gözlemleri karşılaştırmak
istediğimizde grupları x ekseninde, değişkenin ölçüm değerlerini
y ekseninde gösteren bir nokta grafiği yapılabilir
• Her gruba ait veriler dikey olarak noktalar şeklinde görünür.
2- Histogram:
• Histogram ile kantitatif verilerin frekans dağılımları
gösterilir
• İki eksenli bir grafiktir; yatay eksen ölçüm değerlerinin
sınıflarını, dikey eksen frekansları gösterir
• Her sınıf aralığının üzerindeki dikdörtgenlerin alanı
sınıfların oransal frekanslarını gösterir (Aralıklar eşit
genişlikte ise, dikdörtgenin yüksekliği oransal frekansları gösterir)
• Aralıklar eşit değilse, dikdörtgenin yüksekliği değil alanı
önem kazanır
• Bu durumda dikdörtgenin kapsadığı alan frekansı
gösterir.
• Bar grafiğe benzer. Ancak bar grafikteki dikdörtgenler
birbirinden ayrı iken histogramda birbirine bitişiktir
3-Gövde Yaprak Grafiği (stem and leaf):
• Histogramın bir benzeridir, frekans dağılımlarını
gösterir
• Histogramdaki dikey dikdörtgenler yerine
burada yatay rakam dizileri vardır
• Bilgisayarlarda paket programlarda elde edilir
• Gövde (stem) gözlemlerin çekirdek değeridir
(rakamın virgülden önceki kısmı)
• Yaprak (leaf) her gözlem için ayrı olmak üzere,
virgülden sonraki rakamlardır
Kuzu doğum ağırlıklarına ait gövde-yaprak grafiği; N=90; Yaprak ünitesi = 0.01
4- Kutu-bıyık grafiği (box and whisker plot):
• Bu da bilgisayar çıktılarında elde edilen bir grafik
türüdür
• Veri setinin tamamının dağılımını değil de özet
dağılımını gösterir
• Değişkenin ölçülerinin derecesi dikey olarak gösterilir
• Kutu, verilerin %50 sini içine alan birinci dörttebirlik ile
üçüncü dörttebirlik arasını gösterir
• Kutunun içindeki yatay çizgi medyanın yerini belirtir
• Kutudan çıkan dikey çizgiler ise bıyıklardır ve %2,5.
değer ile %97,5. değer arasını gösterir
5- Saçılma Grafiği (scatter plot):
• İki kantitatif değişken arasındaki ilişkiyi
göstermek için yapılır
• Her biri bir değişkeni gösteren iki boyutlu
bir grafiktir
• Örneğin besi kuzularında göğüs çevresi ile
canlı ağırlık arasındaki ilişki
• yapağı verimi ile cüsse arasındaki ilişki
gibi.
6- Çizgi Grafiği:
• Bir değişkenle ilgili zamana bağlı
değişmeleri göstermek için kullanılır
• Aynı zamanda, farklı grupların, bir konuda
değişen şartlara bağlı değişim ve seyirlerini
incelemek için de çizilir
• Daha çok özetlenmiş veriler (örneğin
ortalamalar) kullanılarak bu eğriler çizilir
DAĞILIMLAR
Probabilite (İhtimal, Olasılık)
• Örnek verilerini kullanarak populasyon
hakkında yorumlar yapmak isteriz.
• Örnek verilerine dayanarak populasyon
hakkında yapılan yorumlar belirli ihtimallere
göredir.
• Buna Probabilite veya ihtimal denir.
• Probabilite, istatistiksel anlam çıkarmanın
temelini oluşturur.
• Probabilite ve temel teorik dağılımlar bundan
sonraki kısımlara temel oluşturacaktır.
Probabilite (İhtimal, Olasılık)
Probabilite nedir?
• Tarafsız şekilde bir para atılsın. İki eşit sonucu vardır;
yazı / tura
• Bu örnek, ½ = 0,5 ihtimalli olaylara örnektir.
• Benzer şartlarda bir olayı çok tekrarlayarak elde edilen
sonuçları kaydettiğimizde, alınan sonuçlar
birbirlerinden az çok farklılık gösterirler ve bunların bir
dağılımı elde edilir.
• Bu tip dağılımlara probabilite (ihtimal) dağılımları denir.
• Probabilite, relatif frekans veya oran olarak tanımlanır
ve rakamsal değeri 0 -1 arasındadır.
İhtimal Dağılımları
• Daha önce, deneysel frekans dağılımlarını gördük
(kuzu doğum ağırlığı).
• Diğer bir dağılım şekli ihtimal dağılımlarıdır.
• Birçok ihtimal dağılımı vardır (tesadüf değişkeninin kesikli
veya sürekli oluşuna göre değişir).
• Bir kesikli değişkenin iki muhtemel sonucu varsa bunlar
binomial dağılımları oluşturur.
• Kesikli değişkenlere ait diğer bir dağılım şekli ise poisson
dağılımıdır.
• Sürekli değişkenlere ait çeşitli dağılımlar vardır; bunların
temelini normal dağılım oluşturur.
Kesikli Değişkenlere
Ait İhtimal Dağılımları
Binomial Dağılım
• Verileri sayımla elde edilen ve sonuçların ikili olduğu
özelliklerin dağılımıdır.
• Olayın sadece muhtemel iki sonucu vardır: Evet-hayır,
ölü-sağlam, erkek-dişi, var-yok gibi.
• Binomial dağılım ile Poisson dağılımı birbirine benzer.
• Farkı: Bir olayın oluş ihtimali (p) büyük, olay sayısı (n)
küçük olduğunda binomial dağılım; olayın oluş ihtimali
küçük, n büyükse poisson dağılımıdır.
• Binomial dağılım kullanarak, sağlık bilimlerinde bazı
ihtimal hesapları yapılabilir.
Binomial Dağılım
Örnekler:
• Türkiye’deki Holştayn sığırların IBR pozitifliği. IBR
pozitif oranı 0,30 olsun, buna p denir.
• Bu bilgi, daha sonra incelenecek olan herhangi bir
Holştayn sürüde bu hastalığın ne kadar olması
beklendiği şeklinde kullanılabilir.
• Bir ilaç düşünelim ki bu ilacın belirli bir iyileştirme
yüzdesi (ihtimali) vardır.
• Bu ilacı kullanarak yaptığımız bir tedavide % kaç
bireyin iyileşeceğini tahmin etmek için binom dağılımın
özelliklerinden yararlanırız.
• Bir hastalıktaki ölüm ihtimalini kullanarak, bu hastalığa
yakalananların ne kadarının ölme ihtimali bulunduğu
binom yaklaşımı ile hesaplanabilir.
Binomial Dağılım
Dağılım
• Binom dağılımda, bir tesadüf değişkeninin, her
biri başarı veya başarısızlıkla sonuçlanan n tane
bağımsız deneyi yapılabilir.
• Deney sonucunda, başarı (p) ve başarısızlık
(1-p = q) olmak üzere n+1 tane muhtemel
sonuç çıkar.
• Yapılan deneylerden 1, 2, 3, …. n tane başarı
veya başarısızlık olabilir.
• Sonuçların başarı ve başarısızlık arasındaki
dağılımı binomial dağılımı verir.
Başarının, gerçek başarı ile bir ilgisi var mı?
Binomial Dağılım
Binom dağılımda;
Ortalama, x = np,
Varyans, S2 = npq,
Standart sapma, S = √npq
Ortalama ile varyans ilişkilidir. Varyans
ortalamanın q katıdır.
Hem ortalama hem de varyans n’e bağlıdır;
n büyüdükçe ortalama ve varyans büyür.
Binomial Dağılım
Mendel kalıtımı ile ilgili bir örnek verelim
Angus ırkı sığırlar homozigot siyah renkli (BB), Angler
ırkı sığırlar ise homozigot kırmızı renkli (bb), bunların
F1 melezleri ise siyah renkli görünümde ancak
heterozigot (Bb) genotipindedir.
B ve b genlerini taşıyan iki eşeysel hücrenin birleşmesi ile
oluşacak F2 yavrularının ihtimali;
genotip olarak, BB = 0,25, Bb = 0,50 ve bb = 0,25;
fenotip olarak, siyah = 0,75, kırmızı = 0,25 (ikili durum)
Özet: Bu bireylerin oluşturduğu populasyonda siyahlık
ihtimali %75, kırmızılık ihtimali %25 tir.
Binomial Dağılım
Binom dağılımda ihtimal hesaplamasında kullanılan
formül:
n!
P(r) = pr qr’
r! r’!
Formülde:
n, toplam olay sayısı
r, istenen olayın oluş sayısı
r’, istenmeyen olayın oluş sayısı, n-r
p, istenen olayın oluş ihtimali
q, istenmeyen olayın oluş ihtimali, 1-p
!, faktöriyel işaretidir
Binomial Dağılım
Problem:
Yukarıdaki iki ırkın melezlenmesi ile elde edilen
F1 ebeveynlerden doğacak 4 buzağının, değişik
sayılarda siyah olma ihtimallerini hesaplayalım:
Binom dağılımda ihtimaller, (p+q)n binomunun
terimlerine karşılık gelir. (p+q)n = 1 dir.
Örneğimizde n = 4, P = 3/4, q = 1/4 olduğu için;
(3/4+1/4)4 = 1(3/4)0(1/4)4 + 4(3/4)1(1/4)3 + 6(3/4)2(1/4)2 +
4(3/4)3(1/4)1 + 1(3/4)4(1/4)0 =1
Çözümler ve sonuçlar aşağıdaki tablodadır
Binomial Dağılım
Birinci terimin çözümü:
4! =4.3.2.1=24 0!=1 24/24=1 (3/4)0=1 (1/4)4= 1/256
1 . 1/256 = 1 / 256
Binomial Dağılım
4 buzağının siyah olma ihtimalleri:
Hiçbirinin siyah olmaması ihtimali, %: 0,39
1 tanesinin siyah olması ihtimali, %: 4,69
2 tanesinin siyah olması ihtimali, %: 21,09
3 tanesinin siyah olması ihtimali, %: 42,19
4 tanesinin siyah olması ihtimali, %: 31,64
Binomial Dağılım
Bu sonuçlardan hareketle farklı problemler oluşturulabilir:
1- Melezlemede en fazla 3 buzağının siyah olma ihtimali
nedir?
En fazla dendiği için 0, 1, 2 ve 3 buzağı siyah olabilir
demektir (ihtimaller toplanacaktır).
Sonuç:
0,39 + 4,69 + 21,09 + 42,19 = %68,36
2- En az 1 siyah buzağı olma ihtimali nedir?
4, 3, 2 ve 1 buzağı siyah olabilir demektir (ihtimaller
toplanacaktır)
Sonuç:
4,69 + 21,09 + 42,19 + 31,64 = %99,61
Binomial Dağılım
İncelediğimiz örnekte;
X= np = 4 x 0,75 =3
S2 = npq = 4 x 0,75 x 0,25 = 0,75
S = √npq = √0,75 = 0,866
Binomial Dağılım
Binomial dağılım şekil olarak nasıldır?
Her birinde 4 buzağı doğan 50 melezlemede bu
renk incelemesini yaptık varsayalım
Sonuçlar aşağıdaki tablodaki gibi olsun
Teorik frekanslar toplam sayının ilgili sınıfın
ihtimali (p) ile çarpılması ile elde edilir.
Örneğin 0 sınıfı için teorik frekans, 50 x 0,0039 = 0,20 bulunur.
Binomiyal dağılımın şekli p’ye bağlıdır (P=1/2 ise
dağılım simetriktir. P<1/2 ise dağılım sağa
çarpıktır, P>1/2 ise eğri sola çarpıktır)
Binomiyal dağılım grafikleri çubuk şeklindedir
Binomial Dağılım
Binomial Dağılım
P > ½ ve dağılım sola çarpık
Poisson Dağılımı
• Binom dağılım gibi, tabiattaki ikili olayların dağılımıdır.
• Az rastlanan olaylarda ihtimal hesaplamak için kullanılır
(Olayın oluş ihtimali az ise, yani p küçük n büyükse binom dağılımı yerine Poisson
dağılımı geçerlidir).
• Binom dağılımda n büyük p küçük olduğunda p(r) lerin
hesaplanması zorlaşır.
• Bu nedenle, Poisson dağılımı olarak binomdan farklı bir
fonksiyon geliştirilmiştir.
• Bu fonksiyonu Fransız matematikçi Poisson geliştirmiştir.
• Sağlık bilimlerinde de kullanılan bir yöntemdir.
• Poisson dağılımına uyan olaylar (binomial dağılımdan farklı olarak),
olayın oluş ihtimali ile değil ortalama sayısı ile tanımlanır.
• Sonuçlar her iki dağılım şeklinde de oransal olarak ifade edilir
(“şu olayın olma ihtimali % şu kadardır” gibi).
Poisson Dağılımı
Poisson dağılımının ortalaması ve varyansı birbirine eşittir (sadece
tek bir parametresi vardır; ortalama)
Ortalaması bilinen bir poisson dağılımı belirlenebilir.
Poisson dağılımının;
Ortalaması, X = np,
Varyansı, S2 = np
Standart sapması, S = √np
Eğer dağılımın P si bilinmiyor dağılım tablosu (sınıf (s), frekanslar
(f) ve n sayısı biliniyorsa ortalama;
X = Σs.f /n
Poisson Dağılımı
Poisson dağılımı ile ihtimal hesaplamasında
aşağıdaki formül kullanılır:
xr
P(r) = e –x
r!
x, aritmetik ortalama,
r, istenen olayın oluş sayısı,
e-X, kitap ekindeki üstel fonksiyonlar tablosundan alınan
değerdir. e, tabii logaritma tabanı olup 2,718 dir
Poisson Dağılımı
Poisson Dağılımı
Değişik ihtimaller arasında aşağıdaki gibi bir
ilişki vardır:
P(0) = (0/ 0!) 2,718 -x
P(1) = (1/ 1!) 2,718 -x = x P(0)
P(2) = (2/ 2!) 2,718 – x = x /2 P(1)
P(3) = (3/ 3!) 2,718 -x = x /3 P(2)
P(n) = (n/ n!) 2,718 -x = x /n P(n-1)
Poisson Dağılımı
Örnek:
Merinos koç ve koyunlarda boynuz görülmesi ihtimali.
Konya Hayvancılık Araştırma Enstitüsü’nde yetiştirilen
500 başlık Merinos sürüsünde her yıl birkaç tane
kuzuda boynuz geliştiği ve bunun yıllara göre
ortalaması 3 olsun. 2006 yılında doğacak kuzulardan
0-5 tanesinin (0, 1, 2, 3, 4 veya 5) boynuzlu olması
ihtimalleri nelerdir? e-3 değeri 0,05 tir (kitap ekinden)
Poisson Dağılımı
Çözüm:
Sıfır boynuzlu ihtimali; P(0) = (30 / 0!) 0.05 = 1x 0,05 = 0,05
Bir boynuzlu ihtimali; P(1) = x P(0)= 3 x 0,05 = 0,15
İki boynuzlu ihtimali; P(2) = x/2 P(1)= 3/2 x 0,15 = 0,225
Üç boynuzlu ihtimali; P(3) = x/3 P(2)= 3/3 x 0,225 = 0,225
Dört boynuzlu ihtimali; P(4) = x/4 P(3)= 3/4 x 0,225 = 0,169
Beş boynuzlu ihtimali; P(5) = x/5 P(4)= 3/5 x 0,169 = 0,101
Toplam p = 0,92
6 ve daha fazla olma ihtimali; P(6≤) = 1 – 0,92 = 0,08
Poisson Dağılımı
En fazla 2 kuzunun boynuzlu olma ihtimali nedir?
0, 1 ve 2 nin ihtimalleri toplanacaktır.
P(0) + P(1) + P(2) = 0,05 + 0,15 + 0,225 = 0,425
Sonuç: %43
Bir veya iki boynuzlu kuzu olması ihtimali nedir?
1 ve 2 nin ihtimalleri toplanacaktır.
P(1) + P(2) = 0,15 + 0,225 = 0,375
Sonuç: %37,5
Poisson Dağılımı
Poisson dağılımının grafiksel olarak
gösterilmesi
Bu işletmede 20 yıllık kayıtları incelediğimizi
ve boynuzlu kuzu sayılarını aşağıdaki
tablodaki gibi bulduğumuzu varsayalım.
0-5 arasında boynuzlu kuzu olma
ihtimallerine göre ilgili frekanslar tabloda
verilmiştir.
Tabloya göre frekans dağılımının şeklini
görelim.
Poisson Dağılımı
Poisson Dağılımı
Ortalama (x), standart sapma (s)
ve ihtimal (P)
İncelenen örnekte n=200 ortalama 3,2 bulunmuştur.
Buna göre probabilite (P);
X = np, 3,2 = 200 P ve P = 3,2/200 = 0,016 şeklinde
bulunur. Sürüde boynuzluluk ihtimali; %1,6 dır.
Standart sapma,
S= √np = √ 3,2 = 1,79
132
İhtimal
Dağılımları
Sürekli Değişkenlere
ait İhtimal
dağılımları
Kesikli ve sürekli değişkenler arasındaki ilişki
Kesikli değişkenlerin az sayıda sınıfı vardır ve sınıflar arasında geçiş yoktur;
sürekli değişkenlerin sınıfı çoktur ve sınıflar geçişlidir
Kesikli değişkenlerde sınıf sayısı arttıkça dağılım normal dağılıma benzer
Aşağıdaki şekiller bunu göstermektedir.
Kesikli ve sürekli değişkenler arasındaki ilişki
On yedi sınıfı olan kesikli değişkene ait dağılım
Kesikli ve sürekli değişkenler arasındaki ilişki
Bir sürekli değişkene ait ihtimal sıklığı fonksiyonu
NORMAL DAĞILIM
NORMAL DAĞILIM
18. yy.’da Alman Matematikçi Gauss tarafından geliştirilmiştir
(Gausiyan dağılım)
Normal dağılım, sürekli dağılımlar içinde en önemlisidir
(analizlerde en çok kullanılanıdır).
Normal dağılım teorik bir dağılımdır.
Farklılıkları tesadüften başka bir nedene dayandırılamayan
varyantların dağılımıdır.
Daha önce incelediğimiz 90 kuzunun, aynı ırktan, aynı cinsiyetten,
aynı doğum tipinden ve aynı ana yaşına sahip kuzular olduğunu
düşünürsek bunların oluşturduğu populasyon bir normal
populasyondur ve canlı ağırlık dağılımları da normal dağılım
gösterir.
Normal dağılım gösteren değişkenler genellikle ölçümle elde
edilirler (canlı ağırlık).
Sayımla elde edildiği halde normal dağılım gösteren özellikler de
olabilir (yumurta sayısı).
NORMAL DAĞILIM
Normal Dağılımın Özellikleri
• Ortalama (μ) ve standart sapma (σ) olmak üzere iki
parametresi ile tanımlanır.
• Unimodal (tek modlu) bir dağılımdır.
• Ortalamaya göre simetriktir; sağ taraf sol tarafın ayna
imajıdır, çan eğrisi şeklindedir. Verilerin %50’si
ortalamadan geçen dikey doğrunun sağında, %50’si
solunda yer alır.
• Normal dağılımda ortalama, mod ve medyan birbirine
eşittir.
• Normal dağılım sağa veya sola çarpık değildir.
Çarpıklık (skewness) katsayısı sıfırdır. Sıfırdan küçük
değerler sola, büyük değerler sağa çarpıklığı gösterir.
Normal dağılım ne diktir ne basıktır. Diklik katsayısı da
0 dır. Diklik katsayısının negatif değerleri normalden
dikliği, pozitif değerleri de basıklığı gösterir.
Normal Dağılımın Özellikleri
• μ ± 1σ verilerin %68.26’sını, μ ± 2σ %95.44’ünü, μ ±
3σ ise %99.74’ünü içerir.
• Ortalama sabit olup standart sapma değişirse eğriler
dikey olarak yükselir veya alçalır. Örneğin σ azalırsa
eğri dik, uzun ve ince olur, σ artarsa basık, kısa ve
şişman olur.
Normal Dağılımın Özellikleri
• Standart sapma sabit olup ortalama değişirse, eğriler
yatay olarak, ortalama artarsa sağa, azalırsa sola
doğru kayar
• Normal dağılım, – sonsuzdan + sonsuza kadar bütün
değerleri belirli oranlarla veya ihtimallerle kapsar.
Standart Normal Dağılım; Standart Normal Sapma (SNS)
Z Dağılımı
• Ortalaması sıfır (0) standart sapması bir (1) olan
normal dağılıma standart normal dağılım denir.
• Ortalaması ve standart sapması ne olursa olsun,
bütün normal populasyonları belirleyen bir dağılımdır;
z dağılımı da denir.
• Bir değişkenin herhangi bir değerinin (x1) ihtimalini
hesaplamak için z değerleri hesaplanır
• İncelenen değişkenin ortalaması (μ) ve standart
sapması (σ ) bilinmelidir.
• Elde edilen z değeri, standardize edilmiş normal
sapma (SNS) ismini alır.
Z Dağılımı
SNS Formülü:
z = (x – μ ) / σ
x1 değerine karşılık gelen z1 değeri
z1 = (x1 – μ) / σ
Z Dağılımı
• İstenen alanı belirlemek için, z tablosu kullanılır.
• Standart normal dağılım, simetrik olduğu için, sağa
doğru z1’e kadar olan kuyruğun alanı, sola doğru –
z1’e kadar olan kuyruğun alanına eşittir.
• Eğrinin bir tarafının alanı 0,50 olup iki tarafın toplamı 1
eder.
• Z tablosunda sıfırdan z’ye kadar olan alanlar
(probabiliteler, P) verilmiştir.
• Z nindışında kalan alanı hesaplamak için, tablodan
okunan oran, 0,50 den çıkarılır.
Z Dağılımı
Z Dağılımı
Teorik frekansların hesaplanması
• 90 baş kuzu d.ağ. örneğinde μ = 3,96 ve σ = 0,19 idi.
• Verilerin birinci sınıfı 3,50 den küçük varyantları kapsar
• Birinci sınıfın z değerinin hesaplanması (x olarak sınıf ara
değeri kullanılır)
• z = (3,495 – 3,96) / 0,19 = -2,45 tir.
• Bu değerin karşılık geldiği alan z tablosundan 0,4929 olarak
okunur.
• 0,4929 değeri, ortalamadan z’ye (-2,45) kadar olan alanı verir.
• Biz 3,50 den küçüklerin frekansını hesaplayacağımız için, 0,50
den bu değer çıkarılır.
• 0,50 – 0,4929 = 0,0071 bulunur (binde yedi ihtimal).
• Bu oran, 3,50 den aşağıda değer gösterenlerin dağılımda
bulunma ihtimalidir.
• 90 kuzuda bu alana girenlerin teorik frekansı 90 x 0,0071 =
0,64 tür (yaklaşık yarım kuzu).
Z Dağılımı
İkinci sınıfın z değeri,
• z = (3,585-3,96)/0,19 = -1,97 olup alanı 0,4756 dır.
• İlgili alan, bu z değerinin alanı ile bir alt sınıfın z
değerinin alanı arasındaki farktır:
• 0,4929 – 0,4756 = 0,0173.
• 90 kuzuda bu alana girenlerin teorik frekansı 90 x
0,0173 = 1,56 dır.
• Aynı şekilde, en son sınıfın ve sondan bir önceki
sınıfın alanları da bulunur.
• Son sınıfın net alanı 0,50-0,4890 = 0,011;
• Sondan bir önceki sınıfın alanı 0,4890-0,4656 =
0,0234 dir.
• Bu şekilde ortaya doğru gelinir.
Z Dağılımı
• Ortalamanın bulunduğu sınıfların net alanını
bulurken, 0 dan z’ye kadar olan alan bu
alanlara eklenir.
• Ortalama ile alt gerçek sınır (3,945) arasındaki
alan 0.0319 olup bir önceki alanla toplandığında
0,1769 + 0.0319 = 0,2088 bulunur.
• Ortalama ile üst gerçek sınır (4,035) arasındaki
alan 0,1517 olup bir önceki alanla toplandığında
0,1561 + 0.1517 = 0,3078 bulunur.
• Net alanların toplamının 1 etmesi ve frekans
toplamlarının da toplamı n’i vermesi gerekir.
Z Dağılımı
Z Dağılımı
90 kuzunun doğum ağırlığına ait frekans dağılımı grafiği
Z Dağılımı
Problem 1
• Beş aylık yaştaki Akkaraman besi kuzularında göğüs
çevresi ortalaması 75, standart sapması 2 cm olsun
• 77 cm ve daha yukarı değer gösteren kuzuların bu
dağılımda (Akkaraman kuzu populasyonunda) olma
ihtimali nedir?
Çözüm 1
Önce z değeri hesaplanır
x1 = 77 cm olduğuna göre, buna karşılık gelen z1 değeri;
z1 = (77 –75) / 2 = 1,0 bulunur.
Sonra z tablosundan bu z değerine karşılık gelen P
değeri bulunur.
Çözüm 1
* Bu da 0,3413 tür.
* Biz 77 ve daha büyük olanlar ile ilgileniyoruz;
bu değer 0,50 den çıkarılır;
* 0,50 – 0,3413 = 0,1587 (0,16 şeklinde
yuvarlanabilir)
* 77 cm ve daha yüksek göğüs çevresine sahip
kuzuların Akkaraman populasyonuna ait olma
ihtimali %16 dır denir.
* Veya bu populasyonda 77 cm ve üzerinde
olanların oranı %16 dır denir.
Problem 2
• Bu populasyonda 72-76 cm arasında değere sahip
olanların yüzdesi nedir?
Çözüm 2
• Burada iki tane z değeri hesaplanır;
• z1= (72-75)/2 = -1,5
• z2= (76-75)/2 = 0,5
• z1’e karşılık gelen tablo değeri 0,4332
• z2’ye karşılık gelen tablo değeri 0,1915 tir.
• iki değer toplanır; p= 0,4332 + 0,1915 = 0,6247
(Yuvarlak %63)
• Sonuç: Ppopulasyonda 72-76 cm arasında değere
sahip olanların oranı %63 tür.
Bilinen bir probabiliteden SNS hesaplanması:
• Belirli bir p değeri için z değerini ve dolayısıyla
bu z değerine karşılık gelen x değerini bulma
işlemidir.
Problem3
• Yukarıda ortalaması ve standart sapması
verilen dağılımda verilerin merkezde bulunan %
50 si hangi değer sınırları içerisindedir?
Bilinen bir probabiliteden SNS hesaplanması:
Çözüm 3
• Merkez dendiği için ortalamadan sağa ve sola doğru
bulunan değerler hesap edilecektir.
• Verilen p değeri ikiye bölünmelidir; 0,50/2= 0.25 olur.
• Buna karşılık gelen bir +z bir de –z değeri
hesaplamalıyız.
• Bunlar z tablosundan bulunur; 0,25’e en yakın alan
0.2486 dır ve z değeri 0.67 dir.
• Z = (x-μ) /σ formülü ile; 0.67 = (x – 75) / 2 eşitliği yazılır
• x1 = 2 x 0.67 + 75 = 76.34 cm
• x1 = 2 x 0.67 – 75 = 73.66 cm bulunur.
• Sonuç: Bireylerin merkezdeki %50’si 73.66-76.34 cm
değerleri arasında göğüs çevresine sahiptir.
Bilinen bir probabiliteden SNS hesaplanması:
Normalliğin Tespit Edilmesi; Normalite Testi
Bilgisayar aracılığı ile
1- Verilerin deneysel frekans dağılımlarına ait histogram grafiği
yapılır; dağılım çan şeklinde ve simetrik olmalıdır.
2- Normalite grafiği (normality plot) yapılır; grafikte eğri doğrusal
bir çizgi şeklinde olmalıdır.
3- Shapiro-Wilk W, Anderson-Dorling, Kolmogorow-Simirnov
testlerinden birisi yapılır; P>0.05 olmalıdır.
4- Simetri ölçüsü olan çarpıklık (skewness) ve diklik-basıklık
(kurtosis) katsayıları hesaplanır. Her ikisinin katsayısı da sıfıra
yakın olmalıdır.
Hesap makinesi veya bilgisayar ile;
Verilerin %68.26’sının X ± 1S sınırları içinde olup olmadığı
hesaplanır.
Hipotezler
Hipotezler
• Gruplar arası farkın önemli olup olmadığını
araştıran testlerde kullanılır.
• Bunlara hipotez testleri de denir.
• Hipotez, bir önyargı veya ön kabul demektir
• Başlangıç hipotezini test ederken bunun yerine
geçecek olan hipotez de belirlenir.
• Bir hipotez testinde iki tip hipotez vardır;
1- Sıfır hipotezi (başlangıç hipotezi)
2- Alternatif hipotez.
• Sıfır hipotezi (H0) farksızlık hipotezi veya
eşitlik hipotezidir; H0: μ1 = μ2
• Sıfır hipotezi her araştırmada aynıdır,
tektir.
• Alternatif hipotez (H1), sıfır hipotezi
reddedilince onun yerine geçecek
hipotezdir.
• Alternatif hipotez tek değildir; iki türlüdür,
1- İki yönlü
2- Tek yönlü
• İki yönlü hipotez, sıfır hipotezinin zıttı
olarak iki ortalama birbirine eşit değildir
şeklinde kurulur.
μ1 ≠ μ2 veya μ1 – μ2 ≠ 0
• Tek yönlü hipotez, gruplardan birinin
ortalamasının diğerinin ortalamasına göre
küçük veya büyük olduğu kabulüne
dayanır;
μ1 < μ2 veya μ1 > μ2
• Testin sonunda; H0 kabul edilirse H1
reddedilir; H0 reddedilirse H1 kabul edilir.
• Bu hipotezler genellikle t testleri
içindir.
• Çoklu grupların ikişerli karşılaştırma
testlerinde de bu hipotezler kullanılır.
• F testinde sıfır hipotezi ve alternatif
hipotez biraz daha farklıdır.
F testinde hipotezler
• F testinde başlangıç hipotezi iki varyansın eşit
olduğu kabulüne dayanır.
• Karşıt hipotez ise tek taraflı veya iki taraflı
olabilir.
• F testinde (varyans analizi) karşıt hipotez tek
yönlüdür (F dağılımının sadece sağ tarafı kullanışlı olduğu
için) (σ2
iç<σ2
ara olup büyük varyans küçüğüne bölündüğü için
dağılımın sağ tarafı kullanılır)
• İki grubun varyanslarının homojenliği
kontrollerinde bağımsız iki varyans
karşılaştırılır. O zaman alternatif hipotez iki
yönlü veya tek yönlü olabilir.
Varyans analizinde;
H0: σ2
iç = σ2
ara veya σ2
ara /σ2
iç =1
H1: σ2
ara > σ2
iç;
Homojenlik kontrolünde
H0: σ2
1 = σ2
H1: σ2
1 ≠ σ2
Dağılımın Ret ve Kabul Bölgeleri
• Normal dağılıma uyan verilerle ilgili yapılan testlerde
(t, Z ve F testi) dağılımın ret ve kabul bölgeleri,
alternatif hipotezin tipine göre değişir.
• İki yönlü hipotezlerde ret bölgesi dağılımın her iki
tarafındadır.
• Tek yönlü hipotezde ise ret bölgesi dağılımın sadece
bir tarafındadır
• Ret bölgesi 0,05 lik bir alandır
• Tek yönlüde 0,05 lik ret bölgesi dağılımın tek tarafında
ve bütün iken iki yönlüde dağılımın iki yanında ve
yarısı (0,025) kadardır
• Bu yüzden tek yönlü hipotez ile sıfır hipotezini
reddetme şansı iki misli fazladır diyebiliriz.
α= 0,05 olduğunda ret (0,05) ve kabul
(0,95) bölgeleri
İki yönlü hipotez (μ1≠μ2)
Tek yönlü hipotez (μ1<μ2);
Tek yönlü hipotez (μ1>μ2)
Hata Tipleri
• Hipotez testleri sonunda H0 hipotezi ret veya
kabul edilir
• Verilen bu karar her zaman doğru olmayabilir
• Eğer karar yanlış ise bir hata yapılmış olur
• Bunun için, hipotez testlerinde hata ihtimalleri
ve tipleri belirlenmiştir
• Böylece, hatanın denetim altına alınması
öngörülmüştür
• Hipotez testlerinde iki tip hata ihtimali vardır:
I. tip hata (α hatası)
II. tip hata (β hatası)
174
Hipotez testlerinde hata tipleri
Hipotez testlerinde hata tipleri
• Hatadan nasıl kaçılır? En az hata nasıl yapılır?
• Birinci tip hatadan kaçınmak için düşük α
seviyesi, II. tip hatadan kaçınmak için düşük β
seviyesi kullanılmalıdır
• Alfa hatasını denetlemek kolay, beta hatasını
denetlemek zordur
• α=0,05 olsun şeklinde seçebiliriz, beta için
böyle bir rakamsal düzey belirlenemez
• α küçüldükçe β büyür
(Bu sonuçtan, β hatasını küçültmenin yolu, α hatasını
çok küçük seçmemektir denebilir)
Hipotez testlerinde hata tipleri
Beta hatası dolaylı olarak azaltılabilir
• 1- Örnek hacmini büyütmek (en kestirme ve kesin yol)
• 2- Tekerrür sayısını artırmak (aynı materyalde
muameleyi tekrarlamak)
• 3- Materyali bloklara ayırmak (hatayı azaltmak için bir
başka yol)
• 4- Mümkünse muameleyi bağımsız gruplarda değil de
bağımlı gruplarda uygulamak
(Özellikle birey farklılığına dayalı hataları azaltmak için bu yöntem denenmelidir)
• 5- Alternatif hipotezi doğru kurmak
Etki Büyüklüğü
• Etki büyüklüğü, gruplar arası farkın veya ilişkinin gücünü
gösterir
• (Etki büyükse bunu örnekte tespit etmek kolayken, etki küçükse
örnekte tespit etmek zordur)
• Uygun etki büyüklüğünü belirlemek için; pilot çalışma,önceki
çalışma bulguları
• Veya pratik olarak anlamlı olan en küçük etki büyüklüğü seçilir
• t testinde küçük etki, standart sapmanın %20′si, orta etki
%50′si, büyük etki %80’idir
• Örnek: ortalama 350 ve standart sapma 20 olan bir örnekte
• iki grup arasındaki fark 4 birim ise (20 x 0,2) küçük etki
• fark 10 birim ise (20 x 0,5) orta etki
• fark 16 birim ise (20 x 0,8) büyük etki
• Örneğin varyansı büyüdükçe etki büyüklüğü artar.
Testin Gücü
• sıfır hipotezini reddetme düzeyidir. II. Tip
hatadan kaçınma şansıdır
• Mümkün olan örnek hacmine paralel olarak,
testin gücünün %80 olması yeterlidir (beta
hatası %20)
• Güç büyük seçilirse o kadar örnek hacmi
gereklidir.
• Örnek büyüklüğünü arttırmak zaman ve para
masrafı gerektirir
• küçük bir beta hatası (%20 normal) için gerekli
minimum örnek büyüklüğü seçilir
Önemlilik Seviyesi, Hata Tipi, Testin Gücü, Örnek
Büyüklüğü ve Etki Büyüklüğü İlişkileri
• Önemlilik seviyesi, doğru sıfır hipotezinin reddedilmesi
ihtimali (I. tip hata) olup α ile gösterilir ve genellikle
0,05 taban olarak alınır
• Çoğu zaman I. tip hatanın 0,05 ihtimalle olması, II.tip
hatanın ise 0,20 ihtimalle olması istenir
• Birinci tip hatanın zıttı güven düzeyidir; hata az ise
güven artar; α = 0,05 olursa güven düzeyi 0,95 (%95)
iken α = 0,01 olursa güven düzeyi 0,99 (%99) olur
• İkinci tip hatanın zıttı ise testin gücüdür hata az ise
testin gücü artar; β = 0,20 olursa testin gücü 0,80 iken
β = 0,15 olursa testin gücü 0,85 olur.
• α ile β belirlendikten sonra örnek büyüklüğünü bulmak için,
gruplar arasında ne kadar bir fark bulunmak istendiği (etki
büyüklüğü) de tespit edilmelidir
• Bunun için; farkın pratik önemi de göz önünde tutulur
• İki grup arasındaki farkın büyüklüğü (etki büyüklüğü) azaldıkça,
bunun önemli bulunması için daha büyük örnek genişliğine
ihtiyaç vardır
• Ayrıca, önemlilik seviyesi ne kadar küçük ise (yani alfa hatası
küçük olsun istenirse) o kadar büyük örnek genişliği
belirlenmelidir.
• İdeal olarak, hiç hata yapmamak için, α ve β sıfır olmalıdır
• Hatanın küçültülmesi için daha büyük örnek hacmi gerekir
(populasyonun tamamı)
Örnek Büyüklüğü Belirleme
• Sıfır ve alternatif hipotez tanımlanır.
• Değişken tipine ve grup sayısına göre uygun
istatistik test seçilir.
• Önceki bulgulara göre en küçük etki büyüklüğü
(ortalamalar arası fark) belirlenir.
• Önceki bulgulara/bilgilere göre, incelenen
değişkene ait standart sapma belirlenir.
• Uygun α ile β seviyeleri belirlenir.
• Minitab paket programında bu işlem
yapılabilmektedir (power and sample size)
Z VE t TESTLERİ
1 Örnek T Testi
(Populasyon Ortalaması Önemlilik Testi)
bir örneğin, ortalaması ve standart sapması
bilinen bir kitleden çekilip çekilmediğini
veya eldeki örneğin, içinden çekildiği
varsayılan populasyonu ne derece temsil
ettiğini test etmek için yapılır.
Örnek:
• Kıl Keçilerin yıllık süt verimi ortalaması 75 kg
olsun
• Kıl keçisi yetiştiren bir yetiştirici kendi sürü
ortalamasının 80 kg olduğunu ve sürüye başka
bir ırkın karışmadığını iddia ediyor
• Bu yetiştiricinin sürüsü normal Kıl Keçi
populasyonuna mı ait yoksa bu sürü üzerinde
melezleme veya seleksiyon çalışması yapılarak
farklı özellik kazandırılmış bir sürü müdür?
• Yani, normal Kıl Keçi populasyonundan farklı
bir sürü müdür?
• Yetiştiricinin
sürüsünden rasgele
seçilmiş 30 keçinin
yıllık süt verimi kayıtları
Test istatistiğinin hesaplanması
t = (x-μ) / Sx
X = 77,5 kg; S2 = 93,9
standart sapma, S = 9,69
Sx = S / √n Sx = 9,69 / √30 = 1,77
t = (77,5-75,0)/1,77
t = 1,41
SD = 30 -1 = 29
Tablo t değeri (iki yönlü test P = 0,05 için 2,045)
1,41 < 2,045
P>0,05
2 Örnek T Testi
Bağımsız İki Grup Ortalamasının
Karşılaştırılması
• Bağımsız iki grubun ortalamasını
karşılaştırmada kullanılır
• Elde iki örnek vardır ve bunlardaki veriler farklı
bireylerden alınmıştır
• Gruplardaki veri sayısı farklı olabilir
• Örnek: cinsiyet (erkek/dişi), doğum tipi (tek/ikiz),
iki sınıf (A ve B)
189
İki grubun varyansları eşit olduğunda
Ortalamaları x1 ve x2
Ortak varyansları S0
Örnek büyüklükleri n1 ve n2 olan iki bağımsız
grubun ortalamalarının karşılaştırılması
Örnek:
10 baş Yerli Kara ve 10 baş melez dana, 6 aylık
yaşta besiye alınmıştır
Besi sonunda iki grup besi performansı
açısından karşılaştırılıyor
Danaların yemden yararlanma kabiliyetleri kriter
alınıyor
Veriler tabloda
İki grup arasındaki fark istatistik olarak anlamlı
mıdır?
Sonuç:
18 SD’de iki yönlü test tablo t değerleri:
P = 0,05 için 2,10, P = 0,01 için 2,88
5,93 >2,88 olduğu için P<0,01
“iki grup arasındaki fark önemlidir;
melezlerin yemden yararlanma kabiliyeti
yerlilerden yüksektir”
İki grubun varyansları eşit olmadığında
• Ortalamaları x1 ve x2
• Varyansları S1
2 ve S2
• Örnek büyüklükleri n1 ve n2 olan iki bağımsız grubun
ortalamalarının karşılaştırılması
Örnek:
İki ayrı yem fabrikasının ürettiği süt yem,
içerdikleri ham protein bakımından
karşılaştırılacak
Her iki fabrikadan tesadüfi örnekleme ile 13’er
adet numune alınmış
Laboratuvarda ham protein analizi yapılmıştır
İşlem sırasında A yemine ait numunelerden biri
zarar görmüştür
Sonuçlar Tablo 6’daki gibidir
Yemlar arasında bir fark var mıdır?
23 SD’de iki yönlü test tablo t değeri P = 0,05 için 2,07 dir
-0,84 <2,07 olduğu için P>0,05 dir
Sonuç:
İki grup arasındaki fark önemsizdir; iki fabrikanın ürettiği yemler
arasında ham protein oranları bakımından bir fark yoktur
Iki Eş Arasındaki Farkın Önemlilik Testi
Bağımlı İki Grup Ortalamasının Karşılaştırılması
• Deneme ve kontrol grubunun, uygulanan etki dışında tamamen
aynı olmaları istenir (aynı bireyler). Eşli veriler?
• Aynı bireylerden farklı zamanlarda, veya farklı kişilerce, veya
farklı ölçüm aletleri kullanılarak veriler alınmışsa bu verilere eşli
veriler denir
• Belirli saat veya gün aralıkları ile aynı bireylerden alınan kan
örnekleri (değişik iki zaman)
• İki farklı aletin aynı bireylerin bir özelliğini ölçmesi (değişik iki
alet)
• İki asistanın aynı ölçü pergeli ile 20 kuzunun alın genişliklerini
ölçmesi (değişik iki kişi)
• Aynı hayvanın ön incik ve arka inciğinin karşılaştırılması
• Bu t testi yönteminde eşler arasındaki farkın sıfır olup
olmaması araştırılır
• Eşli veriler yan yana yazılmalıdır.
• Eşler arasındaki fark sıfır ise yapılan muamelenin bir
etkisi olmamış demektir
• Aksi halde etki önemli demektir
• Eşler arasındaki fark d ile ve ortalama fark ta d (üzeri
çizgi) ile gösterildiğinde;
Örnek:
Bir ilacın tansiyon düşürücü etkisini
araştırmak amacıyla yapılan bir
araştırmada 15 yüksek tansiyonlu hastada
ilaç verilmeden önce ve ilaç verildikten
sonra kan basınçları ölçülmüş ve Tablo
7’deki sonuçlar alınmıştır. İlacı tansiyon
düşürmeye etkisi var mıdır?
14 SD’de iki yönlü test tablo t değerleri P = 0,05 için 2,14; P=0,01 için 2,98 dir.
6,38 >2,98 olduğu için P<0,01 dir
Sonuç:
Eşler arası fark sıfır değildir; hastaların kan basıncı düşmüştür, ilaç etkilidir
VARYANS ANALİZİ
VARYANS ANALİZİ
İki varyansın veya ikiden çok ortalamanın
karşılaştırılması
• İkiden fazla grubun ortalamasının karşılaştırılması
• Tek faktör için, üç veya daha fazla grubun ortalamasının
karşılaştırılması (tek yönlü)
• Bir populasyonda, tüm bireylerin değerlerinin farklı olması
(toplam/genel varyans)
• Populasyon bir faktör bakımından gruplara ayrılırsa, gruplar
arasında fark olur (gruplar arası varyans)
• Aynı grubun bireyleri arasında da bir farklılık vardır (grup içi
varyans)
• Gruplar arası varyans + grup içi varyans = toplam varyans
Varyans analizinin şartları
Ham verilerin bazı şartları taşıması gerekir.
Bunlar:
• 1- Grupların bağımsızlığı (Bağımsızlık)
• 2- Gözlemlerin rasgeleliği (Rasgelelik)
• 3- Gözlemlerin normalliği (Normallik)
• 4- Varyansların homojenliği
(Homojenlik)
• H0 hipotezi bütün grupların, σ2 varyanslı normal
dağılım gösteren tek bir populasyondan çekildiği
varsayımına dayanır
• F istatistiği normal dağılım gösteren F
dağılımına göre değerlendirileceği için, verilerin
normal dağılım göstermesi ve varyansların
homojen olması gerekir
• Normallik testi yapılmalı
• Varyansların homojenliği testi yapılmalı
F testi
• Önce F istatistiği hesaplanır (büyük varyansın küçüğüne bölünmesi ile)
• Büyük varyans gruplar arası varyans, küçük varyans ise grup içi varyanstır
(GAKO / GİKO)
• F testi gruplar arası varyansın grup içi varyansa eşit olup olmadığını test
eder
• H0 hipotezi bu iki varyansın eşit olduğunun kabulüdür (F’nin 1 veya ona yakın
bir değer olması)
• Alternatif hipotez, paydaki varyansın büyük olduğunu (F’nin 1’den büyük
olduğunu)
• Normalde, gruplar arasında bireyler arasındakinden başka bir fark yoksa,
gruplar arası varyans grup içi varyansa eşit olur (GAKO / GİKO oranı (F
değeri) 1 çıkar)
• Gruplar arasında büyük faklılıklar varsa bu eşitlik 1’den yüksek olur
• Sonuçta, en az bir grubun diğerlerinden farklı olduğuna (aynı
populasyondan olmadığına) karar verilir.
Örnek
Farklı ana yaşlarından Merinos kuzuların doğum
ağırlığındaki varyasyonun incelenmesi
Acaba ana yaşı, kuzuların doğum ağırlığında etkili bir
faktör müdür?
(kuzuları ana yaşı gruplarına ayırdığımızda grup ortalamaları arası farklar
anlamlı mıdır? önemli midir?)
Anası 2, 3, 4 ve 5 yaşlı olan kuzuların doğum ağırlığı
değerleri aşağıdaki tablodaki gibi bulunmuş olsun
GİKT = GKT – GAKT
GİKT = 2,07 – 0,94
GİKT = 1,13
GKT = Σxi² – ((Σxi)²/n)
GKT = 571,87 – (150,97² / 40)
GKT = 571,87 – 569,80
GKT = 2,07
GAKT = Σ((Σxj)2 / nj) – ((Σ xi)2/n)
GAKT = (127,59 + 139,13 + 144,10 + 159,92) – 569,80
GAKT = 570,74 –569,80
GAKT = 0,94
Sonuç:
36/3 SD’li P = 0.01 düzeyindeki tablo F değeri 4,43 olup 10,01>4,43
olduğundan P<0.01 dir.
Ana yaşı grupları arası fark anlamlıdır; ana yaşı doğum ağırlığına
etkilidir.
En az bir grup diğerlerinden farklıdır.
Hangi grupların farklı olduğunu bulmak için ilave testler yapılmalıdır
(çoklu karşılaştırma testleri)
36 SD için tablo değeri hesaplama: (doğrusal interpolasyonla)
0,05 için; 2,92-2,84=0,08 / 10 = 0,008 x 6 = 0,048 + 2,84= 2,89
0,01 için; 4,51-4,31=0,20 / 10 = 0,02 x 6 = 0,12 + 4,31= 4,43
Soru: Kuzular ana yaşına göre değil de rasgele 4 gruba
ayrılsaydı sonuç ne olurdu? (iadeli rasgele örnekleme ile)
Sonuç:
2,28 < 2,84 olduğundan P > 0,05;
Gruplar arası fark önemsiz.
Bütün gruplar aynı populasyonun başka başka
örnekleridir.
Çoklu karşılaştırma testleri
• Gruplar arası fark önemli çıkarsa, “en az bir grup
diğerlerinden farklıdır” denir.
• (bu durumda, ya sadece bir grup diğerlerinden farklı
olabilir, veya her biri bir diğerinden farklı veya bir kısmı
benzer bir kısmı farklı olabilir).
• İlk test bu detayı vermez
• Bunu anlamak için çoklu karşılaştırma testlerinden
birisi (değişik testler var) yapılır
Tukey Testi
T = Q . Sx
• Formülde Q, kitap ekindeki tablodan okunur, kritik değer
demektir, SD’ne göre değişir
(k grup sayısı ve grup içi SD’de α=0.05 yanılma olasılığına göre bulunur)
• Sx gruplar arası farkın standart hatası demektir; aşağıdaki gibi
bulunur
Sx = √ GİKO /n0
Sx = √ 0,0313 /10
Sx = 0,056
• Tablo Q değeri: 3,79 (Örneğimizde 4 grup var ve grup içi serbestlik
derecesi 36)
T = Q . Sx
T = 3,79 . 0,056
T = 0,212
• Tek bir değer bulunur ve bütün ikili gruplar arası
farklar bu değer ile karşılaştırılır
• İki grup ortalaması arasındaki fark bu değere
eşit veya büyükse fark önemli, küçükse önemsiz
kabul edilir.
Harflendirme:
Farklı grupları göstermek için, ortalamamalrın yanına harfler knur.
Aynı harfi taşıyanlar benzer, farklı harfi taşıyanlar farklı demektir.
Başka Bir Harflendirme Şekli
• Ortalamalar, büyükten küçüğe doğru sütunda aşağı
doğru sıralanır
• Ortalamalar arası farklar, T değeri veya en küçük D
değeri ile karşılaştırılır
• Farklılıklara göre ortalamalar yandaki sütunlarda alt
gruplara ayrılır
• Sütun başına konmak üzere her sütun için bir harf
verilir (a, b, c….)
• Sonra ortalamaların yanına bu harfler konur
• Her iki alt grup içinde de yer alanlara iki alt grubun
harfi de verilir (ab, bc, bcd…. gibi)
4,00 -3,80 = 0,20 < 0,212, fark önemsiz, aynı gruba
4,00 -3,73 = 0,27 > 0,212, fark önemli, başka gruba
3,80 -3,73 = 0,07 < 0,212, fark önemsiz, aynı gruba
3,80 -3,57 = 0,23 > 0,212, fark önemli, başka gruba
3,73 -3,57 = 0,16 < 0,212, fark önemsiz, aynı gruba
Khi-Kare Testi
• Sayımla elde edilen ve yüzde ile ifade edilen
verilerin analizinde kullanılır
• İki oran arasında bir fark olup olmadığı; iki olay
arasında bir bağlantı, ilişki olup olmadığı, bir veri
setinin normal dağılıma uygunluğu gibi
konuların araştırılmasında kullanılır.
• Khi-kare testi, belli bir olayla ilgili gözlenen
frekanslar ile beklenen frekanslar arasındaki
farkın anlamlı olup olmadığı temeline dayanır.
• Khi-kare testleri ile elde edilen test istatistiği, Khi-kare
tablosundaki değer ile karşılaştırılır
• Basit Khi-kare analizi için kullanılan formül şöyledir:
χ2 = Σ(f–f‘)2/f’
f gözlenen frekans (araştırmada sayılarak
elde edilen değerler)
f’ beklenen frekanstır (teorik olarak
hesaplanır).
Formülü şöyle de yazabiliriz:
χ2 = Σ (Gözlenen sayı – Beklenen sayı)2 / Beklenen sayı
Khi-kare uygunluk testi (uyum testi); Tek
değişkenli olaylarda Khi-kare analizi
• Bu test ile herhangi bir veri dizisinin bilinen bir
dağılıma uygunluğu araştırılır.
• Gözlenen frekanslar ile beklenen frekanslar arasındaki
farkın anlamlılığı test edilir.
• Aradaki fark anlamlı ise bu dizinin söz konusu
dağılıma uymadığı anlaşılır.
• Bir bölgede görülen salgın hastalıkların mevsimlere
göre dağılımı, bir iş yerindeki iş kazası sayısının aylara
göre dağılımı, vb. konuların araştırılması amacı ile bu
test kullanılır
Örnek
Koyun yetiştiriciliği yapan ve her biri
aynı kapasitede olan beş işletmede
koyun çiçeği vakası tespit edilmiştir.
Sonuçlar Tablodaki gibidir. Çiçek
vakası bakımından işletmeler
arasında bir fark var mıdır?
Beklenen sayılar nasıl hesaplanır?
Yaklaşım; eğer işletmeler arasında bir fark yoksa bütün
işletmelerdeki çiçek sayıları eşit olmalıdır.
Eşit olma durumu, toplam vakanın işletme sayısına
bölünerek ortalaması alınması ile sağlanır
Toplam vaka 70 olup 5’e bölündüğünde 14 elde edilir.
Test istatistiği:
χ2 = Σ(f–f‘)2/f’
χ2 = ((20 -14)2 / 14) + ((12-14)2 / 14) + ((18-14)2 / 14)
+ ((11-14)2 / 14) + ((9-14)2 / 14)
χ2 = (62/14) + (-22/14) + (42/14) + (-32/14) + (-
52/14)
χ2 = 2,57 + 0,29 + 1,14 + 0,64 + 1,79
χ2 = 6,43
Serbestlik Derecesi:
Serbestlik derecesi,
“(satır-1) x (sütun – 1)” şeklindedir
Satır ve sütunların sayılarında sadece
gözlenen frekanslar hesaba katılır.
Burada satır 1 olup 1 çarpan olarak alınır,
sütun 5 tir ve 5-1 = 4 olup SD: 1 x 4 = 4
Sonuçların Değerlendirilmesi:
• Bulduğumuz değer, tablodaki ilgili SD’de P=0,05
değerine karşılık gelen χ2 değerinden büyükse, bizim
P’miz 0,05’ten küçük (P<0.05) olacaktır (gruplar arası
fark anlamlı)
• Bizim değerimiz tablo değerinden küçükse, P>0,05
olacaktır (fark anlamsız)
• Tek değişkenli Khi-kare analizlerinde bunu, “uyum
yoktur” diye yorumlayacağız.
• Örneğimize ait 4 SD ve P = 0,05 düzeyinde tablo χ2
değeri 9.49 dir.
• Bizim değerimiz (6,43) bundan küçük olduğu için
P>0.05 ve“gruplar (işletmeler) arasında bir fark yok,
işletmeler arasında bir uyum vardır” denir
Khi-kare Bağımsızlık Testi (2 x 2 tablosu), İki
değişkenli ve İkişer alt gruplu verilerin analizi
• Bağımsız iki grubun frekanslarını veya yüzdelerini
karşılaştırmak için kullanılır.
• İki olay arasında bir ilişki olup olmadığı
• İki grubun birbirinden farklı olup olmadığı gibi
konularda kullanılır
• Verilerin sayımla elde edildiği durumlarda bu test
kullanılır.
Örneğin sigara içme bakımından kızlar ile erkekler arasında bir fark var mıdır?
Veya sigara içme konusu cinsiyetle ilişkili midir? Cinsiyete bağımlı mıdır? Bir
hastalığa karşı koruma X aşısına bağımlı mıdır? Öğrencilerin fakülte
tercihinde cinsiyet etkili midir? vb. sorular bu yöntemle cevaplanabilir.
Örnek
Bir tavukçuluk işletmesinde New castle
aşısının etkisi araştırılmak istenmiş olsun.
Bunun için işletmedeki aşılı ve aşısız
tavuklar ile ölen tavukların sayıları
aşağıdaki tabloda verildiği gibi
toplanmıştır. Acaba aşı etkili midir?
Ölümler ile aşı yapmama arasında bir
ilişki var mıdır?
Test İstatistiğinin hesaplanması:
χ2 = Σ(f–f‘)2/f’
χ2 = ((100-176,3)2/176,3) + ((300-223,7)2/223,7) +
((2500-2423,7)2/2423,7) + ((3000-3076,3)2/3076,3)
χ2 = ((-76,3)2/176,3) + ((76,3)2/223,7 + ((76,3)2/2423,7)
+ ((-76,3)2/3076,3
χ2 = 33,0 +26,0 + 2,4 + 1,89
χ2 = 63,29
SD = (2-1) x (2-1) = 1
P = 0,05 de Tablo χ2 değeri 3,84
P = 0,01 de Tablo χ2 değeri 6,64 olup
bizim bulduğumuz değer 63,29>6,64
olduğundan P<0.01 dir.
Tavukların ölümü ile aşı yapmama
arasında bir ilişki vardır.
Aşı yapılmayan sürüdeki ölüm oranı
(%9,09) anlamlı şekilde aşı yapılan
sürüdeki orandan (%3,85) yüksektir.
SONUÇ
Khi-kare Bağımsızlık Testi (R x C tablosu), İki
değişkenli, çok alt gruplu verilerin analizi:
• İkiden fazla bağımsız grubun belli bir faktör bakımından
karşılaştırılmasında kullanılır
• Verileri sayımla elde edilmiş olan çoklu gruplar arası farkın
önemi testi denebilir
• Öncelikle gruplar arası farkın önemi araştırılır
• Gruplar arası fark önemli çıkarsa daha sonra hangi grubun
hangisinden farklı olduğunu bulmak üzere ikişerli analizler
yapılır
• Farklı gruplar harfler ile gösterilerek tablo yapılır
• Yapılan iş Duncan vb. çoklu karşılaştırma testlerinde yapılana
benzer
Örnek:
E. coli üremiş 400 adet besi yerine
dört farklı antibiyotik ile antibyogram
yapılmıştır. Sonuçlar aşağıdaki
tabloda verilmiştir. Mikroorganizmaya
etki bakımından antibiyotikler
arasında fark var mıdır? Hangisi
daha güçlüdür?
Test istatistiğinin (Khi-kare değeri)
Hesaplanması:
Khi-kare = 4,500 + 0,205 + 10,669 + 1,667 +
0,200 +6,613 + 0,232 + 0,794 + 3,130 + 6,722
+ 3,956 + 0,002 + 5,239 + 0,136 + 0,409 +
6,125 + 0,003 + 2,927 + 0,600 + 1,800 =
55,928
Serbestlik Derecesi: (4-1) (5-1) = 3 x 4 = 12
Sonuç: 12 SD deki ve P = 0,01
düzeyindeki tablo Khi-kare değeri
26,22 dır
Bulduğumuz değer (55,93) bu
değerden büyüktür.
Bu durumda P<0,01 dir. Yani
antibiyotikler arası fark önemlidir.
Soruda hangi antibiyotik daha
güçlüdür? Sorusunun cevabı için
analize devam edilmelidir
Bu amaçla önce antibiyotiklerin negatif
yüzdelerini (veya pozitifleri) incelersek
kabaca hangi grupların farklı, hangilerinin
benzer olabileceği kestirilebilir.
Muhtemelen A ile B arasında ve C ile D
arasında bir fark yoktur. %20 ve %43
oranlarına sahip iki grubu (A ile C yi)
karşılaştırırsak kısa sürede sonuç
alabiliriz.
O zaman sadece bu iki gruba ait Khi-kare
analizi yapıp değerlerini toplamalıyız
Khi-kare = 4,442 + 0,064 + 7,504 + 0,833 + 0,010 + 4,038 + 0,058 + 6,822 +
0,758 + 0,009 = 24,538
24,538 > 13,28 (4 SD li ve P=0,01 deki Khi-kare değeri)
P<0,01 ve iki grup arası fark önemlidir.
Buradan %20 ile %43 arasındaki farkın anlamlı olduğu ortaya çıkıyor. O taktirde
%17 ile %46 arasındaki fark haydi haydi önemlidir deriz ve onun için analiz
yapmayız.
Dikkat! Beklenen değerler yeniden hesaplanmıştır.
Acaba %17 ile %20 (yani A ile B) arası fark önemli
midir? Ona bakalım:
Khi-kare = 0,135 + 0,207 + 0,839 + 2,123 + 1,540 +0,150 +
0,230 + 0,932 + 2,359 + 1,711 = 10,226
4 SD de P = 0,05 düzeyindeki tablo Khi-kare değeri 9,49
olup 10,23>9,49 olduğundan P<0,05 tir ve fark önemlidir.
Şimdi de C ve D antibiyotiklerini karşılaştıralım
(%43 ile %46):
Khi-kare = 0,060 + 0,002 + 0,093 + 0,332 + 0,234 +
0,066 + 0,002 + 0,103 + 0,366 + 0,257 = 1,516
4 SD de P=0,05 düzeyindeki tablo Khi-kare değeri 9,49
olup 1,52<9,49 olduğundan P>0,05 tir ve fark
önemsizdir.
Sonuç:
A-B, A-C ve A-D; B-C ve B-D arası fark önemli C-D arası fark
önemsizdir. Negatif yüzdelerine (veya pozitif yüzdeleri)
bakarak bir değerlendirme yapılırsa en güçlü antibiyotik B
antibiyotiğidir, A ikinci sırada güçlüdür; C ile D ikisi de gücü az
olan antibiyotiklerdir. Harflendirme yapmak istersek aşağıdaki
gibi yapılır:
a,b,c: Farklı harf taşıyan oranlar arası fark anlamlıdır (P<0.05).
Korrelasyon ve
Regresyon Analizi
Korrelasyon ve Regresyon Analizi
• Biyolojik özellikler çoğu durumda bir birleriyle ilişkilidir;
birinde meydana gelen bir değişiklik diğerini de az veya çok
etkiler.
• İki özellik arasındaki ilişkinin kuvveti özelliklere göre
değişir; % ile ifade edilir
• Örneğin iri cüsseli bir hayvanın canlı ağırlığı da yüksektir
• Aynı ırktan canlı ağırlığı yüksek bir koyundan, daha düşük
canlı ağırlıktaki bir koyuna göre daha fazla yapağı elde
edilir. Yani ağırlık ile yapağı verimi arasında bir ilişki vardır.
• Aynı ırktan 2 yaşlı ineğe göre 6 yaşlı inekten daha fazla süt
elde edilir
• Diğer yandan, renk ile verimler arasında bir ilişki tespit
edilememiştir. Örneğin siyah renkli bir Holştayn ile beyaz
renkli Holştayn arasında süt verimi yönünden bir fark
yoktur.
• İki değişken arasındaki korrelasyon (ilişki)
korrelasyon katsayısı ile belirlenir
• Korrelasyon katsayısı r harfi ile gösterilir
• Korrelasyon katsayısı –1 ile +1 arasında bir
değer alır. Değer 0’a yaklaştıkça ilişki azalır;
mutlak değer olarak 1’e yaklaştıkça ilişki artar.
• 0 dan 0,30’a kadar düşük, 0,30-0,60 arası orta,
0,60 dan yukarısı yüksek ilişkidir
• İlişkinin önem düzeyi n sayısına çok bağımlıdır.
• Sonuçlara güvenebilmek için korrelasyon
analizlerinde çok sayıda veri kullanılmalıdır.
x ve y şeklinde iki değişken arasındaki korrelasyon
katsayısı aşağıdaki formül ile hesaplanır:
r = (Σxy – (Σx)(Σy)/n) / √(Σx² – (Σx)²/n)(Σy² – (Σy)²/n)
r = xy çarpımlar toplamı / √ (x kareler toplamı) (y kareler toplamı)
r = xy ÇT/ √ (x KT) (y KT)
Korrelasyon katsayısının önem kontrolü
Korrelasyon katsayısı önemli mi değil mi?
t = r / Sr
r korrelasyon katsayısı,
Sr korrelasyon katsayısının standart hatasıdır
Sr = √ (1-r2) / (n-2)
Regresyon analizi
İki değişken arasında anlamlı bir ilişki varsa yapılır
Değişkenlerden birinin bir birim değişmesiyle
diğerinin ne kadar değişeceği tahmin edilir
x ve y gibi iki değişkenden y bağımlı, x bağımsız
değişkendir
Regresyon denklemi:
Y = a + byxX
Y = a + byxX
Y, bağımlı değişken
X, bağımsız değişken,
a, sabit sayı (constant) (regresyon doğrusunun y
eksenini kestiği nokta)
byx, y’nin x’e regresyon katsayısı
Regresyon katsayısı, – ve + olmak üzere her
değeri alabilir.
Regresyon katsayısı (byx) aşağıdaki formül ile
hesaplanır:
byx = (Σxy – (Σx)(Σy)/n) / (Σx² – (Σx)²/n)
byx = xy ÇT / x KT
a sabitinin hesaplanması:
a = Y ort. – byx X ort.
Regresyon denkleminin önem kontrolü
İki değişken arasında doğrusal bir ilişki varsa
regresyon doğrusu istatistik olarak önemlidir
H0 = İki değişken arasında doğrusal ilişki yoktur.
Önem kontrolü için varyans analizinden
yararlanılır ve F istatistiği hesaplanır
Varyans analizi tablosu aşağıdaki gibidir.
Serbestlik dereceleri
Genel serbestlik derecesi: n-1 .
Regresyon serbestlik derecesi: 1
Hata serbestlik derecesi: n-2
Regresyon doğrusunun çizilmesi
Regresyon önemli ise iki değişken arasında doğrusal bir
ilişki vardır
Bu durumda regresyon doğrusu çizilebilir
a sabit değeri ve x ve y nin ortalamalarına ait ordinat
noktası kullanılır
Regresyon doğrusu bu iki noktadan geçen doğrudur
Determinasyon katsayısı, R2
X’in Y’yi belirleme derecesi,
Y nin x’e regresyonu incelenirken, x bağımsız
değişkenindeki varyasyonun y nin
varyasyonunun yüzde olarak ne kadarını
belirleyeceğini gösteren bir değerdir
Büyük R nin karesi olarak gösterilir
İki değişken söz konusu olduğunda R2, r nin
karesidir.
Örnek:
Koyunlarda yıllık yapağı verimi (kg) ile koyunun kırkım sonu canlı
ağırlığı (kg) arasında pozitif bir ilişki vardır. Bunun gerçekten
böyle olup olmadığını test etmek üzere aynı ırktan, aynı
cinsiyetten ve aynı yaştan 20 baş koyundan ilgili ölçümler
yapılmış ve aşağıdaki tablodaki gibi bulunmuştur.
a. Yapağı verimi ile canlı ağırlık arasında önemli bir
ilişki var mıdır? Yönü ve miktarı nedir?
b. Regresyon denklemini yazınız
c. Regresyon önemli midir?
d. Regresyon önemli ise regresyon doğrusunu çiziniz.
e. Determinasyon katsayısı kaçtır?
a- Korrelasyon katsayısı ( r ) ve önem
kontrolü:
r = (Σxy – (Σx)(Σy)/n) / √(Σx² – (Σx)²/n)(Σy² – (Σy)²/n)
r = (2117,8 – 2025,9) / √(39935 – 38456)(115,1 – 106,7)
r = 91,9 / √(1479)(8,4)
r = 91,9 / √12446,4
r = 91,9 / 111,6
r = 0,82
Yorum: Yapağı verimi ile canlı ağırlık arasında 0,82 lik
pozitif yüksek düzeyde bir korrelasyon vardır.
Korrelasyon Katsayısının Önem Kontrolü
Sr = √ (1-r2) / (n-2)
Sr = √ (1-0,68) / (20-2)
Sr = √ 0,32 / 18
Sr = 0,13
t = r / Sr
t = 0,82 / 0,13
t = 6,17
Yorum: 18 SD’li P = 0,01 düzeyinde t tablo
değeri 2,88 olup 6,17>2,88 olduğundan P<0,01;
korrelasyon katsayısı önemlidir.
b- Regresyon denklemi
Y = a + byxX
Önce, denklemde yer alan byx (regresyon katsayısı) ve a (sabit)
değerlerini hesaplamalıyız.
byx = (Σxy – (Σx)(Σy)/n) / (Σx² – (Σx)²/n)
byx = xy ÇT / x KT
byx = 91,9 /1479
byx = 0,062
a = Y ort. – byx X ort.
a = 2,3 – 0,062 x 43,9
a = -0,416
Şimdi regresyon denklemini yazabiliriz;
Y = -0,416 + 0,062 X
b- Regresyon önem kontrolü:
Bunun için varyans analizi yaparak gerekli kareler toplamlarını bulmalıyız
Genel Kareler Toplamı (GKT):
GKT = Σy² – ((Σy)²/n)
GKT = 115,1 – 106,7
GKT = 8,40
Regresyon Kareler Toplamı (RKT):
RKT = (Σxy – (Σx)(Σy)/n)2 / (Σx² – (Σx)²/n)
RKT = (91,9)2 / 1479
RKT = 8451 / 1479
RKT = 5,72
HKT = GKT – RKT
HKT = 8,40 – 5,72
HKT = 2,70
Yorum: 18 – 1 SD li P = 0.01 düzeyindeki F tablo değeri 8,29 olup
38,08>8,29 olduğundan P<0,01 ve regresyon önemlidir; ilişki
doğrusaldır.
b- Regresyon doğrusunun çizimi
a sabiti ile x ve y değerlerinin ortalamalarının kesiştiği
noktanın bilinmesi gerekir
Buna göre örneğimizin regresyon doğrusu aşağıdaki şekildeki
gibi çizilir.
İki değişken arasındaki ilişki grafiği
b- Determinasyon katsayısı kaçtır?
R2 nin bulunması:
Korrelasyon katsayısının (0,82) karesi
determinasyon katsayısını verir ki o da 0,68 dir.
Anlamı: X deki varyasyon y deki varyasyonun
%68’ini belirlemektedir.
%32 lik kısım başka faktörler tarafından
belirlenmektedir
Tüm Notları indirmek için: http://veteriner.selcuk.edu.tr/docs/memintekin.rar
Yorum yapabilmek için giriş yapmalısınız.
alman kurdu at baypamun domuzbaşı hastalığı draksin enjeksiyon golden göz hayvan hayvan belgeseli honey bear Inek insan belgeseli kangal Kedi Kediler Keçi kopekler koyun. kulak küpesi kurt kuş köpek köpek serum nasıl verilir küpe küpe no sorgulama küpe sorgulama kısırlaştırma mantar Mastitis muhabbet kuşu pitbull pug rottweiler sibirya kurdu stronghold SİĞİL sımental tavşan TEKNOLOJİ FAKTÖRÜ terrier TR 35 133 9427 tylosin uzay belgeseli veteriner
WP Cumulus Flash tag cloud by Roy Tanck requires Flash Player 9 or better.
Sen birtanesin kardeşim sonunda buldum.
vahşet bir konu olmuş çok güzel…