Biyoistatistik

BU DERSTE NE ÖĞRENECEĞİZ?

Hayvan sağlığı ve hayvansal ürün üretimi ile ilgili

• Veri toplama yöntem ve ilkelerini

• Verilerin ortalamasını ve dağılımını bulmayı

• Verilere dayalı grafik ve tablo yapmayı

• Veriler veya özellikler arasında farklılık olup

olmadığını

• Verilerin bugünkü durumu ve gelecekte

olabilecek değişiklikleri tahmin etmeyi

• Verilere dayalı yorum çıkarma ve fikir

üretmeyi

İstatistik Nedir?

Herhangi bir konu ile ilgili olarak veri toplama, bunları

analiz edip değerlendirme ve sonuç çıkarma olarak

tanımlanabilir.

Genel olarak küçük bir örnek incelenir ve o örneğin dahil

olduğu populasyon hakkında bilgi edinilir.

İhtimaller üzerinde durulur,

matematiksel işlemler yapılır, sonuçlar

kesin olarak değil belli ihtimallere göre

ilan edilir.

İstatistik Nedir?

İstatistik, bir bulgunun tesadüfler ile bağlantısını

araştırır;

olay tesadüf eseri mi öyledir yoksa değil midir?

Bilim dallarına göre farklı

isimler ile ifade edilir;

biyometri/biyoistatistik,

ekonometri, sosyometri gibi

İki kısımda incelenir;

Tanımlayıcı istatistik ve anlam çıkarma istatistiği.

6

İstatistik Nedir?

• “Veteriner fakültesini tercih eden

öğrencilerin %25’i kız öğrencidir”

• “Siyah alaca sığırlarda A

hastalığının görülme ihtimali

Esmer sığırlara göre daha

yüksektir”

• “Beslemenin süt verimine etkisi

vardır”

İstatistik analizle elde edilen bazı sonuçlar:

2

7

İstatistik Nedir?

• “Yapağı kalitesi ırklara göre

değişir”

• “Yumurta veriminde hayvanın

cüssesinin bir etkisi yoktur”

• “İnsanlarda boy ve kilo

arasında bir ilişki vardır”

• “Sigara içenlerin akciğer

kanserine yakalanma ihtimali

daha yüksektir”

İstatistik analizle elde edilen bazı sonuçlar:

8

İstatistiğin Önemi

Araştırmacı kimliği taşıyan

herkes, hangi bilimle

uğraşırsa uğraşsın, yaptığı

araştırmalarda istatistik

kullanmak zorundadır.

İstisnası çok azdır.

Bütün bilim dallarının kullandığı bir araçtır. Sağlık

bilimleri, sosyal bilimler ve fen bilimlerinin

hepsinde istatistik kullanılır.

9

İstatistiğin Önemi

İstatistik olmadan olayların kalıcı, devamlı ve

değişmez nitelikte olup olmadığı ortaya

konamaz.

Her konuda mevcut durumun ve gelecekte neler

olabileceğinin tespiti istatistik metotlarla

mümkündür.

Bilimsel makalelerde

yorumlar istatistik üzerine

bina edilir.

10

İstatistiğin Tarihçesi

• İstatistik ilk çağlardan beri, değişik düzeylerde de olsa,

kullanılmaktadır

• Devletler gelirlerini, askeri varlıklarını, vergilerini, mal ve arazi

varlıklarını belirlemek amacıyla istatistiği kullanmışlardır.

• İlk olarak basit istatistikleri toplayan toplumlar; Mısırlılar,

Çinliler, Asurlular, Babilliler, Yunanlılar ve Romalılardır.

• Osmanlılar nüfus ve toprak kayıtlarını askeri amaçlar için

tutmuşlardır.

Bugünkü anlamda İstatistik çalışmalar,

16. ve 17. yüzyıllarda yapılmış ve

probabilite (İhtimal) teorisi geliştirilmiştir.

11

İstatistiğin Tarihçesi

• Probabilite konusunda meşhur bilginler: Pascal,

Fermat, Bernoulli, Moivre, Laplace, Poisson, Gauss

• Quetelett, biyoloji, tıp ve sosyolojide istatistik metotları

kullanmış; ortalama kavramını geliştirmiştir.

Galton, biyolojide kalıtım,

variyasyon, regresyon ve

korelasyon konularına açıklık

getirmiştir.

Pearson ve Fisher biyoistatistiksel

genetik ve populasyon genetiği

alanında çalışmışlardır.

12

Bazı Kavramlar

Biyoistatistik: İstatistiğin, biyoloji, veteriner, tıp

gibi sağlık bilimlerindeki ismidir.

Populasyon (Kitle, Evren): Aynı özelliğe sahip

bireylerin ya da birimlerin tümü.

Örnek (Örneklem): Bir populasyonu temsil eden

küçük bir grup.

Örnekleme: Örneğin

populasyondan seçilmesi

işlemi.

3

13

Bazı Kavramlar

Araştırma: Bir konu ile ilgili problem oluşturma,

çözüm yollarını planlama, analiz, sonuç

çıkarma, tartışma ve yorumlama çalışmaları.

Ölçme: Araştırma konusu ile ilgili sayısal verileri

elde etme işlemi.

Ölçü (Ölçek): Verilerin elde

edilmesinde kullanılan araçgereç.

14

Bazı Kavramlar

Faktör: Canlının özellikleri üzerine etki yapan çevre

özellikleri (Sıcaklık, nem, cinsiyet, yaş)

Karakter (Özellik): Canlıların herhangi bir özelliği (kilo,

boy, süt verimi).

Denek (Variyant): Populasyon ya da örnekte yer alan

birey/birim.

Değişken: Canlıların veya çevrenin

bireyden bireye, çevreden çevreye az çok

değişebilen her bir özelliğidir (incelenen

faktör ve karakterler).

15

Bazı Kavramlar

Veri (Data): Deneklerden ölçüm ya da sayım ile elde

edilen değer.

Dağılım: Verilerin ortalamanın sağında ve solunda yer

alışları biçimi.

Parametre: Populasyonda incelenen bir özelliğin

ortalaması (μ), variyansı (σ2) ve standart sapması (σ).

İstatistik: Örnekte incelenen

bir özelliğin ortalaması (x) ve

variyansı (s2) ve standart

sapması (s).

16

Veri Tipleri

Sürekli veriler

Ölçümle elde edilirler, kantitatif (miktar/ nicelik belirten)

özelliklerdir. Normal dağılım gösterirler, kesin sınıflara

ayrılmazlar, birbirine geçişlidirler, çevre şartlarından

çok etkilenirler

canlı ağırlık, süt verimi,

yapağı çapı vb.verim

özellikleri gibi.

17

Veri Tipleri

Kesikli veriler

Sayılarak elde edilirler, kalitatif (kalite/nitelik belirten)

özelliklerdir. Normal dağılım göstermezler, kesin

sınıflara ayrılabilir, çevre şartlarından etkilenmezler

Erkek ve dişi sayısı, ikiz-tek sayısı,

laktasyon sayısı, iyileşeniyileşmeyen

sayısı gibi.

18

Veri toplama yöntem ve ilkeleri

Araştırma verilerinden

veya tutulan kayıtlardan

doğru ve güvenilir

sonuçlara ulaşılmalıdır.

Ham veri tam ve sağlam

olmalıdır.

Veriler nasıl olmalıdır?

4

19

Veri toplama yöntem ve ilkeleri

1- Veriler doğru ve güvenilir

olmalıdır (gerçeği

yansıtmalıdır, tekrarlarından

aynı sonuçlar alınmalıdır).

2- Veri eksiksiz olmalıdır.

3- Veriler kullanılabilir ve

ilgililerine yarayışlı olmalıdır.

20

Veri toplama yöntem ve ilkeleri

Veri kalitesini etkileyebilecek

faktörler nelerdir?

1- Veri toplayan kişi

Veri toplayan kişinin ehil olması gerekir.

2- Veri kaynağı, deneme düzeni ve ölçüm

araçları

Veri kaynağı sağlam olmalı, deneme

düzeni amaca uygun olmalı ve ölçüm

araçları doğru ve hassas ölçüm

yapmalıdır.

21

İstatistik Kaynakları

Kayıtlar

Büyük bir kısmı kanunen tutulması zorunlu

kayıtlardır. Nüfus, doğum, evlenme, boşanma,

hastane ve sigorta kayıtları gibi kayıtlar sayılabilir.

Araştırma Enstitüleri, Tarım

İşletmeleri, Fakülte Klinikleri, Tarım İl

Müdürlükleri gibi hayvancılıkla ilgili

kuruluşların tutmak zorunda olduğu

kayıtlar da bizim kullandığımız

kayıtlardır.

22

İstatistik Kaynakları

Sayımlar

Bütün ülke çapında yapılabileceği gibi belirli bir

bölgeyi veya şehri de içine alan sayımlar

yapılabilir (Tarım Sayımı, nüfus sayımı gibi).

Toplumun bütünü hakkında bilgi (sayısı,

yaşları, ağırlıkları gibi) toplamak amacı ile

yapılan sayıma genel sayım denir.

Toplumun bir kesimi hakkında bilgi toplamak

üzere yapılan sayıma özel sayım denir.

23

İstatistik Kaynakları

Populasyon üzerindeki araştırmalar geriye dönük (retrospektif) veya İleriye

yönelik (prospektif) araştırmalar şeklinde olabilir

Örnekler üzerinde deneysel araştırmalar yapılabilir Değişik

faktörlerin canlı özellikleri üzerine etkilerinin araştırıldığı;

genellikle deneme ve kontrol gruplarının bulunduğu

araştırmalardır.

Anketler düzenleyerek araştırma yapılabilir. İncelenecek konunun bütün

detaylarını kapsayan soruların yer aldığı formlar kullanılır ve gerekli bilgiler

elde edilmeye çalışılır

Araştırmalar

Populasyonda oluşan olayları gözlemek

amacıyla, populasyonun tamamını veya

seçilen örneği incelemek veya deney

düzenlemektir.

24

Örnekleme

Populasyondaki herhangi bir özelliğin incelenmesi

amacıyla, populasyondan sınırlı sayıda bir grup

elde edilmesi işlemine “örnekleme”, seçilen

gruba da “Örnek/örneklem” denir.

Popolasyonu incelemek çoğu zaman mümkün değildir. Mümkün olsa bile uzun

zaman alır, pahalıdır, çok fazla insan gücü gerektirir.

Araştırmalar örneklem üzerinde yapılır.

Az masrafla, az iş gücü ile kısa zamanda

gerçekçi sonuçlar alınabilir.

5

25

Örnekleme

Örnekleme niçin zorunlu?

• Para yetersizliği

• Zaman azlığı

• Kalifiye eleman yetersizliği

• Uzun süren veri toplama sürecinde deneklerin yok

olması veya incelenen deneklerin değerini kaybetme

olasılığı

• Populasyondaki örneklerin tümüne ulaşmanın

mümkün olmaması

• Yürütülen hizmetlerin veya devam eden üretimin

denetimi

26

Örnekleme Metotları

Olasılık Kurallarına Dayanmayan Örneklemeler

Kontenjan örneklemesi, Kota örneklemesi; Dilim örneklemesi

(Saha örneklemesi); Monografi; Populasyonu İkiye Ayırma vb.

Olasılıklı Örneklemeler

Piyango yöntemi, Torba yöntemi (İadeli/ İadesiz rasgele çekiliş),

Rasgele sayılar tablosu kullanma

Diğer yöntemler

Çok Kademeli Örnekleme, Tabakalı

(Bölümlü) Örnekleme, Küme

Örnekleme, Sistematik Örnekleme,

Büyüklüğe Orantılı Örnekleme vb.

FREKANS DAĞILIMLARI

Verilerin Sınıflandırılması:

Veri sayısı çok olduğu zaman onları sınıflandırmak yararlı olur

Sınıflandırma belli kurallar içerisinde yapılır.

Bazı tanımlar ve açıklamalar:

Sınıf sınırı: Bir sınıfın üst ve alt sınırıdır; 4-8 sınıfında 4 alt, 8 üst sınırdır.

Sınıf aralığı: İki sınıfın üst veya alt sınırları arasındaki farktır. (4-8), (9-13), …

sınıf aralığı 5 tir.

Sınıf ara değeri: Önceki sınıfın üst değeri ile sonraki sınıfın alt değeri

ortalamasıdır. Burada 8,5 dur.

Sınıf frekansı: Sınıfta kaç eleman olduğu.

Sınıf sayısı: Arka arkaya gelen sınıfların adedidir.

28

Sınıflandırma kuralları:

• Sınıf sınırları kesin olmalı, sınıflar birbirine

karışmamalıdır. Dizideki bir veri sadece bir

sınıfa ait olmalıdır. (4-8), (8-13),… olmaz

• Sınıflandırma bütün değerleri kapsamalıdır.

• Sınıf sayısı yeterli büyüklükte olmalıdır (10 ± 2

kadar).

Örnek: Merinos kuzuların doğum ağırlıklarının

sınıflandırılması

29

Merinos kuzuların doğum ağırlıkları

30

Sınıflandırmanın yapılışı:

• Önce, minimum ve maksimum değerler bulunur.

Örnekte Min.= 3,50 Max.= 4,34 tür.

• Range (dağılım aralığı) bulunur. Range=0,84

• Sınıf sayısının 10 olmasını istediğimizden Range 10’a

bölünür. Sonuç: 0,084.

• Buna göre, sınıf alt sınırı ile üst sınır arasındaki fark

0,08 olarak alabiliriz (80 g’lık aralıklar).

• Bu durumda örneğimizdeki veriler aşağıdaki gibi 10

sınıfta sınıflandırılabilir.

• Sonra her sınıftaki eleman sayısı (sınıf frekansı) tespit

edilir.

6

31

32

33

Kuzu doğum ağırlığına ait histogram grafiği

Histogram, frekans dağılımının sütunlarla gösterilmesidir

34

Frekans Dağılımlarını Tanımlayıcı

Ölçüler:

• 1-Yer gösteren ölçüler (merkez

ölçüleri, çeyrek ve yüzdelikler)

• 2-Yaygınlık ölçüleri (Varyans,

standart sapma, varyasyon

katsayısı, satandart hata, range

ve interquartil range)

35

MERKEZ ÖLÇÜLERİ

36

• aritmetik ortalama, ortanca, tepe değeri,

geometrik ortalama, harmonik ortalama ve

budanmış ortalamadır.

• Bir veri dizisindeki bütün değerler ortalama

etrafında (sağında ve solunda) yığılma eğilimi

gösterirler.

Ortalama, gruptaki bütün değerlerin (varyantların)

alması beklenen değerdir. Bu yüzden ortalama,

örneği (grubu) temsil eden değerdir.

7

37

1- Aritmetik Ortalama (Mean)

• En yaygın olarak kullanılan merkezi eğilim

ölçüsüdür

• Gözlemlerin toplanıp gözlem sayısına

bölünmesiyle elde edilir.

• Normal dağılım gösteren, kantitatif

değişkenlerde hesaplanır.

• Verilerden her biri x, veri sayısı da n olarak

ifade edilir.

AO = Σx / n

38

Örnek:

Bir koyunculuk işletmesinde 2004 yılında

doğan Merinos kuzulardan rasgele

seçilmiş 20 baş tek doğmuş erkek kuzuya

ait doğum ağırlıkları (kg) aşağıdaki gibi

ölçülmüş olsun.

Bu işletmedeki Merinos kuzularının doğum

ağırlığı ortalaması nedir?

39

Tablo 1: Merinos kuzuların doğum ağırlıkları (kg)

40

Ortalama almanın dezavantajları:

• Ortalama dizideki aşırı uçlardan olumsuz

etkilenir.

• Dağılım simetrik değilse, ortalama

gerçeği yansıtmaz.

• Eğer veriler sağa doğru yığılma

gösteriyorsa, ortalama yüksek; sola

doğru yığılma gösteriyorsa düşük

hesaplanır.

41

Ortalamanın bazı özellikleri:

• Ortalamadan sapmaların toplamı sıfırdır

Σ (x-X) = 0

• Bütün varyantlara A gibi sabit bir değer eklense,

bulunacak ortalama eskisinden A kadar fazladır (A

gibi bir değer çıkarı__________lırsa?).

• Varyantlar sabit bir C değeri ile çarpılsa, bulunacak

ortalama eskisinin C katıdır (C değeri ile bölünürse?).

42

2- Medyan (Ortanca)

• Ortalamadan sonra en çok kullanılan

merkezi eğilim ölçüsüdür.

• n adet verinin küçükten büyüğe doğru

sıralanışında ortadaki değerdir.

• Veriler yüzdelik dilimlere ayrıldığında

ikinci dörttebirlik veya %50. değerdir.

8

43

Avantajları:

• Veri dizisindeki aşırı değerlerden veya dağılımın

sağa veya sola çarpık olmasından etkilenmez.

• Dizideki değerlerin %50 si ortancadan küçük

veya ona eşit, %50 si ortancadan büyük veya

ona eşittir.

• Sağa doğru yığılma varsa medyan ortalamadan

küçüktür; sola yığılma gösterirse büyüktür.

• Dağılım simetrik ise ortanca ile ortalama bir

birine çok yakındır.

• Medyanın dezavantajı: Hesaplamada

gözlemlerin rakamsal değerlerinin

önemsenmemesi

44

Medyanın Kullanıldığı yerler ve durumlar:

• Örnekte + veya – yönde büyük

sapmalar varsa

• Bir veya iki ucu açık dağılımlarda

• Örneğe dahil bütün bireylerden veri

toplamak çok uzun zaman alacaksa

45

Nasıl hesaplanır?

1-Veriler küçükten büyüğe doğru sıralanır.

2-n tek sayı ise (n+1)/2. değer ortancadır.

n=9 ise ortanca 5. değerdir

3- n çift sayı ise medyan, sıralamadaki ortada

bulunan iki değerin ortalamasıdır. Yani n/2 ile

ondan sonraki değerin ortalamasıdır.

n=10 ise ortanca 5. ve 6. değerin ortalamasıdır

46

Örnek

Bir laboratuvarda yetiştirilen

kobaylardan rasgele seçilmiş 15

adedinin canlı ağırlıkları Tablo 2’deki

gibi bulunmuş olsun. Kobayların

ağırlık ortancası nedir?

47

48

3- Mod (Tepe Değeri)

• Eskiden beri bilinen ancak çok az kullanılan

bir yöntemdir. Bir veri dizisinde en çok

tekrarlanan değerdir. Değeri medyan ve

aritmetik ortalamadan farklıdır

• Şu nedenlerden pek tercih edilmez:

1- Gözlemlerin çoğu göz ardı edilir

2- Bazı dağılımların hiç modu olmazken

bazılarında birden fazla mod olabilir ( mod

birden fazla ise bu ölçü kullanılmamalıdır).

9

49

Aritmetik ortalama, medyan ve Tepe

değeri ilişkisi:

Dağılım simetrik ise her üç ölçü de yaklaşık

olarak aynıdır TD = Ortanca = X

50

Dağılım sağa çarpık ise, veriler sağa (bize göre sola) doğru

yığılma eğiliminde iseler Mod<Medyan<Ortalama

Dağılım sola çarpık ise, veriler bize göre sağa doğru yığılma

eğiliminde iseler ortalama<Medyan<Mod

51

4- Geometrik Ortalama

zamana bağlı olarak birbirinin katları şeklinde

çoğalan, geometrik artış gösteren değerlerde

(Nüfus artışı veya mikroorganizmaların çoğalması gibi) ortalama

hesaplamak gerektiğinde kullanılır

Hesaplanması:

n tane değerin birbirleriyle çarpımlarının n. kökü

alınarak hesaplanır.

52

Örnek:

Bir mikroorganizmanın uygun bir

besi yerinde 12 saat süre ile

çoğalmasına ait veriler Tablo

4’teki gibi bulunmuş olsun. Bu

mikroorganizmanın ortalama

çoğalma hızı ne kadardır?

53

GO: 119044

X = 1330250

54

5- Harmonik Ortalama (HO)

Belirli sayıdaki değerin harmonik ortalaması, bu

değerlerin terslerinin ortalamasının tersidir.

Bazı özel hallerde, farklı büyüklükteki pozitif sayıların

ortalamasını almada kullanılır. Örneğin varyans analizinin ardından

yapılan çoklu karşılaştırma testlerinde farklı n sayılarına sahip grupların n ortalamasını

bulmada kullanılır

HO = 1/((1/x1+1/x2+….1/xn)/n)

n, veri sayısı

Karşılaştırılacak grupların ortalama n hesabı için,

HO = 1 / ((1/n1+ 1/n2 + …. 1/nk)/k) k, grup sayısı

10

55

Örnek:

Yedi gruplu bir çoklu karşılaştırma testinde

grupların n sayıları 6, 8, 5, 10, 6, 8 ve 7

şeklindedir. Ortalama n sayısını bulunuz.

HO = 1 / ((1/6+ 1/8 +1/5 +1/10+1/6+ 1/8 +1/7)/7)

= 6,82

(Aynı değerlerin aritmetik ortalaması =7,14

n0’ı 7,09 dur.)

56

6- Budanmış Ortalama (Trimmed mean)

Veri dizisinde artı veya eksi yönde aşırı uçlar olduğu

anlaşılırsa, aritmetik ortalama hesaplamak gerçekçi

olmaz.

Medyanın ise aritmetik ortalama kadar değeri yoktur.

Halbuki böyle durumlarda verileri sıralayıp diziden en

küçük ve en büyük değerlere sahip %5’erlik bir

varyantı (toplam %10) dışarı atarak aritmetik ortalama

hesaplamak daha doğru olabilir.

Bu şekilde alınan ortalamaya budanmış ortalama

denmektedir.

[%5 lik kısım hesaplanırken en yakın tam sayıya yuvarlanarak işlem yapılır. %5 lik değer

0,5 ve aşağısı ise hesaplama yapılmaz. Bir başka deyişle veri sayısı 10 ve aşağı

olursa bu ortalama hesaplanmaz, en az 11 veri olmalıdır.]

57

Örnek:

Tablo 2.4’teki verilere göre bu hesaplamayı yapalım.

Burada veri sayısı 15 olup bunun %5’i 0,75 eder. Bu

değeri en yakın tam sayıya yuvarladığımızda 1 elde

ederiz.

Buna göre, en küçük ve en büyük değerlerden 1’er

tanesini (300 ve 1000) dizi dışına atılır.

Geriye kalan 13 tanenin ortalamasını aldığımızda

605,38 buluruz. Bu budanmış ortalamadır.

Bu dizinin medyanı 600 idi; aritmetik ortalaması ise

611’dir.

58

Çeyrek Ve Yüzdelikler

• Çeyrek ve yüzdelikler, dağılımın dörttebirlik yerlerini ve

herhangi bir yüzdelik dilimdeki yerini gösterirler.

• Birinci çeyrek (Q1; quartile 1) sıralamadaki %25.

değerdir. (n+1)/4. değer.

• İkinci çeyrek (Q2; quartile 2) %50. değerdir. 2(n+1)/4.

değer. Bu, aynı zamanda ortancadır.

• Üçüncü çeyrek (Q3; quartile 3) %75. değerdir.

3(n+1)/4. değer.

• İkinci çeyrek ortanca olup merkez ölçüleri içinde

geçer. Dolayısıyla, çeyrek ve yüzdeliklerde daha çok,

1. ve 3. çeyrek kullanılır.

59

Çeyrek ve yüzdelik hesaplaması

Merinos kuzuların doğum ağırlığı değerlerini

kullanabiliriz.

Veriler küçükten büyüğe doğru sıralanır

Birinci çeyrek (90+1)/4 = 22,75. sıradaki değerdir.

Bunun anlamı, Q1 22. sıradaki değerden büyük, 23.

sıradaki değerden küçüktür.

Üçüncü çeyrek ise 3(90+1)/4 = 68,25. sıradaki değerdir

(68 ile 69 arasındadır).

Bu rakamlar tam sayı değildir. Böyle durumlarda

çeyrekleri hesaplamak için interpolasyon denen

yöntem kullanılır.

60

Çeyrek ve yüzdelik hesaplaması

İnterpolasyon formülü (X2 küçük X3 büyük değer olmak üzere)

Q1 = X2+ 0.75 (X3 – X2) (0,75, 22,75’teki virgülden sonrasıdır)

Örneğimizde X2 22. sıradaki değer, X3 ise 23.

sıradaki değerdir; X2 = 3,83 X3 = 3.84

Buna göre Q1:

Q1 = 3,83 + 0.75 (3,84 – 3,83)

Q1 = 3,83 + 0.75 (0,01)

Q1 = 3,83 + 0.0075

Q1 = 3,8375 bulunur.

11

61

Çeyrek ve yüzdelik hesaplaması

Benzer şekilde Q3:

X2 68. sıradaki değer 4,11 ve X3 ise 69.

sıradaki değer olup o da 4,11 dir.

Buna göre Q3:

Q3= 4,11 + 0.25 (4,11 – 4,11)

Q3= 4,11 + 0

Q3= 4,11 bulunur.

62

Yaygınlık

Ölçüleri

63

1- Dağılım Aralığı (Range):

• Min. ile Max. arasındaki farktır.

• İncelenen örnekte;

Min=3,50 kg, Max.= 4,34 kg;

Dağılım Aralığı = 4,34 – 3,50 = 0.84

• Kantitatif veriler için, yaygınlığ_      _______øın basit bir

ölçüsüdür.

• Veri dizisinde aşırı uçlar varsa yaygınlık

olduğundan fazla çıkar.

64

2-İnterquartil Range:

• Sıralanmış gözlemlerin merkezde

bulunan %50’sinin range’dir. Q1 ile

Q3 arası farktır.

• Veri setindeki aşırı uçlardan ve örnek

büyüklüğünden etkilenmez;

kullanışlıdır.

• Bir çok gözlemin göz ardı edilmesi

dezavantajıdır.

65

3- Varyans:

• Gözlemlerin ortalamadan sapmalarıdır.

• Veriler ortalamadan uzaklaştıkça sapma artar

• Verilerin ortalamadan sapmalarının ortalaması, ortalama sapma

olarak kullanılabilir mi?

• Sapmalardaki negatif işaretin etkisi giderilmelidir. (Sapmaların

karelerinin alınması).

• Karesi alınmış bu sapmaların ortalaması varyansı verir.

• Ortalama bulmak için, kareler toplamını n yerine n-1’e bölünür

(Serbestlik Derecesi).

• Eğer tüm populasyon verilerinde çalışıyorsak bölen rakamı

doğrudan N olur

• Örnek varyansı S2, populasyon varyansı σ2 ile gösterilir.

Formül:

66

Varyans:

12

67

Varyans:

68

4-Standart Sapma, S

(Standart Deviation, SD):

• Varyansın kareköküdür

• Varyansın birimi kg2 şeklindedir.

• Standart sapmanın birimi gözlemlerin

orijinal birimiyle aynıdır

Formül:

S = √varyans S=√ ((Σ(x-)2 )/n-1)

İncelenen örnekte S= 0,528.

69

Standart sapmanın özellikleri:

• Veri setindeki bütün gözlemleri

hesaba katan bir ölçüdür.

• Gözlemlerin birimleriyle aynı birimde

ifade edilir.

• Normal dağılım gösteren verilerde

büyük kullanımı vardır.

• Normal dağılım gösteren verilerde S

nın yaklaşık 4 katı range i verir.

70

5-Varyasyon katsayısı (% V):

• Standart sapmayı ortalamanın yüzdesi olarak ifade etmektir.

%V = S / X * 100

• Ortalama büyüdükçe standart sapma büyür. Farklı büyüklükteki

verileri varyasyon bakımından karşılaştırmak S ile zordur,

yanıltıcıdır.

• Varyasyon katsayısı ortalamanın büyüklüğünden etkilenmez

71

6-Standart hata:

•Standart sapmanın örnek büyüklüğünün (n) kareköküne

bölünmesiyle elde edilir. Formül:

Sx = S / √n

• İncelenen bir örnekten hareketle Populasyon ortalamasını

tahmin etmek için kullanılır

•Bir ortalama ile populasyon hakkında bilgi veriliyorsa,

ortalamanın yanında verilmelidir.

X ± Sx şeklinde ifade edilir.

•Standart hata ile populasyon (evren) ortalaması güven sınırları

hesaplanır.

72

Populasyon ortalaması güven sınırları:

• Çoğu zaman populasyon ortalamasını

hesaplamak mümkün değildir.

• Seçilen bir örneğin ortalaması ve standart

hatası kullanılarak populasyon ortalaması

tahmin edilir.

• Populasyon ortalaması güven sınırları:

μ = x ± Sx x t

• μ: Populasyon ortalamasıdır

• t: t tablosundan alınan bir değerdir. Belirli bir

hata ile (α) n-1 serbestlik derecesinde tablo t

değeridir.

13

73

Örnek: (90 kuzuya ait doğum ağırlığı örneği)

• Hata payını %5 alalım (yani α=0,05

olsun).

• Bu seviyedeki ve 89 serbestlik

derecesindeki tablo t değeri 1,99 dur.

Sonuç:

μ =3,96 ± 0,020 x 1,99

3,92 < μ > 4,00

74

Tablo ve Grafikler

Tablo kuralları:

•Kısa, özlü ama kapsayıcı bilgi veren bir başlık

•Kolon ve satır için açıklayıcı başlık, ölçüm birimi (g,

cm, gün vb.)

•Oranlar ile ifade edilen sonuçlarda sayılar da verilmeli

•Özet ön bilgi verme amacında olan tablolarda

ortalama ve güven aralıkları

•Önem dereceleri uygun şekilde belirtilmelidir.

•Karmaşık ve çok detaylı olmamalı

Tablolar, frekans (çetele) tabloları ve çapraz tablolar olmak

üzere iki türlüdür.

75

Tablo 3.1: Merinos kuzuların doğum ağırlığı değerleri

(sınıflandırılmış, kg).

76

Çapraz Tablo:

• İki ya da üç değişkenin birbirlerine

göre durumları ve dağılımlarını

incelemek için yapılır

• Ki kare analizlerinde kullanılan

tablolar böyledir

• Çok faktörlü varyans analizi sonuçları

da bu şekil tablolar ile gösterilir.

77

Tablo 2: Kliniğe getirilen kedilerin yaş ve cinsiyete göre dağılımı

78

Tablo 4: Farklı rasyonlar ile beslenen iki sığır ırkının danalarında

günlük canlı ağırlık artışına ait ortalama ve standart sapmalar (g).

Tablo 3: İki koyun ırkının kuzularında doğum tipi dağılımı

14

79

Grafikler:

Grafik yapma kuralları:

• Grafik karmaşık olmamalı, basit olmalı, gereksiz

süsten kaçınılmalı

• Kısa, özlü ancak kapsayıcı bir başlık olmalı; başlık

kesin ve açık ifadeli olmalı

• Bütün eksenlerin, parçaların ve sütunların ismi veya

anlamı belirtilmeli

• Eksenler üzerinde ölçüm değerleri sade ve abartısız

şekilde verilmeli

• Ekstrem değerleri göstermek için grafikte kesme işareti

kullanılmalı

• Seçilen grafik çeşidi amaçlanan bilgiyi yeterince

sunacak nitelikte olmalı

Grafikte kesme işaretlerinin kullanılması

Kalitatif veriler:

Veriler kategorik olduğunda, her bir

gözlem, sınırları belirgin birkaç

kategori veya sınıftan birine ait olur

Böylece her bir sınıfa düşen bireylerin

sayı ve oranlarını belirleyebiliriz

Bu şekildeki bilgileri pay grafiği veya

bar grafiği ile gösteririz.

1- Bar (Sütun) Grafiği:

Değişkenin her kategorisi bir sütun ile gösterilir

Sabit kalınlıktaki her bir sütunun uzunluğu, kategorideki

bireylerin sayılarını gösterir

Grafik 1: Türkiye yıllık kırmızı et üretiminin türlere göre dağılımı; bar grafiği

2- Pay Grafiği:

• Kategoriler daire dilimleri şeklinde gösterilir

• Her dilim bir kategoriyi veya sınıfı gösterir

• Dilimlerin yanında veya içinde sınıf adı ve değeri

• Dairenin alanı toplam frekansı verir

• Yapılışında yüzdelik değerler 360’a göre oransal

artırılarak açı dereceleri bulunur (Yüzde 55, 360’ta kaç

eder?)

%55 değerine karşılık gelen açı derecesi, (360*55)/100

eşitliği ile 198

%35 için 126

%10 için 36 derece

Grafik 2: Türkiye yıllık kırmızı et üretiminin türlere göre dağılımı; pay grafiği

Grafik 3: Farklı koyun ırklarının doğum ve kısırlık oranları, yan yana sütun

Grafik 4: Farklı koyun ırklarının doğum ve kısırlık oranları, üst üste sütun

Kantitatif veriler:

• Ham verilerin tamamı bir nokta grafik

şeklinde gösterilebilir

• Histogram ile verilerin bir özeti sunulabilir

• Yapılan analizler sonucunda elde edilen

ortalama değerler grafikle gösterilebilir

• Bunlar için çeşitli grafik yöntemleri vardır

1-Nokta Grafiği (dotplot):

• Veri sayısı az olduğunda ham verilerin tamamının dağılımı

nokta grafikle sunulabilir

• Tek bir kantitatif değişken varsa gözlemler bir çizgi üzerinde

nokta şeklinde gösterilebilir

• İki veya daha fazla gruptaki gözlemleri karşılaştırmak

istediğimizde grupları x ekseninde, değişkenin ölçüm değerlerini

y ekseninde gösteren bir nokta grafiği yapılabilir

• Her gruba ait veriler dikey olarak noktalar şeklinde görünür.

2- Histogram:

• Histogram ile kantitatif verilerin frekans dağılımları

gösterilir

• İki eksenli bir grafiktir; yatay eksen ölçüm değerlerinin

sınıflarını, dikey eksen frekansları gösterir

• Her sınıf aralığının üzerindeki dikdörtgenlerin alanı

sınıfların oransal frekanslarını gösterir (Aralıklar eşit

genişlikte ise, dikdörtgenin yüksekliği oransal frekansları gösterir)

• Aralıklar eşit değilse, dikdörtgenin yüksekliği değil alanı

önem kazanır

• Bu durumda dikdörtgenin kapsadığı alan frekansı

gösterir.

• Bar grafiğe benzer. Ancak bar grafikteki dikdörtgenler

birbirinden ayrı iken histogramda birbirine bitişiktir

3-Gövde Yaprak Grafiği (stem and leaf):

• Histogramın bir benzeridir, frekans dağılımlarını

gösterir

• Histogramdaki dikey dikdörtgenler yerine

burada yatay rakam dizileri vardır

• Bilgisayarlarda paket programlarda elde edilir

• Gövde (stem) gözlemlerin çekirdek değeridir

(rakamın virgülden önceki kısmı)

• Yaprak (leaf) her gözlem için ayrı olmak üzere,

virgülden sonraki rakamlardır

Kuzu doğum ağırlıklarına ait gövde-yaprak grafiği; N=90; Yaprak ünitesi = 0.01

4- Kutu-bıyık grafiği (box and whisker plot):

• Bu da bilgisayar çıktılarında elde edilen bir grafik

türüdür

• Veri setinin tamamının dağılımını değil de özet

dağılımını gösterir

• Değişkenin ölçülerinin derecesi dikey olarak gösterilir

• Kutu, verilerin %50 sini içine alan birinci dörttebirlik ile

üçüncü dörttebirlik arasını gösterir

• Kutunun içindeki yatay çizgi medyanın yerini belirtir

• Kutudan çıkan dikey çizgiler ise bıyıklardır ve %2,5.

değer ile %97,5. değer arasını gösterir

5- Saçılma Grafiği (scatter plot):

• İki kantitatif değişken arasındaki ilişkiyi

göstermek için yapılır

• Her biri bir değişkeni gösteren iki boyutlu

bir grafiktir

• Örneğin besi kuzularında göğüs çevresi ile

canlı ağırlık arasındaki ilişki

• yapağı verimi ile cüsse arasındaki ilişki

gibi.

6- Çizgi Grafiği:

• Bir değişkenle ilgili zamana bağlı

değişmeleri göstermek için kullanılır

• Aynı zamanda, farklı grupların, bir konuda

değişen şartlara bağlı değişim ve seyirlerini

incelemek için de çizilir

• Daha çok özetlenmiş veriler (örneğin

ortalamalar) kullanılarak bu eğriler çizilir

DAĞILIMLAR

Probabilite (İhtimal, Olasılık)

• Örnek verilerini kullanarak populasyon

hakkında yorumlar yapmak isteriz.

• Örnek verilerine dayanarak populasyon

hakkında yapılan yorumlar belirli ihtimallere

göredir.

• Buna Probabilite veya ihtimal denir.

• Probabilite, istatistiksel anlam çıkarmanın

temelini oluşturur.

• Probabilite ve temel teorik dağılımlar bundan

sonraki kısımlara temel oluşturacaktır.

Probabilite (İhtimal, Olasılık)

Probabilite nedir?

• Tarafsız şekilde bir para atılsın. İki eşit sonucu vardır;

yazı / tura

• Bu örnek, ½ = 0,5 ihtimalli olaylara örnektir.

• Benzer şartlarda bir olayı çok tekrarlayarak elde edilen

sonuçları kaydettiğimizde, alınan sonuçlar

birbirlerinden az çok farklılık gösterirler ve bunların bir

dağılımı elde edilir.

• Bu tip dağılımlara probabilite (ihtimal) dağılımları denir.

• Probabilite, relatif frekans veya oran olarak tanımlanır

ve rakamsal değeri 0 -1 arasındadır.

İhtimal Dağılımları

• Daha önce, deneysel frekans dağılımlarını gördük

(kuzu doğum ağırlığı).

• Diğer bir dağılım şekli ihtimal dağılımlarıdır.

• Birçok ihtimal dağılımı vardır (tesadüf değişkeninin kesikli

veya sürekli oluşuna göre değişir).

Bir kesikli değişkenin iki muhtemel sonucu varsa bunlar

binomial dağılımları oluşturur.

Kesikli değişkenlere ait diğer bir dağılım şekli ise poisson

dağılımıdır.

Sürekli değişkenlere ait çeşitli dağılımlar vardır; bunların

temelini normal dağılım oluşturur.

Kesikli Değişkenlere

Ait İhtimal Dağılımları

Binomial Dağılım

• Verileri sayımla elde edilen ve sonuçların ikili olduğu

özelliklerin dağılımıdır.

• Olayın sadece muhtemel iki sonucu vardır: Evet-hayır,

ölü-sağlam, erkek-dişi, var-yok gibi.

• Binomial dağılım ile Poisson dağılımı birbirine benzer.

• Farkı: Bir olayın oluş ihtimali (p) büyük, olay sayısı (n)

küçük olduğunda binomial dağılım; olayın oluş ihtimali

küçük, n büyükse poisson dağılımıdır.

• Binomial dağılım kullanarak, sağlık bilimlerinde bazı

ihtimal hesapları yapılabilir.

Binomial Dağılım

Örnekler:

• Türkiye’deki Holştayn sığırların IBR pozitifliği. IBR

pozitif oranı 0,30 olsun, buna p denir.

• Bu bilgi, daha sonra incelenecek olan herhangi bir

Holştayn sürüde bu hastalığın ne kadar olması

beklendiği şeklinde kullanılabilir.

• Bir ilaç düşünelim ki bu ilacın belirli bir iyileştirme

yüzdesi (ihtimali) vardır.

• Bu ilacı kullanarak yaptığımız bir tedavide % kaç

bireyin iyileşeceğini tahmin etmek için binom dağılımın

özelliklerinden yararlanırız.

• Bir hastalıktaki ölüm ihtimalini kullanarak, bu hastalığa

yakalananların ne kadarının ölme ihtimali bulunduğu

binom yaklaşımı ile hesaplanabilir.

Binomial Dağılım

Dağılım

• Binom dağılımda, bir tesadüf değişkeninin, her

biri başarı veya başarısızlıkla sonuçlanan n tane

bağımsız deneyi yapılabilir.

• Deney sonucunda, başarı (p) ve başarısızlık

(1-p = q) olmak üzere n+1 tane muhtemel

sonuç çıkar.

• Yapılan deneylerden 1, 2, 3, …. n tane başarı

veya başarısızlık olabilir.

• Sonuçların başarı ve başarısızlık arasındaki

dağılımı binomial dağılımı verir.

Başarının, gerçek başarı ile bir ilgisi var mı?

Binomial Dağılım

Binom dağılımda;

Ortalama, x = np,

Varyans, S2 = npq,

Standart sapma, S = √npq

Ortalama ile varyans ilişkilidir. Varyans

ortalamanın q katıdır.

Hem ortalama hem de varyans n’e bağlıdır;

n büyüdükçe ortalama ve varyans büyür.

Binomial Dağılım

Mendel kalıtımı ile ilgili bir örnek verelim

Angus ırkı sığırlar homozigot siyah renkli (BB), Angler

ırkı sığırlar ise homozigot kırmızı renkli (bb), bunların

F1 melezleri ise siyah renkli görünümde ancak

heterozigot (Bb) genotipindedir.

B ve b genlerini taşıyan iki eşeysel hücrenin birleşmesi ile

oluşacak F2 yavrularının ihtimali;

genotip olarak, BB = 0,25, Bb = 0,50 ve bb = 0,25;

fenotip olarak, siyah = 0,75, kırmızı = 0,25 (ikili durum)

Özet: Bu bireylerin oluşturduğu populasyonda siyahlık

ihtimali %75, kırmızılık ihtimali %25 tir.

Binomial Dağılım

Binom dağılımda ihtimal hesaplamasında kullanılan

formül:

n!

P(r) = pr qr’

r! r’!

Formülde:

n, toplam olay sayısı

r, istenen olayın oluş sayısı

r’, istenmeyen olayın oluş sayısı, n-r

p, istenen olayın oluş ihtimali

q, istenmeyen olayın oluş ihtimali, 1-p

!, faktöriyel işaretidir

Binomial Dağılım

Problem:

Yukarıdaki iki ırkın melezlenmesi ile elde edilen

F1 ebeveynlerden doğacak 4 buzağının, değişik

sayılarda siyah olma ihtimallerini hesaplayalım:

Binom dağılımda ihtimaller, (p+q)n binomunun

terimlerine karşılık gelir. (p+q)n = 1 dir.

Örneğimizde n = 4, P = 3/4, q = 1/4 olduğu için;

(3/4+1/4)4 = 1(3/4)0(1/4)4 + 4(3/4)1(1/4)3 + 6(3/4)2(1/4)2 +

4(3/4)3(1/4)1 + 1(3/4)4(1/4)0 =1

Çözümler ve sonuçlar aşağıdaki tablodadır

Binomial Dağılım

Birinci terimin çözümü:

4! =4.3.2.1=24 0!=1 24/24=1 (3/4)0=1 (1/4)4= 1/256

1 . 1/256 = 1 / 256

Binomial Dağılım

4 buzağının siyah olma ihtimalleri:

Hiçbirinin siyah olmaması ihtimali, %: 0,39

1 tanesinin siyah olması ihtimali, %: 4,69

2 tanesinin siyah olması ihtimali, %: 21,09

3 tanesinin siyah olması ihtimali, %: 42,19

4 tanesinin siyah olması ihtimali, %: 31,64

Binomial Dağılım

Bu sonuçlardan hareketle farklı problemler oluşturulabilir:

1- Melezlemede en fazla 3 buzağının siyah olma ihtimali

nedir?

En fazla dendiği için 0, 1, 2 ve 3 buzağı siyah olabilir

demektir (ihtimaller toplanacaktır).

Sonuç:

0,39 + 4,69 + 21,09 + 42,19 = %68,36

2- En az 1 siyah buzağı olma ihtimali nedir?

4, 3, 2 ve 1 buzağı siyah olabilir demektir (ihtimaller

toplanacaktır)

Sonuç:

4,69 + 21,09 + 42,19 + 31,64 = %99,61

Binomial Dağılım

İncelediğimiz örnekte;

X= np = 4 x 0,75 =3

S2 = npq = 4 x 0,75 x 0,25 = 0,75

S = √npq = √0,75 = 0,866

Binomial Dağılım

Binomial dağılım şekil olarak nasıldır?

Her birinde 4 buzağı doğan 50 melezlemede bu

renk incelemesini yaptık varsayalım

Sonuçlar aşağıdaki tablodaki gibi olsun

Teorik frekanslar toplam sayının ilgili sınıfın

ihtimali (p) ile çarpılması ile elde edilir.

Örneğin 0 sınıfı için teorik frekans, 50 x 0,0039 = 0,20 bulunur.

Binomiyal dağılımın şekli p’ye bağlıdır (P=1/2 ise

dağılım simetriktir. P<1/2 ise dağılım sağa

çarpıktır, P>1/2 ise eğri sola çarpıktır)

Binomiyal dağılım grafikleri çubuk şeklindedir

Binomial Dağılım

Binomial Dağılım

P > ½ ve dağılım sola çarpık

Poisson Dağılımı

• Binom dağılım gibi, tabiattaki ikili olayların dağılımıdır.

• Az rastlanan olaylarda ihtimal hesaplamak için kullanılır

(Olayın oluş ihtimali az ise, yani p küçük n büyükse binom dağılımı yerine Poisson

dağılımı geçerlidir).

• Binom dağılımda n büyük p küçük olduğunda p(r) lerin

hesaplanması zorlaşır.

• Bu nedenle, Poisson dağılımı olarak binomdan farklı bir

fonksiyon geliştirilmiştir.

• Bu fonksiyonu Fransız matematikçi Poisson geliştirmiştir.

• Sağlık bilimlerinde de kullanılan bir yöntemdir.

• Poisson dağılımına uyan olaylar (binomial dağılımdan farklı olarak),

olayın oluş ihtimali ile değil ortalama sayısı ile tanımlanır.

• Sonuçlar her iki dağılım şeklinde de oransal olarak ifade edilir

(“şu olayın olma ihtimali % şu kadardır” gibi).

Poisson Dağılımı

Poisson dağılımının ortalaması ve varyansı birbirine eşittir (sadece

tek bir parametresi vardır; ortalama)

Ortalaması bilinen bir poisson dağılımı belirlenebilir.

Poisson dağılımının;

Ortalaması, X = np,

Varyansı, S2 = np

Standart sapması, S = √np

Eğer dağılımın P si bilinmiyor dağılım tablosu (sınıf (s), frekanslar

(f) ve n sayısı biliniyorsa ortalama;

X = Σs.f /n

Poisson Dağılımı

Poisson dağılımı ile ihtimal hesaplamasında

aşağıdaki formül kullanılır:

xr

P(r) = e –x

r!

x, aritmetik ortalama,

r, istenen olayın oluş sayısı,

e-X, kitap ekindeki üstel fonksiyonlar tablosundan alınan

değerdir. e, tabii logaritma tabanı olup 2,718 dir

Poisson Dağılımı

Poisson Dağılımı

Değişik ihtimaller arasında aşağıdaki gibi bir

ilişki vardır:

P(0) = (0/ 0!) 2,718 -x

P(1) = (1/ 1!) 2,718 -x = x P(0)

P(2) = (2/ 2!) 2,718 – x = x /2 P(1)

P(3) = (3/ 3!) 2,718 -x = x /3 P(2)

P(n) = (n/ n!) 2,718 -x = x /n P(n-1)

Poisson Dağılımı

Örnek:

Merinos koç ve koyunlarda boynuz görülmesi ihtimali.

Konya Hayvancılık Araştırma Enstitüsü’nde yetiştirilen

500 başlık Merinos sürüsünde her yıl birkaç tane

kuzuda boynuz geliştiği ve bunun yıllara göre

ortalaması 3 olsun. 2006 yılında doğacak kuzulardan

0-5 tanesinin (0, 1, 2, 3, 4 veya 5) boynuzlu olması

ihtimalleri nelerdir? e-3 değeri 0,05 tir (kitap ekinden)

Poisson Dağılımı

Çözüm:

Sıfır boynuzlu ihtimali; P(0) = (30 / 0!) 0.05 = 1x 0,05 = 0,05

Bir boynuzlu ihtimali; P(1) = x P(0)= 3 x 0,05 = 0,15

İki boynuzlu ihtimali; P(2) = x/2 P(1)= 3/2 x 0,15 = 0,225

Üç boynuzlu ihtimali; P(3) = x/3 P(2)= 3/3 x 0,225 = 0,225

Dört boynuzlu ihtimali; P(4) = x/4 P(3)= 3/4 x 0,225 = 0,169

Beş boynuzlu ihtimali; P(5) = x/5 P(4)= 3/5 x 0,169 = 0,101

Toplam p = 0,92

6 ve daha fazla olma ihtimali; P(6≤) = 1 – 0,92 = 0,08

Poisson Dağılımı

En fazla 2 kuzunun boynuzlu olma ihtimali nedir?

0, 1 ve 2 nin ihtimalleri toplanacaktır.

P(0) + P(1) + P(2) = 0,05 + 0,15 + 0,225 = 0,425

Sonuç: %43

Bir veya iki boynuzlu kuzu olması ihtimali nedir?

1 ve 2 nin ihtimalleri toplanacaktır.

P(1) + P(2) = 0,15 + 0,225 = 0,375

Sonuç: %37,5

Poisson Dağılımı

Poisson dağılımının grafiksel olarak

gösterilmesi

Bu işletmede 20 yıllık kayıtları incelediğimizi

ve boynuzlu kuzu sayılarını aşağıdaki

tablodaki gibi bulduğumuzu varsayalım.

0-5 arasında boynuzlu kuzu olma

ihtimallerine göre ilgili frekanslar tabloda

verilmiştir.

Tabloya göre frekans dağılımının şeklini

görelim.

Poisson Dağılımı

Poisson Dağılımı

Ortalama (x), standart sapma (s)

ve ihtimal (P)

İncelenen örnekte n=200 ortalama 3,2 bulunmuştur.

Buna göre probabilite (P);

X = np, 3,2 = 200 P ve P = 3,2/200 = 0,016 şeklinde

bulunur. Sürüde boynuzluluk ihtimali; %1,6 dır.

Standart sapma,

S= √np = 3,2 = 1,79

132

İhtimal

Dağılımları

Sürekli Değişkenlere

ait İhtimal

dağılımları

Kesikli ve sürekli değişkenler arasındaki ilişki

Kesikli değişkenlerin az sayıda sınıfı vardır ve sınıflar arasında geçiş yoktur;

sürekli değişkenlerin sınıfı çoktur ve sınıflar geçişlidir

Kesikli değişkenlerde sınıf sayısı arttıkça dağılım normal dağılıma benzer

Aşağıdaki şekiller bunu göstermektedir.

Kesikli ve sürekli değişkenler arasındaki ilişki

On yedi sınıfı olan kesikli değişkene ait dağılım

Kesikli ve sürekli değişkenler arasındaki ilişki

Bir sürekli değişkene ait ihtimal sıklığı fonksiyonu

NORMAL DAĞILIM

NORMAL DAĞILIM

18. yy.’da Alman Matematikçi Gauss tarafından geliştirilmiştir

(Gausiyan dağılım)

Normal dağılım, sürekli dağılımlar içinde en önemlisidir

(analizlerde en çok kullanılanıdır).

Normal dağılım teorik bir dağılımdır.

Farklılıkları tesadüften başka bir nedene dayandırılamayan

varyantların dağılımıdır.

Daha önce incelediğimiz 90 kuzunun, aynı ırktan, aynı cinsiyetten,

aynı doğum tipinden ve aynı ana yaşına sahip kuzular olduğunu

düşünürsek bunların oluşturduğu populasyon bir normal

populasyondur ve canlı ağırlık dağılımları da normal dağılım

gösterir.

Normal dağılım gösteren değişkenler genellikle ölçümle elde

edilirler (canlı ağırlık).

Sayımla elde edildiği halde normal dağılım gösteren özellikler de

olabilir (yumurta sayısı).

NORMAL DAĞILIM

Normal Dağılımın Özellikleri

• Ortalama (μ) ve standart sapma (σ) olmak üzere iki

parametresi ile tanımlanır.

• Unimodal (tek modlu) bir dağılımdır.

• Ortalamaya göre simetriktir; sağ taraf sol tarafın ayna

imajıdır, çan eğrisi şeklindedir. Verilerin %50’si

ortalamadan geçen dikey doğrunun sağında, %50’si

solunda yer alır.

• Normal dağılımda ortalama, mod ve medyan birbirine

eşittir.

• Normal dağılım sağa veya sola çarpık değildir.

Çarpıklık (skewness) katsayısı sıfırdır. Sıfırdan küçük

değerler sola, büyük değerler sağa çarpıklığı gösterir.

Normal dağılım ne diktir ne basıktır. Diklik katsayısı da

0 dır. Diklik katsayısının negatif değerleri normalden

dikliği, pozitif değerleri de basıklığı gösterir.

Normal Dağılımın Özellikleri

• μ ± 1σ verilerin %68.26’sını, μ ± 2σ %95.44’ünü, μ ±

3σ ise %99.74’ünü içerir.

• Ortalama sabit olup standart sapma değişirse eğriler

dikey olarak yükselir veya alçalır. Örneğin σ azalırsa

eğri dik, uzun ve ince olur, σ artarsa basık, kısa ve

şişman olur.

Normal Dağılımın Özellikleri

• Standart sapma sabit olup ortalama değişirse, eğriler

yatay olarak, ortalama artarsa sağa, azalırsa sola

doğru kayar

• Normal dağılım, – sonsuzdan + sonsuza kadar bütün

değerleri belirli oranlarla veya ihtimallerle kapsar.

Standart Normal Dağılım; Standart Normal Sapma (SNS)

Z Dağılımı

• Ortalaması sıfır (0) standart sapması bir (1) olan

normal dağılıma standart normal dağılım denir.

• Ortalaması ve standart sapması ne olursa olsun,

bütün normal populasyonları belirleyen bir dağılımdır;

z dağılımı da denir.

• Bir değişkenin herhangi bir değerinin (x1) ihtimalini

hesaplamak için z değerleri hesaplanır

• İncelenen değişkenin ortalaması (μ) ve standart

sapması (σ ) bilinmelidir.

• Elde edilen z değeri, standardize edilmiş normal

sapma (SNS) ismini alır.

Z Dağılımı

SNS Formülü:

z = (x – μ ) / σ

x1 değerine karşılık gelen z1 değeri

z1 = (x1 – μ) / σ

Z Dağılımı

• İstenen alanı belirlemek için, z tablosu kullanılır.

• Standart normal dağılım, simetrik olduğu için, sağa

doğru z1’e kadar olan kuyruğun alanı, sola doğru –

z1’e kadar olan kuyruğun alanına eşittir.

• Eğrinin bir tarafının alanı 0,50 olup iki tarafın toplamı 1

eder.

• Z tablosunda sıfırdan z’ye kadar olan alanlar

(probabiliteler, P) verilmiştir.

• Z nindışında kalan alanı hesaplamak için, tablodan

okunan oran, 0,50 den çıkarılır.

Z Dağılımı

Z Dağılımı

Teorik frekansların hesaplanması

• 90 baş kuzu d.ağ. örneğinde μ = 3,96 ve σ = 0,19 idi.

• Verilerin birinci sınıfı 3,50 den küçük varyantları kapsar

• Birinci sınıfın z değerinin hesaplanması (x olarak sınıf ara

değeri kullanılır)

• z = (3,495 – 3,96) / 0,19 = -2,45 tir.

• Bu değerin karşılık geldiği alan z tablosundan 0,4929 olarak

okunur.

• 0,4929 değeri, ortalamadan z’ye (-2,45) kadar olan alanı verir.

• Biz 3,50 den küçüklerin frekansını hesaplayacağımız için, 0,50

den bu değer çıkarılır.

• 0,50 – 0,4929 = 0,0071 bulunur (binde yedi ihtimal).

• Bu oran, 3,50 den aşağıda değer gösterenlerin dağılımda

bulunma ihtimalidir.

• 90 kuzuda bu alana girenlerin teorik frekansı 90 x 0,0071 =

0,64 tür (yaklaşık yarım kuzu).

Z Dağılımı

İkinci sınıfın z değeri,

• z = (3,585-3,96)/0,19 = -1,97 olup alanı 0,4756 dır.

• İlgili alan, bu z değerinin alanı ile bir alt sınıfın z

değerinin alanı arasındaki farktır:

• 0,4929 – 0,4756 = 0,0173.

• 90 kuzuda bu alana girenlerin teorik frekansı 90 x

0,0173 = 1,56 dır.

• Aynı şekilde, en son sınıfın ve sondan bir önceki

sınıfın alanları da bulunur.

• Son sınıfın net alanı 0,50-0,4890 = 0,011;

• Sondan bir önceki sınıfın alanı 0,4890-0,4656 =

0,0234 dir.

• Bu şekilde ortaya doğru gelinir.

Z Dağılımı

• Ortalamanın bulunduğu sınıfların net alanını

bulurken, 0 dan z’ye kadar olan alan bu

alanlara eklenir.

• Ortalama ile alt gerçek sınır (3,945) arasındaki

alan 0.0319 olup bir önceki alanla toplandığında

0,1769 + 0.0319 = 0,2088 bulunur.

• Ortalama ile üst gerçek sınır (4,035) arasındaki

alan 0,1517 olup bir önceki alanla toplandığında

0,1561 + 0.1517 = 0,3078 bulunur.

• Net alanların toplamının 1 etmesi ve frekans

toplamlarının da toplamı n’i vermesi gerekir.

Z Dağılımı

Z Dağılımı

90 kuzunun doğum ağırlığına ait frekans dağılımı grafiği

Z Dağılımı

Problem 1

• Beş aylık yaştaki Akkaraman besi kuzularında göğüs

çevresi ortalaması 75, standart sapması 2 cm olsun

• 77 cm ve daha yukarı değer gösteren kuzuların bu

dağılımda (Akkaraman kuzu populasyonunda) olma

ihtimali nedir?

Çözüm 1

Önce z değeri hesaplanır

x1 = 77 cm olduğuna göre, buna karşılık gelen z1 değeri;

z1 = (77 –75) / 2 = 1,0 bulunur.

Sonra z tablosundan bu z değerine karşılık gelen P

değeri bulunur.

Çözüm 1

* Bu da 0,3413 tür.

* Biz 77 ve daha büyük olanlar ile ilgileniyoruz;

bu değer 0,50 den çıkarılır;

* 0,50 – 0,3413 = 0,1587 (0,16 şeklinde

yuvarlanabilir)

* 77 cm ve daha yüksek göğüs çevresine sahip

kuzuların Akkaraman populasyonuna ait olma

ihtimali %16 dır denir.

* Veya bu populasyonda 77 cm ve üzerinde

olanların oranı %16 dır denir.

Problem 2

• Bu populasyonda 72-76 cm arasında değere sahip

olanların yüzdesi nedir?

Çözüm 2

• Burada iki tane z değeri hesaplanır;

• z1= (72-75)/2 = -1,5

• z2= (76-75)/2 = 0,5

• z1’e karşılık gelen tablo değeri 0,4332

• z2’ye karşılık gelen tablo değeri 0,1915 tir.

• iki değer toplanır; p= 0,4332 + 0,1915 = 0,6247

(Yuvarlak %63)

• Sonuç: Ppopulasyonda 72-76 cm arasında değere

sahip olanların oranı %63 tür.

Bilinen bir probabiliteden SNS hesaplanması:

• Belirli bir p değeri için z değerini ve dolayısıyla

bu z değerine karşılık gelen x değerini bulma

işlemidir.

Problem3

• Yukarıda ortalaması ve standart sapması

verilen dağılımda verilerin merkezde bulunan %

50 si hangi değer sınırları içerisindedir?

Bilinen bir probabiliteden SNS hesaplanması:

Çözüm 3

• Merkez dendiği için ortalamadan sağa ve sola doğru

bulunan değerler hesap edilecektir.

• Verilen p değeri ikiye bölünmelidir; 0,50/2= 0.25 olur.

• Buna karşılık gelen bir +z bir de –z değeri

hesaplamalıyız.

• Bunlar z tablosundan bulunur; 0,25’e en yakın alan

0.2486 dır ve z değeri 0.67 dir.

• Z = (x-μ) /σ formülü ile; 0.67 = (x – 75) / 2 eşitliği yazılır

• x1 = 2 x 0.67 + 75 = 76.34 cm

• x1 = 2 x 0.67 – 75 = 73.66 cm bulunur.

• Sonuç: Bireylerin merkezdeki %50’si 73.66-76.34 cm

değerleri arasında göğüs çevresine sahiptir.

Bilinen bir probabiliteden SNS hesaplanması:

Normalliğin Tespit Edilmesi; Normalite Testi

Bilgisayar aracılığı ile

1- Verilerin deneysel frekans dağılımlarına ait histogram grafiği

yapılır; dağılım çan şeklinde ve simetrik olmalıdır.

2- Normalite grafiği (normality plot) yapılır; grafikte eğri doğrusal

bir çizgi şeklinde olmalıdır.

3- Shapiro-Wilk W, Anderson-Dorling, Kolmogorow-Simirnov

testlerinden birisi yapılır; P>0.05 olmalıdır.

4- Simetri ölçüsü olan çarpıklık (skewness) ve diklik-basıklık

(kurtosis) katsayıları hesaplanır. Her ikisinin katsayısı da sıfıra

yakın olmalıdır.

Hesap makinesi veya bilgisayar ile;

Verilerin %68.26’sının X ± 1S sınırları içinde olup olmadığı

hesaplanır.

Hipotezler

Hipotezler

• Gruplar arası farkın önemli olup olmadığını

araştıran testlerde kullanılır.

• Bunlara hipotez testleri de denir.

• Hipotez, bir önyargı veya ön kabul demektir

• Başlangıç hipotezini test ederken bunun yerine

geçecek olan hipotez de belirlenir.

• Bir hipotez testinde iki tip hipotez vardır;

1- Sıfır hipotezi (başlangıç hipotezi)

2- Alternatif hipotez.

• Sıfır hipotezi (H0) farksızlık hipotezi veya

eşitlik hipotezidir; H0: μ1 = μ2

• Sıfır hipotezi her araştırmada aynıdır,

tektir.

• Alternatif hipotez (H1), sıfır hipotezi

reddedilince onun yerine geçecek

hipotezdir.

• Alternatif hipotez tek değildir; iki türlüdür,

1- İki yönlü

2- Tek yönlü

• İki yönlü hipotez, sıfır hipotezinin zıttı

olarak iki ortalama birbirine eşit değildir

şeklinde kurulur.

μ1 ≠ μ2 veya μ1 – μ2 0

• Tek yönlü hipotez, gruplardan birinin

ortalamasının diğerinin ortalamasına göre

küçük veya büyük olduğu kabulüne

dayanır;

μ1 < μ2 veya μ1 > μ2

• Testin sonunda; H0 kabul edilirse H1

reddedilir; H0 reddedilirse H1 kabul edilir.

• Bu hipotezler genellikle t testleri

içindir.

• Çoklu grupların ikişerli karşılaştırma

testlerinde de bu hipotezler kullanılır.

• F testinde sıfır hipotezi ve alternatif

hipotez biraz daha farklıdır.

F testinde hipotezler

• F testinde başlangıç hipotezi iki varyansın eşit

olduğu kabulüne dayanır.

• Karşıt hipotez ise tek taraflı veya iki taraflı

olabilir.

• F testinde (varyans analizi) karşıt hipotez tek

yönlüdür (F dağılımının sadece sağ tarafı kullanışlı olduğu

için) (σ2

iç<σ2

ara olup büyük varyans küçüğüne bölündüğü için

dağılımın sağ tarafı kullanılır)

• İki grubun varyanslarının homojenliği

kontrollerinde bağımsız iki varyans

karşılaştırılır. O zaman alternatif hipotez iki

yönlü veya tek yönlü olabilir.

Varyans analizinde;

H0: σ2

iç = σ2

ara veya σ2

ara /σ2

iç =1

H1: σ2

ara > σ2

iç;

Homojenlik kontrolünde

H0: σ2

1 = σ2

H1: σ2

1 ≠ σ2

Dağılımın Ret ve Kabul Bölgeleri

• Normal dağılıma uyan verilerle ilgili yapılan testlerde

(t, Z ve F testi) dağılımın ret ve kabul bölgeleri,

alternatif hipotezin tipine göre değişir.

• İki yönlü hipotezlerde ret bölgesi dağılımın her iki

tarafındadır.

• Tek yönlü hipotezde ise ret bölgesi dağılımın sadece

bir tarafındadır

• Ret bölgesi 0,05 lik bir alandır

• Tek yönlüde 0,05 lik ret bölgesi dağılımın tek tarafında

ve bütün iken iki yönlüde dağılımın iki yanında ve

yarısı (0,025) kadardır

• Bu yüzden tek yönlü hipotez ile sıfır hipotezini

reddetme şansı iki misli fazladır diyebiliriz.

α= 0,05 olduğunda ret (0,05) ve kabul

(0,95) bölgeleri

İki yönlü hipotez (μ1≠μ2)

Tek yönlü hipotez (μ1<μ2);

Tek yönlü hipotez (μ1>μ2)

Hata Tipleri

• Hipotez testleri sonunda H0 hipotezi ret veya

kabul edilir

• Verilen bu karar her zaman doğru olmayabilir

• Eğer karar yanlış ise bir hata yapılmış olur

• Bunun için, hipotez testlerinde hata ihtimalleri

ve tipleri belirlenmiştir

• Böylece, hatanın denetim altına alınması

öngörülmüştür

• Hipotez testlerinde iki tip hata ihtimali vardır:

I. tip hata (α hatası)

II. tip hata (β hatası)

174

Hipotez testlerinde hata tipleri

Hipotez testlerinde hata tipleri

• Hatadan nasıl kaçılır? En az hata nasıl yapılır?

• Birinci tip hatadan kaçınmak için düşük α

seviyesi, II. tip hatadan kaçınmak için düşük β

seviyesi kullanılmalıdır

• Alfa hatasını denetlemek kolay, beta hatasını

denetlemek zordur

• α=0,05 olsun şeklinde seçebiliriz, beta için

böyle bir rakamsal düzey belirlenemez

• α küçüldükçe β büyür

(Bu sonuçtan, β hatasını küçültmenin yolu, α hatasını

çok küçük seçmemektir denebilir)

Hipotez testlerinde hata tipleri

Beta hatası dolaylı olarak azaltılabilir

• 1- Örnek hacmini büyütmek (en kestirme ve kesin yol)

• 2- Tekerrür sayısını artırmak (aynı materyalde

muameleyi tekrarlamak)

• 3- Materyali bloklara ayırmak (hatayı azaltmak için bir

başka yol)

• 4- Mümkünse muameleyi bağımsız gruplarda değil de

bağımlı gruplarda uygulamak

(Özellikle birey farklılığına dayalı hataları azaltmak için bu yöntem denenmelidir)

• 5- Alternatif hipotezi doğru kurmak

Etki Büyüklüğü

• Etki büyüklüğü, gruplar arası farkın veya ilişkinin gücünü

gösterir

• (Etki büyükse bunu örnekte tespit etmek kolayken, etki küçükse

örnekte tespit etmek zordur)

• Uygun etki büyüklüğünü belirlemek için; pilot çalışma,önceki

çalışma bulguları

• Veya pratik olarak anlamlı olan en küçük etki büyüklüğü seçilir

• t testinde küçük etki, standart sapmanın %20′si, orta etki

%50′si, büyük etki %80’idir

• Örnek: ortalama 350 ve standart sapma 20 olan bir örnekte

• iki grup arasındaki fark 4 birim ise (20 x 0,2) küçük etki

• fark 10 birim ise (20 x 0,5) orta etki

• fark 16 birim ise (20 x 0,8) büyük etki

• Örneğin varyansı büyüdükçe etki büyüklüğü artar.

Testin Gücü

• sıfır hipotezini reddetme düzeyidir. II. Tip

hatadan kaçınma şansıdır

• Mümkün olan örnek hacmine paralel olarak,

testin gücünün %80 olması yeterlidir (beta

hatası %20)

• Güç büyük seçilirse o kadar örnek hacmi

gereklidir.

• Örnek büyüklüğünü arttırmak zaman ve para

masrafı gerektirir

• küçük bir beta hatası (%20 normal) için gerekli

minimum örnek büyüklüğü seçilir

Önemlilik Seviyesi, Hata Tipi, Testin Gücü, Örnek

Büyüklüğü ve Etki Büyüklüğü İlişkileri

• Önemlilik seviyesi, doğru sıfır hipotezinin reddedilmesi

ihtimali (I. tip hata) olup α ile gösterilir ve genellikle

0,05 taban olarak alınır

• Çoğu zaman I. tip hatanın 0,05 ihtimalle olması, II.tip

hatanın ise 0,20 ihtimalle olması istenir

• Birinci tip hatanın zıttı güven düzeyidir; hata az ise

güven artar; α = 0,05 olursa güven düzeyi 0,95 (%95)

iken α = 0,01 olursa güven düzeyi 0,99 (%99) olur

• İkinci tip hatanın zıttı ise testin gücüdür hata az ise

testin gücü artar; β = 0,20 olursa testin gücü 0,80 iken

β = 0,15 olursa testin gücü 0,85 olur.

• α ile β belirlendikten sonra örnek büyüklüğünü bulmak için,

gruplar arasında ne kadar bir fark bulunmak istendiği (etki

büyüklüğü) de tespit edilmelidir

• Bunun için; farkın pratik önemi de göz önünde tutulur

• İki grup arasındaki farkın büyüklüğü (etki büyüklüğü) azaldıkça,

bunun önemli bulunması için daha büyük örnek genişliğine

ihtiyaç vardır

• Ayrıca, önemlilik seviyesi ne kadar küçük ise (yani alfa hatası

küçük olsun istenirse) o kadar büyük örnek genişliği

belirlenmelidir.

• İdeal olarak, hiç hata yapmamak için, α ve β sıfır olmalıdır

• Hatanın küçültülmesi için daha büyük örnek hacmi gerekir

(populasyonun tamamı)

Örnek Büyüklüğü Belirleme

• Sıfır ve alternatif hipotez tanımlanır.

• Değişken tipine ve grup sayısına göre uygun

istatistik test seçilir.

• Önceki bulgulara göre en küçük etki büyüklüğü

(ortalamalar arası fark) belirlenir.

• Önceki bulgulara/bilgilere göre, incelenen

değişkene ait standart sapma belirlenir.

• Uygun α ile β seviyeleri belirlenir.

• Minitab paket programında bu işlem

yapılabilmektedir (power and sample size)

Z VE t TESTLERİ

1 Örnek T Testi

(Populasyon Ortalaması Önemlilik Testi)

bir örneğin, ortalaması ve standart sapması

bilinen bir kitleden çekilip çekilmediğini

veya eldeki örneğin, içinden çekildiği

varsayılan populasyonu ne derece temsil

ettiğini test etmek için yapılır.

Örnek:

• Kıl Keçilerin yıllık süt verimi ortalaması 75 kg

olsun

• Kıl keçisi yetiştiren bir yetiştirici kendi sürü

ortalamasının 80 kg olduğunu ve sürüye başka

bir ırkın karışmadığını iddia ediyor

• Bu yetiştiricinin sürüsü normal Kıl Keçi

populasyonuna mı ait yoksa bu sürü üzerinde

melezleme veya seleksiyon çalışması yapılarak

farklı özellik kazandırılmış bir sürü müdür?

• Yani, normal Kıl Keçi populasyonundan farklı

bir sürü müdür?

• Yetiştiricinin

sürüsünden rasgele

seçilmiş 30 keçinin

yıllık süt verimi kayıtları

Test istatistiğinin hesaplanması

t = (x-μ) / Sx

X = 77,5 kg; S2 = 93,9

standart sapma, S = 9,69

Sx = S / √n Sx = 9,69 / √30 = 1,77

t = (77,5-75,0)/1,77

t = 1,41

SD = 30 -1 = 29

Tablo t değeri (iki yönlü test P = 0,05 için 2,045)

1,41 < 2,045

P>0,05

2 Örnek T Testi

Bağımsız İki Grup Ortalamasının

Karşılaştırılması

• Bağımsız iki grubun ortalamasını

karşılaştırmada kullanılır

• Elde iki örnek vardır ve bunlardaki veriler farklı

bireylerden alınmıştır

• Gruplardaki veri sayısı farklı olabilir

• Örnek: cinsiyet (erkek/dişi), doğum tipi (tek/ikiz),

iki sınıf (A ve B)

189

İki grubun varyansları eşit olduğunda

Ortalamaları x1 ve x2

Ortak varyansları S0

Örnek büyüklükleri n1 ve n2 olan iki bağımsız

grubun ortalamalarının karşılaştırılması

Örnek:

10 baş Yerli Kara ve 10 baş melez dana, 6 aylık

yaşta besiye alınmıştır

Besi sonunda iki grup besi performansı

açısından karşılaştırılıyor

Danaların yemden yararlanma kabiliyetleri kriter

alınıyor

Veriler tabloda

İki grup arasındaki fark istatistik olarak anlamlı

mıdır?

Sonuç:

18 SD’de iki yönlü test tablo t değerleri:

P = 0,05 için 2,10, P = 0,01 için 2,88

5,93 >2,88 olduğu için P<0,01

“iki grup arasındaki fark önemlidir;

melezlerin yemden yararlanma kabiliyeti

yerlilerden yüksektir”

İki grubun varyansları eşit olmadığında

• Ortalamaları x1 ve x2

• Varyansları S1

2 ve S2

• Örnek büyüklükleri n1 ve n2 olan iki bağımsız grubun

ortalamalarının karşılaştırılması

Örnek:

İki ayrı yem fabrikasının ürettiği süt yem,

içerdikleri ham protein bakımından

karşılaştırılacak

Her iki fabrikadan tesadüfi örnekleme ile 13’er

adet numune alınmış

Laboratuvarda ham protein analizi yapılmıştır

İşlem sırasında A yemine ait numunelerden biri

zarar görmüştür

Sonuçlar Tablo 6’daki gibidir

Yemlar arasında bir fark var mıdır?

23 SD’de iki yönlü test tablo t değeri P = 0,05 için 2,07 dir

-0,84 <2,07 olduğu için P>0,05 dir

Sonuç:

İki grup arasındaki fark önemsizdir; iki fabrikanın ürettiği yemler

arasında ham protein oranları bakımından bir fark yoktur

Iki Eş Arasındaki Farkın Önemlilik Testi

Bağımlı İki Grup Ortalamasının Karşılaştırılması

• Deneme ve kontrol grubunun, uygulanan etki dışında tamamen

aynı olmaları istenir (aynı bireyler). Eşli veriler?

• Aynı bireylerden farklı zamanlarda, veya farklı kişilerce, veya

farklı ölçüm aletleri kullanılarak veriler alınmışsa bu verilere eşli

veriler denir

• Belirli saat veya gün aralıkları ile aynı bireylerden alınan kan

örnekleri (değişik iki zaman)

• İki farklı aletin aynı bireylerin bir özelliğini ölçmesi (değişik iki

alet)

• İki asistanın aynı ölçü pergeli ile 20 kuzunun alın genişliklerini

ölçmesi (değişik iki kişi)

• Aynı hayvanın ön incik ve arka inciğinin karşılaştırılması

• Bu t testi yönteminde eşler arasındaki farkın sıfır olup

olmaması araştırılır

• Eşli veriler yan yana yazılmalıdır.

• Eşler arasındaki fark sıfır ise yapılan muamelenin bir

etkisi olmamış demektir

• Aksi halde etki önemli demektir

• Eşler arasındaki fark d ile ve ortalama fark ta d (üzeri

çizgi) ile gösterildiğinde;

Örnek:

Bir ilacın tansiyon düşürücü etkisini

araştırmak amacıyla yapılan bir

araştırmada 15 yüksek tansiyonlu hastada

ilaç verilmeden önce ve ilaç verildikten

sonra kan basınçları ölçülmüş ve Tablo

7’deki sonuçlar alınmıştır. İlacı tansiyon

düşürmeye etkisi var mıdır?

14 SD’de iki yönlü test tablo t değerleri P = 0,05 için 2,14; P=0,01 için 2,98 dir.

6,38 >2,98 olduğu için P<0,01 dir

Sonuç:

Eşler arası fark sıfır değildir; hastaların kan basıncı düşmüştür, ilaç etkilidir

VARYANS ANALİZİ

VARYANS ANALİZİ

İki varyansın veya ikiden çok ortalamanın

karşılaştırılması

• İkiden fazla grubun ortalamasının karşılaştırılması

• Tek faktör için, üç veya daha fazla grubun ortalamasının

karşılaştırılması (tek yönlü)

• Bir populasyonda, tüm bireylerin değerlerinin farklı olması

(toplam/genel varyans)

• Populasyon bir faktör bakımından gruplara ayrılırsa, gruplar

arasında fark olur (gruplar arası varyans)

• Aynı grubun bireyleri arasında da bir farklılık vardır (grup içi

varyans)

• Gruplar arası varyans + grup içi varyans = toplam varyans

Varyans analizinin şartları

Ham verilerin bazı şartları taşıması gerekir.

Bunlar:

• 1- Grupların bağımsızlığı (Bağımsızlık)

• 2- Gözlemlerin rasgeleliği (Rasgelelik)

• 3- Gözlemlerin normalliği (Normallik)

• 4- Varyansların homojenliği

(Homojenlik)

• H0 hipotezi bütün grupların, σ2 varyanslı normal

dağılım gösteren tek bir populasyondan çekildiği

varsayımına dayanır

• F istatistiği normal dağılım gösteren F

dağılımına göre değerlendirileceği için, verilerin

normal dağılım göstermesi ve varyansların

homojen olması gerekir

• Normallik testi yapılmalı

• Varyansların homojenliği testi yapılmalı

F testi

• Önce F istatistiği hesaplanır (büyük varyansın küçüğüne bölünmesi ile)

• Büyük varyans gruplar arası varyans, küçük varyans ise grup içi varyanstır

(GAKO / GİKO)

• F testi gruplar arası varyansın grup içi varyansa eşit olup olmadığını test

eder

• H0 hipotezi bu iki varyansın eşit olduğunun kabulüdür (F’nin 1 veya ona yakın

bir değer olması)

• Alternatif hipotez, paydaki varyansın büyük olduğunu (F’nin 1’den büyük

olduğunu)

• Normalde, gruplar arasında bireyler arasındakinden başka bir fark yoksa,

gruplar arası varyans grup içi varyansa eşit olur (GAKO / GİKO oranı (F

değeri) 1 çıkar)

• Gruplar arasında büyük faklılıklar varsa bu eşitlik 1’den yüksek olur

• Sonuçta, en az bir grubun diğerlerinden farklı olduğuna (aynı

populasyondan olmadığına) karar verilir.

Örnek

Farklı ana yaşlarından Merinos kuzuların doğum

ağırlığındaki varyasyonun incelenmesi

Acaba ana yaşı, kuzuların doğum ağırlığında etkili bir

faktör müdür?

(kuzuları ana yaşı gruplarına ayırdığımızda grup ortalamaları arası farklar

anlamlı mıdır? önemli midir?)

Anası 2, 3, 4 ve 5 yaşlı olan kuzuların doğum ağırlığı

değerleri aşağıdaki tablodaki gibi bulunmuş olsun

GİKT = GKT – GAKT

GİKT = 2,07 – 0,94

GİKT = 1,13

GKT = Σxi² – ((Σxi)²/n)

GKT = 571,87 – (150,97² / 40)

GKT = 571,87 – 569,80

GKT = 2,07

GAKT = Σ((Σxj)2 / nj) – ((Σ xi)2/n)

GAKT = (127,59 + 139,13 + 144,10 + 159,92) – 569,80

GAKT = 570,74 –569,80

GAKT = 0,94

Sonuç:

36/3 SD’li P = 0.01 düzeyindeki tablo F değeri 4,43 olup 10,01>4,43

olduğundan P<0.01 dir.

Ana yaşı grupları arası fark anlamlıdır; ana yaşı doğum ağırlığına

etkilidir.

En az bir grup diğerlerinden farklıdır.

Hangi grupların farklı olduğunu bulmak için ilave testler yapılmalıdır

(çoklu karşılaştırma testleri)

36 SD için tablo değeri hesaplama: (doğrusal interpolasyonla)

0,05 için; 2,92-2,84=0,08 / 10 = 0,008 x 6 = 0,048 + 2,84= 2,89

0,01 için; 4,51-4,31=0,20 / 10 = 0,02 x 6 = 0,12 + 4,31= 4,43

Soru: Kuzular ana yaşına göre değil de rasgele 4 gruba

ayrılsaydı sonuç ne olurdu? (iadeli rasgele örnekleme ile)

Sonuç:

2,28 < 2,84 olduğundan P > 0,05;

Gruplar arası fark önemsiz.

Bütün gruplar aynı populasyonun başka başka

örnekleridir.

Çoklu karşılaştırma testleri

• Gruplar arası fark önemli çıkarsa, “en az bir grup

diğerlerinden farklıdır” denir.

• (bu durumda, ya sadece bir grup diğerlerinden farklı

olabilir, veya her biri bir diğerinden farklı veya bir kısmı

benzer bir kısmı farklı olabilir).

• İlk test bu detayı vermez

• Bunu anlamak için çoklu karşılaştırma testlerinden

birisi (değişik testler var) yapılır

Tukey Testi

T = Q . Sx

• Formülde Q, kitap ekindeki tablodan okunur, kritik değer

demektir, SD’ne göre değişir

(k grup sayısı ve grup içi SD’de α=0.05 yanılma olasılığına göre bulunur)

• Sx gruplar arası farkın standart hatası demektir; aşağıdaki gibi

bulunur

Sx = √ GİKO /n0

Sx = √ 0,0313 /10

Sx = 0,056

• Tablo Q değeri: 3,79 (Örneğimizde 4 grup var ve grup içi serbestlik

derecesi 36)

T = Q . Sx

T = 3,79 . 0,056

T = 0,212

• Tek bir değer bulunur ve bütün ikili gruplar arası

farklar bu değer ile karşılaştırılır

• İki grup ortalaması arasındaki fark bu değere

eşit veya büyükse fark önemli, küçükse önemsiz

kabul edilir.

Harflendirme:

Farklı grupları göstermek için, ortalamamalrın yanına harfler knur.

Aynı harfi taşıyanlar benzer, farklı harfi taşıyanlar farklı demektir.

Başka Bir Harflendirme Şekli

• Ortalamalar, büyükten küçüğe doğru sütunda aşağı

doğru sıralanır

• Ortalamalar arası farklar, T değeri veya en küçük D

değeri ile karşılaştırılır

• Farklılıklara göre ortalamalar yandaki sütunlarda alt

gruplara ayrılır

• Sütun başına konmak üzere her sütun için bir harf

verilir (a, b, c….)

• Sonra ortalamaların yanına bu harfler konur

• Her iki alt grup içinde de yer alanlara iki alt grubun

harfi de verilir (ab, bc, bcd…. gibi)

4,00 -3,80 = 0,20 < 0,212, fark önemsiz, aynı gruba

4,00 -3,73 = 0,27 > 0,212, fark önemli, başka gruba

3,80 -3,73 = 0,07 < 0,212, fark önemsiz, aynı gruba

3,80 -3,57 = 0,23 > 0,212, fark önemli, başka gruba

3,73 -3,57 = 0,16 < 0,212, fark önemsiz, aynı gruba

Khi-Kare Testi

• Sayımla elde edilen ve yüzde ile ifade edilen

verilerin analizinde kullanılır

• İki oran arasında bir fark olup olmadığı; iki olay

arasında bir bağlantı, ilişki olup olmadığı, bir veri

setinin normal dağılıma uygunluğu gibi

konuların araştırılmasında kullanılır.

• Khi-kare testi, belli bir olayla ilgili gözlenen

frekanslar ile beklenen frekanslar arasındaki

farkın anlamlı olup olmadığı temeline dayanır.

• Khi-kare testleri ile elde edilen test istatistiği, Khi-kare

tablosundaki değer ile karşılaştırılır

• Basit Khi-kare analizi için kullanılan formül şöyledir:

χ2 = Σ(f–f‘)2/f’

f gözlenen frekans (araştırmada sayılarak

elde edilen değerler)

f’ beklenen frekanstır (teorik olarak

hesaplanır).

Formülü şöyle de yazabiliriz:

χ2 = Σ (Gözlenen sayı – Beklenen sayı)2 / Beklenen sayı

Khi-kare uygunluk testi (uyum testi); Tek

değişkenli olaylarda Khi-kare analizi

• Bu test ile herhangi bir veri dizisinin bilinen bir

dağılıma uygunluğu araştırılır.

• Gözlenen frekanslar ile beklenen frekanslar arasındaki

farkın anlamlılığı test edilir.

• Aradaki fark anlamlı ise bu dizinin söz konusu

dağılıma uymadığı anlaşılır.

• Bir bölgede görülen salgın hastalıkların mevsimlere

göre dağılımı, bir iş yerindeki iş kazası sayısının aylara

göre dağılımı, vb. konuların araştırılması amacı ile bu

test kullanılır

Örnek

Koyun yetiştiriciliği yapan ve her biri

aynı kapasitede olan beş işletmede

koyun çiçeği vakası tespit edilmiştir.

Sonuçlar Tablodaki gibidir. Çiçek

vakası bakımından işletmeler

arasında bir fark var mıdır?

Beklenen sayılar nasıl hesaplanır?

Yaklaşım; eğer işletmeler arasında bir fark yoksa bütün

işletmelerdeki çiçek sayıları eşit olmalıdır.

Eşit olma durumu, toplam vakanın işletme sayısına

bölünerek ortalaması alınması ile sağlanır

Toplam vaka 70 olup 5’e bölündüğünde 14 elde edilir.

Test istatistiği:

χ2 = Σ(f–f‘)2/f’

χ2 = ((20 -14)2 / 14) + ((12-14)2 / 14) + ((18-14)2 / 14)

+ ((11-14)2 / 14) + ((9-14)2 / 14)

χ2 = (62/14) + (-22/14) + (42/14) + (-32/14) + (-

52/14)

χ2 = 2,57 + 0,29 + 1,14 + 0,64 + 1,79

χ2 = 6,43

Serbestlik Derecesi:

Serbestlik derecesi,

“(satır-1) x (sütun – 1)” şeklindedir

Satır ve sütunların sayılarında sadece

gözlenen frekanslar hesaba katılır.

Burada satır 1 olup 1 çarpan olarak alınır,

sütun 5 tir ve 5-1 = 4 olup SD: 1 x 4 = 4

Sonuçların Değerlendirilmesi:

• Bulduğumuz değer, tablodaki ilgili SD’de P=0,05

değerine karşılık gelen χ2 değerinden büyükse, bizim

P’miz 0,05’ten küçük (P<0.05) olacaktır (gruplar arası

fark anlamlı)

• Bizim değerimiz tablo değerinden küçükse, P>0,05

olacaktır (fark anlamsız)

• Tek değişkenli Khi-kare analizlerinde bunu, “uyum

yoktur” diye yorumlayacağız.

• Örneğimize ait 4 SD ve P = 0,05 düzeyinde tablo χ2

değeri 9.49 dir.

• Bizim değerimiz (6,43) bundan küçük olduğu için

P>0.05 ve“gruplar (işletmeler) arasında bir fark yok,

işletmeler arasında bir uyum vardır” denir

Khi-kare Bağımsızlık Testi (2 x 2 tablosu), İki

değişkenli ve İkişer alt gruplu verilerin analizi

• Bağımsız iki grubun frekanslarını veya yüzdelerini

karşılaştırmak için kullanılır.

• İki olay arasında bir ilişki olup olmadığı

• İki grubun birbirinden farklı olup olmadığı gibi

konularda kullanılır

• Verilerin sayımla elde edildiği durumlarda bu test

kullanılır.

Örneğin sigara içme bakımından kızlar ile erkekler arasında bir fark var mıdır?

Veya sigara içme konusu cinsiyetle ilişkili midir? Cinsiyete bağımlı mıdır? Bir

hastalığa karşı koruma X aşısına bağımlı mıdır? Öğrencilerin fakülte

tercihinde cinsiyet etkili midir? vb. sorular bu yöntemle cevaplanabilir.

Örnek

Bir tavukçuluk işletmesinde New castle

aşısının etkisi araştırılmak istenmiş olsun.

Bunun için işletmedeki aşılı ve aşısız

tavuklar ile ölen tavukların sayıları

aşağıdaki tabloda verildiği gibi

toplanmıştır. Acaba aşı etkili midir?

Ölümler ile aşı yapmama arasında bir

ilişki var mıdır?

Test İstatistiğinin hesaplanması:

χ2 = Σ(f–f‘)2/f’

χ2 = ((100-176,3)2/176,3) + ((300-223,7)2/223,7) +

((2500-2423,7)2/2423,7) + ((3000-3076,3)2/3076,3)

χ2 = ((-76,3)2/176,3) + ((76,3)2/223,7 + ((76,3)2/2423,7)

+ ((-76,3)2/3076,3

χ2 = 33,0 +26,0 + 2,4 + 1,89

χ2 = 63,29

SD = (2-1) x (2-1) = 1

P = 0,05 de Tablo χ2 değeri 3,84

P = 0,01 de Tablo χ2 değeri 6,64 olup

bizim bulduğumuz değer 63,29>6,64

olduğundan P<0.01 dir.

Tavukların ölümü ile aşı yapmama

arasında bir ilişki vardır.

Aşı yapılmayan sürüdeki ölüm oranı

(%9,09) anlamlı şekilde aşı yapılan

sürüdeki orandan (%3,85) yüksektir.

SONUÇ

Khi-kare Bağımsızlık Testi (R x C tablosu), İki

değişkenli, çok alt gruplu verilerin analizi:

• İkiden fazla bağımsız grubun belli bir faktör bakımından

karşılaştırılmasında kullanılır

• Verileri sayımla elde edilmiş olan çoklu gruplar arası farkın

önemi testi denebilir

• Öncelikle gruplar arası farkın önemi araştırılır

• Gruplar arası fark önemli çıkarsa daha sonra hangi grubun

hangisinden farklı olduğunu bulmak üzere ikişerli analizler

yapılır

• Farklı gruplar harfler ile gösterilerek tablo yapılır

• Yapılan iş Duncan vb. çoklu karşılaştırma testlerinde yapılana

benzer

Örnek:

E. coli üremiş 400 adet besi yerine

dört farklı antibiyotik ile antibyogram

yapılmıştır. Sonuçlar aşağıdaki

tabloda verilmiştir. Mikroorganizmaya

etki bakımından antibiyotikler

arasında fark var mıdır? Hangisi

daha güçlüdür?

Test istatistiğinin (Khi-kare değeri)

Hesaplanması:

Khi-kare = 4,500 + 0,205 + 10,669 + 1,667 +

0,200 +6,613 + 0,232 + 0,794 + 3,130 + 6,722

+ 3,956 + 0,002 + 5,239 + 0,136 + 0,409 +

6,125 + 0,003 + 2,927 + 0,600 + 1,800 =

55,928

Serbestlik Derecesi: (4-1) (5-1) = 3 x 4 = 12

Sonuç: 12 SD deki ve P = 0,01

düzeyindeki tablo Khi-kare değeri

26,22 dır

Bulduğumuz değer (55,93) bu

değerden büyüktür.

Bu durumda P<0,01 dir. Yani

antibiyotikler arası fark önemlidir.

Soruda hangi antibiyotik daha

güçlüdür? Sorusunun cevabı için

analize devam edilmelidir

Bu amaçla önce antibiyotiklerin negatif

yüzdelerini (veya pozitifleri) incelersek

kabaca hangi grupların farklı, hangilerinin

benzer olabileceği kestirilebilir.

Muhtemelen A ile B arasında ve C ile D

arasında bir fark yoktur. %20 ve %43

oranlarına sahip iki grubu (A ile C yi)

karşılaştırırsak kısa sürede sonuç

alabiliriz.

O zaman sadece bu iki gruba ait Khi-kare

analizi yapıp değerlerini toplamalıyız

Khi-kare = 4,442 + 0,064 + 7,504 + 0,833 + 0,010 + 4,038 + 0,058 + 6,822 +

0,758 + 0,009 = 24,538

24,538 > 13,28 (4 SD li ve P=0,01 deki Khi-kare değeri)

P<0,01 ve iki grup arası fark önemlidir.

Buradan %20 ile %43 arasındaki farkın anlamlı olduğu ortaya çıkıyor. O taktirde

%17 ile %46 arasındaki fark haydi haydi önemlidir deriz ve onun için analiz

yapmayız.

Dikkat! Beklenen değerler yeniden hesaplanmıştır.

Acaba %17 ile %20 (yani A ile B) arası fark önemli

midir? Ona bakalım:

Khi-kare = 0,135 + 0,207 + 0,839 + 2,123 + 1,540 +0,150 +

0,230 + 0,932 + 2,359 + 1,711 = 10,226

4 SD de P = 0,05 düzeyindeki tablo Khi-kare değeri 9,49

olup 10,23>9,49 olduğundan P<0,05 tir ve fark önemlidir.

Şimdi de C ve D antibiyotiklerini karşılaştıralım

(%43 ile %46):

Khi-kare = 0,060 + 0,002 + 0,093 + 0,332 + 0,234 +

0,066 + 0,002 + 0,103 + 0,366 + 0,257 = 1,516

4 SD de P=0,05 düzeyindeki tablo Khi-kare değeri 9,49

olup 1,52<9,49 olduğundan P>0,05 tir ve fark

önemsizdir.

Sonuç:

A-B, A-C ve A-D; B-C ve B-D arası fark önemli C-D arası fark

önemsizdir. Negatif yüzdelerine (veya pozitif yüzdeleri)

bakarak bir değerlendirme yapılırsa en güçlü antibiyotik B

antibiyotiğidir, A ikinci sırada güçlüdür; C ile D ikisi de gücü az

olan antibiyotiklerdir. Harflendirme yapmak istersek aşağıdaki

gibi yapılır:

a,b,c: Farklı harf taşıyan oranlar arası fark anlamlıdır (P<0.05).

Korrelasyon ve

Regresyon Analizi

Korrelasyon ve Regresyon Analizi

Biyolojik özellikler çoğu durumda bir birleriyle ilişkilidir;

birinde meydana gelen bir değişiklik diğerini de az veya çok

etkiler.

İki özellik arasındaki ilişkinin kuvveti özelliklere göre

değişir; % ile ifade edilir

Örneğin iri cüsseli bir hayvanın canlı ağırlığı da yüksektir

Aynı ırktan canlı ağırlığı yüksek bir koyundan, daha düşük

canlı ağırlıktaki bir koyuna göre daha fazla yapağı elde

edilir. Yani ağırlık ile yapağı verimi arasında bir ilişki vardır.

Aynı ırktan 2 yaşlı ineğe göre 6 yaşlı inekten daha fazla süt

elde edilir

Diğer yandan, renk ile verimler arasında bir ilişki tespit

edilememiştir. Örneğin siyah renkli bir Holştayn ile beyaz

renkli Holştayn arasında süt verimi yönünden bir fark

yoktur.

• İki değişken arasındaki korrelasyon (ilişki)

korrelasyon katsayısı ile belirlenir

• Korrelasyon katsayısı r harfi ile gösterilir

• Korrelasyon katsayısı –1 ile +1 arasında bir

değer alır. Değer 0’a yaklaştıkça ilişki azalır;

mutlak değer olarak 1’e yaklaştıkça ilişki artar.

• 0 dan 0,30’a kadar düşük, 0,30-0,60 arası orta,

0,60 dan yukarısı yüksek ilişkidir

• İlişkinin önem düzeyi n sayısına çok bağımlıdır.

• Sonuçlara güvenebilmek için korrelasyon

analizlerinde çok sayıda veri kullanılmalıdır.

x ve y şeklinde iki değişken arasındaki korrelasyon

katsayısı aşağıdaki formül ile hesaplanır:

r = (Σxy – (Σx)(Σy)/n) / √(Σx² – (Σx)²/n)(Σy² – (Σy)²/n)

r = xy çarpımlar toplamı / √ (x kareler toplamı) (y kareler toplamı)

r = xy ÇT/ √ (x KT) (y KT)

Korrelasyon katsayısının önem kontrolü

Korrelasyon katsayısı önemli mi değil mi?

t = r / Sr

r korrelasyon katsayısı,

Sr korrelasyon katsayısının standart hatasıdır

Sr = √ (1-r2) / (n-2)

Regresyon analizi

İki değişken arasında anlamlı bir ilişki varsa yapılır

Değişkenlerden birinin bir birim değişmesiyle

diğerinin ne kadar değişeceği tahmin edilir

x ve y gibi iki değişkenden y bağımlı, x bağımsız

değişkendir

Regresyon denklemi:

Y = a + byxX

Y = a + byxX

Y, bağımlı değişken

X, bağımsız değişken,

a, sabit sayı (constant) (regresyon doğrusunun y

eksenini kestiği nokta)

byx, y’nin x’e regresyon katsayısı

Regresyon katsayısı, – ve + olmak üzere her

değeri alabilir.

Regresyon katsayısı (byx) aşağıdaki formül ile

hesaplanır:

byx = (Σxy – (Σx)(Σy)/n) / (Σx² – (Σx)²/n)

byx = xy ÇT / x KT

a sabitinin hesaplanması:

a = Y ort. – byx X ort.

Regresyon denkleminin önem kontrolü

İki değişken arasında doğrusal bir ilişki varsa

regresyon doğrusu istatistik olarak önemlidir

H0 = İki değişken arasında doğrusal ilişki yoktur.

Önem kontrolü için varyans analizinden

yararlanılır ve F istatistiği hesaplanır

Varyans analizi tablosu aşağıdaki gibidir.

Serbestlik dereceleri

Genel serbestlik derecesi: n-1 .

Regresyon serbestlik derecesi: 1

Hata serbestlik derecesi: n-2

Regresyon doğrusunun çizilmesi

Regresyon önemli ise iki değişken arasında doğrusal bir

ilişki vardır

Bu durumda regresyon doğrusu çizilebilir

a sabit değeri ve x ve y nin ortalamalarına ait ordinat

noktası kullanılır

Regresyon doğrusu bu iki noktadan geçen doğrudur

Determinasyon katsayısı, R2

X’in Y’yi belirleme derecesi,

Y nin x’e regresyonu incelenirken, x bağımsız

değişkenindeki varyasyonun y nin

varyasyonunun yüzde olarak ne kadarını

belirleyeceğini gösteren bir değerdir

Büyük R nin karesi olarak gösterilir

İki değişken söz konusu olduğunda R2, r nin

karesidir.

Örnek:

Koyunlarda yıllık yapağı verimi (kg) ile koyunun kırkım sonu canlı

ağırlığı (kg) arasında pozitif bir ilişki vardır. Bunun gerçekten

böyle olup olmadığını test etmek üzere aynı ırktan, aynı

cinsiyetten ve aynı yaştan 20 baş koyundan ilgili ölçümler

yapılmış ve aşağıdaki tablodaki gibi bulunmuştur.

a. Yapağı verimi ile canlı ağırlık arasında önemli bir

ilişki var mıdır? Yönü ve miktarı nedir?

b. Regresyon denklemini yazınız

c. Regresyon önemli midir?

d. Regresyon önemli ise regresyon doğrusunu çiziniz.

e. Determinasyon katsayısı kaçtır?

a- Korrelasyon katsayısı ( r ) ve önem

kontrolü:

r = (Σxy – (Σx)(Σy)/n) / √(Σx² – (Σx)²/n)(Σy² – (Σy)²/n)

r = (2117,8 – 2025,9) / √(39935 – 38456)(115,1 – 106,7)

r = 91,9 / √(1479)(8,4)

r = 91,9 / √12446,4

r = 91,9 / 111,6

r = 0,82

Yorum: Yapağı verimi ile canlı ağırlık arasında 0,82 lik

pozitif yüksek düzeyde bir korrelasyon vardır.

Korrelasyon Katsayısının Önem Kontrolü

Sr = √ (1-r2) / (n-2)

Sr = √ (1-0,68) / (20-2)

Sr = √ 0,32 / 18

Sr = 0,13

t = r / Sr

t = 0,82 / 0,13

t = 6,17

Yorum: 18 SD’li P = 0,01 düzeyinde t tablo

değeri 2,88 olup 6,17>2,88 olduğundan P<0,01;

korrelasyon katsayısı önemlidir.

b- Regresyon denklemi

Y = a + byxX

Önce, denklemde yer alan byx (regresyon katsayısı) ve a (sabit)

değerlerini hesaplamalıyız.

byx = (Σxy – (Σx)(Σy)/n) / (Σx² – (Σx)²/n)

byx = xy ÇT / x KT

byx = 91,9 /1479

byx = 0,062

a = Y ort. – byx X ort.

a = 2,3 – 0,062 x 43,9

a = -0,416

Şimdi regresyon denklemini yazabiliriz;

Y = -0,416 + 0,062 X

b- Regresyon önem kontrolü:

Bunun için varyans analizi yaparak gerekli kareler toplamlarını bulmalıyız

Genel Kareler Toplamı (GKT):

GKT = Σy² – ((Σy)²/n)

GKT = 115,1 – 106,7

GKT = 8,40

Regresyon Kareler Toplamı (RKT):

RKT = (Σxy – (Σx)(Σy)/n)2 / (Σx² – (Σx)²/n)

RKT = (91,9)2 / 1479

RKT = 8451 / 1479

RKT = 5,72

HKT = GKT – RKT

HKT = 8,40 – 5,72

HKT = 2,70

Yorum: 18 – 1 SD li P = 0.01 düzeyindeki F tablo değeri 8,29 olup

38,08>8,29 olduğundan P<0,01 ve regresyon önemlidir; ilişki

doğrusaldır.

b- Regresyon doğrusunun çizimi

a sabiti ile x ve y değerlerinin ortalamalarının kesiştiği

noktanın bilinmesi gerekir

Buna göre örneğimizin regresyon doğrusu aşağıdaki şekildeki

gibi çizilir.

İki değişken arasındaki ilişki grafiği

b- Determinasyon katsayısı kaçtır?

R2 nin bulunması:

Korrelasyon katsayısının (0,82) karesi

determinasyon katsayısını verir ki o da 0,68 dir.

Anlamı: X deki varyasyon y deki varyasyonun

%68’ini belirlemektedir.

%32 lik kısım başka faktörler tarafından

belirlenmektedir

Tüm Notları indirmek için: http://veteriner.selcuk.edu.tr/docs/memintekin.rar

Gelen Aramalar:

çetele tablosuaşağıda verilen veriler için mod medyan aritmetik ortalama ve değişim aralığını ve pearson eğiklik katsayısını bulunuzsayısal verilerden yararlanmaçetele tablosu ve sıklık tablosupascal(negatif binom) dağılımıveri toplama yöntemleriaritmetik ortalama çizgi grafiğiölçmede hatayla ilgili resim ve tablokoyunlarda melezlemede kan yüzdeliği nasıl hesaplamaortalamalardan sapmalarla tahminsıklık ve çetele tablosu örnekleribiyometri grafikİnterpolasyon formülühayvancılık ile ilgili tablo ve grafiklerrenkli çetele tablosu
EKLENME TARİHİ
Bu haber 26 Ağustos 2010, 22:24 tarihinde eklendi.
KATEGORİ
OKUNMA
Bu Haber 1.545 Kez Okunmuş..
PAYLAŞ
facebook Twitter Frienfeed Twitter Google
YORUM YAZIN

Yorum yapabilmek için giriş yapmalısınız.

  1. ece^^ diyor ki:

    Sen birtanesin kardeşim sonunda buldum.

  2. ivamd diyor ki:

    vahşet bir konu olmuş çok güzel…

Benzer Haberler
Reklam
Popüler Haberler & Yorumlar
Yazarlarımız
Sponsor Reklam Alanı
egevet anatolia vet iddaa
promosyon Promosyon T-shirt PROMOSYON
Anket
Sitemizin yeni halini nasıl buldunuz ?
Gayet güzel
iyi
Normal
Berbat
Eski hali daha güzeldi