Bilişim dünyasına kaliteli, özgün ve Türkçe içerikler kazandırmayı hedefleyen bir platform..

friends friends friends

P-Value

İngilizce olasılık anlamına gelen "probability" sözcüğünden gelen p değeri, bir araştırma örnekleminde değişkenler arasındaki fark veya ilişkinin, gerçekte bir ilişki veya fark yokken sadece şans eseri ortaya çıkmış olma olasılığıdır. Ayrıca "p-value", örneğin bir veri içinde gerekli ve gereksiz değişkenlerin tespitinde kullanılabilmektedir.

İstatistikte, "p-value" bir hipotez testinde bir sonucun anlamlılığını belirtmek için kullanılır. Örneğin, bir hipotez testinde p değeri, anlamlılık düzeyi olan 0.05'ten küçükse, H0 hipotezimizi reddeder ve istatistiksel olarak anlamlı bir fark olduğuna karar veririz. Başka bir deyişle, p-değeri anlamlılık seviyesinden azsa , sıfır hipotezini reddetmek için yeterli kanıt olduğunu söyleyebiliriz.

Anlamlılık düzeyinin başka bir ifadeyle yanılma olasılığının belirlenmesi, yapılacak çalışmanın hassasiyetine göre değişebilir. Örneğin: tıptaki çalışmalar için anlamlılık düzeyi α = 0,05 değeri genel olarak kabul görmüş bir sınırdır. Ancak insan sağlığının söz konusu olduğu yani hata yaptığınızda çok büyük problemlerin olabileceği tıp veya daha hassas hesaplamaların olduğu astronomi gibi alanlarda çalışıyorsak, anlamlılık düzeyini 0,05 yerine 0,01 hatta 0,001 alabiliriz.

Kısaca bir hipotez testinde, hesapladığımız p değerini, daha önce kabul ettiğimiz anlamlılık düzeyi ile karşılaştırarak H0 hipotezinin reddedilip reddedilemeyeceğine karar verebiliriz.

  • P>0.05 : anlamlı fark bulunamadı
  • P<0.05 : anlamlı fark bulundu
  • P<0.01 : ileri düzeyde anlamlı fark bulundu
  • P<0.001: çok ileri düzeyde anlamlı fark bulundu

P harfi, İngilizce olasılık anlamına gelen "probability" sözcüğünden gelmektedir. P value, test edilen hipotezin doğruluğunu araştırmak için kullanılan bir ölçüdür ve genellikle 0 ile 1 arasında bir sayıdır.

  • P değeri 0.05 olduğunda H0 hipotezi %95 olasılıkla yanlıştır,
  • P değeri 0.01 olduğunda H0 hipotezi %99 olasılıkla yanlıştır,
  • P değeri 0.001 olduğunda H0 hipotezi %99.9 olasılıkla yanlıştır.

Shapiro-Wilk Normallik Testi

P value, Shapiro-Wilk Normallik Testinde aşağıdaki gibi kullanılır. Verilerin normal dağılıma sahip olup olmadıklarını R programlama ile test etmek isteyelim:

sinav_notlari<-c(40, 52, 65, 15, 30, 100, 90, 55, 45, 74, 80, 36, 25, 65, 60, 40, 45, 78, 50, 70)
shapiro.test(sinav_notlari)

Hipotez:

Öncelikle Hipotezimizi yazalım:

  1. H0: Veriler Normal Dağılıma sahiptir.
  2. H1: Veriler Normal Dağılıma sahip değildir.

Yorum:

Yanılma Olasılığı: Yanılma olasılığı olarak α = 0.05 olarak seçilmiştir(p anlamlılık düzeyi %5 alınmıştır).

p-value = 0.9984 olarak hesaplanmıştı, bu değer yanılma olasılığından büyük olduğu için( 0.9984 >0.05 ), H0 Hipotezi reddedilemez. Yani α = 0.05 anlamlılık düzeyinde(95% güven seviyesinde) veriler Normal Dağılıma sahiptir diyebiliriz.

Backward Elimination-Geri Eleme

"p-value", örneğin bir veri içinde gerekli ve gereksiz değişkenlerin tespitinde kullanılabilir. p değeri, test edilen şeyin etkisin olup olmadığını söyler. Ancak ne kadar bir etkinin söz konusu olduğu hakkında bilgi vermez.

Backward Elimination, makine öğrenmesi algoritmalarında, modelimizin başarısında değişkenlerin önemini anlamak için yapılan bir yöntemdir. Değişkenlerin hangisinin sisteme daha fazla etkisi olduğunu anlamak için kullanılır. Bir dizi oluşturulur ve etkisi ölçüldükten sonra sırasıyla değişkenler elenerek etkiye bakılır. Burada bizim için önemli olan değer p-value değeri, bu değer 0,05 değerinden büyük çıkarsa bu değişken verilerin içinden çıkarılabilir.

Bilinmesi gereken başka bir nokta, p değerlerinin olasılıklar olmasıdır; bu nedenle, 0 ile 1 arasında olmalıdırlar. 1'den büyük veya 0'dan küçük bir p değeri hatalı bir sonucu temsil eder.

Interpreting the results of Linear Regression using OLS Summary

Kaynaklar

  1. https://www.docpid.com/hesaplama/p-degeri-hesaplama
  2. https://www.youtube.com/watch?v=Oqsl-9tmfw4&t=45s
P-Value Olasılık Değeri p değeri p değeri yorumlama p-değeri p value nasıl hesaplanır p değeri nedir tıp spps p değeri P<0.05 ten küçükse p<0.05 ne demek
0 Beğeni
Makine Öğrenmesi
Önceki Yazı

Veri Ölçekleme(Feature Scaling)

12 Nis. 2020 tarihinde yayınlandı.
Sonraki Yazı

Confusion Matrix(Hata Matrisi)

12 Nis. 2020 tarihinde yayınlandı.
arrow