Bilişim dünyasına kaliteli, özgün ve Türkçe içerikler kazandırmayı hedefleyen bir platform..

friends friends friends

k-Means(k-Ortalama)

k-Means kümeleme algoritması, data mining dünyasında en çok kullanılan algoritmaların başında yer almaktadır. En çok kullanılan gözetimsiz öğrenme algoritmalarının başında gelir. 1967 yılında J. MacQueen tarafından geliştirişmiştir. K-means’in atama mekanizması her verinin sadece bir kümeye ait olabilmesine izin verir

Kümeleme algoritmaları ile Sınıflandırma algoritmaları arasında bir takım farklılıklar bulunmaktadır. k-means algoritması bir kümeleme algoritmasıdır. Kümeleme algoritmaları otomatik olarak verileri daha küçük kümelere yada alt kümelere ayırmaya yarayan algoritmalardır. Algoritma istatistiksel olarak benzer nitelikteki kayıtları aynı gruba sokar. Bir elemanın yalnızca bir kümeye ait olmasına izin verilir. Küme merkezi kümeyi temsil eden değerdir.

Algoritmanın isminde yer alan "k" harfi, aslında küme sayısını belirtir: Algoritma, hata hesaplamada yaygın olarak kullanılan Karasel Hata Fonksiyonunu en aza indirgeyecek "k" küme sayısını da arar. Verilen "n" sayıdaki veri seti "k" tane kümeye bu hata fonksiyonunu en aza indirgeyecek şekilde yerleştirilir. Bu nedenle küme benzerliği kümedeki değerlerin ortalamaya yakınlıkları ile ölçülür. Bu da kümenin ağırlık merkezidir. Kümenin merkezinde yer alan değer kümenin temsilci değeridir ve medoid olarak adlandırılır.

Nasıl Çalışır?

  1. Kaç küme olacağı kullanıcıdan parametre olarak istenir.
  2. Rastgele olarak k merkez noktası seçilir.
  3. Her veri örneği, en yakın merkez noktasına göre ilgili kümeye atanır.
  4. Her küme için yeni merkez noktaları hesaplanarak merkez noktaları kaydırılır.
  5. Yeni merkez noktalarına göre çeşitli işlemlere devam edilir.

K-Means'in iki büyük sorunu var:

  • - Küme sayısı bilinmelidir
  • - Aykırı değerleri işlemez

Ama bir çözüm var!

Yoğunluk tabanlı bir kümeleme algoritması olan DBSCAN ile çözülebilir.

Kaynaklar

  1. https://www.datanovia.com/en/lessons/k-means-clustering-in-r-algorith-and-practical-examples/
  2. https://dergipark.org.tr/download/article-file/193944
  3. https://uc-r.github.io/kmeans_clustering
  4. https://twitter.com/akshay_pachaar/status/1645048847922794502
  5. https://twitter.com/akshay_pachaar/status/1666422267763650560
K-means K-Ortalama Makine Öğrenmesi Yapay Zeka
0 Beğeni
Makine Öğrenmesi
Önceki Yazı

Destek Vektör(SVR) ile Tahmin

12 Nis. 2020 tarihinde yayınlandı.
Sonraki Yazı

Hiyerarşik Bölütleme

12 Nis. 2020 tarihinde yayınlandı.
arrow