Bilişim dünyasına kaliteli, özgün ve Türkçe içerikler kazandırmayı hedefleyen bir platform..

friends friends friends

Rassal Ağac(Random Forest)

Random Forest Algoritması hem sınıflandırma hemde regresyon(tahmin) için kullanılabilir. Amaç veri kümesini birden fazla parçaya bölmek ve bunlar üzerinde karar ağaçlarını çalıştırıp daha sonra birleştirmek.

Temel olarak, birden fazla karar ağacının tahminlerini birleştirerek daha doğru ve kararlı bir tahmin sağlar. Random Forest algoritması, aşağıdaki durumlarda kullanılabilir:

  1. Özellikler arasında karmaşık etkileşimler bulunan veri kümesi durumlarında: Random Forest, özellikler arasındaki etkileşimleri otomatik olarak yakalayabilen ve modelin doğruluğunu artıran bir algoritmadır.
  2. Hem kategorik hem de sürekli özelliklere sahip veri kümelerinde: Random Forest algoritması, kategorik ve sürekli özelliklerin her ikisiyle de başa çıkabilen çok yönlü bir algoritmadır.
  3. Yüksek boyutlu veri kümelerinde: Random Forest, yüksek boyutlu veri kümelerini işlemekte etkilidir ve önemli özellikleri belirleyebilir.
  4. Aşırı öğrenmeye karşı dayanıklılık gerektiren durumlarda: Random Forest algoritması, birden fazla karar ağacının tahminlerini birleştirerek aşırı öğrenmeye karşı dayanıklılık sağlar.
  5. Özellik seçimi ve öneminin değerlendirilmesi gereken durumlarda: Random Forest, özellik önemini ölçmekte ve önemsiz özelliklerin etkisini azaltmakta etkilidir.
  6. Hızlı tahmin yapma gereksinimi olan durumlarda: Random Forest, paralel olarak çalışabilen ve hızlı tahminler yapabilen bir algoritmadır.
  7. Modelin yorumlanabilirliği önemli olmayan durumlarda: Random Forest algoritması, doğru ve kararlı tahminler sağlasa da, modelin yorumlanabilirliği daha düşüktür. Eğer modelin yorumlanabilirliği önemli değilse, Random Forest algoritması kullanılabilir.

Random Forest algoritması, çok çeşitli uygulama alanlarında kullanılabilir, ancak her durumda en iyi seçenek olmayabilir. Problemin doğasına ve veri kümesine bağlı olarak, başka makine öğrenmesi algoritmaları daha uygun olabilir. Bu nedenle, en iyi modeli belirlemek için çapraz doğrulama ve hiperparametre ayarlama gibi teknikler kullanarak birden fazla algoritmayı denemekte fayda vardır.

Rassal Ağac(Random Forest)
Veri Kümesi: maaslar.csv (indirmek için tıklayınız)
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

veriler= pd.read_csv("maaslar.csv")

x=veriler.iloc[:,1:2]#eğitim seviyesi
y=veriler.iloc[:,2:]#maaş
X=x.values
Y=y.values

#TEST VE TRAIN VERİLERİ BÖLME


from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test=train_test_split(X,Y,test_size=0.33,random_state=0)


#STANDARTLAŞTIRMA
from sklearn.preprocessing import StandardScaler
sc1=StandardScaler()
x_olcekli=sc1.fit_transform(X)
sc2=StandardScaler()
y_olcekli=sc2.fit_transform(Y)

#RANDOM FOREST
from sklearn.ensemble import RandomForestRegressor
rf_reg=RandomForestRegressor(n_estimators=10,random_state=0)
rf_reg.fit(X,Y)#X bilgisinden Y bilgisini öğren
print(rf_reg.predict(np.array([6.5]).reshape(1, 1)))
plt.scatter(X,Y,color='red')
plt.plot(x,rf_reg.predict(X),color='blue')
plt.show()

 

random forest, rastgele orman

Rassal Ağaç Makine Öğrenmesi Yapay Zeka sınıflandırma Random Forest Random forest classifier rastgele orman
0 Beğeni
Makine Öğrenmesi
Önceki Yazı

Karar Ağaçları (Decision Tree)

12 Nis. 2020 tarihinde yayınlandı.
Sonraki Yazı

Linear Regresyon(Doğrusal)

12 Nis. 2020 tarihinde yayınlandı.
arrow