Örneğin bir model geliştirdik ve "modelimizin başarılı olup olmadığını nasıl ölçeriz?" sorusunun cevabı R-Square(R Kare) ve Adjusted R2'dir.
Gerçek değerle tahmin değerleri arasında ki farkların kareleri toplamı=HKT
Ortalama değer ile tahmin değerleri arasında ki farkların kareleri toplamı=OFT
R2 değeri max 1 olacaktır, 0 ise kötü, negatif ise bu algoritmayı bırakabilirsiniz.
R2 değeri 1'e ne kadar yakın olursa model o kadar iyi demektir.
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
veriler= pd.read_csv("maaslar.csv")
x=veriler.iloc[:,1:2]#eğitim seviyesi
y=veriler.iloc[:,2:]#maaş
X=x.values
Y=y.values
#TEST VE TRAIN VERİLERİ BÖLME
from sklearn.model_selection import train_test_split
x_train,x_test,y_train,y_test=train_test_split(X,Y,test_size=0.33,random_state=0)
#RANDOM FOREST
from sklearn.ensemble import RandomForestRegressor
rf_reg=RandomForestRegressor(n_estimators=10,random_state=0)
rf_reg.fit(X,Y)#X bilgisinden Y bilgisini öğren
print(rf_reg.predict(np.array([6.5]).reshape(1, 1)))
plt.scatter(X,Y,color='red')
plt.plot(x,rf_reg.predict(X),color='blue')
plt.show()
from sklearn.metrics import r2_score
print(r2_score(Y,rf_reg.predict(X)))