Scikit Learn, Python programlama dili ile yazılmış bir makine öğrenmesi kütüphanesidir. Doğrusal regresyon, lojistik regresyon, karar ağaçları, rastgele orman gibi birçok temel yöntemi içeren bu kütüphane, Anaconda ile beraber geliyor.
scikit-learn paketinin bu kadar popüler olmasının birkaç sebebi var. Bunlardan ilki ihtiyaç duyacağınız temel yöntemlerin büyük bir kısmını içermesi. İkinci olarak, scikit-learn sayesinde veri analitiği uygulamalarını baştan sona yürütmenizin mümkün olmasını sayabiliriz.
Verideki eksik değerleri doldurmak, öznitelik seçmek, çapraz doğrulama yapmak, sonuçları değerlendirmek için ayrı ayrı modüller sayesinde başka bir pakete ihtiyacınız kalmıyor. scikit-learn paketinin en güzel yanı basit bir API’a sahip olması sayesinde uygulayacağınız farklı yöntemler için farklı sözdizimleri öğrenmenizin önüne geçmesi.
Veri Seti Ekleme
from sklearn import datasets
import pandas as pd
import numpy as np
from sklearn import svm
iris = datasets.load_iris()
print(iris.data)
print(iris.target)
Cross Validation
cross validation(çapraz doğrulama) işlemlerini bu kütüphane ile yapabiliriz. Cross Validation işlemi veriyi test ve eğitim verisi olarak ayırma işlemlerinde geçiyor.
from sklearn.cross_validation import train_test_split
x_train,x_test,y_train,y_test=train_test_split(a,b,test_size=0.33,ransom_state)
düzeltme:cross_validation yerine model_selection kullanılacak.
Scikit Learn kütüphanesinin R programlamada karşılığı Tidymodels'dir.