Sosyal Ağlarda Makine Öğrenmesi 6 [ Decision Tree Regression ]

Bu bölümde Decision Tree Regression, Türkçe ismiyle karar ağaçları regresyonunda modelleme yapacağız.

İlk olarak bir kavramla başlayalım.

CART:

CART, Classification and Regression Trees ifadesinin kısaltması olarak karşımıza geliyor. Karar ağaçları ve regresyon ağaçları için kullanılan bir terim. Bu bölümde Regresyon Ağaçlarına odaklanıyoruz. Regresyon ağaçları sınıflandırma ağaçlarına göre bir miktar daha kompleks diyebiliriz.

Karar ağacı regresyonunda özetle bağımsız değişkenleri bilgi kazancına göre aralıklara ayırıyor ve bir değer sorulduğunda cevap olarak bu aralıktan ortalamayı söylüyor.

Şimdi kodlarımıza geçelim.

İlk olarak kütüphaneleri ve veri setimizi içe aktaralım. Yine fenomen isimli dosyamızı kullanalım.

Şimdi DecisionTreeRegressor sınıfını içe aktararak buradan bir DecisionTreeRegressor nesnesi oluşturuyoruz. Ardından fit metoduyla eğitiyoruz. Random_state ifadesinin fonksiyonunu tekrar hatırlarsak, kodu her çalıştırdığımızda aynı rastgelelik ile çalışmasını sağlıyordu. Ardından 6.5 değerini tahmin ettik.

Bu değer için sonuç 10000 olarak geldi.

y_pred
Out[23]: array([10000.])

Tüm değerler için sonuçlarımızı görselleştirelim.

Verisetimiz basit olduğu için doğruluk oranı biraz sıradışı derecede iyi olsa da normalde de daha karmaşık veri setlerinde bu yöntem ile güzel sonuçlar alabiliyoruz. Ayrıca SVR’deki gibi bir Feature Scaling işlemine ihtiyaç duymamız daha hızlı ilerlememizi sağladı.

Unutma:

Karar ağaçları regresyonu kesiklidir. O yüzden 6.5’i de 6.4’ü de tahmin ederken aynı değeri 10000’i bulur. Grafikten de bu durumu rahatlıkla görebiliriz. Bu problemimize göre bazen avantaj olabilirken bazen de dezavantaj olabilir.

You may also like...

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir