Makine Öğrenmesiyle ilgili en çok sorulan 50 soru ve cevapları ( Bölüm 1)

Soru 1: Makine öğrenmesi nedir ?

Makine öğrenmesi, bir bilgisayar dalı. Geleneksel programlamadan farkı otomatik olarak öğrenen ve kendini geliştiren sistemler olması. Örneğin: Bir spam e-posta algoritması kullanıcılardan gelen geri bildirimler ile her geçen gün yeni şeyler öğrenir ve bu bilgilerle kendini geliştirir.

Soru 2: Veri madenciliği ile makine öğrenmesi arasındaki fark nedir ?

Veri madenciliği mevcut veriden bazı şablonlar, örüntüler çıkarırken makine öğrenmesi gerçek zamanlı problemlere de bu çıkan örüntüleri uygulayarak yol alır. Aşağıdaki görsel bu durumu daha güzel somutlaştırmış. İlk durumda Veri Madenciliği sıradışı bir engelle karşılaştığında bunla başa çıkamıyor. Tekrar dışarıdan programlanması gerekiyor. Fakat makine öğrenmesi için resmedilen ikinci çizimde araba buna benzer bir şablon arayarak engeli insan müdahalesi olmadan geçiyor.

Soru 3: Makine öğrenmesinde Overfitting nedir ?

Türkçe’ye “aşırı uyumlama” olarak çevrilen Overfitting olayında veri setinden öğrenmek yerine onu ezberlemeyi tercih eden kötü bir model geliştirilir. Bu istenmeyen, kaçınılması gereken bir durumdur. Bu durumda üzerinizde çalıştığınız veri seti üzerinde çok iyi sonuçlar alabilirsiniz fakat farklı bir veri setinde başarısız sonuçlar ortaya çıkacaktır. Şöyle düşünebiliriz. Kedi ve köpek ayrımı yapan bir veri setindeki hayvanların fotoğraflarını birebir ezberlediği için test kümesi iyi çalışıyor. Fakat farklı cins bir kedi veya köpek geldiğinde normalde yapabileceği doğru tahmini dahi yapamıyor.

Soru 4: Overfitting neden olur ?

Model oluştururken eğitim setinden faydalanmak yerine birebir bu set ezberlenirse overfitting olur. Tıpkı önceki yıllardaki sorulara çalışan birinin, bu soruları yorumlamak yerine birebir ezberleyip yeni bir soruda takılması gibi.

Soru 5: Overfitting olayının olmasının önüne nasıl geçerim ?

Aslında overfitting esas olarak küçük veri setlerinin sorunudur. Verisetinin büyümesi overfitting ihtimalini çoğu zaman azaltır. Verisetiniz küçükse çarpaz doğrulama ( cross validation ) tekniği kullanabilirsiniz. Bu yöntemde veriseti iki bölüme ayrılır. Eğitim seti üzerinden eğitim gerçekleşir ve test seti üzerinde bu eğitime göre uygulama yapılır. Tabi eğitim ve veri setini bölerken kullanacağınız oranı da doğru seçmeniz gerekiyor. Biz de blogtaki örneklerin bir çoğunda cross validation tekniğini kullandık. Oranımız ise genellikle verisetinin %75’ini eğitim , %25’ini test için ayırmak şeklinde oldu.

Soru 6: Endüktif makine öğrenmesi nedir?

Endüktif makine öğrenmesi, gözetimli makine öğrenmesinin diğer ismidir. Makine öğrenmesinin bu türünde, önceden öğretilen örneklere göre makine karar verir. Örneğin bir e-postanın spam olup olmadığı gözetimli(endüktif) öğrenme türüdür. Makina önceden bizim yaptığımız işaretlemelere göre yeni durumlarda karar verir.

Soru 7: Makine öğrenmesinde en popüler 5 algoritma hangisidir ?

a) Karar ağaçları
b) Sinir ağları(geri yayılım)
c) Olasılıksal ağlar
d)En yakın komşular
e) Destek vektör makinesi

Soru 8: Makine öğrenmesi algoritmaları arasındaki fark nedir ?

a)Gözetimli öğrenme
b)Gözetimsiz öğrenme
c)Yarı Gözetimli Öğrenme
d)Takviyeli Öğrenme
e) Transduction
f) Learning to Learn

Not: Çoğu kaynak bu öğrenme şekillerinden sadece ilk 3 tanesini esas alıyor. Yarım gözetimli ve takviyeli öğrenme de aynı anlamda kullanılıyor.

Soru 9: Bir makine öğrenmesi modeli inşaa ederken hangi aşamalardan geçilir?

a) Modelin tasarlanması

b)Modelin test edilmesi

c)Modelin uygulanması

Soru 10: Gözetimli öğrenmede standart yaklaşım nedir?

Gözetimli öğrenmede standart yaklaşım verisetinin eğitim ve test seti olarak ikiye ayrılmasıdır.

Soru 11: Eğitim seti ve test seti nedir ?

Enformasyon bilimlerinin bir çok alanında veri üzerinden şablonlar çıkarılır. Makine öğrenmesinde de tahminler için kullanacağımız desenleri keşfetmek için faydalandığımız veri setinin parçasına ‘Eğitim Seti’ denir. Eğitim seti içerdiği örneklerle Test Seti dediğimiz verisetinin kalan kısmındaki sonuçları doğru tahmin etmeye çalışır.

Soru 12: Makine öğrenmesindeki çeşitli yaklaşımlar nelerdir?

a) Konsept vs Sınıflandırma Öğrenmesi
b) Sembolik vs İstatistiksel Öğrenme
c)Endüktif vs Analitik öğrenme

Soru 13: Ne makine öğrenmesi değildir ?

a)Yapay Zeka
b)Kural bazlı müdahale

Bunların her ikiside yakın çalışma alanları olmasına rağmen birebir makine öğrenmesidir demek doğru değil. Bir çok yaklaşım makine öğrenmesini yapay zekanın bir alt dalı olarak gösteriyor. Fakat birbirinin yerine doğrudan kullanamıyoruz.

Soru 14: Gözetimsiz öğrenmenin fonksiyonu nedir?

a)Veri içerisindeki kümeleri keşfederiz
b)Verinin içerisindeki sıradışı yönelimleri keşfederiz
c)Verinin içindeki sıradışı koordinatları ve korelasyonları keşfederiz
d) Verinin içindeki düşük boyutlu kısımları keşfederiz

Soru 15: Gözetimli öğrenmenin fonksiyonunu nedir?

a)Sınıflandırma
b) Konuşma tanıma
c) Regresyon
d)Serileri tahmin etme

Soru 16: Algoritmadan bağımsız makine öğrenmesi nedir ?

Herhangi bir sınıflandırma veya öğrenme algoritmasından bağımsız öğrenmenin yapıldığı modeller bu isimle anılır.

Soru 17: Yapay zeka ile makine öğrenmesi arasındaki fark nedir?

Makine öğrenmesi verilerden bir algoritmaya göre model çıkarmayı hedeflerken yapay zekada buna ek olarak doğal dil işleme,planlama,robotik gibi alanları da kapsar.

Soru 18: Makine öğrenmesidneki sınıflandırıcı nedir?

Makine öğrenmesindeki sınıflandırıcı ayrık veya sürekli özellikteki vektörü tek bir ayrık değer olarak veren sistemdir.

Soru 19 : Naive Bayes algoritmasının avantajı nedir ?

Naive Bayes algorimasının avantajı küçük bir veri kümesiyle de eğitilebilmesi ve rakiplerine göre daha hızlı çalışmasıdır. Dezavantajı ise değişkenler arasındaki ilişkinin gösterilememesidir.

Soru 20: Örüntü tanıma hangi alanlarda kullanılır?

a)Bilgisayar Görüsü
b)Konuşma tanıma
c)Veri madenciliği
d)İstatistik
e)Biyoenformatik

Soru 21: Genetik programlama nedir?

Genetik algoritmalarının alt kolu olarak düşünülebilecek bir alan olan genetik programlamada belirlenen hedef fonksiyonunun sonuca ulaşması için yazılımın nasıl çalışması gerektiği bulunmaya çalışılır.

Soru 22: Endüktif mantıksal programlama nedir ?

Makine öğrenmesinde Endüktif Mantıksal Programlama nedir? Makine öğrenmesinin alt dalı olan Endüktif Mantıksal Programlama’da, arka plandaki bilgi ve örnekleri kullanarak mantıksal programlama yapılır.

Soru 23: Makine öğrenmesinde model seçimi nedir?

Makine öğrenmesinde doğru model seçimine ihtiyaç duyarız. Aynı veri setinde farklı sonuçlar doğurabilen bu model seçimi istatistik,veri madenciliği gibi alanlara da uygulanabilmektedir.

Soru 24: Gözetimli öğrenmede kalibrasyon için kullanılan iki metod nedir ?

Bu metodlar Platt Kalibrasyonu ve Isotonic Regresyondur. Platt kalibrasyonunda bir sınıflandırma modelinin çıktıları sınıflar üzerinde olasılıksal dağılıma dönüşür. Örnek görsel aşağıdadır.

Isotonic Regresyon’un arka planında lojistik regresyon yerine basamaklandırılmış merdivenimsi bir kalibrasyon kullanma fikri vardır. Örnek görsel aşağıdadır.

Soru 25: Overfittingi önlemek için kalibrasyon metodlarından hangisi daha çok kullanılır ?

Yeterli veriye sahip verisetleri için Isotonic Regresyon overfitting sorununu önlemede kullanılır.

You may also like...

Bir cevap yazın

E-posta hesabınız yayımlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir