Veri Madenciliği Nedir ve Veri Madenciliği’ne Giriş

Merhaba,
Uzun zamandır dikkatimi çeken bir platformdu mobilhanem.com. Kimi zaman benim de istifade ettiğim yazılar da oldu bu siteden. Günlerden bir gün mobilhanem ekibinden Cahit İşleyen isimli arkadaş ile sosyal medya üzerinden tanışma ve görüşme fırsatı bulduk.  İşte o tanışmanın bir sonucu olarak bir anda kendimi ben de bu platformda yazar olarak buldum. Şimdi Veri Madenciliği Nedir ve Veri Madenciliği’ne Giriş dersi ile birlikteyiz. Neden yazar oldum diye sorarsanız? Daha fazla kişiye ulaşmak ve uzmanlık alanım veri madenciliği hakkında size bilgiler sunabilmek için.

Veri Madenciliği Giriş

Bu ilk yazıda önce kendimden bahsedeyim, sonra veri madenciliğine yüzeysel bir bakalım sonra da bundan sonraki yazılarımız hakkında bir şeyler yazarak bitireyim.

İsmim Hidayet Takcı. 2011 yılından bu yana Sivas Cumhuriyet Üniversitesi Bilgisayar Mühendisliği Bölümü Yazılım Anabilim Dalında öğretim üyesi olarak görev yapıyorum. Daha önce Gebze Yüksek Teknoloji Enstitüsünde 1997 – 2011 yılları arasında öğretim elemanı olarak görev yapmıştım. Şu an akademik unvanım Doçent olup doçentlik alanım da Bilgisayar Mühendisliği doğal olarak. 1999 yılında doktora çalışmalarına başladığımda Data Mining konusu ile tanıştım. Bu alanda en iyi yazılımlardan biri olan Statistica Data Miner ürün tanıtımını ülkemizde ilk olarak ben yaptım. Finansbank dahil olmak üzere birçok firma ile data mining projeleri bağlamında görüşmelerimiz ve başarılı projelerimiz oldu. Bu alanda Gebze Yüksek Teknoloji Enstitüsü Bilgisayar Mühendisliği bölümü bünyesinde Data Mining Lab. İsimli araştırma laboratuvarını kurdum. Çok sayıda proje ve yayın çalışması yaptım ve yapmaya devam ediyorum. Ayrıca; facebook ortamında 2008 yılında Data Mining grubunu kurdum ve sosyal medyanın en aktif Data Mining gruplarından birisini yönetiyorum. Ek olarak verimadencisi.blogspot.com adresinde yer alan bloğumda yıllardır bu alanda yazılar yazıyorum. Kısacası 20 yıldır Data Mining alanında birçok çalışma yaptım ve yapmaya devam ediyorum. Son olarak yıllardır bu alanda dersler veriyor ve dilim döndüğünce içerik üretiyorum.

Veri Madenciliği Nedir?

Veri madenciliğinin birçok tanımı var mutlaka ama benim yıllardır tercih ettiğim tanım şu şekilde: “Büyük hacimli veri içerisinde anlamlı fakat gizli kalmış bilgi, örüntü veya kuralların otomatik veya yarı otomatik yöntemlerle çıkarılmasını ifade eden sürecin adıdır”. Veri madenciliği bir süreçtir. Tek bir atomik işlemden fazlasıdır. Verinin seçilmesinden başlayan bu süreç üst yönetime anlamlı bilginin sunumuna kadar devam etmektedir.

Veri madenciliği yapmak bir ihtiyacın sonucudur. Artan veri miktarı, düşen donanım maliyetleri, rekabetçi baskı ve buna benzer nedenlerle artık bu işi yapmak lüks değil ihtiyaçtır. Sebebi bilinmeyen hastalıkların teşhisi klasik yöntemlerle mümkün değildir, insan kaynaklı yorum belli bir aşamadan sonra sorunludur, uzmanlık gerektiren işlerde görev alan personel her zaman gerçekten uzman değildir ve bunun sonucu olarak da çözülmesi gereken birçok problem çözülememektedir.

Veri Madenciliği Nerede Kullanılıyor?

Hangi sektörlerde kullanılıyor sorusu da ilk etapta akla gelen sorulardan birisi muhakkak. İçinde veri bulunup da veri madenciliği kullanılmayan sektör hemen hemen yok. Örneğin, web alanında kullanılıyor ve adına web madenciliği diyoruz, tıp alanında kullanılıyor ve adına tıbbi veri madenciliği diyoruz, metin alanında kullanılıyor ve adına metin madenciliği diyoruz, eğitim alanında kullanıldığında adı eğitimsel veri madenciliği oluyor vs.

Bu alanı en iyi kullanan firma hangisidir sorusunu cevaplamak çok zor. Artık veri madenciliği kullanmayan firma kalmadığı için böyle bir soruya cevap vermek mümkün değil. Bununla birlikte IBM Watson bilgisayarlarında yoğun olarak veri madenciliği ve yapay zekâ kullanılıyor. Ayrıca Genom projesi de bir yönüyle önemli bir veri madenciliği projesi. Buradan veri ile ilgili makaleye ulaşabilirsiniz.

Veri Madenciliği ve Yapay Zeka

Son dönemde gündemde olan iki konu ile de yakından ilişkilidir: Yapay Zekâ ve Büyük Veri. Aralarındaki ilişki şu şekilde aslında. Yapay Zekâ veya özelde Makine Öğrenmesi veri madenciliği adımları arasında yer alıyor. Yani veri madenciliği çalışanlar için yapay zekâ teknikleri bir araç olarak kullanılıyor. Veri madenciliği ile yapay zekâ arasında üstünlük ilişkisi kurmaya gerek yok çünkü arada kapsama ilişkisi var ve veri madenciliği yapay zekâ tekniklerini kapsıyor. Veri madenciliğinin yapay zekâdan farkı veriye ait ön işlem ve son işlem faaliyetlerini de içermesi. Peki, büyük veri ile ilişkisi nedir derseniz. Büyük veri ile üretilen verilerin önemli bir kısmı aslında veri madenciliği süreciyle keşif ve analiz ediliyor.

 

Bugün bir giriş yapmaya çalıştık. Bundan sonraki yazılarımızda çerçeveyi geniş tutarak alanla ilgili her şeyden bahsetmeye çalışacağız. Sizlerden gelen geri bildirimler de yazılarımıza yön verecektir.  Gelecek yazılarda görüşmek dileğiyle.

64

Doç. Dr.Hidayet TAKÇI

Assoc. Prof. Dr. Hidayet TAKCI
Sivas Cumhuriyet University, Computer Engineering Department

Yorum Yaz

Haftalık Bülten

Mobilhanem'de yayınlanan dersleri haftalık mail almak ister misiniz?