Veri madenciliği uygulamalarında kaynakların %80’ i verilerin ön işlemden geçirilmesi ve temizlenmesi süreçleri için harcanmaktadır (Piramuthu, 2003:1)
Veri temizliği: Nihai raporu elde etmek için verilerin gruplandırması gerekir
8K views 3 years ago Veri Madenciliği
Veri Madenciliği Neden Önemlidir? Veri Madenciliği Süreci Nasıl İşler? Veri Madenciliği
Konular
Veri madenciliği, eldeki verilerden üstü kapalı, çok net olmayan, önceden bilinmeyen ancak potansiyel olarak kullanışlı bilginin çıkarılmasıdır
Bunun anlamı, veri madenciliği bir kurumda üretilen tüm verilerin
İlişkilendirme Kuralları
-Neyin önemli olduğunu bulup, bundan en iyi hangi şekilde Veri Seçimi, Ön İşleme ve Temizleme, İndirgeme, Veriyi Dönüştürme, Veri Madenciliği, Yorumlama ve Doğrulama aşamalarını içerir
Veri Pazarı (Data Mart): İstenilen araştırmaya Veri analitiği süreci, veri toplama, veri temizleme, veri modelleme, veri analizi ve sonuçların sunumu aşamalarını içerir
Veri madenciliği uygulaması için gerekli olan niteliklerin seçilmesi
Veri Bütünleştirme: Veri Madenciliği Yapabilmek İçin Hangi Becerilere Sahip Olmak Gerekir? Milyonlarca farklı veri üzerinde çalışmalar yapmak sabır ve dayanıklılık gerektirir
sürekli nitelik değerlerini tahmin etmek: öngörü
Veritabanlarını kullanarak büyük veri kümelerindeki bir deseni keşfetmeye ve ham verileri iş öngörülerine Temiz, nitelikli ve bütünsel veriler karar vericilerin işleriyle ilgili daha doğru karar vermesine yardımcı olur ve potansiyel risklerden kurtarır
aof
Kısaca istatistik bilimi rakamları okur ve olasılıklı modellerle, özellikle verileri kullanan bu modellere ilikin tanımlama ve çıkarımlar ilgilidir
Bu şekilde birden fazla yöntem kullanılmaktadır
2
4
2
Veri İndirgeme 2
Ardından, toplanan veriler temizlenir ve düzenlenir