Sample, Explore, Modify, Model, dan Assess (SEMMA) adalah struktur alternatif yang dibuat oleh SAS Institute untuk mengelola proses data mining. Ini adalah metode yang teratur untuk menganalisis data serta membangun model prediksi. Berikut adalah ringkasan dari masing-masing tahapan dalam SEMMA: 1. Sample : Pada tahap pertama, data yang relevan dipilih dari berbagai sumber data. Sampel ini dapat berupa subset dari keseluruhan data dan dipilih sesuai kebutuhan analisis. 2. Explore : Setelah sampel data dipilih, tahap eksplorasi dilakukan untuk memahami secara lebih mendalam karakteristik dan struktur data. Ini melibatkan penggunaan visualisasi data, serta analisis statistik untuk mengidentifikasi pola atau tren yang menarik. 3. Modify : Tahap modifikasi melibatkan pra-pemrosesan data, di mana data dimodifikasi atau disiapkan untuk analisis lebih lanjut. Ini termasuk tindakan seperti penghapusan nilai yang hilang, pengisian data yang hilang, normalisasi, atau transformas...
Komentar
Posting Komentar