Apa itu SEMMA
SEMMA merupakan singkatan dari Sample, Explore, Modify, Model, Assess dan merupakan framework yang digunakan dalam proses data mining.
Kerangka SEMMA diperkenalkan oleh SAS Institute sebagai alternatif kerangka CRISP-DM.
Berikut tahapan kerangka SEMMA.
1.Sampel: Pilih sampel yang representatif dari data yang tersedia.
Fase ini mengumpulkan data yang berisi subset data lengkap yang relevan untuk dianalisis.
2.Eksplorasi: Mengeksplorasi dan menganalisis data untuk memahami karakteristiknya.
Ini mencakup visualisasi data, statistik deskriptif, dan teknik eksplorasi data lainnya untuk mengidentifikasi pola, anomali, dan tren yang menarik.
3.Perubahan: Memproses dan mengubah data untuk mempersiapkannya untuk analisis lebih lanjut.
Hal ini dapat mencakup normalisasi, memasukkan data yang hilang, atau menyesuaikan fitur untuk meningkatkan kualitas data.
4.Model: Membangun model atau algoritme yang sesuai untuk menganalisis data dan mengekstrak informasi berguna.
Teknik penambangan data seperti regresi, klasifikasi, dan pengelompokan digunakan untuk memodelkan pola dalam data.
5.Evaluasi: Evaluasi model yang dibuat untuk menentukan keakuratan dan relevansinya untuk mencapai tujuan analitis Anda.
Evaluasi ini mencakup penggunaan metrik kinerja yang tepat untuk mengukur kualitas model.
Kerangka SEMMA menekankan pendekatan berulang dan interaktif dalam proses penambangan data, memungkinkan tahapan diulang dan disesuaikan tergantung pada hasil analisis yang diperoleh.
Comments