Apa itu SEMMA

 SEMMA merupakan singkatan dari Sample, Explore, Modify, Model, Assess dan  merupakan framework yang digunakan dalam proses data mining.

 Kerangka  SEMMA diperkenalkan oleh SAS Institute sebagai alternatif  kerangka  CRISP-DM.

 Berikut tahapan kerangka SEMMA.

 1.Sampel: Pilih sampel yang representatif dari data yang tersedia.

 Fase ini mengumpulkan data yang berisi subset  data lengkap yang relevan untuk dianalisis.

 2.Eksplorasi: Mengeksplorasi dan menganalisis data untuk memahami karakteristiknya.

 Ini mencakup visualisasi data, statistik deskriptif, dan teknik eksplorasi data lainnya untuk mengidentifikasi pola, anomali, dan tren yang menarik.

 3.Perubahan: Memproses dan mengubah data untuk mempersiapkannya untuk analisis lebih lanjut.

 Hal ini dapat mencakup normalisasi, memasukkan data yang hilang, atau menyesuaikan fitur untuk meningkatkan kualitas data.

 4.Model: Membangun model atau algoritme yang sesuai untuk menganalisis data dan mengekstrak informasi  berguna.

 Teknik penambangan data  seperti regresi, klasifikasi, dan pengelompokan digunakan untuk memodelkan pola dalam data.

 5.Evaluasi: Evaluasi model yang dibuat untuk menentukan keakuratan dan relevansinya untuk mencapai tujuan analitis Anda.

 Evaluasi ini mencakup penggunaan metrik kinerja yang tepat untuk mengukur kualitas model.

 Kerangka  SEMMA menekankan  pendekatan berulang dan interaktif dalam proses penambangan data, memungkinkan tahapan diulang dan disesuaikan tergantung pada hasil analisis yang diperoleh.


Comments

Popular posts from this blog

QUIS 5

Mengenal CRISP-DM