Preprocessing data adalah langkah krusial dalam analisis data untuk memastikan bahwa data yang akan dianalisis bersih, terstruktur, dan siap digunakan. Berikut adalah beberapa langkah umum dalam preprocessing data: 1. Mengumpulkan Data Data dapat diperoleh dari berbagai sumber seperti database, file CSV, API, atau web scraping. Penting untuk memastikan data yang dikumpulkan relevan dengan tujuan analisis. 2. Memahami Data Melakukan eksplorasi awal untuk memahami struktur dan karakteristik data, termasuk jenis data (numerik, kategorikal, teks, dll.), distribusi data, dan mengidentifikasi missing values atau outliers. 3. Membersihkan Data - Mengatasi Missing Values: Mengisi missing values dengan metode seperti imputasi (mean, median, mode), atau menghapus baris/kolom yang memiliki missing values. - Mengatasi Duplikasi: Menghapus data duplikat untuk menghindari bias dalam analisis. - Mengatasi Outliers: Mengidentifikasi dan menangani outliers yang dapat mempengaruhi hasil analisis. Me