Data Analytic Bertujuan Membangun model Machine Learning
Pengertian dari Data👀
Data Menurut para Ahli:
Apa Itu Data Analytic?👀
Data analytics merupakan salah satu bentuk business intelligence. Artinya, data ini digunakan organisasi untuk memecahkan masalah dan tantangan tertentu. Proses yang dilalui berkaitan dengan menemukan pola di antara kumpulan data, lalu memberikan pengetahuan tentang sesuatu yang berguna dan relevan berkaitan dengan usaha peningkatan bisnis.
Nantinya, data analytics membantu kamu mengevaluasi pengalaman di masa lalu dan memprediksi tren yang mungkin terjadi di masa depan. Alih-alih mendasarkan keputusan bisnis dan strategi pada tebakan saja, kamu bisa memutuskan sesuatu berbasis data.
Apa Itu Big Data?👀
Namun saat ini, data yang Anda miliki makin beragam, termasuk postingan di media sosial, riwayat belanja di marketplace, hingga pencarian di mesin pencari yang menunjukkan ketertarikan Anda tentang suatu topik.
Semua data tersebut terus dihasilkan bersamaan dengan data dari pengguna lain di seluruh dunia. Bahkan, pengguna internet menghasilkan data sekitar 2,5 quintillion bytes setiap hari!
Pandas Dataframe?👀
Library Visualisasi Data pada Python👀
Beberapa library visualisasi data pada Python antara lain:
- Matplotlib: Library dasar untuk membuat grafik statis, animasi, dan interaktif.
- Seaborn: Dibangun di atas Matplotlib, menyediakan antarmuka tingkat tinggi untuk membuat visualisasi statistik yang menarik.
- Plotly: Digunakan untuk membuat visualisasi interaktif dan dinamis, cocok untuk dashboard web.
- Bokeh: Menyediakan kemampuan untuk membuat visualisasi interaktif yang dapat ditampilkan di browser.
- Altair: Library deklaratif untuk membuat grafik statistik yang interaktif dan mudah digunakan.
Machine Learning!👀
Machine Learning adalah cabang dari kecerdasan buatan yang memungkinkan komputer untuk belajar dari data tanpa diprogram secara eksplisit. Dengan menggunakan algoritma, komputer dapat mengidentifikasi pola dan membuat prediksi berdasarkan data yang diberikan. Contoh aplikasi machine learning termasuk pengenalan suara, klasifikasi gambar, dan rekomendasi produk.
Outlier pada Data Analytic
Outlier adalah data yang berbeda secara signifikan dari data lainnya dalam satu set. Outlier dapat disebabkan oleh kesalahan pengukuran, variasi alami dalam populasi, atau kejadian luar biasa. Mengidentifikasi dan menangani outlier penting untuk mencegah distorsi analisis data.
Model Supervised Learning
Supervised Learning adalah jenis machine learning di mana model dilatih menggunakan data berlabel. Artinya, setiap input data memiliki output yang diketahui, dan model belajar untuk memetakan input ke output. Contoh algoritma supervised learning termasuk regresi linear, regresi logistik, dan pohon keputusan.
9. Cross Validation Sampling
Cross Validation adalah teknik untuk menilai kinerja model machine learning dengan membagi data menjadi beberapa subset, melatih model pada beberapa subset, dan mengujinya pada subset yang tersisa. Teknik ini membantu dalam mengurangi overfitting dan memberikan estimasi yang lebih akurat tentang kinerja model pada data yang tidak terlihat.
Hyperparameter Tuning
Hyperparameter Tuning adalah proses untuk menemukan set hyperparameter optimal untuk model machine learning. Hyperparameter adalah parameter yang tidak dipelajari dari data tetapi ditentukan sebelum pelatihan model. Tuning dilakukan untuk meningkatkan kinerja model dengan mencoba berbagai kombinasi hyperparameter.
Google Colab
Google Colab adalah lingkungan notepad berbasis cloud yang memungkinkan Anda menulis dan mengeksekusi kode Python langsung di browser. Colab menyediakan akses gratis ke GPU, memungkinkan kolaborasi real-time, dan mendukung banyak library populer seperti TensorFlow, Keras, dan PyTorch. Ini adalah alat yang sangat berguna untuk pembelajaran dan proyek machine learning.
Sumber:
https://www.gramedia.com/literasi/pengertian-data/
https://revou.co/panduan-karir/data-analytics-adalah
Komentar
Posting Komentar