Data Analytic Bertujuan Membangun model Machine Learning

 



Pengertian dari Data👀

    Sekarang ini, data dijadikan sebagai sebuah keterangan dan bahkan menjadi acuan untuk mempermudah orang-orang dalam mencari ataupun mengamati suatu hal. Keterangan dari data tersebut bisa berupa kata-kata, kalimat, angka, simbol, dan lainnya. Akan tetapi, jika ingin memahami lebih dalam mengenai data, maka alangkah lebih baik kita kita mencari tahu dulu apa pengertian data secara umum.

    Data adalah sekumpulan informasi yang dapat berupa angka, teks, gambar, atau jenis informasi lainnya yang dikumpulkan melalui observasi, pengukuran, atau penelitian. Data digunakan untuk analisis dan pengambilan keputusan.

    Data Menurut para Ahli:

    Pengertian data menurut Arikunto Suharsimi adalah serangkaian fakta dan juga angka yang bisa digunakan sebagai salah satu bahan untuk menyusun suatu informasi.

    Pengertian data menurut Kuswandi dan E. Mutiara adalah sekumpulan informasi yang diperoleh dari suatu pengamatan yang dapat berupa simbol, angka, dan juga properti.

Apa Itu Data Analytic?👀

    Data Analyst adalah seseorang yang bertugas untuk mengumpulkan, memproses, dan menganalisis data untuk mendapatkan wawasan yang dapat digunakan untuk mendukung keputusan bisnis. Tugas utama mereka termasuk membersihkan data, melakukan analisis statistik, dan menyajikan hasil dalam bentuk laporan atau visualisasi.

    Data analytics merupakan salah satu bentuk business intelligenceArtinya, data ini digunakan organisasi untuk memecahkan masalah dan tantangan tertentu. Proses yang dilalui berkaitan dengan menemukan pola di antara kumpulan data, lalu memberikan pengetahuan tentang sesuatu yang berguna dan relevan berkaitan dengan usaha peningkatan bisnis.

    Nantinya, data analytics membantu kamu mengevaluasi pengalaman di masa lalu dan memprediksi tren yang mungkin terjadi di masa depan. Alih-alih mendasarkan keputusan bisnis dan strategi pada tebakan saja, kamu bisa memutuskan sesuatu berbasis data.

Apa Itu Big Data?👀 

    Big Data adalah istilah yang digunakan untuk menggambarkan volume data yang sangat besar dan kompleks sehingga sulit untuk dianalisis menggunakan alat dan teknik tradisional. Big Data biasanya dicirikan oleh 3V: Volume, Velocity, dan Variety.

    Namun saat ini, data yang Anda miliki makin beragam, termasuk postingan di media sosial, riwayat belanja di marketplace, hingga pencarian di mesin pencari yang menunjukkan ketertarikan Anda tentang suatu topik.

    Semua data tersebut terus dihasilkan bersamaan dengan data dari pengguna lain di seluruh dunia. Bahkan, pengguna internet menghasilkan data sekitar 2,5 quintillion bytes setiap hari

Pandas Dataframe?👀 

    Pandas DataFrame adalah struktur data tabular dua dimensi yang sangat fleksibel dalam pustaka Pandas pada Python. DataFrame mirip dengan tabel dalam database atau spreadsheet, di mana setiap kolom dapat memiliki jenis data yang berbeda.

    Dengan kata lain, Pandas adalah librari analisis data yang memiliki struktur data yang diperlukan untuk membersihkan data mentah ke dalam sebuah bentuk yang cocok untuk analisis (yaitu tabel). Pandas melakukan tugas penting seperti menyelaraskan data untuk perbandingan dan penggabungan set data, penanganan data yang hilang, dll, itu telah menjadi sebuah librari de facto untuk pemrosesan data tingkat tinggi dalam Python (yaitu statistik). Pandas pada mulanya didesain untuk menangani data finansial, dikarenakan altenatif umum adalah menggunakan spreadsheet (misalnya Microsoft Excel).

Library Visualisasi Data pada Python👀

Beberapa library visualisasi data pada Python antara lain:

  • Matplotlib: Library dasar untuk membuat grafik statis, animasi, dan interaktif.
  • Seaborn: Dibangun di atas Matplotlib, menyediakan antarmuka tingkat tinggi untuk membuat visualisasi statistik yang menarik.
  • Plotly: Digunakan untuk membuat visualisasi interaktif dan dinamis, cocok untuk dashboard web.
  • Bokeh: Menyediakan kemampuan untuk membuat visualisasi interaktif yang dapat ditampilkan di browser.
  • Altair: Library deklaratif untuk membuat grafik statistik yang interaktif dan mudah digunakan.

Machine Learning!👀

Machine Learning adalah cabang dari kecerdasan buatan yang memungkinkan komputer untuk belajar dari data tanpa diprogram secara eksplisit. Dengan menggunakan algoritma, komputer dapat mengidentifikasi pola dan membuat prediksi berdasarkan data yang diberikan. Contoh aplikasi machine learning termasuk pengenalan suara, klasifikasi gambar, dan rekomendasi produk.

Outlier pada Data Analytic

Outlier adalah data yang berbeda secara signifikan dari data lainnya dalam satu set. Outlier dapat disebabkan oleh kesalahan pengukuran, variasi alami dalam populasi, atau kejadian luar biasa. Mengidentifikasi dan menangani outlier penting untuk mencegah distorsi analisis data.

Model Supervised Learning

Supervised Learning adalah jenis machine learning di mana model dilatih menggunakan data berlabel. Artinya, setiap input data memiliki output yang diketahui, dan model belajar untuk memetakan input ke output. Contoh algoritma supervised learning termasuk regresi linear, regresi logistik, dan pohon keputusan.

9. Cross Validation Sampling

Cross Validation adalah teknik untuk menilai kinerja model machine learning dengan membagi data menjadi beberapa subset, melatih model pada beberapa subset, dan mengujinya pada subset yang tersisa. Teknik ini membantu dalam mengurangi overfitting dan memberikan estimasi yang lebih akurat tentang kinerja model pada data yang tidak terlihat.

Hyperparameter Tuning

Hyperparameter Tuning adalah proses untuk menemukan set hyperparameter optimal untuk model machine learning. Hyperparameter adalah parameter yang tidak dipelajari dari data tetapi ditentukan sebelum pelatihan model. Tuning dilakukan untuk meningkatkan kinerja model dengan mencoba berbagai kombinasi hyperparameter.

Google Colab

Google Colab adalah lingkungan notepad berbasis cloud yang memungkinkan Anda menulis dan mengeksekusi kode Python langsung di browser. Colab menyediakan akses gratis ke GPU, memungkinkan kolaborasi real-time, dan mendukung banyak library populer seperti TensorFlow, Keras, dan PyTorch. Ini adalah alat yang sangat berguna untuk pembelajaran dan proyek machine learning.


Sumber:

https://www.gramedia.com/literasi/pengertian-data/

https://revou.co/panduan-karir/data-analytics-adalah

https://www.niagahoster.co.id/blog/big-data-adalah/

https://r.search.yahoo.com/_ylt=Awr99vYxOEZmWO8DbHFXNyoA;_ylu=Y29sbwNncTEEcG9zAzEEdnRpZAMEc2VjA3Ny/RV=2/RE=1717087538/RO=10/RU=https%3a%2f%2fmedium.com%2f%4016611092%2fmengenal-pandas-dalam-python-cc66d0c5ea40/RK=2/RS=ZlQTbsTTvXU3hmEYA8InLyNG08s-

https://chatgpt.com/




Komentar

Postingan populer dari blog ini

Sejarah Laravel dari awal hingga versi terbaru

Penjelasan Tentang GitHub dan GitLab