Pertemuan 9 (Supervise Learning (Klasifikasi) & Algoritma yang ada didalamnya (minimal 30 algoritma Klasifikasi))
Supervised Learning (Klasifikasi) & Algoritma yang ada didalamnya (minimal 30 algoritma Klasifikasi)
A. Apa itu Supervised Learning?
Supervised Learning, atau pembelajaran terawasi, adalah sebuah metode dalam machine learning di mana model dilatih dengan menggunakan data yang sudah memiliki label. Artinya, setiap data yang digunakan untuk melatih model sudah diketahui hasil atau kategorinya. Selama proses pelatihan, data input diberikan bersama dengan output yang benar, sehingga model dapat belajar bagaimana mencocokkan input dengan output yang tepat.
Contoh sederhana dari Supervised Learning adalah saat kita ingin mengajarkan program komputer untuk mengenali gambar kucing dan anjing. Kita menyediakan sejumlah gambar kucing dan anjing yang sudah diberi label, misalnya gambar kucing dengan label "kucing" dan gambar anjing dengan label "anjing". Model kemudian mempelajari data ini untuk mengenali pola-pola yang membedakan kucing dari anjing. Setelah proses pelatihan selesai, ketika diberikan gambar baru, model akan dapat memprediksi apakah gambar tersebut adalah kucing atau anjing berdasarkan pola-pola yang telah dipelajarinya.
Supervised Learning banyak digunakan dalam berbagai aplikasi, seperti pengenalan suara, pengenalan wajah, deteksi spam pada email, prediksi cuaca, dan masih banyak lagi. Metode ini sangat efektif jika data pelatihan yang tersedia cukup banyak dan representatif, karena model dapat belajar dengan baik dari data yang sudah dilabeli tersebut.
B. Klasifikasi
Klasifikasi adalah salah satu tugas utama dalam Supervised Learning. Dalam klasifikasi, tujuan utamanya adalah mengelompokkan atau mengklasifikasikan data ke dalam kategori yang telah ditentukan. Kategori ini bisa berupa kelas diskrit, seperti "spam" atau "bukan spam" dalam kasus deteksi email spam, atau lebih kompleks seperti mengklasifikasikan jenis tumor sebagai "jinak" atau "ganas" dalam diagnosis medis.
Proses klasifikasi melibatkan beberapa tahap. Pertama, model dilatih menggunakan data pelatihan yang sudah diberi label. Misalnya, jika kita ingin membangun model untuk mengklasifikasikan email sebagai spam atau bukan spam, kita akan melatih model menggunakan sekumpulan email yang sudah dilabeli dengan benar. Model belajar mengenali fitur-fitur yang membedakan email spam dari email yang bukan spam, seperti kata-kata tertentu yang sering muncul dalam email spam.
Setelah model dilatih, model tersebut dapat digunakan untuk mengklasifikasikan data baru yang belum pernah dilihat sebelumnya. Misalnya, ketika sebuah email baru masuk, model akan menganalisis email tersebut dan memutuskan apakah email tersebut adalah spam atau bukan spam berdasarkan pola-pola yang telah dipelajari selama pelatihan.
C. 30 Algoritma Klasifikasi
1. K-Nearest Neighbors (KNN)
2. Decision Tree
3. Random Forest
4. Support Vector Machine (SVM)
5. Naive Bayes
6. Logistic Regression
7. Linear Discriminant Analysis (LDA)
8. Quadratic Discriminant Analysis (QDA)
9. Gradient Boosting Machine (GBM)
10. XGBoost
11. LightGBM
12. CatBoost
13. AdaBoost
14. Bagging
15. Extra Trees
16. Neural Networks
17. Convolutional Neural Networks (CNN)
18. Recurrent Neural Networks (RNN)
19. Long Short-Term Memory (LSTM)
20. Multilayer Perceptron (MLP)
21. Linear Regression (untuk klasifikasi biner)
22. Stochastic Gradient Descent (SGD)
23. Perceptron
24. Ridge Classifier
25. Lasso Classifier
26. Elastic-Net Classifier
27. Passive Aggressive Classifier
28. Voting Classifier
29. Stacking Classifier
30. Polynomial Kernel SVM
Komentar
Posting Komentar