|
| Latest News |
 |
Jadwal Kuliah
- Kelas A: Rabu jam 12:50-15:20 di Y-102
- Kelas X: Kamis jam 15:30-18:00 di Y-102
|
|
|
Website Mata Kuliah Pengenalan Pola
Dosen: Dr. Agus Zainal Arifin
Email: agus.za (at) its-sby . edu
Kelas: A dan X
Kode: CI1423
Jurusan: Teknik Informatika, FTIF, ITS
OTHER CLUSTERING ALGORITMA
- Ada beberapa algoritma yang dapat dipelajari selain algoritma clustering. Namun dasar dari algoritma-algoritma ini adalah algoritma clutsering.
- Algoritma yang dipelajari yaitu:
- Graph theory based clustering algorithms.
- Competitive learning algorithms.
- Valley seeking clustering algorithms
- Sebelum kita mengklarifikasi tergolong algoritma clustering atau bukan maka kita harus memahami dulu dasar dari algoritma clustering. Dasar dari algoritma clustering diantaranya :
- The Minimum Spanning Tree (MST).
- Regions of influence.
- Directed trees
- Untuk membuat sketsa algoritmanya, ada beberapa hal yang menjadi acuan, diantaranya :
- Menentukan MSG dari G
- Menghapus edge yang tidak konsisten
- Mengidentifikasi klutser yang berhubungan dengan MST
- Identifikasi edge tidak konsisten
- Untuk setiap edge e pada MST dari G:
- Anggap semua edges yang melewati k menjauh dari edge e
Tentukan mean me dan standard deviation Še dari weights.
If we melewati lebih dari q (biasanya q=2) standard deviations Še dari me, maka:
e dianggap tidak konsisten
Else e
dianggap konsisten
End if
Cara mengidentifikasi tidak konsistennya edge sesuai dengan algoritma diatas, dengan menentukan gthe mean me and the standard deviation Še of their weightsh.
- Algoritma berdasarkan ROI digunakan untuk menambahkan edge yang terkoneksi antara xi dan xj. Jika tidak ada vektor lain pada X yang membentang pada R(xi,xj).
- Tujuan dari Generalized Competitive Learning Scheme (GCLS) untuk meg-update kondisi terbaru dari wj sampai didapat converge occurred atau (t > tmax).
- Valley ? Seeking Clustering Algorithms,Membiarkan p(x) menjadi fungsi yang ringkas yang didistribusikan dari vector dalam X. Himpunan terlihat seperti puncak dari p(x) (himpunan) yang dipisahkan oleh lembah
- Clustering Via Cost Optimization
- Branch and Bound Clustering Algorithms
- Memperhitungkan solusi optimal secara global dengan masalah kombinatorial.
- Menghindari seluruh pencarian dengan pekerjaan criteria monotonic J.
- Kriteria monotonic J: Jika vector k bagian Xditempatkan pada himpunan, tugas dari extra vector pada himpunan tidak berkurang nilainya dari J.
- Clustering using genetic algorithms? Mutation:
- Algoritma ini diterapkan setelah reproduksi dan operator di crossover.
- Algoritma ini memilih secara acak sebuah elemen dari solusi dan menambahkannya pada beberapa kemungkinan.
- Algoritma ini dapat dilihat sebagai jalan keluar ketika terbentur masalah minimal lokal.
- Density ? Based Algorithms For Large Data Sets
- Anggap cluster sebagai wilayah pada ruang l-dimensi? yang berpotongan di titik X.
- Memiliki kemampuan untuk memulihkan bentuk? arbitary cluster.
- Menghandle secara efisien.?. Memilikin waktu? kompleksitas kurang dari O(N2).
- Dalam mengidentifikasi HIf digunakan beberapa metode, antara lain
- Feature generation methods?
- Digunakan untuk menjaga jarak antara points dalam high-dimensional space, ketika dirancang untuk lower-dimensional space.
- Semuanya sangat berguna pada produksi representasi compact dari the original high-dimensional feature space.
- Semuanya berguna dalam berbagai kasus dimana nilai yang sering muncul dari suatu fitur yang tercontribut untuk mengidentifikasi clusters.
- Cara-cara yang? dipakai pada kategori ini adalah
- Principal component analysis (PCA).
- Singular value decomposition (SVD).
- Nonlinear PCA.
- Independent component analysis (ICA)
- Feature selection methods?
- Pengidentifikasian fitur-fitur yang menjadi? kontributor utama untuk informasi clusters.
- Wrapper model (algoritma cluster adalah pilihan utama dan sebuah set dari fitur Fi yg terevaluasi hasilnya tercampur dari aplikasi algorithm ke X, dimana masing-masing point hanya bersama dalam Fi yang mengambil dalam akun). Filter model (evaluasi dari sebuah subset untuk fitur-fitur yang menggunakan interinsik datri property-properti data, sebelim terjadi aplikasi algoritma cluster).
- Biasanya digunakan ketika semua clusters terhubung dalam subspace? yang sama dari suatu feature space?
- Random projections

|


|