CI1423 Mata Kuliah Pengenalan Pola
Latest News
Jadwal Kuliah
  1. Kelas A: Rabu jam 12:50-15:20 di Y-102
  2. Kelas X: Kamis jam 15:30-18:00 di Y-102

Website Mata Kuliah Pengenalan Pola
Dosen: Dr. Agus Zainal Arifin
Email: agus.za (at) its-sby . edu
Kelas: A dan X
Kode: CI1423
Jurusan: Teknik Informatika, FTIF, ITS

OTHER CLUSTERING ALGORITMA

  • Ada beberapa algoritma yang dapat dipelajari selain algoritma clustering. Namun dasar dari algoritma-algoritma ini adalah algoritma clutsering.
  • Algoritma yang dipelajari yaitu:
    • Graph theory based clustering algorithms.
    • Competitive learning algorithms.
    • Valley seeking clustering algorithms
  • Sebelum kita mengklarifikasi tergolong algoritma clustering atau bukan maka kita harus memahami dulu dasar dari algoritma clustering. Dasar dari algoritma clustering diantaranya :
    • The Minimum Spanning Tree (MST).
    • Regions of influence.
    • Directed trees
  • Untuk membuat sketsa algoritmanya, ada beberapa hal yang menjadi acuan, diantaranya :
    • Menentukan MSG dari G
    • Menghapus edge yang tidak konsisten
    • Mengidentifikasi klutser yang berhubungan dengan MST
    • Identifikasi edge tidak konsisten
  • Untuk setiap edge e pada MST dari G:
  • Anggap semua edges yang melewati k menjauh dari edge e
    Tentukan mean me dan standard deviation ƒŠe dari weights.
    If we melewati lebih dari q (biasanya q=2) standard deviations ƒŠe dari me, maka:
    e dianggap tidak konsisten
    Else e
    dianggap konsisten
    End if
    Cara mengidentifikasi tidak konsistennya edge sesuai dengan algoritma diatas, dengan menentukan gthe mean me and the standard deviation ƒŠe of their weightsh.
  • Algoritma berdasarkan ROI digunakan untuk menambahkan edge yang terkoneksi antara xi dan xj. Jika tidak ada vektor lain pada X yang membentang pada R(xi,xj).
  • Tujuan dari Generalized Competitive Learning Scheme (GCLS) untuk meg-update kondisi terbaru dari wj sampai didapat converge occurred atau (t > tmax).
  • Valley ? Seeking Clustering Algorithms,Membiarkan p(x) menjadi fungsi yang ringkas yang didistribusikan dari vector dalam X. Himpunan terlihat seperti puncak dari p(x) (himpunan) yang dipisahkan oleh lembah
  • Clustering Via Cost Optimization
    • Branch and Bound Clustering Algorithms
    • Memperhitungkan solusi optimal secara global dengan masalah kombinatorial.
    • Menghindari seluruh pencarian dengan pekerjaan criteria monotonic J.
    • Kriteria monotonic J: Jika vector k bagian Xditempatkan pada himpunan, tugas dari extra vector pada himpunan tidak berkurang nilainya dari J.
  • Clustering using genetic algorithms? Mutation:
    • Algoritma ini diterapkan setelah reproduksi dan operator di crossover.
    • Algoritma ini memilih secara acak sebuah elemen dari solusi dan menambahkannya pada beberapa kemungkinan.
    • Algoritma ini dapat dilihat sebagai jalan keluar ketika terbentur masalah minimal lokal.
  • Density ? Based Algorithms For Large Data Sets
    • Anggap cluster sebagai wilayah pada ruang l-dimensi? yang berpotongan di titik X.
    • Memiliki kemampuan untuk memulihkan bentuk? arbitary cluster.
    • Menghandle secara efisien.?. Memilikin waktu? kompleksitas kurang dari O(N2).
    • Dalam mengidentifikasi HIf digunakan beberapa metode, antara lain
      • Feature generation methods?
        • Digunakan untuk menjaga jarak antara points dalam high-dimensional space, ketika dirancang untuk lower-dimensional space.
        • Semuanya sangat berguna pada produksi representasi compact dari the original high-dimensional feature space.
        • Semuanya berguna dalam berbagai kasus dimana nilai yang sering muncul dari suatu fitur yang tercontribut untuk mengidentifikasi clusters.
        • Cara-cara yang? dipakai pada kategori ini adalah
          • Principal component analysis (PCA).
          • Singular value decomposition (SVD).
          • Nonlinear PCA.
          • Independent component analysis (ICA)

      • Feature selection methods?
        • Pengidentifikasian fitur-fitur yang menjadi? kontributor utama untuk informasi clusters.
        • Wrapper model (algoritma cluster adalah pilihan utama dan sebuah set dari fitur Fi yg terevaluasi hasilnya tercampur dari aplikasi algorithm ke X, dimana masing-masing point hanya bersama dalam Fi yang mengambil dalam akun). Filter model (evaluasi dari sebuah subset untuk fitur-fitur yang menggunakan interinsik datri property-properti data, sebelim terjadi aplikasi algoritma cluster).
        • Biasanya digunakan ketika semua clusters terhubung dalam subspace? yang sama dari suatu feature space?
      • Random projections

 

 

Contoh Paper 1


 

Contoh Paper 2


     
 
© Agus Zainal Arifin, Desember 2007, email : agusza299 [at] its-sby . edu ; Pengajian Aswaja