Fuzzy-C-Means (FCM) Clusteralgorithmus

Es ist ein Prototyp-basiertes Verfahren. Ein Objekt repräsentiert ein Cluster. Es ist ein probabilistisches Verfahren und die Summe aller Zugehörigkeitswerte eines Objektes zu allen Clustern ist 1. Die Idee der Clusterberechnung besteht darin, die Abstände aller Datenpunkte zu allen Clusterzentren zu minimieren. Die Clusteranzahl c muss vorgegeben werden. Daher kommt auch das c in Fuzzy-C-Means.

$J_{FCM} = \sum_{k = 1}^{N} \sum_{i = 1}^{C} {(mik)}^{m} \cdot {dik}^{2}$

Es ist ein heuristisches Verfahren und ich verwende es so:

Schritt 1: Initialisierung

Ich habe die euklidische Abstandsnorm als Abstandsmaß ausgewählt. Die Anfangsverteilung der Fuzzy-Partintionsmatrix U wird mit Zufallszahlen zwischen 0.0 und 1.0 initialisiert. Die Abbruchschwelle als Abbruchbedingung liegt normalerweise bei 1.0e-7. Die Anzahl der Objekte und Cluster wird festgelegt werden.

Schritt 2: Bestimmung der Clusterzentren

$vi [k] [] = \frac{\sum_{i = 0}^{mik.length} mik [i] {[k]}^{m = 2} \cdot object [i] []}{\sum_{k = 1}^{mik.length} mik [i] {[k]}^{m = 2}}$

Schritt 3: Berechnen der neuen Partitionsmatrix

$mik [i] [k] = \frac{{(\frac{1}{dik = object [i] [] - vi [k] []})}^{\frac{1}{m = 2 - 1}}}{\sum_{j = 0}^{vi.length} {(\frac{1}{dik = object [i] [] - vi [j] []})}^{\frac{1}{m = 2 - 1}}}$

Schritt 4: Abbruch oder Wiederholung

Schritt 5: optional - Neuberechnung mit dem Ergebnis als Initialisierung (Schritt 2 bis 4)