Es ist ein Prototyp-basiertes Verfahren. Ein Objekt repräsentiert ein Cluster. Es ist ein probabilistisches
Verfahren und die Summe aller Zugehörigkeitswerte eines Objektes zu allen Clustern ist 1. Die Idee der
Clusterberechnung besteht darin, die Abstände aller Datenpunkte zu allen Clusterzentren zu minimieren. Die
Clusteranzahl c muss vorgegeben werden. Daher kommt auch das c in Fuzzy-C-Means.
Es ist ein heuristisches Verfahren und ich verwende es so:
Schritt 1: Initialisierung
Ich habe die euklidische Abstandsnorm als Abstandsmaß ausgewählt. Die Anfangsverteilung der Fuzzy-Partintionsmatrix
U wird mit Zufallszahlen zwischen 0.0 und 1.0 initialisiert. Die Abbruchschwelle als Abbruchbedingung liegt
normalerweise bei 1.0e-7. Die Anzahl der Objekte und Cluster wird festgelegt werden.
Schritt 2: Bestimmung der Clusterzentren
Schritt 3: Berechnen der neuen Partitionsmatrix
Schritt 4: Abbruch oder Wiederholung
Schritt 5: optional - Neuberechnung mit dem Ergebnis als Initialisierung (Schritt 2 bis 4)