Weitere Detailansichten mit einfachen Grafiken II
Natürlich kann man auch die Frage stellen, mit welcher Häufigkeit ein bestimmter Begriff in unterschiedlichen Clustern vorhanden ist. Die Antwort auf eine solche Frage wird in Bild 14 gezeigt.
Bild 14: Darstellung der Häufigkeit eines Begriffs in unterschiedlichen Clustern
Bild 15 zeigt – als weitere Variante – die Bedeutung mehrerer Begriffe für die einzelnen Dokumente in unterschiedlichen Clustern.
Bild 15: Bedeutung unterschiedlicher Begriffe (kodiert durch Punktfarben, vgl. oben links) für die Dokumente in unterschiedlichen Clustern
Im nächsten Bild sieht man, mit welcher inhaltlichen Bedeutung ein bestimmter Begriff in einem Dokument gemessen wird (erste Zahl), und in wie vielen Fälle dies so ist (zweite Zahl in Klammern).
Bild 16: Welche inhaltliche Bedeutung hat ein bestimmter Begriff in einem Dokument, (erste Zahl), und in wie vielen Fälle ist dies so (zweite Zahl in Klammern).
Eine etwas andere Art der Darstellung zeigt Bild 17. Hier sind unterschiedlich breite Verteilungskurven gezeigt, wobei jede Kurve die Verteilung eines Begriffes in einem Cluster darstellt. Eine enge Verteilungskurve bedeutet, dass der Begriff in allen Dokumenten eines Clustern mit ungefähr gleicher Häufigkeit zu finden ist. Eine breite Verteilungskurve meint hingegen, die Begriffshäufigkeit in den einzelnen Dokumenten des Clusters variiert über einen weiten Bereich (in Bild 16 variiert die Begriffshäufigkeit zwischen 0,002 und 0,122, also eher über einen weiten Bereich).
Bild 17: Verteilungskurve eines Begriffs in unterschiedlichen Clustern (Erklärung siehe Text).