Netzwerkanalysen
Mit Hilfe der Eingenschaftsmatrix ist es möglich, zu ermitteln, wie wichtig ein bestimmtes Thema für ein ausgewähltes Dokument ist (das Verfahren dazu läuft anders als das, was üblicherweise unter dem Begriff Suchmaschinenoptimierung (Search Engine Optimization - SEO) verstanden wird, weil in diesem Fall der reine Text analysiert wird, ohne dass Textattribute wie z. B. Überschriften, Seitennamen, Bildunterschriften, etc. berücksichtigt werden). Man berechnet - in unterschiedlicher Weise, das Verhältnis von Worthäufigkeit zu Artikellänge, um die Bedeutung eines Wortes für den Artikel zu erfahren.
Will man diese Information nicht für ein Dokument, sondern für eine Dokumentkollektion erfahren, ist dies im Prinzip mit Darstellungen wie in Bild 7 möglich: man zeigt die Häufigkeit eines ausgewählten Wortes für jedes einzelne Dokument der Kollektion. Schwieriger wird es jedoch, wenn die Bedeutung mehrerer Begriffe für viele Dokumente übersichtlich darzugestellt ist.
Abhilfe schafft in solchen Fällen ein Netzwekdiagramm. Sowohl Dokumente, als auch Themen sind als Punkte dargestellt, die durch Linien verbunden werden. Die Länge der Linie ist dabei ein Maß für die thematische Nähe. Kürzere Linien bedeuten also größere Nähe, und damit einen höheren Wert für die Worthäufigkeit in der Eigenschaftsmatrix. Die Punkte der Dokumente und Themen werden dabei so auf der Zeichenfläche verteilt, dass die "Entfernung" der Themen von einem bestimmten Dokument auf einen Blick ersichtlich ist. Bild 4a zeigt ein Beispiel mit drei Themen, und ca. 850 Dokumenten. Themenpunkte sind - entsprechend ihrer Bedeutung für die Dokumentkollektion - in passender Größe gezeigt.
Bild 4a: Netzwerkdiagramm zur Darstellung der thematischen Entfernung von ca. 850 Patenten zu drei Themen (weitere Erklärung im Text).
Bild 4b zeigt die gleiche Dokumentkollektion, diesmal jedoch mit 20 Themen.
Bild 4b: wie Bild 4a, jedoch mit 20 Themen
Bild 4c zeigt einen Ausschnitt aus 4b, in dem nicht nur die Beschriftungen der Themen, sondern ebenso die Beschriftungen der Dokumente sichtbar werden.
Bild 4c: Ausschnitt aus Bild 4b