Wenn wir wüssten, was wir wissen - Dokumente im Intranet automatisch verschlagworten
Kennen Sie das? Das Intranet ist eingerichtet, alle Dokumente werden laufend abgelegt, wenn man aber etwas sucht, hat man immer wieder das Gefühl, dass eigentlich mehr zu diesem Thema vorhanden sein müsste ...
Unabhängig davon, mit welchem Schwerpunkt ihr Unternehmen ein Intranet betreibt (Document Management, Web-Content-Management, Collaboration, Workflow Management, Business Process Management oder Records Management), funktioniert "Finden von abgelegten Dokumenten" in aller Regel über eine oder mehrere der folgenden Methoden: suchen, strukturierte Ablage von Dokumenten in vorgegebene Verzeichnisse oder Vergabe von Schlüsselworten.
Jede dieser Methoden weist dabei spezifische Vor- und Nachteile auf.
Finden durch suchen: finden durch suchen ist sehr einfach, weil man abgelegte Dokumente nicht in eine wie auch immer geartete Struktur einfügen muss; die Ablagestruktur ist beliebig. Suchen hat jedoch den gravierenden Nachteil, dass man nur suchen kann, was man bereits kennt. Auch Suchalgorithmen, die die Suchergebnisse clustern, lösen das Problem nicht wirklich; natürlich erhält man auf diese Weise eine Struktur in den Ergebnissen, aber eben nicht außerhalb. Damit erhält man keine Angabe darüber, welche Themen darüber hinaus noch in den Dokumenten enthalten sind. Fazit: der Anteil des Unbekannten ist unbekannt.
Ablage in vorgegebenen Strukturen: die Ablage von Dokumenten in vorgegebene Strukturen ist dann nützlich, wenn einerseits die Strukturen zeitlich stabil sind, und sich die abgelegten Dokumente eindeutig unter einem einzigen Gesichtspunkt ablegen lassen.
Vergabe von Schlüsselworten: treffen beide Voraussetzungen nicht zu, helfen Schlüsselworte. Bei Verwendung von Schlüsselworten ist es möglich, einerseits einfache Ablagestrukturen zu wählen, und Dokumente trotzdem andererseits unter den verschiedensten Gesichtspunkten wieder finden zu können.
Lästig daran ist nur, dass Schlüsselworte manuell vergeben werden müssen. Und um das tun zu können, muss man das jeweilige Dokument gelesen haben. Der Vorgang wird also zeitintensiv, besonders dann, wenn bereits einige hundert bis tausend Dokumente vorhanden sind.
Lösung: Dokumente automatisch mit Schlüsselworten versehen
Viel einfacher ist es, eine solche Aufgabe - die Vergabe von Schlüsselworten für Dokumente - an einen Algorithmus zu delegieren, und Dokumente automatisch zu verschlagworten. Auf diese Weise lassen sich unterschiedlichste Strukturen erzeugen, so dass das Verfahren ganz auf die Anforderungen einer Organisation abgestimmt werden kann.
1. Freie Vergabe von Schlüsselworten: Jedes Dokument kann für sich betrachten werden; die wichtigsten Begriffe des Dokuments werden als Schlüsselworte ausgewählt.
2. Vergabe von Schlüsselworten nach einem Dictionary. Bei dieser Variante wird aus allen verfügbaren Dokumenten zuerst ein Dictionary der relevanten Begriffe gebildet. Anschließend wird jedes Einzeldokument mit den Schlüsselworten versehen, die sowohl im Dokument, als auch im Dictionary enthalten sind. Auf diese Weise ist sicher gestellt, dass in sich konsistente Strukturen aufgebaut werden.
3. Themenspezifische Dictionaries: das Verfahren läuft im Prinzip wie bei 2., jedoch mit dem Unterschied, dass das Gesamt-Dictionary in eigenständige, benannte Dictionaries unterteilt wird, die jeweils für ein abgegrentes Thema gelten. Beispielsweise können Dokumente in einer Ordnerstruktur nach Organisationsbereichen abgelegt sein. Durch die Vergabe von Schlüsselworten incl. themenspezifischer Dictionaries ist es dann möglich, z. B. alle Dokumente eines bestimmten Projekts zu finden, unabhängig davon, ob es sich um Dokumente aus der Buchhaltung, der Entwicklung oder der Produktion handelt. Dazu müsste das themenspezifische Dictionary lediglich in einem Schlüsselwort die Projektbezeichnung aufnehmen.
4. Berücksichtigung von Synonymen: um solche Dictionaries nicht unendlich groß werden zu lassen, kann es gewünscht sein, Synonyme eines Begriffes unter einem festen Stichwort zusammen zu fassen, und nur dieses Stichwort als Schlüsselbegriff zu berücksichtigen. Synonyme kann jedoch auch bedeuten, Orte in geografische Koordinaten umzuwandeln, statt "Quarzglas" "SiO2" zu schreiben, oder anstatt einer Länge von 3 ft (foot) den Meßwert 91,44 cm zu verwenden.
5. Dokumenten in anderen Sprachen: gerade bei technischen Dokumenten, bei denen es nicht hauptsächlich um sprachliche Schönheit, sondern um eine genaue Vorgangsbeschreibung geht, können maschinelle Übersetzungen der Schlüsselworte sehr einfach dabei helfen, auch fremdsprachliche Dokumente in die gleiche Struktur mit aufzunehmen.
Ist Ihr potentieller Anwendungsfall dabei? Oder doch noch nicht ganz? Sie sind aber neugierig geworden, und haben Fragen dazu?