Unser Ziel ist es, die Art und Weise, wie SIE Dokumente benutzen, um zu verstehen, wer SIE sind, und wer ANDERE sind, völlig zu verändern.

  • WER WIR SIND
    Wir sind ein Ingenieurbüro mit dem Arbeitsgebiet TextAnalytics. Für unsere Arbeit benutzen wir technische Dokumente, um komplexe Zusammenhänge sichtbar zu machen
    WARUM
    Ergebnisse werden nachvollziehbar
    ERGÄNZUNG
    Als Ergänzung oder Ersatz eines Brainstormings
  • Was wir tun
    Wir betreiben Explorative Dokumentanalyse (Mustererkennung und maschinelles Lernen), um das zu finden, was Sie sich durch klassisches Lesen sonst mühsam erarbeiten müssten.
    90 Millionen
    Werkstoffnamen finden wir ebenso wie Reaktionsgleichungen, Formeln, Herstellungsverfahren oder Normen
    90 Mess
    größen in ca. 3000 Schreibweisen können wir erkennen und ineinander umwandeln.
  • WIR LIEFERN ANTWORTEN
    Anstatt Experten zu befragen, die Sie zuerst suchen müssten, liefern wir Antworten aus Dokumenten, die von Experten weltweit verfasst worden sind.
    80 %
    geringerer Zeitaufwand
    200 %
    und mehr Steigerung der Ergebnissqualität
  • MASCHINELLES LESEN
    Wir haben Zugriff auf Millionen von Dokumenten mir regelmässigem Update des Datenbestands.
    450
    Millionen Dokumente
    UPDATES
    jede Woche

 Dokumente automatisch verschlagworten

 

Wenn wir wüssten, was wir wissen - Dokumente im Intranet automatisch verschlagworten

Kennen Sie das? Das Intranet ist eingerichtet, alle Dokumente werden laufend abgelegt, wenn man aber etwas sucht, hat man immer wieder das Gefühl, dass eigentlich mehr zu diesem Thema vorhanden sein müsste ...

Unabhängig davon, mit welchem Schwerpunkt ihr Unternehmen ein Intranet betreibt (Document Management, Web-Content-Management, Collaboration, Workflow Management, Business Process Management oder Records Management), funktioniert "Finden von abgelegten Dokumenten" in aller Regel über eine oder mehrere der folgenden Methoden: suchen, strukturierte Ablage von Dokumenten in vorgegebene Verzeichnisse oder Vergabe von Schlüsselworten.

Jede dieser Methoden weist dabei spezifische Vor- und Nachteile auf.

 

Finden durch suchen: finden durch suchen ist sehr einfach, weil man abgelegte Dokumente nicht in eine wie auch immer geartete Struktur einfügen muss; die Ablagestruktur ist beliebig. Suchen hat jedoch den gravierenden Nachteil, dass man nur suchen kann, was man bereits kennt. Auch Suchalgorithmen, die die Suchergebnisse clustern, lösen das Problem nicht wirklich; natürlich erhält man auf diese Weise eine Struktur in den Ergebnissen, aber eben nicht außerhalb. Damit erhält man keine Angabe darüber, welche Themen darüber hinaus noch in den Dokumenten enthalten sind. Fazit: der Anteil des Unbekannten ist unbekannt.

Ablage in vorgegebenen Strukturen: die Ablage von Dokumenten in vorgegebene Strukturen ist dann nützlich, wenn einerseits die Strukturen zeitlich stabil sind, und sich die abgelegten Dokumente eindeutig unter einem einzigen Gesichtspunkt ablegen lassen.

Vergabe von Schlüsselworten: treffen beide Voraussetzungen nicht zu, helfen Schlüsselworte. Bei Verwendung von Schlüsselworten ist es möglich, einerseits einfache Ablagestrukturen zu wählen, und Dokumente trotzdem andererseits unter den verschiedensten Gesichtspunkten wieder finden zu können.

Lästig daran ist nur, dass Schlüsselworte manuell vergeben werden müssen. Und um das tun zu können, muss man das jeweilige Dokument gelesen haben. Der Vorgang wird also zeitintensiv, besonders dann, wenn bereits einige hundert bis tausend Dokumente vorhanden sind.

Lösung: Dokumente automatisch mit Schlüsselworten versehen

Viel einfacher ist es, eine solche Aufgabe - die Vergabe von Schlüsselworten für Dokumente - an einen Algorithmus zu delegieren, und Dokumente automatisch zu verschlagworten.  Auf diese Weise lassen sich unterschiedlichste Strukturen erzeugen, so dass das Verfahren ganz auf die Anforderungen einer Organisation abgestimmt werden kann.

1. Freie Vergabe von Schlüsselworten: Jedes Dokument kann für sich betrachten werden; die wichtigsten Begriffe des Dokuments werden als Schlüsselworte ausgewählt.

2. Vergabe von Schlüsselworten nach einem Dictionary. Bei dieser Variante wird aus allen verfügbaren Dokumenten zuerst ein Dictionary der relevanten Begriffe gebildet. Anschließend wird jedes Einzeldokument mit den Schlüsselworten versehen, die sowohl im Dokument, als auch im Dictionary enthalten sind. Auf diese Weise ist sicher gestellt, dass in sich konsistente Strukturen aufgebaut werden.

3. Themenspezifische Dictionaries: das Verfahren läuft im Prinzip wie bei 2., jedoch mit dem Unterschied, dass das Gesamt-Dictionary in eigenständige, benannte Dictionaries unterteilt wird, die jeweils für ein abgegrentes Thema gelten. Beispielsweise können Dokumente in einer Ordnerstruktur nach Organisationsbereichen abgelegt sein. Durch die Vergabe von Schlüsselworten incl. themenspezifischer Dictionaries ist es dann möglich, z. B. alle Dokumente eines bestimmten Projekts zu finden, unabhängig davon, ob es sich um Dokumente aus der Buchhaltung, der Entwicklung oder der Produktion handelt. Dazu müsste das themenspezifische Dictionary lediglich in einem Schlüsselwort die Projektbezeichnung aufnehmen.

4. Berücksichtigung von Synonymen: um solche Dictionaries nicht unendlich groß werden zu lassen, kann es gewünscht sein, Synonyme eines Begriffes unter einem festen Stichwort zusammen zu fassen, und nur dieses Stichwort als Schlüsselbegriff zu berücksichtigen. Synonyme kann jedoch auch bedeuten, Orte in geografische Koordinaten umzuwandeln,  statt "Quarzglas" "SiO2" zu schreiben, oder anstatt einer Länge von 3 ft (foot) den Meßwert 91,44 cm zu verwenden.

5. Dokumenten in anderen Sprachen: gerade bei technischen Dokumenten, bei denen es nicht hauptsächlich um sprachliche Schönheit, sondern um eine genaue Vorgangsbeschreibung geht, können maschinelle Übersetzungen der Schlüsselworte sehr einfach dabei helfen, auch fremdsprachliche Dokumente in die gleiche Struktur mit aufzunehmen.

Ist Ihr potentieller Anwendungsfall dabei? Oder doch noch nicht ganz? Sie sind aber neugierig geworden, und haben Fragen dazu?

Jederzeit gerne! keywords at numberland.com

EXPLORE
Forschungseinrichtung: finden von Werkstoffnamen
(Werkstoffe für die thermische Energiespeicherung).
NAVIGATE
Forschungseinrichtung: finden von Märkten,
auf denen Werkstoffe aus Metallschaum gebraucht werden.
IDEATE
Unternehmen: finden von Möglichkeiten, um den
Abfüllvorgang einer hochviskosen Flüssigkeit zu beschleunigen.
EXPLORE
Kommune mit > 500.000 Einwohnern: finden von regionalen
IT-Unternehmen und clustern der Interessen
REMEMBER
Unternehmen: automatisches Verschlagworten
von Dokumenten im Intranet
COMPARE
Unternehmen: Vergleich des internen Wissens
mit dem Wissen von Wettbewerbern.
LOCATE
EU-Projekt einer Landesentwicklungsgesellschaft:
Verfahren, um Regionen mit gleichen Kenntnissen und
Interessen sichtbar zu machen.
EXPLORE
IHK: finden von regionalen Automobilzulieferern
und clustern der Interessen
BLEND
Hochschule: finden von passenden Partnern
für ein EU-Entwicklungsvorhaben.
CHANGE
Unternehmen: Innovationsaudit zur Ausrichtung
der Unternehmensstrategie auf Megatrends.
REMEMBER
Ablagesystem für studentische Abschlussarbeiten
Combine
Expansion und / oder Marktanpassung im Verlauf einer Unternehmensnachfolge