(klingt irgendiwe besser als "lassen Sie uns mal über Zeichenfolgen reden", finden Sie nicht auch?)
Übrigens: an dieser Stelle verstehen Sie auch sofort, was Semantik bedeutet: die Lehre von der Bedeutung der Worte, die sich in vielen Fällen erst aus dem Zusammenhang ergibt. Während der eine bei Wort „String“, an Saiten denkt, ein anderer hingegen an Wäsche, sind hier Zeichenfolgen gemeint - (https://de.wikipedia.org/wiki/Semantik)
Wer ein funktionierendes, zielgerichtetes und effizientes Wissensmanagement in der eigenen Organisation aufbauen möchte, steht vor zahlreichen Aufgaben. Es geht darum
- relevantes, individuelles Wissen zu sammeln und dem Kollektiv zur Verfügung zu stellen,
- implizites – d. h., in den Köpfen von Personen vorhandenes – Wissen in explizites (dokumentiertes) Wissen zu verwandeln, und
- internes mit relevantem externen Wissen zu verknüpfen.
Um diesen Zusammenhang graphisch darstellen zu können, hat Klaus North (http://north-online.de/)
bereits im Jahr 2002 den Wissenswürfel benutzt.
Eine Darstellung, die insgesamt auch sehr gut gelungen ist, finden Sie auf der Seite des österreichischen Bundesministeriums für Kunst, Kultur, öffentlicher Dienst und Sport. (https://www.wissensmanagement.gv.at/Ziele_des_Wissensmanagements).
Wenn Sie bisher den Zusammenhang mit der Überschrift noch nicht sehen, hier kommt er …
Für die Verwaltung des Wissens, das Sie aufbauen und zur Verfügung stellen möchten, werden Sie natürlich IT einsetzen. Eine Möglichkeit, um einen Computer in die Lage zu versetzen, Text „zu verstehen“, besteht darin, den Text in einzelne Worte zu zerlegen, und danach weiter zu verarbeiten (die Details der Weiterverarbeitung sind an dieser Stelle nicht von Bedeutung).
Wobei „Worte“ eben eigentlich der falsche Begriff ist – es müsste Stings, also Zeichenfolgen heißen, weil oft erst eine komplexere Folge von Zeichen von Interesse ist. Während man einen Text dadurch in Worte im umgangssprachlichen Sinn trennen kann, dass man definiert: ein Wort beginnt nach einem Leerzeichen und endet vor einem Leerzeichen oder einem Satzzeichen, kommt man mit dieser Definition in vielen Fällen nicht weiter.
Denken Sie nur an folgende Situation: Sie möchten den Text aus einem mehrspaltigen Dokument so extrahieren, dass alle Sätze in der richtigen Reihenfolge aufeinander folgen (wer bereits mal versucht hat, den Text eines mehrspaltigen PDF-Dokumentes zu extrahieren, weiß, wovon hier die Rede ist!). Ein String wäre in diesem Fall ein vollständiger Satz, und die Reihenfolge der Strings ist relevant.
Nehmen wir zum Beispiel an, sie sind als Organisation auf dem Gebiet Batterietechnik – speziell der Elektrodenherstellung - tätig, und möchten den Artikel „Lithium and lithium ion batteries for applications in microelectronic devices: A review“ in ihr internes Wissensmanagement integrieren, weil er für Sie von Bedeutung ist.
(https://www.sciencedirect.com/science/article/abs/pii/S0378775315005984)
Sie können das PDF-Dokument herunterladen, indem Sie oben auf der Seite auf „View Open Manuscript“ klicken. Danach fangen die Schwierigkeiten aber erst an. Natürlich können Sie das PDF Dokument in ihrem Intranet ablegen und von der zugehörigen Suchmaschine indexieren lassen, so dass es durchsucht werden kann. Sie möchten aber ersten nicht auf suchen allein angewiesen sein (weil man nur suchen kann, was man bereits kennt), und zweitens bei einer Suche nicht ein ganzes Dokument gezeigt bekommen, das Sie wieder ganz klassisch durchlesen müssen.
Was Sie möchten, ist: ein Wissensmanagement, das in der Lage ist, Ihnen relevantes Wissen kompakt zu präsentieren, und außerdem auf Wunsch zu sagen, woher dieses Wissen stammt. Ich wette, das kann ihr System nicht.
Um relevantes Wissen bei einer Suche kompakt angezeigt zu bekommen, können Sie z. B.
- den Text des Artikels so extrahieren, dass dort, wo Spalten vorhanden sind, auch spaltenweise extrahiert wird, und danach den Text mit Hilfe eines intelligenten Mechanismus (der sich nicht durch Abkürzungen wie z. B. „Fig.“ durcheinander bringen lässt) in einzelne Sätze zerlegen (hier steht das Ergebnis)
- diese Sätze eindeutig dem Dokument zuordnen können, dem sie entnommen worden sind
- ein unternehmensweites Wörterbuch mit für Sie relevanten Begriffen aufbauen
- jeden einzelnen Eintrag in diesem Wörterbuch mit den Sätzen verknüpfen, in denen der Begriff vorkommt
Haben Sie das getan, können Sie z. B. nach dem Elektrodenmaterial LiCoO2 suchen, und erhalten – für das o. g. Dokument – folgendes Ergebnis:
- Lithium and lithium ion batteries for applications in microelectronic devices: A review: Zeile 18: Cathode side also uses intercalation materials such as lithium cobalt dioxide (LiCoO2), while Liþ ions transport back and forth between cathode and anode during operating [5].
- Lithium and lithium ion batteries for applications in microelectronic devices: A review: Zeile 56: Type Volume (mm3) Maximum dimension (mm) Specific capacity (Wh L-1) Chemistry NCR18650, Panasonic [29] Cylindrical; Secondary 16700 65 577 Lithiumecobalt CR2032, Panasonic [33] Button; Primary 1000 20 675 Li/MnO2 ML421, Panasonic [32] Button; Primary 38 4.8 95 Li/MnO2 MEC201, Thinergy [31] Thin-film; Secondary 110 25.4 36 Li/LiCoO2 CBC005-BDC, Enerchip [30] Thin-film; Secondary 0.75 2.25 27 Li/LiCoO2 CG320, Panasonic [13] Pin-type; Primary 192 20 203 e MB306, PNNL [12] Pin-type; Primary 42 6 528 Li/CFx Microbattery by Sun et_al [34] 3D; Secondary 0.23 1 1260 LiFePO4/Li4Ti5O12 Microbattery by Lai et_al [35] Monolithic porous electrode; Secondary 6 3 400 Li/LiCoO2 Microbattery by Pikul et_al [36] 3D; Secondary 0.03 e 150 MnO2/NiSn Y_Wang et_al / Journal of Power Sources 286 (2015) 330e345332inorganic glassy or crystalline materials are typically used because of the dimensional stability and design flexibility.
- Lithium and lithium ion batteries for applications in microelectronic devices: A review: Zeile 64: LiCoO2 is the most commonly used cathode material for thin-film batteries (see more discussion in Section 2.2.).
- Lithium and lithium ion batteries for applications in microelectronic devices: A review: Zeile 76: Thinergy batteries adopt the LiCoO2/Lipon designwhereas EnerChip batteries are built on silicon substrate designed to be directly placed on integrated circuits.
- Lithium and lithium ion batteries for applications in microelectronic devices: A review: Zeile 222: LiCoO2 Lithium Cobalt Oxide has been demonstrated as a mature, industry-standard battery material that provides long cycle life and very high energy density [15,142].
- Lithium and lithium ion batteries for applications in microelectronic devices: A review: Zeile 223: LiCoO2 adopts two different structures depending on the synthesis condition [143].
- Lithium and lithium ion batteries for applications in microelectronic devices: A review: Zeile 224: The cubic spinel-type LiCoO2 [144], also known as the low temperature LiCoO2 (LT-LiCoO2), has relatively poor cyclability and low operating voltage [145] as compared to the hexagonal layered structure LiCoO2 (HT-LiCoO2) [146], which operates at around 3.9 V against pure Li metal [147].
- Lithium and lithium ion batteries for applications in microelectronic devices: A review: Zeile 225: Therefore, the HT-LiCoO2 has been the preferable choice.
- Lithium and lithium ion batteries for applications in microelectronic devices: A review: Zeile 226: It is generally accepted that LiCoO2 should not be charged over 4.2 V (extracting more than 0.5 mol of Li) in order to Figure4.
- Lithium and lithium ion batteries for applications in microelectronic devices: A review: Zeile 232: LiCoO2 also possesses good rate capability due to its excellent electronic and ionic conductivities.
- Lithium and lithium ion batteries for applications in microelectronic devices: A review: Zeile 233: Although LiCoO2 behaves as an insulator, the electronic conductivity of LixCoO2 increases quickly as Li is extracted, marking a metal-insulator transition [153,154].
- Lithium and lithium ion batteries for applications in microelectronic devices: A review: Zeile 235: Both the electronic conductivity and ion diffusion are highly anisotropic so strong orientation effects have been observed for LiCoO2 thin films [143,156,157].
Wie Sie sehen, ist das für Sie im Moment entscheidende Wissen jetzt in sehr kompakter Form verfügbar.
Wenn - wie oft in technischen Dokumenten üblich - von Messgrößen, Werkstoffen, mathematischen Formeln oder chemischen Reaktionsgleichungen die Rede ist, die für sich jeweils genau so einen String bilden können, wird die Mustererkennung noch einen Tick komplexer.
Gut für Sie zu wissen: wir haben bereits vor fünf Jahren eine europaweite Ausschreibung der Fraunhofergesellschaft gewonnen, in der genau solche Möglichkeiten gefordert worden sind.