Statt Dokumente wie bisher zu lesen, um einen Überblick zu erhalten, werden wir das tun, was jedem, der mit Zahlen arbeitet, beigebracht wird: Daten werden erhoben, gesammelt, in eine übersichtliche Form gebracht und anschließend mit Hilfe von Kennzahlen charakterisiert. Der Fachbegriff daführ lautet: Beschreibende Statistik", oder Explorative Datenanalyse (EDA)". Durch Verfahren des maschinellen Lernens" sind inzwischen noch zusätzliche Analysemöglichkeiten vorhanden.
Sie haben schon Messdaten ausgewertet und kennen "Explorative Datenanalyse (EDA)"? Bei der Analyse von Messdaten gibt es ja immer eine erste Orientierungsphase, wenn man nicht weiß, welche Situation vorliegt: um die zu untersuchenden Daten besser zu verstehen, führt man verschiedene Standardanalysen durch, wie z. B. Boxplot, Histogramm, Q-Q-Plot, Scatterplotmatrix, etc. Niemand käme auf die Idee, Messdaten in Form von Zahlenkolonnen durchzusehen und zu glauben, er könnte auf diese Weise ein Verständnis über die Daten bekommen. Das, was wir hier machen, ist EDA mit Dokumenten. Wir fangen nicht an, einzelne Dokumente zu lesen, sondern führen eine Explorative Dokumentanalyse (EDA)" durch. Lesen können Sie immer noch, aber bitte erst später, und dann nur das, was im Moment für Sie wichtig ist.