Überdies gibt es eine schier unglaublich große Anzahl von Fachbegriffen in diesem Kontext, die mehr oder weniger richtig - und leider in vielen Fällen missbräuchlich oder falsch - benutzt werden. In diesem Zusammenhang verweise ich nochmals auf das umfangreiche Glossar in diesem Buch, wo ich im Rahmen meiner langjährigen Erfahrung und schrittweise aufgebauten Expertise viele dieser Fachbegriffe gesammelt, definiert und beschrieben habe.
Allein die gewaltige Anzahl von Treffern bei einer Suchanfrage im Internet und das gleichzeitig beträchtliche Angebot an Literatur machen das Unterfangen, ein grundsätzliches Verständnis über den Nutzen und die Nutzung von Daten und die angestammten, teilweise kognitiven Technologien zu erlangen, eine schier unlösbare Aufgabe.
Nach einiger Zeit des Nachdenkens an meinem Schreibtisch wende ich für dieses Buch das Pareto-Prinzip an, benannt nach Vilfredo Pareto und 80-zu-20-Regel genannt, um mit einem pragmatischen Ansatz die wesentlichen Aspekte, also 80 Prozent der Grundbegriffe und Themen mit 20 Prozent des Gesamtaufwandes zu finden und zu beschreiben.
Mir ist bewusst, dass es aus einer perfektionistischen Sicht darüber hinaus noch weitere Aspekte, Begriffe und Zusammenhänge gibt; diese verbleibenden 20 Prozent der Grundbegriffe zu finden und zu beschreiben würde jedoch mit 80 Prozent des Gesamtaufwandes die quantitativ meiste Arbeit erfordern und das Gesamtergebnis dabei meines Erachtens nicht wesentlich verbessern.
«Daten sind der neue Grund und Boden.»
Die in der Literatur, auf zahlreichen Internet-Seiten, in Blogs und Vorträgen oftmals zitierte Aussage „Daten sind das neue Öl“ soll auf die scheinbar unverkennbare Tatsache hinweisen, dass Erdöl die Wirtschaft wesentlich schmiert und daraus ganz neue Ökonomien entstanden sind. Man denke nur an den ersten Einsatz von Öllampen, welche eine ganz andere Lebensqualität für Menschen ermöglicht haben und gleichzeitig der durch John D. Rockefeller [04] gegründeten „Standard Oil Company“ zu einem beträchtlichen Wohlstand verholfen haben.
Öl ist allerdings aufgrund der heute bekannten und vorhandenen Ressourcen, welche nicht erneuert werden können, durchaus begrenzt. Es verbraucht sich in einem klassischen Produktnutzungskreislauf, bis die Vorräte völlig aufgebraucht sind, nichts mehr vorhanden ist und neues Öl beschafft werden muss. Zudem fluktuiert der Ölpreis stark aufgrund der Marktkräfte sowie politischer Ereignisse und wird sich zukünftig nachhaltig verteuern, je weniger davon vorhanden ist.
«Mit Daten verhält es sich anders.»
Die meisten Kosten fallen zu Anfang bei der Datenerzeugung an, analog dazu ist das Grundstück der größte Kostenfaktor bei einem Hauskauf, zumindest in der Schweiz. Die Kosten reduzieren sich mit jeder weiteren Datennutzung und die mehr- oder vielmalige Datenverwendung beschädigt oder vernichtet Daten nicht, ganz im Gegenteil verbessert sich das Kosten-Nutzen-Verhältnis bei jeder zusätzlichen Nutzung. Somit sind Daten und die daraus gewonnene Informationen - wie die meisten Häuser - langlebig und nach der einmaligen Entstehung langfristig nutzbar.
Die von mir in diesem Buch genutzte Analogie für Daten ist der Acker, also Grund und Boden, welcher zwar ebenfalls in bestimmten Masse und nach den jeweiligen Gegebenheiten eines Landes beschränkt sein kann, aber nach dem Erwerb - und den damit verbundenen einmaligen, hohen Kosten - bleibt Grund und Boden beim Eigentümer. Die grundlegende Basis für einen Acker bildet der Boden mit seinen einzelnen Bestandteilen wie erodiertes und verwittertes Gestein, organische Reste, Mineralien sowie Nährstoffe.
Dies entspricht in meiner Analogie der Basis für alle digitalen Fakten, aus denen schlussendlich die elektronischen Daten und Dokumente entstehen und gleicht der Datenbereitstellung von gespeicherten, digitalen Daten sowie dem Records Management für physische (in Papierform) und gespeicherte, digitale Dokumente und Aufzeichnungen.
Im Idealfall werden elektronische Daten und Dokumente zukünftig in Form von «Smart Data» bereitgestellt, was ich in einem späteren Abschnitt in diesem Buch noch im Detail darstellen werde. Wichtig ist die richtige Auswahl und eine gute Kenntnis über den entsprechenden Zustand des Ackers, beispielsweise ist der Boden sandig oder gibt es das ganze Jahr über eine gute Besonnung (analog dem Datendesign).
Pflegt man den Acker nicht, so entstehen Gräser und Unkraut spontan (analog zu schlecht bewirtschafteten Daten und daher das Kennzeichen für eine schlechte Datenqualität), welches dann kosten- und zeitaufwändig bereinigt werden muss (analog der Datenbereinigung). Man kann selbst darüber entscheiden, welche Art von Gemüse oder Früchten man zu welchem Zeitpunkt und an welchem Ort im Acker anpflanzen möchte (analog zu den Informationen, welche man aus den vorhandenen Daten durch Kombination und Interpretation ableiten will, was der gewünschten Datenaktualität und Datentransparenz entspricht).
Mit dem zielgerichteten Einsatz von Dünger, einer passenden Bewässerung sowie dem regelmäßigen Rückschnitt der Pflanzen kann man den Ertrag weiter steigern (analog der Datenstandardisierung und der Datenpflege). Vergisst man allerdings nach der Aussaat, wo beispielsweise die speziellen, blauen Kartoffeln angebaut worden sind, so ist eine mühsame, oft manuelle und ebenso zeitaufwändige Suche erforderlich (analog zu einem fehlenden Datenmodell).
Für den Schutz der Pflanzen vor ungewünschten Gästen (sonst frisst vielleicht eine Rotte Wildschweine die ganzen Reben ab), ist beispielsweise ein stabiler Zaun um den Acker empfehlenswert (analog zu Datenschutz und Informationssicherheit, welche neben internen Richtlinien auch von Politik und Wirtschaft durch verbindliche, rechtliche und regulatorische Vorgaben festgelegt werden).
Zudem ist die Art der Pflanzenbewirtschaftung wählbar - ob manuell und mit Menschenkraft oder mit maschineller Unterstützung durch Werkzeuge und Traktoren (analog der Datennutzung von durch Menschen oder Computern gewonnenen Informationen im Rahmen von Business Intelligence oder Datenanalysen, was ich später im Buch noch ausführlich beschreiben werde). Unter normalen Umständen und bei entsprechender Sorgfalt verbraucht sich ein Acker wenig bis gar nicht und man kann gute oder sogar sehr gute Erträge langfristig erwirtschaften.
Hierfür müssen Fruchtfolge und Fruchtwechsel sorgfältig geplant sein und es wird eine entsprechende Pflege - beispielsweise Dünger und der Verzicht auf ausschließliche Monokulturen - regelmäßig durchgeführt (analog meiner Auffassung eines umfassenden Daten- und Informationsmanagements).
Benötigt man größere oder andere Ackerflächen (analog zu einer Erweiterung der bestehenden Datensammlung mit beispielsweise unstrukturierten Daten aus dem Internet), so kann man bei entsprechender Verfügbarkeit weiteren Acker dazu kaufen oder pachten. Dies ist jedoch mit zusätzlichen Kosten verbunden ist und sollte gut durchdacht werden (analog einer passenden Datenstrategie als Basis für die grundlegende Planung von Datenbereitstellung und Datennutzung).
Dann braucht es noch das Management für die Bewirtschaftung des Ackers, der Pflanzen und der eingesetzten Werkzeuge, das heißt der richtige und effiziente Umgang durch entsprechend qualifizierte Personen wie Bauer oder Gärtner sowie die dazugehörigen Regeln, Vorschriften und Richtlinien (analog einer umfassenden Daten-Governance für elektronische Daten, Informationen und Dokumente). Schlussendlich bestimmt der Farmer selbst, welche seiner Produkte unter welchen Umständen und wie produziert werden sollen: Ein biologischer vs. konventioneller Anbau oder unter Nutzung eines bestimmten Labels (dies entspricht in meiner Analogie der Datenpolitik mit internen, auf die jeweilige Geschäftsstrategie bezogenen Vorgaben für die Datenbereitstellung und Datennutzung).
In diesem Zusammenhang ist ebenso die gesellschaftliche Sicht und gegenwärtige Meinung durch die Ausformulierung einer Datenethik zu berücksichtigen, um die eigene Reputation zu schützen - wer will heute schon einen medialen Shit-Storm provozieren?
Ich blicke von meinem Notebook auf und frage