Anonymisierung und positives Beispiel aus der Medizin
Ein theoretischer Ausweg heiße zwar Anonymisierung, aber perfekte Anonymisierung von Daten gebe es „genau so wenig, wie es sichere Häfen für Daten gibt. Auch hier ist Kompromissfähigkeit gefragt“. Als positives Beispiel für erfolgreiche Verwendung von Medizindaten nannte Grötschel den Erfolg von Mathematikern der FU Berlin und des Zuse-Instituts in Zusammenarbeit mit Medizinern der Charité und der Uniklinik Leipzig: Sie hätten „aus Tausenden von Blutproben durch neue Datenanalyse-Algorithmen sogenannte Fingerabrücke von fünf verschiedenen Krebskrankheiten“ entdeckt, mit denen diese Erkrankungen jetzt mehrere Monate früher als bisher robust diagnostiziert werden könnten. Dadurch steigen die Heilungschancen erheblich.
Aus der Physik: Higgs-Boson – Einstein
Peter Higgs habe in den 60er Jahren das jetzt nach ihm benannte Teilchen vorhergesagt – und erst vor drei Jahren „wurde am CERN aus der vermutlich größten, jemals in der Wissenschaft erzeugten Datenmenge geschlossen, dass es das Higgs-Boson tatsächlich gibt, was dann Nobelpreise nach sich zog“. Dagegen sei für die von Albert Einstein 1918 vorhergesagten Gravitationswellen trotz enormen experimentellen Aufwandes bisher kein direkter Nachweis gelungen: „Big Data ist hier noch erfolglos.“
Das Standard-Modell der Kosmologie und Daten
„Das Standardmodell der Kosmologie wurde durch präzise Messungen der Umlaufgeschwindigkeit von Sternen in den Außenbereichen von Galaxien so erschüttert, dass der normale Mensch sagen würde: Die Daten zeigen, dass die Theorie falsch ist.“ Forscher hätten aber erkannt, dass die Vorhersagen des Standardmodells dann mit den gemessenen Daten übereinstimmten, wenn man annehme, „dass die Masse des Universums fünfmal so groß ist wie derzeit bekannt. Und so haben dunkle Materie und dunkle Energie durch datengetriebene Theorie das Licht der Welt erblickt. Erstaunt es Sie nicht auch, dass wir vielleicht nur rund ein Sechstel unserer physischen Welt kennen? So können Daten möglicherweise erneut unser Weltbild völlig verändern.“
Beispiel für einen Hype: DNA-Sequenzierung
Grötschel nannte es als „medial stark vermarktetes Versprechen“, dass durch DNA-Sequenzierung Krankheiten geheilt werden könnten. Zwar habe die DNA-Sequenzierung die Biologie revolutioniert und genetische Gründe für einige Krankheiten gefunden und die Ära der Genomik eingeleitet. So wüssten wir dadurch heute beispielsweise, dass Tut Ench Amun Echnatons Sohn mit einer Halbschwester aber nicht von Nofretete war, und dass alle Menschen bis auf die afrikanischer Abstammung ein bis drei Prozent Neandertaler-Gene in sich tragen. Das versprochene Erkennen und Heilen von Krankheiten aber „hat sich als viel komplexer herausgestellt, als man das vorher gedacht hatte“.
Big Data und Datenanalyse
Was Big Data wirklich seien, sei „nicht ganz einfach zu definieren“. Für Grötschel „zählen zum Bereich Big Data ganz viele Daten, sehr fehlerbehaftete Daten, komplexe Daten, Daten, die nur mit Mühe erhebbar sind oder nicht reproduziert werden können. Das gilt für Wirtschaft und Wissenschaft. Lassen sie mich Big Data, Datenanalyse, Datenmodellierung und die damit verbundenen algorithmischen Techniken der Informatik und Mathematik stark verkürzt als Datenwissenschaft bezeichnen. Datenwissenschaft ist für mich so etwas wie eine Maschine, die in großen Datenbeständen Muster erkennt und aus zahllosen möglichen Hypothesen, die man über diese Daten äußern kann, einige wenige generiert, die vielversprechende Aussagen über die Daten machen. Diese Aussagen können in der Wissenschaft eine Theorie bestätigen bzw. deren Modifikation bewirken, hilfreiche neue Methoden bei der Früherkennung von Krankheiten und deren Therapie vorschlagen oder auch zur optimalen Steuerung und Wartung von Heizungspumpen führen. Die Bandbreite ist einfach enorm.“
Folgt: „Genau hierdurch entsteht Fortschritt.“