{"id":1824,"date":"2016-01-15T14:27:54","date_gmt":"2016-01-15T13:27:54","guid":{"rendered":"http:\/\/www3.unifr.ch\/alma-georges\/?p=1824"},"modified":"2016-02-26T10:02:41","modified_gmt":"2016-02-26T09:02:41","slug":"big-data-auch-im-stall-von-nutzen","status":"publish","type":"post","link":"https:\/\/www.unifr.ch\/alma-georges\/articles\/2016\/big-data-auch-im-stall-von-nutzen","title":{"rendered":"Big Data: Auch im Stall von Nutzen"},"content":{"rendered":"<h4><strong>Big Data \u2013 alle reden davon und niemand weiss so ganz genau was das eigentlich ist. Eine Begriffskl\u00e4rung lieferte auch der swissnex Day\u201915 nicht, der im Dezember unter dem Motto <\/strong>\u00ab<strong>Big Data for smart ideas<\/strong>\u00bb<strong> eine kunterbunte Mischung von Wissenschafts- und Zukunftsinteressierten an der Uni Freiburg versammelte. Vielmehr bot der Anlass die Gelegenheit, interessante K\u00f6pfe zu treffen, die Big Data lieber konkret nutzen als Wortklaubereien zu betreiben. <\/strong><\/h4>\n<p>Wie ein Fisch im Wasser f\u00fchlt sich auch Philippe Cudr\u00e9-Mauroux im grossen Datenmeer. Er ist Professor f\u00fcr Informatik an der Uni Freiburg und Leiter des <a href=\"http:\/\/exascale.info\/\" target=\"_blank\">eXascale Infolab<\/a> und von <a href=\"http:\/\/daplab.ch\/\" target=\"_blank\">daplab.ch<\/a>, einer Plattform, die Big Data-Analysen auch f\u00fcr Big Data-Ahnungslose leicht zug\u00e4nglich machen soll. \u00abIhr habt die Daten, wir haben die Skills\u00bb \u2013 so k\u00f6nnte man den Cudr\u00e9-Mauroux\u2019 Ansatz auf den Punkt bringen. Im Gegensatz zur weitverbreiteten Angst davor, dass die intelligenten Computersysteme uns die Arbeit wegnehmen oder gar den Untergang der Menschheit bedeuten, geh\u00f6rt Cudr\u00e9-Mauroux zu den Optimisten, die in Daten und ihrer Analyse vor allem Chancen sehen \u2013 f\u00fcr Firmen wie auch f\u00fcr den einzelnen Menschen. Er geh\u00f6rt damit zur jungen Garde der Informatiker, die sich, \u00e4hnlich wie die Ingenieure des 19. Jahrhunderts, mit viel Drive und einem unersch\u00fctterlichen Zukunftsglauben an die Umgestaltung unserer Lebenswelt machen und im Schlagwort der \u00abdisruptiven\u00bb Gesch\u00e4ftsideen nichts Zerst\u00f6rerisches sehen. Die Digitalisierung und Big Data sind, was das Frischdrauflos der Pioniere (und die Mischung aus Faszination und Unbehagen in der Bev\u00f6lkerung) angeht, die Eisenbahn und Elektrizit\u00e4t unserer Zeit.<\/p>\n<p><strong>Familienplanung mit Big Data<br \/>\n<\/strong>Welche \u00fcberraschenden Anwendungen so eine datenzentrierte Weltsicht erlaubt, zeigte Cudr\u00e9-Mauroux am <a href=\"http:\/\/www.swissnex.org\/news\/swissnexdays\/\" target=\"_blank\">swissnex Day\u201915<\/a> in seiner Pr\u00e4sentation anhand eines Beispiels aus Japan auf: Verpasst ein Bauer jeder Kuh im Stall einen Bewegungsmelder am Fuss, dann hat er sofort jede Menge Daten \u00fcber die Schrittzahl seiner Tiere zur Hand. Ja gut, wird sich der alte Bauer sagen \u2013 und was soll ich damit? Der junge Bauer aber kennt einen Data Scientist und findet rasch heraus: In diesen Daten stecken \u00fcberraschende Informationen. So l\u00e4sst sich die Empf\u00e4ngnisbereitschaft der K\u00fche ziemlich exakt aus deren Bewegungsmuster ableiten \u2013 der Bauer weiss also genau, wann seine Tiere am fruchtbarsten sind, ohne dass er \u00fcberhaupt in den Stall zu gehen braucht. Damit nicht genug: Einer eigenartigen Laune der Natur wegen h\u00e4ngt das Geschlecht der Jungtiere davon ab, ob die Mutterkuh in den Minuten vor oder nach dem fruchtbarsten Moment befruchtet wird, der Bauer braucht also nur den passenden Moment abzuwarten.<\/p>\n<div class=\"clear\" style=\"height:20px\"><\/div>\n<p><a href=\"http:\/\/www.unifr.ch\/alma-georges\/wp-content\/uploads\/2016\/01\/Prof_Cudre-Mauroux_Philippe_01_4C1.jpg\"><img decoding=\"async\" loading=\"lazy\" class=\"alignnone size-large wp-image-1813\" src=\"http:\/\/www.unifr.ch\/alma-georges\/wp-content\/uploads\/2016\/01\/Prof_Cudre-Mauroux_Philippe_01_4C1-1024x685.jpg\" alt=\"Prof_Cudre-Mauroux_Philippe_01_4C\" width=\"680\" height=\"455\" srcset=\"https:\/\/www.unifr.ch\/alma-georges\/wp-content\/uploads\/2016\/01\/Prof_Cudre-Mauroux_Philippe_01_4C1-1024x685.jpg 1024w, https:\/\/www.unifr.ch\/alma-georges\/wp-content\/uploads\/2016\/01\/Prof_Cudre-Mauroux_Philippe_01_4C1-300x201.jpg 300w\" sizes=\"(max-width: 680px) 100vw, 680px\" \/><\/a><\/p>\n<div class=\"clear\" style=\"height:20px\"><\/div>\n<p>Wir trafen Prof. Philippe Cudr\u00e9-Mauroux im Rahmen des swissnex Day\u201915 zu einem kurzen Gespr\u00e4ch und befragten ihn zur Widerspenstigkeit von Daten und zur Zukunftsvision einer intelligenten Maschine, die selber Schl\u00fcsse zu ziehen vermag und so wom\u00f6glich dereinst auch Forscher ersetzen wird \u2013 oder auch nicht.<\/p>\n<p><strong>Philippe Cudr\u00e9-Mauroux, mitunter h\u00f6rt man, dass Big Data schon jetzt Too-Big Data sei, dass man die Menge der Daten gar nicht mehr sinnvoll analysieren k\u00f6nne. Haben auch die Maschinen schon einen \u00abInformation Overload\u00bb?<br \/>\n<\/strong>Nein, im Prinzip nicht. Es gilt immer noch die Pr\u00e4misse: Je mehr Daten, desto besser. Algorithmen m\u00fcssen trainiert werden, und je mehr Daten wir daf\u00fcr zur Verf\u00fcgung haben, desto pr\u00e4ziser werden die Analysen. Allerdings haben wir tats\u00e4chlich immer mehr Probleme, die vorhandenen Rohdaten zu verdauen.<\/p>\n<p><strong>Sie erw\u00e4hnten in der Diskussion im Anschluss an ihre Pr\u00e4sentation die 80\/20-Regel. Was hat es damit auf sich?<br \/>\n<\/strong>In der Datenverarbeitung stecken wir derzeit 80 Prozent des Aufwands in die Bereitstellung der Daten, in das Suchen und Aufbereiten, die eigentliche Analyse macht dann nur noch 20 Prozent der Arbeit aus. Das m\u00fcssen wir besser in den Griff bekommen.<\/p>\n<p><strong>Warum ist das so?<br \/>\n<\/strong>Weil Daten in sehr vielen verschiedenen Formaten und sehr unstrukturiert vorliegen und Computer eben nach wie vor nicht gut darin sind, selbst\u00e4ndig in den Daten zu \u00ablesen\u00bb. Erst wenn Computer in der Lage sind, Rohdaten selbst zu sortieren und die Inhalte zu strukturieren k\u00f6nnen wir das Potential von Big Data richtig aussch\u00f6pfen.<\/p>\n<p><strong>Also k\u00f6nnen Maschinen auch noch kein eigenes Wissen erwerben und logische Schl\u00fcsse ziehen. Der Job des Wissenschaftlers ist nicht in Gefahr?<br \/>\n<\/strong>Derzeit noch nicht, solche Ideen sind allerdings Zukunftsmusik. Versucht wird das nat\u00fcrlich schon, und wenn die vorliegende Information sehr rigide strukturiert ist, k\u00f6nnen Computer durchaus zwei Ideen logisch verkn\u00fcpfen und so neue Zusammenh\u00e4nge erschliessen. Aber im normalen Forschungsalltag liegt das noch in weiter Ferne.<\/p>\n<p><strong>Welche H\u00fcrde muss denn in dem Zusammenhang genommen werden?<br \/>\n<\/strong>Oft haben die Aufgaben ganz simpel mit Textverst\u00e4ndnis zu tun. Ein Grossteil der vorliegenden Datenmengen liegt als Text vor: Social Media, Emails, oder eben auch ein Forschungspaper. Daraus selbstt\u00e4tig die relevanten Informationen zu extrahieren und in eine Form zu bringen, die f\u00fcr Datenanalysen geeignet ist, davon sind Computer nach wie vor sehr weit entfernt.<\/p>\n<p><strong>Und wann werden wir soweit sein? Wagen Sie eine Prognose?<br \/>\n<\/strong>Lieber nicht, das Feld ist so dynamisch, da ist es schwer, Vorhersagen zu machen. Allerdings bin ich nach den grossen Fortschritten in den letzten Jahren durchaus optimistisch \u2013 die Maschinen werden nicht zuletzt immer besser darin, selber zu lernen.<\/p>\n<p><strong>Wenn sie an diese Zukunft denken, was \u00fcberwiegt bei Ihnen pers\u00f6nlich: die Faszination oder doch das Gef\u00fchl der Unheimlichkeit?<br \/>\n<\/strong>Ehrlich: ein wenig von beidem. Vor ein paar Jahren h\u00e4tte ich noch gesagt: Das ist zu futuristisch, um dar\u00fcber \u00fcberhaupt nachzudenken. Aber nun glaube ich tats\u00e4chlich, dass wir uns Gedanken \u00fcber intelligente Maschinen machen sollten \u2013 wir werden fr\u00fcher mit ihnen zu tun haben als wir denken.<\/p>\n<p><strong>Sie leiten auch die Plattform DapLap. Was genau haben Sie mit dem Projekt vor?<br \/>\n<\/strong>Viele Unternehmen haben interessante Daten, doch sie sind \u00fcberfordert mit deren Verarbeitung \u2013 nicht zuletzt wegen der raschen Fortschritte, die das Feld macht. Wir m\u00f6chten eine Plattform bereitstellen, die durch alle n\u00f6tigen Datenanalyse-Schritte f\u00fchrt und interessante Ergebnisse aufzeigt, mit einem Minimum an Infrastruktur f\u00fcr die Nutzer.<\/p>\n<p><strong>Und was k\u00f6nnte man damit konkret anfangen?<br \/>\n<\/strong>Nehmen Sie zum Beispiel Mobilfunkdaten und eine Technik namens Anomaly Detection. Wenn man die Bewegungsdaten der Handys in Echtzeit analysiert und mit dem \u00abNormalfall\u00bb abgleicht, kann man erkennen, wenn zum Beispiel wegen eines Unfalls eine Strasse gesperrt ist \u2013 diese Anomalie wird sogleich erkannt. Oder, ein ganz anderes Beispiel: Fernsehserien. Netflix hat die Serie \u00abHouse of Cards\u00bbmit einem System entwickelt, das aufgrund der Nutzerdaten gezielt ein Thema, einen Regisseur und einen Hauptdarsteller vorgeschlagen hat. Und das offensichtlich sehr treffsicher.<\/p>\n<div class=\"clear\" style=\"height:20px\"><\/div>\n<hr \/>\n<div class=\"clear\" style=\"height:20px\"><\/div>\n<p><strong>Big Data<\/strong><\/p>\n<p>Wie big ist Big Data? Gr\u00f6sser als fr\u00fcher, gr\u00f6sser als vorstellbar, gr\u00f6sser als alles, was noch zu handhaben ist? Die Begriffsbestimmung via blosse Datenmengen f\u00fchrt zu nichts \u2013 Big Data macht erst Sinn im Zusammenhang mit den algorithmischen Analysemethoden, die f\u00fcr diese grossen Datenmengen zum Einsatz kommen. Auf eine griffige Formel gebracht: Big Data sind Anwendungen, f\u00fcr die es kein Zuviel an Daten gibt. Weil man die Analysewerkzeuge mit Datens\u00e4tzen trainiert, werden sie immer besser, je mehr Input sie bekommen. Das funktioniert beim Aufsp\u00fcren verd\u00e4chtiger Kreditkartenzahlungen ebenso wie bei automatischen \u00dcbersetzungen (Google trainierte seinen Service mit EU-Verordnungen, die in zig Sprachen vorlagen). Der Sicherheitsexperte Bruce Schneier hat unl\u00e4ngst noch eine ganz andere Definition vorgeschlagen: Big Data, das m\u00fcsse man gleich verstehen wie Big Oil oder Big Tobacco \u2013 also Grossfirmen, die ihre Marktmacht f\u00fcr den eigenen Gesch\u00e4ftsvorteil auch gern mal missbrauchen. Die potenteste Lobbygruppe in Washington stellt unterdessen \u00fcbrigens Google.<\/p>\n<div class=\"clear\" style=\"height:20px\"><\/div>\n<hr \/>\n<div class=\"clear\" style=\"height:20px\"><\/div>\n<iframe loading=\"lazy\" src=\"https:\/\/www.youtube.com\/embed\/uH813u7_b0s?rel=0\" width=\"560\" height=\"315\" frameborder=\"0\" allowfullscreen=\"allowfullscreen\"><\/iframe><\/p>\n<p>&nbsp;<\/p>\n<p>&nbsp;<\/p>\n","protected":false},"excerpt":{"rendered":"<p>Big Data \u2013 alle reden davon und niemand weiss so ganz genau was das eigentlich ist. Eine Begriffskl\u00e4rung lieferte auch der swissnex Day\u201915 nicht, der im Dezember unter dem Motto \u00abBig Data for smart ideas\u00bb eine kunterbunte Mischung von Wissenschafts- und Zukunftsinteressierten an der Uni Freiburg versammelte. Vielmehr bot der Anlass die Gelegenheit, interessante K\u00f6pfe zu treffen, die Big Data lieber konkret nutzen als Wortklaubereien zu betreiben. Wie ein Fisch im Wasser f\u00fchlt sich auch Philippe Cudr\u00e9-Mauroux im grossen Datenmeer. Er ist Professor f\u00fcr Informatik an der Uni Freiburg und Leiter des eXascale Infolab und von daplab.ch, einer Plattform, die<\/p>\n","protected":false},"author":19,"featured_media":1821,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[115,75],"tags":[237,232,234],"_links":{"self":[{"href":"https:\/\/www.unifr.ch\/alma-georges\/wp-json\/wp\/v2\/posts\/1824"}],"collection":[{"href":"https:\/\/www.unifr.ch\/alma-georges\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/www.unifr.ch\/alma-georges\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/www.unifr.ch\/alma-georges\/wp-json\/wp\/v2\/users\/19"}],"replies":[{"embeddable":true,"href":"https:\/\/www.unifr.ch\/alma-georges\/wp-json\/wp\/v2\/comments?post=1824"}],"version-history":[{"count":1,"href":"https:\/\/www.unifr.ch\/alma-georges\/wp-json\/wp\/v2\/posts\/1824\/revisions"}],"predecessor-version":[{"id":1825,"href":"https:\/\/www.unifr.ch\/alma-georges\/wp-json\/wp\/v2\/posts\/1824\/revisions\/1825"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/www.unifr.ch\/alma-georges\/wp-json\/wp\/v2\/media\/1821"}],"wp:attachment":[{"href":"https:\/\/www.unifr.ch\/alma-georges\/wp-json\/wp\/v2\/media?parent=1824"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/www.unifr.ch\/alma-georges\/wp-json\/wp\/v2\/categories?post=1824"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/www.unifr.ch\/alma-georges\/wp-json\/wp\/v2\/tags?post=1824"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}