ANZEIGE
Folgen Sie uns:
planung & analyse GmbH auf facebook.de planung & analyse auf twitter.de planung & analyse GmbH auf google+ planung & analyse GmbH auf xing

Editor's Pick


Freischwimmer im Data-Lake

Bild: pixabay.com 

 Bild: pixabay.com


Ralph Wirth leitet das Data Lab bei GfK. Mit planung&analyse sprach er über Big Data, Deep Learning und die Trumpfkarten der Marktforschung.


Wo ist bei Ihnen der Data Lake?
Der Data Lake ist im Prinzip ein großer Rechnerverbund. Dort laufen die Daten unserer großen Panel zusammen und werden mit weiteren Daten integriert.

Alle Daten von GfK sind da drin?
Das ist die Vision. Wir entwickeln den Data Lake Schritt für Schritt. Zukünftig sollen auch Kundendaten eingebracht werden, um integrative Erkenntnisse zu gewinnen. Der Data Lake ist eine Datenintegrationsplattform, die eine unserer wichtigen Aufgaben erleichtert: aus verschiedenen Datensätzen relevante integrierte Erkenntnisse zu extrahieren. Wenn zum Beispiel ein FMCG-Hersteller eine konkrete Fragestellung hat, dann überlegen wir, welche Daten wir benötigen, integrieren diese in unseren Data Lake und führen mit dem Kunden auf der Grundlage dieser Datenbasis das Projekt durch. So wächst der Data Lake mit der Zeit. Wir haben das Ziel, dass einmal alle von GfK erfassten Daten in diesem Rechnercluster sind und wir flexibel Daten von Kunden oder offene Datenquellen, etwa Wetterdaten, dort einbinden können. Wir achten dabei natürlich strikt auf den Datenschutz.

Dr. Ralph Wirth ist Head of Data Lab der GfK. 

 Dr. Ralph Wirth ist Head of Data Lab der GfK.

Und was machen Sie im Data Lab?
Das Data Lab ist davon differenziert zu sehen. Hier stellen wir kontinuierlich ein globales Team zusammen, das sich um Herausforderungen von Big Data für GfK kümmert. Wir treiben neue Projekte im Bereich Big Data und Data Science voran. Der Aufbau des Data Lake ist also nur eines unserer Themen.

Wer arbeitet in Ihrem Data Lab?
Vor allem Data Scientists. Wir haben die Stellen global ausgeschrieben und die Besten genommen. Das Team ist international zusammengestellt, mit Mitarbeitern aus dem Iran, Ukraine, Deutschland, Polen, USA… Das sind sehr gute Leute – und die sind schwierig zu bekommen.

Fühlen die sich als Marktforscher?
Ich glaube nicht primär. Die Kollegen haben ganz verschiedene Hintergründe. Es sind Astrophysiker, Spieltheoretiker, Mathematiker, aber eben auch Experten aus der Marktforschung.

Welche Aufgaben stellen Sie sich im Data Lab?
Anfangs haben wir viel Grundlagenforschung betrieben. Jetzt greifen wir aktiv dringende Fragestellung der Kunden auf und überlegen mit ihnen, welche Daten für die Lösung nötig sind. Das ist nicht immer eine Befragung. Viele moderne Geräte, mit denen wir uns täglich umgeben, hinterlassen digitale Spuren. Die können wir auswerten. Das sind beispielsweise GPS-Tracks aus dem Handy, Sensor-Daten oder Social-Media-Daten. Smartphones generieren zum Beispiel viele Daten, aus denen man spannende Einsichten in Konsumentenpräferenzen erhalten kann. Zusätzlich haben wir Informationen über das Medien- und Internetnutzungsverhalten auf anderen Geräten oder auch zum Einkaufsverhalten. Diese können wir zusammenzuführen. Dabei halten wir uns stets an die engen Datenschutzvorgaben und die Freigaben der Personen, deren Daten wir messen.

Ist das dann dieselbe Person?
Wenn man den Smartphonenutzer fragt, ob man die entsprechenden Daten über mehrere Geräte hinweg analysieren und aufzeichnen darf, dann hat man wirklich Single-Source-Daten. Aber wenn wir uns unterschiedliche Personen mit ähnlichem Mediennutzungsverhalten ansehen, können wir über statistische Fusion anonyme „statistische Zwillinge“ erzeugen. So erhalten wir personenunabhängige Informationen über fiktive Personentypen, die vermutlich ein ähnliches Verhalten – beispielsweise beim Internetbrowsen, Musikhören oder Einkauf – haben.

Wieso geben die Kunden Ihnen Daten aus ihren Unternehmen?
Für diese Zusammenarbeit braucht es Vertrauen. Da haben wir als Marktforscher einen erheblichen Vorteil gegenüber anderen Unternehmen. Denn wir haben zu Recht den Ruf, sehr gut und gewissenhaft mit Daten umzugehen. Wir wissen genau, worauf wir zu achten haben und welche Daten wie anonymisiert werden müssen. Das ist bei einem Datenaustausch mit unseren Kunden sehr wichtig, heute sogar wichtiger denn je. Diese Trumpfkarte müssen wir als Marktforscher ausspielen.

Bei dieser Art Marktforschung gibt es aber reichlich Konkurrenz von Google & Co?
Wir arbeiten auch mit den großen Playern zusammen. Wir konzipieren beispielsweise auch Panel mit ihnen und gehen Partnerschaften ein. Aber in gewisser Weise sind sie natürlich auch Konkurrenz. Dazu zählen auch einige Startups. Aber gegenüber diesen Playern hat die Marktforschung ihren eigenen Vorteil. Wir wissen durch unsere Panels beispielsweise genau, wie viele von einem bestimmten Produkt in welcher Stadt verkauft wurden. Das sind spannende und wichtige Daten, die kein Startup und auch kein Internetkonzern so hat. Und wir genießen bei den Verbrauchern einen Vertrauensvorschuss im Umgang mit persönlichen Daten. Große IT-Unternehmen führen zwar ebenfalls Big-Data-Analysen durch, haben aber keine eigene Datenbasis wie wir. Die Konkurrenz kann auch Kooperationspartner sein. Es gibt beispielsweise gute Tools, etwa zur Stimmerkennung, bei denen wir das Rad nicht neu erfinden müssen. Hier können wir lizensieren und sie selber einsetzen oder sie auch weiterentwickeln.

Und das Thema Big Data steht erst seit einem Jahr bei GfK auf der Agenda?
Nein, wir arbeiten schon länger an vielen Stellen mit Big Data, auch mit Kunden zusammen. Unser Crossmedia Link Panel ist beispielsweise „Big Data“ par Excellence. Hier führen wir beobachtete Daten zum Kaufverhalten, zur Internet-, Smartphone- und Mediennutzung zusammen. Da kommen für die Analyse schnell Petabytes an Daten zusammen. Diese Analysen machen wir seit vielen Jahren, auch standardisierte Produkte wurden daraus entwickelt. Viele Big-Data-Projekte sind an dezentralen Stellen gelaufen. Dann wurde das Thema in Bezug auf Forschung und Entwicklung zentralisiert, weil es ein so dynamischer Bereich im Hinblick auf Technologien und Methoden ist.

GfK hat ja den Luxus, noch einen Eigentümer zu haben, der ebenfalls forscht?
Ja, der GfK-Verein macht viel Grundlagenforschung, zum Beispiel die Erkennung von Emotionen in der Stimme oder in Gesichtern. Auch auf Basis solcher Erkenntnisse entwickelt GfK Produkte. Beispielsweise werden mit der Webcam Gesichtsausdrücke eingescannt, während die Probanden einen Werbefilm anschauen, und dann können wir genau sagen, wie sie reagieren. Dabei geht es häufig um Deep Learning. Das heißt, mit vielen Trainingsdaten und großen Rechnerkapazitäten mathematische Modelle zu entwickeln, die sehr komplexe Zusammenhänge erkennen. Um bei dem Beispiel zu bleiben: Für die Marktforschung geht es beispielsweise darum, ob Probanden Marken oder Produkte, die sie auf Bildern sehen, in einem positiven oder negativen Kontext erleben.

Big Data und Deep Learning Methoden sind die Zauberworte moderner Marktforschung. Können demnächst schlaue Maschinen die Fragen alleine beantworten?
Ich glaube, dass man immer gut ausgebildete Fachleute – Marktforscher, Statistiker etc. – braucht, um wirklich das herauszufinden, was man wissen will. Sonst geht man ganz schnell Scheinkorrelationen auf den Leim oder beantwortet Fragen auf völlig falsche Weise. Vor zehn Jahren war das Jedem klar. Marktforscher haben gelernt, valide Schlüsse auf Basis von Daten zu ziehen und Dinge zu hinterfragen. Hier können wir als Marktforscher die Trumpfkarte ziehen, nämlich unsere Kompetenzen und das Vertrauen, das man uns in Bezug auf Datenschutz und unsere Datenbasis entgegen bringt. Bei uns muss ein Panelist mehrmals zustimmen, dass wir seine Daten nutzen dürfen. Und das muss auch so bleiben.

Wir danken Ihnen für das Gespräch.

Weitere Beiträge zu Künstlicher Intelligenz >>

Künstliche Intelligenz ist das Titelthema
im Heft 4/2016 von planung&analyse
Zum Inhalt |zum Abo | dieses Heft bestellen

Nähere Informationen zur GfK-Gruppe finden Sie online im p&a Handbuch der Marktforschung. Firmenprofil >>

Facebook Twitter Google LinkedIn Xing RSS Email