ZIM-Kooperationsprojekt will Machine Learning Verfahren zur fehlertoleranten automatischen Dublettenerkennung (Identity Resolution) entwickeln
Die Pflege von Kunden- und Interessentendatenbanken für Unternehmen und Institutionen künftig zu vereinfachen ist das Ziel eines gemeinsamen Forschungs- und Entwicklungsprojekts des Instituts für Angewandte Informatik (InfAI) e.V., Leipzig und der Uniserv GmbH, Pforzheim. Beide Partner sind Mitglied in dem bundesweiten GFFT-Kooperationsnetzwerk „Erfolgreiche IT-Großprojekte: Mit System zum Erfolg“.
Fehlertolerante automatische Dublettenerkennung ist Voraussetzung, damit Unternehmen zum Beispiel eine komplette 360°-Sicht auf Kunden und Interessenten herstellen oder personalisierte Kundeninteraktion auslösen können. Dies gilt auch für Analysen auf Haushaltsebene oder um einen Abgleich gegen Sperrlisten zur Betrugserkennung und Risikoabschätzung durchzuführen.
Im Bereich der Verwaltung großer Datenbestände von Kunden und Interessenten ist die Erstellung von Geschäftsregeln für die Erkennung von Duplikaten eine hoch komplexe Aufgabe. Denn es geht dabei nicht nur um doppelte oder mehrfach vorhandene Stammdaten, sondern oft auch um zugehörige Transaktionsdaten, die nicht über eindeutige Kundennummern, sondern über so genannte „weiche“ Identifikationskriterien wie Namen und Adressen, Telefonnummer, E-Mailadresse oder Social Login zugeordnet werden müssen. Diese Zuordnungen maschinell sicher durch zu führen, wird im Zeitalter der Digitalisierung immer wichtiger.
Dabei sind diese Geschäftsregeln nicht nur je Unternehmen und Institution unterschiedlich. Sie hängen auch erheblich von der jeweiligen Aufgabenstellung (wie beispielsweise Konsolidierung aller Finanz- und Versicherungsverträge in einem Haushalt oder Datenanreicherung für Marketing-Kampagnen) ab sowie auch von der Datenqualität, die je nach Erfassungsart (Webformular, Call-Center etc.) sehr unterschiedlich ist. Da sich Aufgaben und Anforderungen oft sehr kurzfristig ergeben bzw. ändern, muss die Erstellung eines neuen aufgabenspezifischen Regelwerks sehr schnell und möglichst durch die Fachabteilung direkt erfolgen können.
Mit Hilfe des Projekts KOBRA (Konfiguration von Business-Regeln für Anwender von Duplikaterkennungssystemen) soll nun eine Lösung geschaffen werden, die die aufgaben- und unternehmensspeziellen Regeln durch Hinzufügen von positiven und negativen Beispielen der Nutzer immer besser an die spezifische Problemstellung anpasst. Dies geschieht durch eine neuartige Kombination unterschiedlicher Verfahren des maschinellen Lernens mit einer Trainingsdatenselektion, Historisierung und Simulationsumgebung. Mittels dieser automatisierten Identitäts- und damit Duplikaterkennung kann die Datenqualität signifikant gesteigert werden.
„Das Projekt ermöglicht es uns, Knowhow aus langjähriger Forschungsarbeit in die Praxis übertragen zu können und gemeinsam weiter zu vertiefen. Wir freuen uns sehr auf die Zusammenarbeit mit Uniserv“, erläutert Professor Erhard Rahm, Leiter der Abteilung Datenbanken am InfAI.
Hervorgegangen ist das Projekt KOBRA aus dem ZIM-geförderten Kooperationsnetzwerk „Erfolgreiche IT-Großprojekte: Mit System zum Erfolg“, welches von der GFFT Innovationsförderung GmbH betrieben wird. Ziel des Netzwerks ist es, bestehende Methoden, Techniken und Werkzeuge, die für kleine und mittlere Projekte gut geeignet sind, systematisch auf ihre Eignung für IT-Großprojekte zu untersuchen, um dann die dort erkannten methodischen und technologischen Lücken zu schließen. So soll ein durchgehendes Gesamtkonzept zur erfolgreichen Durchführung großer IT-Projekte geschaffen werden.
„Wir freuen uns sehr auf die künftige Zusammenarbeit mit der GFFT und dem InfAI im Rahmen des Forschungsprojekts KOBRA. Das Projekt soll zeigen, wie Künstliche Intelligenz dabei helfen kann, die Ansprache von Unternehmen an ihre Kunden zu verbessern – und die Qualität von Kundendaten zu erhöhen. Die Ergebnisse des Projekts wollen wir nach Abschluss auch in unsere Lösung Uniserv Identity einfließen lassen“, erklärt Dr. Simone Braun, Business Development, Uniserv.
Das Projekt KOBRA wird für zwei Jahre im Rahmen des Zentralen Innovationsprogramms Mittelstand (ZIM) durch das Bundesministerium für Wirtschaft und Energie gefördert.
Die GFFT Innovationsförderung GmbH
Die GFFT Innovationsförderung GmbH mit Sitz in Bad Vilbel initiiert und betreibt Netzwerke und Innovationszentren, deren Ziel die Entwicklung und Bündelung innovativer Lösungen im Bereich der Informationstechnologie ist. Diese Initiativen führen kompetente Partner aus Forschung und Praxis zusammen und richten ihre Kräfte auf ein gemeinsames Ziel aus. Die GFFT Innovationsförderung GmbH unterstützt ihre Partner durch das Management, die Fortschrittskontrolle und den sukzessiven Ausbau der Netzwerke sowie durch die Vermarktung der Lösungen.
Mehr Informationen unter www.gfft-ev.de.
Uniserv GmbH
Uniserv ist Experte für erfolgreiches Kundendatenmanagement. In seinen Customer-Data-Management- und Data-Quality-Lösungen für Kundenstamm- und Bewegungsdaten vereint Uniserv Datenqualitätssicherung und Datenintegration zu einem ganzheitlichen Ansatz. Kundendaten stehen im Mittelpunkt von Initiativen für Master Data Management, Datenqualität, Datenmigration und Data Warehousing, beispielsweise im Umfeld von CRM-Anwendungen, eBusiness, Direct- und Database-Marketing, CDI/MDM-Anwendungen und Business Intelligence. Mit mehreren Tausend Installationen weltweit bedient Uniserv die Erwartungshaltung einer ganzheitlichen Lösung für alle Geschäfts- und Kundendaten über den gesamten Datenlebenszyklus hinweg. Am Stammsitz in Pforzheim sowie in den Niederlassungen in Paris, Frankreich, und Amsterdam, Niederlande, beschäftigt das Unternehmen über 130 Mitarbeiter und zählt branchenübergreifend und international zahlreiche renommierte Unternehmen wie beispielsweise Allianz, Deutsche Bank, eBay, EDEKA, E.ON, France Telecom, Lufthansa, Otto, Siemens, Time Warner sowie TUI und VOLKSWAGEN zu seinen Kunden. Der Landesdatenschutzbeauftragte für Baden-Württemberg hat kürzlich bestätigt, dass Uniserv seine Geschäftsprozesse datenschutzgerecht gestaltet. Zudem hat das Unternehmen kürzlich erneut das Qualitätssiegel Datenverarbeitung des Deutschen Dialogmarketing Verbandes e.V. für das Jahr 2017 erhalten.
Mehr Informationen unter www.uniserv.com.
Institut für Angewandte Informatik (InfAI) e.V.
Das InfAI bzw. die am InfAI beteiligte Arbeitsgruppe von Prof. Dr. Erhard Rahm an der Universität Leipzig ist eine der weltweit führenden Forschungsgruppen im Bereich der Datenintegration, Datenmigration und insbesondere der Duplikaterkennung und kann umfangreiche wissenschaftliche Erfahrungen auf diesem Gebiet vorweisen. Erhard Rahm ist außerdem einer der wissenschaftlichen Koordinatoren des nationalen Big Data Kompetenzzentrums ScaDS Dresden/Leipzig, welches das Projekt ebenfalls inhaltlich unterstützen wird.
Mehr Informationen unter www.infai.org.
Ansprechpartner für Rückfragen:
GFFT Innovationsförderung GmbH
Dr. Thorsten Arendt
Mail: thorsten.arendt@gfft-ev.de
Tel: +49 6101/ 95 49 8 98
Uniserv GmbH
Dr. Simone Braun
Mail: simone.braun@uniserv.com
Tel.: +49 7231 936 1081
Institut für Angewandte Informatik (InfAI) e.V.
Dr. Erik Peukert
Mail: peukert@infai.org
Tel.: +49 341 97 39524