Digitalisierung im Journalismus

Die echtzeitnahe Verarbeitung von hochdynamischen Nachrichtenströmen ist das Thema im Kolloquium am 25. Oktober.

Am 25. Oktober 2017 referiert Matthäus Deutsch über die echtzeitnahe Verarbeitung von hochdynamischen, unstrukturierten Nachrichtenströmen zur Qualitäts- und Effizienzsteigerung der Redakteurs-Recherche mit Hilfe einer Content Curation Engine. Der Vortrag startet um 17:00 Uhr in Hörsaal 5.

Zum Vortrag:

Die Idee „Future News“ startete im August 2014 und verfolgte einen neuartigen Ansatz des journalistischen Storytellings. Einmal täglich sollten die wichtigsten Themen des Tages identifiziert und die wertvollsten und besten Quellen (z. B. Artikel, Blog-Einträge, Leitartikel, Kommentare) um sie herum gesucht werden. Aus diesen Quellen sollten die wesentlichen Inhalte und Aspekte automatisiert entnommen werden, anstatt Teaser-Texte zu aggregieren oder eine neue Auflage bereits geschriebener Geschichte zu haben. Im Ergebnis entstand daraus eine Bildschirmkarte für das Smartphone. Die darin enthaltenen Informationen aus den einzelnen Quellen wie Texten, Daten, Grafiken oder Karten erzählen neu zusammengestellt eine einzigartige Geschichte. Der Prototyp des Konzeptes wurde in unterschiedlichen closed Betas getestet und überzeugte mit deutlich überdurchschnittlichen Bewertungen.

In Zusammenarbeit mit Google konnte Gruner+Jahr im Rahmen der Digital News Initiative über ein Jahr lang eine Content Curation Engine von der Idee bis hin zu einer existierenden Applikation realisieren. Die Content Curation Engine (CCE) ist ein System, das es den Journalisten ermöglicht, die besten (einzigartigen, qualitativ hochwertigen) Artikel im Web schnell und mit möglichst wenig manuellem Aufwand zu finden. Dabei kombiniert die CCE intelligente und semantische Suchalgorithmen mit maschinellem Lernen und Data Science.

Zusätzlich wurde eine Programmierschnittstelle API für die CCE entwickelt, mit der die Informationen ebenfalls für Dritt-Applikationen abrufbar vorliegen. So können zukünftig nicht nur die Redakteure im Front-End die Engine nutzen. Es sind viele weitere Anwendungsmöglichkeiten etwa in Newslettern oder Chatbots möglich.
 
Das Kolloquium befasst sich mit unstrukturierten Nachrichtenströmen, Crawling, Web Content Extraction, semantischer Analyse, automatisierter Entitäts- und Textgenreerkennung bis hin zur automatisierten Kuration und Bereitstellung der Artikel für den Redakteur. Oder kurz gefasst: wie Gruner+Jahr täglich 85.000 Artikel aus 1.285 Quellen verarbeitet.

Zum Referenten:

Matthäus Deutsch hat in Graz und Berlin Mathematik und Statistik studiert und an der Humboldt-Universität zu Berlin im Bereich des Maschinellen Lernens zu bayesianischen Modellen (Topic Modeling, Stochastic Variational Inference) geforscht. Er war Mitglied im Entwicklerteam der Google Digital News Initiative (DNI) bei Gruner+Jahr und dort insbesondere für das Engineering der Machine-Learning-Modelle zuständig.

In Kürze:

Was: Kolloquium "Future News - Echtzeitnahe Verarbeitung von hochdynamischen, unstrukturierten Nachrichtenströmen zur Qualitäts- und Effizienzsteigerung der Redakteurs-Recherche"
Wann: 25. Oktober, 17:00 Uhr
Wo: Hörsaal 5