Künstliche Intelligenz für den Datenjournalismus

TH KölnTH Köln und Science Media Center Germany entwickeln Lösung für die Informationsextraktion

Datenjournalisten sammeln und analysieren öffentlich zugängliche Daten und bereiten die darin verborgenen Informationen für ihre Medien auf. Dafür müssen sie häufig mit Daten arbeiten, die nur in unstrukturierter Form vorliegen. Dies macht eine automatisierte Auswertung schwierig. Im Forschungsprojekt „Journalistic Information Extraction“ (JoIE) möchten die TH Köln und das Science Media Center Germany daher ein Tool entwickeln, das mit solchen Datenquellen umgehen und diese journalistisch nutzbar machen kann.

„Die Daten, in denen Journalisten nach Informationen suchen, können ungemein vielfältig sein: Es handelt sich um Texte, Tabellen oder Grafiken, Dokumente unterschiedlichen Typs wie Word, PDF oder E-Mail oder um Webseiten, die zudem noch höchst unterschiedlich formatiert sein können. All das macht es sehr schwierig, zuverlässige und konsistente Regeln zu definieren, nach denen eine automatisierte Auswertung erfolgen könnte“, erläutert Prof. Dr. Philipp Schaer vom Institut für Informationswissenschaft der TH Köln die Problemstellung.

Auf Grundlage der beiden Open-Source-Werkzeuge Workbench und Fonduer soll eine Lösung entstehen, die unstrukturierte Daten in eine strukturierte und damit auswertbare Form bringt. Workbench erlaubt unter anderem die Extraktion von Webdaten. Fonduer verwendet künstliche Intelligenz, um automatisch Extraktionsmuster zum Beispiel zur Erkennung von Tabellen zu lernen.

„Kernidee unseres Projektes ist die Synthese der Nutzerfreundlichkeit von Workbench mit der hervorragenden Extraktionsleistung von Fonduer. Dabei geht es auch darum, komplexe Eingabehilfen zu entwickeln, mit denen Regeln für die Datenbearbeitung ohne Programmierkenntnisse erstellt und entwickelt werden können“, sagt Björn Engelmann, der im Rahmen von JoIE seine Doktorarbeit verfassen wird.

Um die spezifischen Anforderungen von Redaktionen und Datenjournalisten zu erfahren, sind Experteninterviews und gegebenenfalls Umfragen geplant. „Mit unserem Tool möchten wir den State of the Art der Datenverarbeitung für Redakteurinnen und Redakteure verfügbar machen, damit sie Informationen aus der Wildnis des Internets schnell und zuverlässig beschaffen können. Da diese oftmals mit begrenzten Ressourcen arbeiten müssen, wird unsere Lösung kostenlos und als Open-Source-Software verfügbar sein“, sagt Dr. Meik Bittkowski, Leiter Forschung und Entwicklung beim Science Media Center Germany.

Das Forschungsprojekt „Journalistic Information Extraction“ (JoIE) wird über drei Jahre von der Klaus Tschira Stiftung gGmbH gefördert. In dieser Zeit soll das Grundgerüst der Anwendung entstehen. Die Überführung in ein für Externe nutzbares System ist für eine optionale Projektverlängerung von zwölf Monaten angedacht.

Quelle: www.th-koeln.de

Diesen Beitrag teilen, das Unterstützt uns, DANKE !

FacebookVZJappyDeliciousMister WongXingTwitterLinkedInPinterestDiggGoogle Plus

weitere Beiträge

Musik / Film

DEEP PURPLE kündigt neues Album an


Deep Purple CoverEine der größten Rockbands aller Zeiten veröffentlicht am 19. Juli neues Album „=1“ bei earMUSIC. ‘It all adds up to 1’

Hamburg, 24. April 2024  Deep Purple, eine der größten und einflussreichsten Rockbands aller Zeiten, veröffentlicht am 19. Juli...


weiterlesen...

222 Jahre Hänneschen-Theater


Ausstellung Hänneschen Puppen in der Kassenhalle der Kreissparkasse Köln Foto KSKAusstellung vom 22. April bis 17. Mai 2024 in der Kassenhalle der Kreissparkasse Köln am Neumarkt

Köln, den 18. April 2024 Das Hänneschen-Theater begeht in diesem Jahr seinen 222. Geburtstag und möchte dieses besondere kölsche Jubiläum mit möglich...


weiterlesen...

Schüleraustausch und Gap Year –


Weltkugel auf in die Welt MesseFernweh: AUF IN DIE WELT-Messe am 20.04.2024 in Köln: Kostenfreie Insider-Informationen zu Schüleraustausch und Gap Year für das Auslandsjahr 2025 und 2026

Schüleraustausch USA und weltweit, High School in den USA, Internat in Kanada, Freiwilligen...


weiterlesen...

Esports World Cup mit Rekord-Preisgeld


Life Changing Prize Money 1920x1080Das höchste Preisgeld in der Geschichte des E-Sports ist richtungsweisend für das anstehende Turnier im Sommer und unterstreicht ein globales, umfassendes Engagement für die Zukunft des kompetitiven Gamings

 Innovatives Format zur Krönung eines sp...


weiterlesen...

Firmenlauf Köln - Die Anmeldezahlen


06 Firmenlauf Koln Nachmeldung Larasch GmbHKnapp 3.500 Voranmeldungen zum Firmenlauf Köln, Nachmeldungen sind noch möglich!

Mit knapp 3.500 Firmenläufer:innen ist der Firmenlauf Köln in seiner 15. Edition zurück. Am Mittwoch, 8. Mai beweisen die Läufer:innen erneut auf der 5 km Strecke um ...


weiterlesen...

Atemberaubender Saisonauftakt der NIGHT


Luc Ackermann NOTJ Munchen 2024 3N3A1383 webÜber 9.000 Besucher in der Olympiahalle München erlebten am Samstag ein Extremsportspektakel par excellence. Vor ausverkaufter Kulisse feierte die NIGHT of the JUMPs den gigantischen Auftakt in die Saison 2024. Mit dabei die beiden FMX Weltmeister...


weiterlesen...
@2022 lebeART / MC-proMedia
toTop

Wir nutzen Cookies auf unserer Website. Einige von ihnen sind essenziell für den Betrieb der Seite, während andere uns helfen, diese Website und die Nutzererfahrung zu verbessern (Tracking Cookies). Sie können selbst entscheiden, ob Sie die Cookies zulassen möchten. Bitte beachten Sie, dass bei einer Ablehnung womöglich nicht mehr alle Funktionalitäten der Seite zur Verfügung stehen.