Detail-Informationen

Autor

Hans-Arthur Marsiske

verfasst am

26.03.2013

im Heft

journalist 2/2013

facebooktwitterdel.icio.usMister Wongdigg.comaddthis.comMa.gnolia

Mehr zum Thema auf journalist.de

Mehr Texte aus der Redaktionswerkstatt gibt es hier

Redaktionswerkstatt

Warum sich Journalisten auf Text-Roboter einstellen müssen

Als Reporter berichtet Hans-Arthur Marsiske regelmäßig vom RoboCup, dem internationalen Fußballturnier für Roboter. Für den journalist hat er sich angeschaut, wie Roboter als Reporter in den verschiedenen Ressorts abschneiden. Sein Fazit: Texte aus dem Computer werden den Journalismus verändern.

Sportberichte, die ein Computer unmittelbar nach Spielende in Sekundenschnelle schreibt? Im vergangenen Jahr haben solche Texte für einige Unruhe unter Journalisten gesorgt. Eine Technologie, die sich bislang weitab vom redaktionellen Alltag entwickelte, berührte auf einmal eine journalistische Kernkompetenz und weckte Ängste.

Zwei junge US-Unternehmen bieten bislang solche automatisch produzierten Artikel an – mit der üblichen Begleitmusik: Natürlich gehe es nicht darum, den Journalisten zu ersetzen, versicherte etwa Robbie Allen, Gründer der Firma Automated Insights in Durham, North Carolina. Schon klar. Das Lied vom Wachstums- und Jobmotor Robotik ist Technikjournalisten bestens vertraut. Aber es kann nicht darüber hinwegtäuschen, dass die Industrieautomatisierung dem Menschen zwar Arbeit abnimmt, aber ausgerechnet diejenigen, denen sie abgenommen wird, in der Regel am wenigsten davon haben.

Nun also könnte es die Journalisten selbst treffen. Die Verunsicherung darüber ist vielen Artikeln anzumerken. Joe Fassler beruhigte sich in der Zeitschrift The Atlantic damit, dass es ja noch viele Bereiche des menschlichen Erlebens gebe, die nicht von einem Computer erfasst werden könnten – für Autoren sei also noch ausreichend Arbeit vorhanden. Steven Levy dagegen, der für Wired die Firma Narrative Science in Chicago besuchte, hatte es danach eilig, seinen Artikel fertig zu schreiben, "bevor mir ein MacBook Air zuvorkommt".

Ganz so ernst ist die Lage noch nicht. Aber Journalisten und alle anderen, die beruflich Texte verfassen, sind gut beraten, die Entwicklung der Technologie im Auge zu behalten. Die Systeme werden mit der Zeit unweigerlich besser und sich zuerst in den Ressorts auswirken, in denen Journalisten vor allem Zahlen verarbeiten.

Es klingt erst mal beruhigend, was der Computerlinguist Sebastian Padó in der Süddeutschen Zeitung sagte: Man dürfe von den Textautomaten "nicht zu viel erwarten". Dem Computer fehle das Weltwissen eines Menschen. Texte, in denen jeder Satz auf dem vorhergehenden aufbaue, bekomme ein Computer noch nicht hin.

Für konkrete Anwendungen ist ein umfassendes Wissen über Grammatik, Semantik und Rhetorik aber gar nicht erforderlich. In der Regel genügt die intelligente Kombination gröberer Textbausteine. Neben Werbebriefen, Bahnhofsdurchsagen und Hilfeseiten in großen Internetportalen entstehen auf diese Weise schon seit vielen Jahren auch Wetterberichte.

Das erste derartige System nannte sich FoG (Forecast Generator) und wandelte bereits 1992 für den kanadischen Wetterdienst mehrmals täglich die meteorologischen Daten in französische und englische Texte um. Ein vergleichbares System namens Multimeteo wurde Ende der 90er Jahre auch in Europa entwickelt.

Bei Wettervorhersagen ist die Sprache klar definiert, die Anzahl der Satzbausteine überschaubar. Zugleich werden die meteorologischen Rohdaten erst nach der Umwandlung in Text überhaupt verständlich: "Mäßige Winde" und "leichter Sprühregen" sind anschaulicher als Kilometer-pro-Stunde- und Millimeter-Angaben. Da die Berichte zudem mehrmals täglich entstehen, bieten sich viele Ansatzpunkte für eine Maschine.

Journalisten ist dadurch kaum Arbeit verlorengegangen. Sie beschäftigen sich ohnehin schon lange nicht mehr mit der täglichen Routine, sondern konzentrieren sich auf extreme Wetterereignisse, Hintergrundreportagen – und natürlich auf die hohe Schule meteorologischer Berichterstattung: die lockere Plauderei übers Wetter.

Börsenkurse, Zinssätze, Bilanzen – was für wunderbare Rohstoffe für Textgeneratoren! "Wo immer es um Zahlen geht und die Menschen Mühe haben, sie zu erfassen, ist unser Platz", sagt Kris Hammond, Mitgründer der Firma Narrative Science. "Wir nehmen eine Sprache, mit der die Menschen nicht vertraut sind, die Sprache von hochstrukturierten Daten und Zahlentabellen, und wandeln sie um in Geschichten – in die natürliche Weise, in der Menschen miteinander kommunizieren."

Zu den Kunden des Unternehmens, das aus Forschungen an der Northwestern University hervorgegangen ist, zählt eine Fast-Food-Kette, die einst mit großem Aufwand ein System eingerichtet hatte, um in Echtzeit die Geschäftstätigkeit in jeder Filiale zu erfassen. Allerdings waren die Daten so schwer zu durchschauen, dass 90 Prozent der Filialleiter sie nie nutzten. Die zu lesbaren Wochenberichten aufbereiteten Daten sollen jetzt in schlichter Prosa erklären, wie eine Filiale im Vergleich zu einer anderen dasteht, welche Produkte gut laufen, welche nicht und was sich daran ändern lässt.

Das Wirtschaftsmagazin Forbes nutzt ebenfalls den Textgenerator Quill von Narrative Science und veröffentlicht auf seinen Internetseiten regelmäßig automatisch erstellte Gewinnerwartungen für Unternehmen. Ähnlich wie beim Wetter ist die Zahl der erforderlichen Textbausteine auch hier überschaubar. Formulierungen wie "enttäuschte Erwartungen", "übertroffene Erwartungen" oder "fortgesetzte Trends" lassen sich leicht Zahlenentwicklungen zuordnen.

Natürlich kann ein Textgenerator auf der Bilanzpressekonferenz keine kritischen Nachfragen stellen und auch nicht zwischen widersprüchlichen Informationen abwägen. Aber wo es um reine Informationsaufbereitung geht, hat der Roboterreporter bereits den Fuß in der Tür – und wird ihn gewiss nicht mehr zurückziehen.

Bis zu zwei Millionen Berichte von Baseballspielen werde Narrative Science bis Ende des Jahres erstellen, kündigte der Firmenchef Hammond im vergangenen Sommer an. Die Konkurrenzfirma Automated Insights behauptet, pro Sekunde 1.100 Spielberichte mit einer Länge von 500 bis 1.000 Wörtern schreiben zu können.

Wie ist das möglich? Hier geht es doch um mehr als nur Zahlen. Die Leser wollen die Dramatik des Wettkampfs nacherleben, wollen Spannung, Emotion, Witz. Die Sportseiten der Zeitungen sind daher nicht umsonst oft Spielwiesen für Schreibtalente und leben von originellen Wortschöpfungen und Formulierungen. Haben die Informatiker der beiden US-Firmen etwa unabhängig voneinander einen genialen neuen Algorithmus zur Texterstellung entwickelt?

Nein, die Sportmeldungen entstehen auf die gleiche Weise wie Gewinnerwartungen und Wettervorhersagen. Auch diese Textgeneratoren bestehen aus den Hauptkomponenten Diskursplaner und Oberflächenrealisierer. Der Diskursplaner leitet aus den statistischen Daten zuerst den Charakter des Spiels ab: War ein Team deutlich überlegen, oder waren beide abwechselnd in Führung? Ist das Spiel gekippt? Danach wählt er aus seiner Bibliothek eine geeignete Erzählweise, um es zu beschreiben. Der Oberflächenrealisierer fügt auf dieser Grundlage dann geeignete Textbausteine zu einem Fließtext zusammen.

Das funktioniert bei Baseball recht gut, weil es ein zahlenintensiver Sport ist: Die Website der amerikanischen Major League Baseball führt allein 28 der wichtigsten Kennzahlen tabellarisch auf, mit denen Leistungen der Spieler erfasst werden. In den USA gibt es sogar eine Vereinigung, die sich der Erforschung und Analyse solcher Baseballdaten widmet.

Aber wie kommen die Zahlen in den Textgenerator? Narrative Science hat sich bei der Sportberichterstattung bislang vor allem auf Begegnungen der Little League konzentriert, in der mehrere Hunderttausend amerikanische Juniorenteams organisiert sind – und über die sonst niemand berichten würde. Hier ist vorgeschrieben, dass ein Elternteil oder ein anderer Erwachsener das Spiel für jedes Team protokolliert – eine Aufgabe, die sie jahrzehntelang mit Stift und Papier erledigt haben, die sich jetzt aber mehr und mehr auf Smartphones und Tablets verlagert. Die seit 2010 angebotene App GameChanger ermöglicht nicht nur die Eingabe von bis zu 150 verschiedenen statistischen Daten pro Spieler, sondern publiziert diese auch gleich in Echtzeit im Internet. Im Mai 2011 taten sich GameChanger und Narrative Science zusammen, sodass Eltern und Freunde den Spielen aus der Ferne nicht nur in Gestalt nackter Zahlen, sondern auch in Prosa folgen können.

Das Geschäftsmodell dürfte nur schwer auf andere Sportarten zu übertragen sein. Zwar lieben Fußballfans Statistiken, aber zur Beschreibung eines Spiels taugen solche Zahlen wenig. Sportreporter müssen im deutschsprachigen Raum wohl vorerst nicht mit ernsthafter Konkurrenz durch Textgeneratoren rechnen.

Medizinische Anwendungen für Textgeneratoren werden intensiv erforscht. Sie sollen etwa den Schichtwechsel auf Intensivstationen unterstützen, bei dem das Pflegepersonal Berichte für die Ablöse schreiben muss, oder bei Notfalleinsätzen kompakt die Infos bereitstellen, die Ärzte gerade benötigen. Solche Systeme haben mit dem journalistischen Alltag wenig zu tun.

Andere Forschungsvorhaben zielen hingegen darauf ab, medizinische Daten für die Patienten verständlich aufzubereiten. Ehud Reiter von der University of Aberdeen, einer der führenden Forscher auf dem Gebiet der Sprachgenerierung, will zudem Ärzten helfen, die Kommunikation mit ihren Patienten zu verbessern. Das an seinem Institut entstandene System BabyTalk-Family erstellt in einem Krankenhaus in Edinburgh täglich Berichte über Behandlung und Zustand von Frühgeborenen, um die Eltern in der Situation zu unterstützen.

Das bewegt sich schon etwas dichter an den journalistischen Arbeitsfeldern. Komplizierte Zusammenhänge verständlich darzustellen, zählt schließlich zu den Grundanforderungen an Journalisten. Gut möglich, dass sich Kollegen im Gesundheitsressort bei dieser Arbeit künftig von Textgeneratoren unterstützen lassen.

Hellhörig machen sollte auch der Hinweis, dass BabyTalk-Family nicht nur Zahlen verarbeitet, sondern auch Textinformationen aus dem klinischen Protokoll nutzt. Die Wissenschaftler sprechen im Unterschied zur reinen "data-to-text generation", der Aufbereitung von Zahlenmaterial zu Prosa, von der "text-to-text generation", die auch die Sprache selbst als Rohstoff nutzt. Aufgrund der rasanten Fortschritte der Forschung auf diesem Gebiet sollten sich selbst zahlenferne Ressorts wie ...

... oder das Feuilleton nicht in Sicherheit wiegen dürfen. Automatisch erstellte Texte dürften auch ihre Arbeit in den kommenden Jahren prägen. Dabei werden die Textgeneratoren wohl weniger als Konkurrenten denn als Assistenten auftreten, etwa bei Recherchen. Das "automatische Zusammenfassen längerer Texte und die Identifikation wichtiger Passagen" seien derzeit die Forschungsschwerpunkte, sagt Alexander Koller, Computerlinguistik-Professor an der Uni Potsdam.

Beim Lesen-und-Schreiben-Lernen stützen sich die Maschinen mehr und mehr auf Wikipedia. "Die Texte", so Koller, "haben eine relativ hohe Qualität, und die Linkstruktur erlaubt thematische Gruppierungen. Die internationale Verlinkung unterstützt zudem Übersetzungen." Durch den Abgleich mit Titeln von Wikipedia-Artikeln, den darin verlinkten Passagen und den Wikipedia-Kategorien entdecken Computerprogramme schon heute inhaltliche Gemeinsamkeiten – auch bei unterschiedlichen Begriffen. An der University of North Texas haben Forscher ihr System mit dem Satz The United States was involved in the Cold War gespeist und es nach verwandten Begriffen suchen lassen. Es fand unter anderem: Vietnam War, NATO, Ronald Reagan, Mikhail Gorbachev.

Das Bergen der in Wikipedia verborgenen Schätze scheint gerade erst in Schwung zu kommen. Textgeneratoren dürften sich daher in den kommenden Jahren rasant verbessern. Auf absehbare Zeit werden sie zwar keine Literaturkritiken verfassen oder Fußballspiele kommentieren, könnten sich aber bei anderen Aufgaben bewähren. Diskussionen in Internetforen oder das weltweite Aufkommen von Twitter-Meldungen lassen sich nur mithilfe von Softwareagenten richtig verfolgen, die das Geschehen regelmäßig zusammenfassen und bei ungewöhnlichen Entwicklungen Alarm schlagen.

Journalisten werden sich auf Roboter als Kollegen einstellen müssen. Die Maschinen werden den Menschen nicht verdrängen, aber sie werden Platz beanspruchen. Wie vielen menschlichen Schreibern sie damit die Erwerbsgrundlage entziehen, ist schwer einzuschätzen. Manch einer wird es zu schätzen wissen, wenn ein Computer ihm langweilige Routinetätigkeiten abnimmt. Andere verlieren lukrative Aufträge und werden gezwungen, sich neu zu orientieren.

Die Einschätzung in einer Broschüre des Deutschen Wetterdiensts zur Zukunft der Meteorologen passt auch ganz gut zum Journalismus: "Die Erfahrung zeigt, dass die Technik zwar viele Aufgaben übernehmen kann ... doch sie erfordert Spezialisten, die sie verstehen, bedienen und weiterentwickeln können. Das Berufsbild der Meteorologen wird daher nicht verschwinden, sondern sich ... mit dem technischen Fortschritt wandeln."

 

Mehr Texte aus der Redaktionswerkstatt gibt es hier.

Dieser Text stammt aus der Februar-Ausgabe des journalists. journalist-Abonnenten lesen die Texte aus der Redaktionswerkstatt acht Wochen früher.

Jetzt Probeabo bestellen: Hier gibt es die kommenden drei Ausgaben zum Kennenlernpreis von 5 Euro.

Über den Autor

Hans-Arthur Marsiske arbeitet als freier Wissenschaftsjournalist in Hamburg. Hier geht es zu seiner Website.

Aktuelle Kommentare zu diesem Text

28.03.2013 06:12

vorname nachname

Was ein Roboter ist, hat der Autor ganz gut verstanden. mac intosh müsste vielleicht mal nachrecherchieren, ob der Begriff sich seit Metropolis oder Asimovs "I Robot" sich nicht doch etwas verändert hat. Um Blechkisten mit zwei Armen und zwei Beinen geht es in der Roboterforschung jedenfalls längst nicht mehr.
Was dem Autor entgangen ist, sind aber Projekte wie beispielsweise an der University of Southern California, wo Textmeldungen in Twitter, Facebook usw zum Beispiel während der TV-Debatten bei der Präsidentenwahl analysiert werden, und daraus Meinungen und Stimmungen erkannt werden. Daraus entstehen dann auch Reports und analytische Texte, und zwar äußerst zeitnah und es geht nicht um Wahlstatistik, sondern um getextete Kommentare, oft sogar mit Slang-Wörtern, Jugend- oder Gang-Sprache und die werden mit hoher Zuverlässigkeit erkannt und im richtigen Kontext eingeordnet. Die Geschichten, wo es nur um Zahlen geht wie beim Sport, Wirtschaft/Finanzen oder Wetter sind längst Routine.

27.03.2013 10:23

Moritz Jaeger

Und ich hab kein Problem damit. Wenn mir der Roboter die immer wiederkehrenden Texte abnehmen kann, kann ich mich auf "richtige" Texte konzentrieren, also Dinge die dann sowohl mir wie auch dem Leser Spaß machen.

@mac intosh: Super konstruktive Kritik. Fehlt nur noch ein "Erster". Hier, ein Fisch: <°(((()))))><

27.03.2013 00:10

mac intosh

Da es relativ unwahrscheinlich ist, dass eine Maschine diese automatisierten Texte zukünftig per Papier und Bleistift schreibt, empfehle ich dem Autor dieses Artikels vielleicht erst einmal zu recherchieren, was man gemeinhin unter einem Roboter versteht.

 
Anzeige: 1 - 3 von 3.
 
Viavision