Die elektrische Kanzlerin

Svenna Triebler stellt un-bot-mäße Überlegungen zu sprachverarbeitender Software an.

Ich versichere hiermit an Eides statt, dass ich diesen Text persönlich und ohne Zuhilfenahme elektronischer Hilfsmittel erstelle. Abgesehen natürlich von jenem Textverarbeitungsprogramm, das mir als virtuelle Schreibmaschine dient, mich darüber hinaus dezent auf Tippfehler hinweist und mir mit seinem Thesaurus über Wortfindungsschwierigkeiten hinweghilft. Und dem Betriebssystem, auf dem dieses Programm wiederum läuft. Und selbstverständlich dem Browser, den Suchma-schinen und allem, was sonst noch so für die Onlinerecherche nötig ist. Ansonsten aber handelt es sich bei diesem Artikel um reine Handarbeit.
Man sieht: Computer nehmen der schreibenden Zunft schon lange eine Menge Arbeit ab. Der nächste Schritt, also Programme, die auch den anstrengendsten Teil übernehmen, will heißen: dieses lästige Formulieren, war also nur folgerichtig. Eine entsprechende Software zu programmieren, ist mittlerweile auch für informatikaffine Amateure nicht mehr allzu schwer: Unter Twitterern ist es vor einiger Zeit in Mode gekommen, sich automatisierte Zweitaccounts (sogenannte Bots) zuzulegen, die sich Satzbausteine aus den Posts der Originale aus Fleisch und Blut zusammensuchen und daraus neue Tweets basteln. Das Ganze erinnert ein wenig an jene dreigeteilten Bilderbücher im Kindergarten, in denen Kopf, Rumpf und Hinterteile verschiedener Tiere zu merkwürdigen Fabelwesen zusammengesetzt werden können, funktioniert aber noch ein Stückchen raffinierter: Das Programm würfelt die Versatzstücke nicht einfach zufällig durcheinander, sondern versucht anhand eines Algorithmus zu erraten, welche Kombinationen am wahrscheinlichsten sind.
Genaueres über die Funktionsweise solcher Bots lässt sich im »Merkel-Blog« der Netzautorin und Schöpferin des Twitter-Accounts »Merkel eBooks« (@merkel_ebooks), Julia Schramm, nachlesen. Da Angela Merkel nicht twittert (jedenfalls nicht offiziell; dass sie inkognito unter irgendeinem phantasievollen Pseudonym auf der Zwitscherplattform aktiv ist, lässt sich ja nicht vollständig ausschließen), dienen in diesem Fall über 400 Reden der deutschen Bundeskanzlerin als Grundlage; das Programm erstellt daraus automatisch alle 15 Minuten eine neue Kurzmitteilung.
Mit durchwachsenen Resultaten. Von Grammatik weiß so ein Bot nichts, und so erwecken die Mitteilungen der elektrischen Kanzlerin oft eher den Eindruck, als stammten sie von einem gewissen Edmund Stoiber: »Gewerkschaftstag in Paris, die Gewalt, Flucht in Los Angeles – manchmal muss jetzt klare, transparente«, heißt es dort etwa. Manches hingegen klingt sogar menschlicher als das Original: »Du, lieber Herr Sommer des temporären Rettungsschirm, die unvollendete Doha-Runde«, und anderes geradezu visionär: »Klonen, sei es bei Frauen und das gilt nicht aufgegeben.«

Derartige Software-Basteleien taugen nicht allein als Spielerei. So startete die Berliner Künstlergruppe »Peng Collective« im April dieses Jahres die Aktion »Zero Trollerance«, um in sozialen Netzwerken gegen sexistische Hasskommentare anzugehen. Deren Inhalt und Duktus sind ziemlich vorhersehbar; das vereinfachte es, mit Hilfe eines Sprachanalysetools entsprechende Trollaccounts zu identifizieren. Wer beim Herumpöbeln ertappt wurde, erhielt freundliche Nachrichten von einem von 160 eigens programmierten Twitter-Bots: zuerst einen Hinweis auf die sexistische Natur des Posts, dann Schritt für Schritt Links auf sechs Videos mit einem satirischen »Selbsthilfeprogramm«, das »auf dem Weg zu Selbstreflexion und feministischer Resozialisierung« helfen solle. Die Aktion lief eine Woche lang; ob dadurch auch nur ein einziger Troll von seinem Verhalten »kuriert« wurde, ist für die Macherinnen und Macher allerdings zweitrangig. Viel wichtiger sei ihnen das Signal an die Betroffenen, den Anfeindungen nicht hilflos ausgeliefert zu sein, erklärt »Peng«-Aktivistin Lia Rea.
Noch größeren praktischen Nutzen bieten Fake-Accounts, die als Turing-Maschine programmiert sind, also mehr oder weniger überzeugend eine Kommunikation mit einer realen Person simulieren: Von Kommentarrhoe befallenen Zeitgenossen fällt in ihrer Rage oftmals nicht auf, dass sie sich stundenlang an einem Computerprogramm abarbeiten – mit dem angenehmen Nebeneffekt, dass die Trollmöpse in dieser Zeit nicht dazu kommen, echte Menschen zu belästigen.
Ein Programm zur Sprachanalyse bildete nicht nur die Grundlage für »Zero Trollerance«, sondern auch für die »Trolldrossel«, einem Experiment des Chaos-Computer-Club-Sprechers Linus Neumann und des Datenaktivisten Michael Kreil. Diese beiden nutzten eine Kopie des sich in Nerdkreisen zweifelhafter Beliebtheit erfreuenden Blogs »Fefes Blog«. Im Unterschied zum Original besaß das Duplikat »re:Fefe« eine Kommentarfunktion, welche auch eifrig genutzt wurde. Diese Datengrundlage erlaubte es, Wörtern und Sätzen eine Trollwahrscheinlichkeit zuzuordnen.
Anstatt nun mutmaßlichen Knalltüten-Content einfach auszusperren, bewirkte die eigentliche »Trolldrossel« etwas weitaus Fieseres: Je höher der Trollquotient eines Kommentars, um so größer die Wahrscheinlichkeit, dass das Programm dem mutmaßlichen Kommunikationsquerulanten ein falsches Captcha für die Freischaltung des Beitrags zuwies. Wer schon einmal mühsam einen dieser verzerrten Zahlen- oder Buchstabencodes entziffert hat, weiß, wie leicht man sich da vertippen kann, so dass die Zielgruppe offenbar keinen Verdacht schöpfte; manch einer gab selbst nach zehn vergeblichen Anläufen nicht auf, bis er endlich ein gültiges Captcha erwischte. Die Erfinder des Konzepts beschreiben die Vorteile so: »Kein Moderationsaufwand, keine Zensurvorwürfe, und ich habe die Leute maximal beschäftigt.«[1]

Sprachverarbeitende Software kann aber nicht nur dazu dienen, Inhalte aus dem Internet fernzuhalten, sondern generiert auch längst selbst welche. Während es dem Merkel-Bot und seinen Anverwandten noch an Sinn und Syntax gebricht, sind kommerzielle Schreibprogramme längst viel weiter und kommen vor allem dort zur Anwendung, wo es um die Aufarbeitung von Zahlen und Statistiken geht.
Ich muss gestehen, dass ich es sträflich versäumt habe, mir die Werke von Philip M. Parker zu Gemüte zu führen - die Auswahl fiel zu schwer: Im Angebot von Amazon finden sich über 100.000 per print on demand bestellbare Bücher des US-Wirtschaftswissenschaftlers. Wie man sich denken kann, hat Parker die nicht alle selbst geschrieben, sondern ebenfalls eine Software, an der er das Patent hält. Die geneigte Leserschaft möge mir verzeihen, dass ich aufgrund meiner Lesefaulheit nichts über die literarische Qualität der Werke aussagen kann, die so klanghafte Titel tragen wie »Webster‘s Italian to English Crossword Puzzles« oder The World Market for Coated, Impregnated, or Bleached Kraft Paper and Paperboard with over 95% by Weight of Wood Fiber Obtained by Chemical Process and over 150 G/M2 in Rolls or Sheets: A 2007 Global Trade Perspective«.
Die potentielle Kundschaft für diese Schmöker dürfte überschaubar sein, aber automatisch generierte Texte erreichen in Form von Börsen- oder Sportberichten längst ein breiteres Publikum. So nutzt beispielsweise »FussiFreunde«, das Fußballportal von Radio Hamburg, seit vier Monaten eine Anwendung, die aus den Mannschaftsaufstellungen und Ergebnissen der Kreisklasse eigenständig Artikel produziert. Wie Radio Hamburg der »Versorgerin« gegenüber erklärte, kommen diese Texte ohne Nachbearbeitung aus, dies sei zeitlich ohnehin nicht zu machen. Bei Berichten aus höheren Spielklassen sitzen allerdings noch immer Menschen an der Tastatur, die den Schreibroboter lediglich zur Unterstützung heranziehen. Wer die Probe aufs Exempel machen will, möge versuchen, herauszufinden, welche Artikel auf »FussiFreunde« menschen- oder aber maschinengemacht sind - ich für meinen Teil bin an dieser Aufgabe gescheitert.
Die journalistischen Ambitionen der Softwarebranche machen an diesem Punkt nicht halt, und Zeitungsverleger dürften die Entwicklung der kostensparenden Technologie aufmerksam beobachten. 50 Prozent der Inhalte von Tageszeitungen könnte auch der Computer schreiben, meint etwa Saim Alkan, Geschäftsführer der Berliner Firma Aexea, die ein entsprechendes Programm vertreibt. Er dürfte berufsbedingt optimistisch sein, aber vielleicht ist seine Schätzung trotzdem noch zu niedrig. Ob nun, wie heute üblich, unter Zeitdruck stehende Redakteure oder aber die elektronischen Heinzelmännchen Agenturmeldungen und Pressemitteilungen zusammenkopieren, dürfte ohnehin kaum einen Unterschied machen. Was aber ist mit den bewertenden Textformen, die werden doch sicherlich weiter Menschensache bleiben?
Garantiert ist das nicht. Noch gilt der Stil der Schreibprogramme als hölzern, aber man könnte ja beispielsweise mal testen, was herauskommt, wenn man die Software mit den Datenbanken zur Troll-Identifizierung füttert: vermutlich eine überzeugende Simulation des Stammtischgestammels von Franz-Josef Wagner, dem Obertroll der »Bildzeitung«. Und betrachtet man etwa die deutsche Kommentarlandschaft zum Thema Griechenland, wird man feststellen, dass dazu auch nicht mehr als das Aneinanderreihen vorhersehbarer Phrasen (»Fass ohne Boden«, »Hausaufgaben machen«, etc.) nötig zu sein scheint. Mit einem Kommentar-Bot, dem man verschiedene politische Stoßrichtungen vorgeben kann, ließe sich sogar eine weitaus größere inhaltliche Bandbreite erzielen.
Und es muss ja nicht mal der Anbieter sein, der diese Richtung vorgibt. Opinion on demand könnte die Zukunft des Onlinejournalismus sein, in der die Leser selbst die gewünschte Meinung beim Textprogramm bestellen. Die so entstandenen Artikel könnte man dann wiederum durch die automatisierten Social-Media-Zweitaccounts verbreiten lassen. Wenn diese dann auch gleich die sich anschließenden Schlammschlachten übernehmen, darf die Automatisierung des Journalismus als abgeschlossen gelten.

[1] Ausführlich haben Neumann und Kreil ihre Versuchsanordnung auf der Web-2.0-Konferenz Re:publica 2013 beschrieben. Der Vortrag ist auf Youtube unter dem Titel »Die Trolldrossel [re:Fefe: Erkenntnisse der empirischen Trollforschung]« zu finden.

Zurück zur Ausgabe: 
#107
10

Bot, or Not? Merkelraute als Geometrieaufgabe beim Turing-Test. (Foto: cc)

& Drupal

Versorgerin 2011

rss