Stochastische Texte von Theo Lutz (23.7.1932 - 31.1.2010) Wenn auch die programmgesteuerten, elektronischen Rechenanlagen ursprünglich entwickelt wurden für die Bedürfnisse der praktischen Mathematik und der rechnenden Technik, so war man sich schon frühzeitig darüber im Klaren, daß eine Anwendung dieser Anlagen weit über diese Grenzen hinaus möglich sein müßte. Heute scheint die Vielfalt der Anwendungsmöglichkeiten unbegrenzt. Allerdings sind viele Wissenschaftler noch immer dem Irrtum verhaftet, daß die Benutzung elektronischer Rechenanlagen gebunden ist an die Verwendung von Zahlen. Eine Vielzahl von Programmen hat jedoch gezeigt, daß eine solche Einstellung falsch ist. So haben amerikanische Wissenschaftler auf der jüngst in Paris stattgefundenen Tagung zu Fragen der Informationstheorie über ein Programm berichtet, das von einem Satz der euklidischen Geometrie auf Grund einer logistischen Untersuchung in kürzester Zeit aussagt, ob der Satz wahr ist oder nicht. Es ist also ein Programm zum Beweis elementargeometrischer Lehrsätze. Des weiteren existieren schon seit längerer Zeit Programme für die Übersetzung von Texten in eine andere Sprache. Eine amerikanische büromaschinenfabrik hat berichtet, daß sie über ein Programm verfüge, das aus einem vorgegebenen wissenschaftlichen Text eine Kurzfassung verfertige. Die Existenz solcher Programme demonstriert wohl eindeutig, daß sich die Verwendung programmgesteuerter elektronischer Rechenanlagen tatsächlich nicht nur auf Probleme beschränkt, die an den Begriff der Zahl gebunden sind. Der Begriff "Rechnen" erhält durch solche Programme eine wesentlich allgemeinere Bedeutung. Für die Benutzer einer solchen Anlage ist nicht entscheidend, was die Maschine tut; wichtig ist allein, wie man die Funktion der Maschine interpretiert. So ist es für den modernen Wissenschaftler unerläßlich, zu wissen, wie man eine elektronische Rechenanlage programmiert und welches ihre Strukturen sind. Seine Aufgabe ist es, jene Strukturen im Sinne seiner Wissenschaft zu interpretieren. Es soll hier an dieser Stelle berichtet werden über ein Programm, das der Autor neulich auf der elektronischen Großrechenanlage ZUSE Z 22 im Rechenzentrum der T.H. Stuttgart durchgeführt hat. Die Maschine wurde verwendet zur Erzeugung von stochastischen Texten, von Sätzen also, deren Wörter zufallsmäßig bestimmt werden. Gerade die Z 22 ist ausgesprochen geeignet für Anwendungen im außermathematischen Bereich, sie eignet sich besonders für Programme mit vorwiegend logischer Struktur, für Programme also, die viele logische Entscheidungen enthalten. Sehr vorteilhaft für wissenschaftliche Probleme ist die Eigenart der Maschine, auf Wunsch die Ergebnisse sofort durch einen Fernschreiber ausdrucken zu können. Unser Programm hatte die Aufgabe, das im allgemeinen recht mühsame Herstellen von stochastischen Texten zu übernehmen. Früher hatte man solche Texte bestimmt, indem man durch Würfeln oder einen sonstigen Zufallsprozeß Sätze oder Satzteile auswählte und diese aneinandersetzte. Für die programmgesteuerte Maschine lag es nahe, als stochastischen Prozeß einen arithmetischen Zufallsgenerator zu verwenden, der mit sogenannten Zufallszahlen arbeitet. Ein solcher Zufallsgenerator funktioniert im Prinzip folgendermaßen: Aus einer Ausgangszahl wird durch eine arithmetische Operation eine
neue Zahl gebildet und aus dieser Zahl durch Intersektion eine Anzahl
Ziffern entnommen, die dann als Zufallszahl angesehen werden. Die bei
dieser Mit der Existenz eines solchen Zufallsgenerators ist das Problem der
stochastischen Texte im wesentlichen gelöst. In ihrem Speicher
enthält die Maschine eine gewisse Anzahl von Subjekten, Prädikaten,
logischen NICHT JEDER BLICKAnschließend wird das Wort IST ausgedruckt und mit Hilfe des Zufallsgenerators ein Prädikat und eine logische Konstante ausgewählt und ausgedruckt. Damit hat die Maschine etwa den Satz gebildet NICHT JEDER BLICK IST NAHund eine logische Konstante, d.h. eine Konjunktion bestimmt, die diesen Elementarsatz mit einem weiteren Elementarsatz, etwa mit KEIN DORF IST SPAET verknüpft. Als Ergebnis haben wir ein Paar von Elementarsätzen, verknüpft durch eine logische Konstante: NICHT JEDER BLICK IST NAH UND KEIN DORF IST SPAETDamit ist das Programm abgeschlossen und beginnt von vorne, weitere Paare von Elementarsätzen zu bilden. Die Maschine arbeitet, bis sie abgestellt wird. Bei dem beigegebenen Zufallstext enthielt die Maschine insgesamt 16 Subjekte und 16 Prädikate, ausgewählt aus F. KAFKA "Das Schloß": DER GRAF DER FREMDE DER BLICK DIE KIRCHEJedes der gegebenen Subjekte bzw. Prädikate soll gleich häufig, also mit gleicher Wahrscheinlichkeit auftreten. Die beiden Elementarsätze eines Paares sollen durch folgende logischen Konstanten verknüpft werden: a) durch "und' mit einer relativen Häufigkeit von 1/8Als logische Operatoren wurden mit gleicher Häufigkeit verwendet der Partikularisator "ein, eine, ein",Ergänzend mag noch darauf hingewiesen werden, daß man aus diesen Satzteilen 4x16x16 = 1024 verschiedene Elementarsätze bilden kann. Diese können auf (l024)² verschiedene Arten zu Paaren von Elementarsätzen kombiniert werden; berücksichtigt man, daß wir 4 verschiedene Verknüpfungsarten kennen, so ergibt sich für die gegebene Menge von Satzteilen eine Kombinationsmöglichkeit von 4x(1024)² = 4174304 verschiedenen Paaren von Elementarsätzen. Die Maschine hat etwa 50 solcher Paare zufallsmäßig bestimmt und davon sind nachfolgende 35 Paare abgedruckt. Es mag noch darauf hingewiesen werden, daß dieses Programm - es bestand ohne Texte aus etwa 50 Einzelbefehlen - in mancherlei Hinsicht ausbaufähig ist. Man kann etwa in den vorgegebenen Prädikaten- und Subjektmengen Wörter mit großer Häufigkeit dadurch auszeichnen, daß man sie mehrfach einspeichert. Der entstehende Text wird diese Wörter in entsprechender Häufigkeit enthalten. Weiterhin kann man die zugrunde gelegte Wortmenge auswählen im Hinblick auf eine spezielle Sprache. Die Maschine erzeugt dann Sätze in dieser Sprache. Wesentlich erscheint weiter. daß es möglich ist, die zugrunde gelegte Wortmenge durch eine zugeordnete Wahrscheinlichkeitsmatrix in ein "Wortfeld" zu verwandeln und der Maschine aufzuerlegen, nur solche Sätze auszudrucken, zwischen deren Subjekt und Prädikat eine Wahrscheinlichkeit besteht, die größer ist als ein bestimmter Wert. Auf diese Weise kann man einen Text erzeugen, der in Bezug auf die zugrundegelegte Matrix "sinnvoll" ist. Eine solche rechteckige Matrix enthält etwa an der Stelle (m,n)
die sogenannte Übergangswahrscheinlichkeit vom Subjekt m zum Prädikat
n, d.h. also eine Korrelationsziffer zwischen diesen beiden Satzteilen.
Erweitert man das Programm durch ein Oberprogramm, des in der Lage ist,
bei einem als "sinnvoll" gefundenen Satz die Übergangswahrscheinlichkeiten
zwischen seinem Subjekt und seinem Prädikat hinaufzusetzen und
die übrigen Wahrscheinlichkeiten dem mathematischen Zusammenhang
gemäß zu vermindern, so hat die Maschine in einem gewissen
Sinne "gelernt", indem sie auf diese Weise im Laufe der Zeit gewisse
Subjekt-Objekt-Kombinationen bevorzugt. Die bis jetzt gefundenen Ergebnisse
lassen die Hoffnung gerechtfertigt erscheinen, daß auch bei Untersuchungen
im sprachlichen und sprachanalytischen Bereich programmgesteuerte elektronische
Rechenanlagen mit großem Erfolg eingesetzt werden können.
Es ist zu wünschen, daß das Mißtrauen mancher traditionsgebundener
Philologen gegen die Errungenschaften moderner Technik recht bald einer
breiten und fruchtbaren Zusammenarbeit Platz macht. Stochastische Texte. Auswahl Zuerste erschienen:
-------------------------------------------------------------------- Materialien: |