Die Aufgabe von Language Generation [Lg] ist das automatische Erzeugen eines natürlichsprachlichen Textes aus der formalen logischen Repräsentation von Wissen.
Language Generation [Lg] kommt in zwei zentralen Aufgabenstellungen zum Einsatz. Einerseits beim Erzeugen von Textausgaben von natürlichsprachlichen Bedienschnittstellen, z. B. Sprachdialogsysteme oder Chatbots, andererseits für Systeme, die Texte generieren, z. B. technische Dokumentationen, Wetterberichte oder Nachrichten.
Der allgemeine Trend hin zu Sprachassistenz-Systemen ist offensichtlich. Produkte wie Amazon Alexa, Samsung Bixby oder Google Voice halten Einzug in Telefone oder intelligente Lautsprecher. Im Einsatz für Unternehmen bestehen noch große Defizite in der Bedienbarkeit, der Leistungsfähigkeit und Sicherheit.
Im Rahmen eines Sprachdialogsystems stellt Language Generation [Lg] die zentrale Dialogschnittstelle dar. Meist verantwortet ein Dialogmanager oder Präsentationsplaner die übergeordnete Kontrollfunktion zur Strukturierung und Durchführung eines Interaktionsablaufs. Dieser erzeugt eine abstrakte Repräsentation des zu erzeugenden Textes, der dann durch Language Generation [Lg] in natürlichsprachlichen Text der Zielsprache ausgegeben wird. Der Text kann im Anschluss durch Sprachsynthese in gesprochene Sprache umgewandelt werden. Language Generation [Lg] wird durch KI-Elemente wie Planning [Pl] und Reasoning [Sy] unterstützt. Häufig werden für die Generierung natürlichsprachlicher Texte auch Formular-basierte Verfahren eingesetzt, die feste Textfragmente mit dynamischen Inhalten kombinieren.
Lösungen für Language Generation [Lg] werden einerseits von Spezialanbietern wie paragon semvox oder Aexea angeboten, andererseits von Konzernen wie Google, IBM oder Amazon.
Das KI-Element kommt in allen Anwendungen zum Einsatz, die über eine sprachbasierte Schnittstelle mit Anwendern kommunizieren. Mit der zunehmenden Verbreitung von Sprachassistenzsystemen nimmt die Bedeutung dieser Komponente weiter zu. Language Generation [Lg] wird zunehmend wichtiger, damit die nächste Generation derartiger Produkte ausreichend Akzeptanz im Alltag finden wird.
Die maschinelle Umsetzung von Language Generation [Lg] ist anspruchsvoll. Neben dem Erschließen vorhandener und dem Erzeugen neuer Wissensquellen stellen die Qualitätssicherung der Ausgabe und die Übersetzung in verschiedene Zielsprachen derzeit noch hohe Hürden für eine kommerzielle Anwendung dar. Deshalb werden bisher in der Praxis vielfach formularbasierte Ansätze eingesetzt.
IBM Arria ist eine Schnittstelle auf der IBM Cloud-Plattform für Anwendungen im Finanzbereich. Arria ist eine Sprachtechnologie, die nachbildet, wie ein menschlicher Experte Daten analysiert, Informationen herausfiltert und schließlich natürliche Sprache generiert. Yseop präsentiert eine Lösung, um Benutzern ihre Daten in schriftlicher Form, in der Muttersprache und in Echtzeit zu erklären. textOmatic nutzt formularbasierte Verfahren, um große Textmengen in Echtzeit zu erzeugen. paragon semvox setzt auf eine tiefgehende semantische Verarbeitung von Sprache, um als Resultat eine natürliche gesprochene oder geschriebene Sprachausgabe in möglichst vielen Zielsprachen zu liefern.