Language Understanding [Lu] beschreibt das Verstehen der Information im Text, also die Zuordnung zur Bedeutung. Das KI-Element versteht die in Texten gemeinten Beziehungen zwischen Entitäten und Konzepten (siehe auch Text Extraction Te). Dabei werden zwei Probleme gelöst: einerseits wird geklärt, welche Entitäten und Konzepte in Satzstrukturen überhaupt eine Beziehung bilden; andererseits wird untersucht, welche Bedeutung diese Beziehung hat. Beziehungen können in vielen Varianten ausgedrückt werden. Als Beispiel dienen die folgenden Sätze: »Er ist der Geschäftsführer des Unternehmens«, »Er leitet das Unternehmen« und »Er führt die Geschäfte des Unternehmens«. Das Ergebnis von Language Understanding [Lu] – gemeinsam mit Text Extraction [Te] – ist der Transfer eines möglicherweise mehrdeutigen Textes in eine eindeutige maschinelle Repräsentation.
Die derzeit augenscheinlichste Bedeutung hat Language Understanding [Lu] in sprachgesteuerten Assistenten wie Apples Siri, Amazons Alexa oder Microsofts Cortana. Ohne das Verstehen der Absicht, die hinter einer Frage steht, sowie das Erkennen und die korrekte Zuordnung von Ortsnamen wären weder einfache Anfragen, z. B. nach dem Wetterbericht, noch komplexere Anfragen, z. B. die Frage der Zugehörigkeit von Unternehmen zu Konzernen, möglich. Beispielsweise muss die Frage »Wo wurde Dylan geboren?« zunächst der Absicht zugeordnet werden, den Geburtsort zu finden, sowie der wahrscheinlichsten Person: Bob Dylan, bevor die richtige Antwort »In Duluth, Minnesota« gegeben werden kann.
Dieselbe Bedeutung kommt diesem Element bei Chatbots zu. Hier müssen die Absicht der Fragen, ihre verschiedenen Elemente und ihre Beziehung zueinander verstanden werden. Geht es über eine einfache Frage-Antwort-Konstruktion hinaus, müssen Chatbots den Kontext verstehen und für den weiteren Dialog erinnern können. Grundsätzlich ist es durch Language Understanding [Lu] möglich, große Textmengen so aufzubereiten, dass Wissensfragen beantwortet oder Entscheidungen automatisiert getroffen werden können. Relevant ist dies etwa für Analysten. Investoren oder Analysten profitieren von Language Understanding [Lu], wenn sie Unternehmen bewerten müssen und dafür Dokumente und öffentliche Quellen weitgehend automatisiert auswerten können. Eine weitere Anwendung ist der Datenjournalismus: Language Understanding [Lu] kann die Tiefenanalyse von Whistleblower-Dokumenten, z. B. den Panama Papers, beschleunigen und erlaubt es, bisher unerkannte Zusammenhänge aufzudecken.
Sprachgesteuerte Assistenten wie Siri, Alexa oder Cortana werden bereits nach kurzer Zeit von Millionen Menschen genutzt. Alle diese Assistenten benötigen Language Understanding [Lu]. Ähnlich rasant ist das Aufkommen von Chatbots, die Unternehmen unterstützen, ihre Kundenkommunikation zu optimieren. Auch die Verbesserung der Qualität und die Personalisierung von Suchmaschinen wie Google und Bing ist auf das immer besser werdende Sprachverstehen zurückzuführen.
Language Understanding [Lu] spielt häufig mit Text Extraction [Te] zusammen: Ohne das Wissen um die Bedeutung von Entitäten und Konzepten, die in Texten und Fragen vorkommen, ist die Erkennung der Beziehungen oder der Absicht einer Frage kaum möglich. Language Understanding [Lu] ist häufig Speech Recognition [Sr] nachgelagert, um Sprache in eine maschinenlesbare Repräsentation ihrer Bedeutung zu überführen.
Amazon, Google, IBM und Microsoft bieten Lösungen für die automatische Zuordnung von Fragen auf Absichten an, IBM auch Lösungen für die Erkennung von Beziehungen zwischen Entitäten und Konzepten in Texten. Spezialanbieter wie paragon semvox bieten vollständige Dialogsteuerungen an, Ambiverse und TextRazor die Erkennung von Beziehungen zwischen Entitäten und Konzepten.
Marketsandmarkets schätzt die Größe des Markts für Text Analytics für das Jahr 2022 auf 8,8 Milliarden US-Dollar.
Die Absicht einer Frage automatisch zu erkennen und Beziehungen wie ›ist Vorstand von‹ oder ›wurde gegründet am‹ klar zu definieren, ist heute schon mit hoher Präzision möglich. Hierfür kommen maschinelles Lernen und Trainingsdaten zum Einsatz. Um die Leistungsfähigkeit von Language Understanding [Lu] zu steigern, insbesondere für die korrekte Zuordnung der Beziehungen zwischen Entitäten und Konzepten zu ihren Bedeutungen, ist jedoch weitere Grundlagenforschung nötig. Entsprechende Techniken sind zwar bereits in Demonstratoren einsetzbar, aber noch weit von vollständigem Sprachverstehen entfernt. Auch recht einfache Wissensfragen wie »Welches ist das bekannteste Lied von Bob Dylan« oder »Welches ist der größte Hersteller von Luxusautos?« können noch nicht beantwortet werden.
Language Understanding [Lu] hat große Bedeutung und lange Tradition in der Informatikforschung. Turing hat seinen berühmten Intelligenztest (Turing-Test) für Maschinen im Sprachverstehen verankert. Auch nach einem halben Jahrhundert akademischer Forschung ist dieses Problem nicht gelöst. Fortschritte werden regelmäßig auf Konferenzen wie der ACL, EMNLP, WWW oder ISWC, oder in Fachzeitschriften wie Artificial Intelligence veröffentlicht. Besonders Amazon, Google und Microsoft forschen auf diesem Gebiet. Zu den bedeutendsten Forschungseinrichtungen in diesem Bereich gehören in Deutschland das Language Technology Lab des DFKI, das MPI-INF und das Fraunhofer IAIS.