Antwortextraktion. Wir versuchen, auf intelligente Art auf den Inhalt von Texten zuzugreifen, indem wir in Texten (exakte) Antworten auf sprachlich formulierte Fragen zu finden versuchen. Weiter
Kontrollierte Sprache. Wir erforschen, wie die Ambiguität natürlicher Sprache durch Einschränkung von Lexikon, Syntax und Semantik kontrolliert werden kann. Weiter
Koreferenzauflösung. Koreferenz bezeichnet das Phänomen, dass eine Entität durch unterschiedlichen Formen an der Textoberfläche referiert werden kann ("Obama" - "Der Präsident" - "er"). Wir erforschen automatische Verfahren, um diese Referenzen zu erkennen. Weiter
Linguistisch unterstütztes Redigieren – LingURed. Wir untersuchen, wie typische Fehler beim Schreiben und Redigieren von Texten (z.B. falsche Wortstellung, Sätze ohne Verb) vermieden werden können. Wir entwickeln Funktionen für Textverarbeitungsprogramme, die auf sprachlichen Einheiten und sprachlichem Wissen beruhen. Weiter
Maschinelle Stilprüfung. Wir betreiben Forschung im Bereich der maschinellen Stilprüfung. Unser Fokus liegt dabei speziell auf der domänenspezifischen Stilanalyse schweizerischer Gesetzestexte. Weiter
NLP für Quechua. Wir erstellen sprachtechnologische Ressourcen für Cuzco-Quechua, eine indigene Sprache mit ca. 1.5 Millionen Sprechern v.a. in Peru. Die Ressourcen reichen von Morphologie-Analyse-Werkzeugen über Rechtschreibeprüfer und maschinelle Übersetzung bis hin zu parallelen annotierten Korpora (Baumbanken). Weiter
Satzergänzungstests. Satzergänzungstests (SET) ähneln Multiple Choice Tests, sie erlauben dem Benutzer jedoch, sprachlich sehr komplexe Antworten zu formulieren, auf welche passende Kommentare generiert werden können.
Syntaxanalyse und Grammatikkonstruktion. Wir versuchen, auch grosse Textmengen automatisch syntaktisch zu analysieren und erstellen zu diesem Zweck hybride (teils regelbasierte, teils statistikbasierte) Syntaxanalyseprogramme (Parser), und wir entwickeln dazu geeignete Grammatiken verschiedener westeuropäischer Sprachen. Weiter