Abgeschlossene Forschungsprojekte

Biomedizinisches Text Mining

SNF-Projekt MelanoBase (2016–2019) Weiter
NRP-Projekt SwissMADE (2017-2020) Weiter
CTI-Projekt MedMon (2018-2019) Weiter
Kollaboration mit Vetsuisse Veterinary Pathology Text Mining (2014–2016) Weiter
Cogito-Projekt PsyMine (2015–2017) Weiter
NIH-Projekt Assisted Curation (2015-2018) Weiter

Digital Humanities

impresso: Media Monitoring of the Past (2017–2021) Weiter
Extraktion von Zeitausdrücken in historischen Texten (2014–2019) Weiter
AGORA-Projekt Citizen Linguistics (2016–2018) Weiter
Visual Linguistics (2015–2018) Weiter
Text+Berg: Digitalisierung der Publikationsreihen des Schweizer Alpen-Clubs (SAC; 2008–2018) Weiter
SNIS-Projekt Diffusion of Law (2015–2017) Weiter
Digitalisierung und Auszeichnung der Zürcher Regierungsratsbeschlüsse (2011) Weiter

Maschinelle Übersetzung

SNIS-Projekt Diffusion of Law (2015–2017) Weiter
MODERN: Diskurs in der Statistischen Maschinellen Übersetzung (2013–2017) Weiter
Trainslate: Maschinelle Übersetzung in Gebärdensprache (2011–2016) Weiter
Hybride Maschinelle Übersetzung (2011–2015) Weiter
Maschinelle Übersetzung im praktischen Einsatz (2012–2013) Weiter
Domänenspezifische Maschinelle Übersetzung (2010–2013) Weiter

Medieninhaltsanalyse

Sub-Projekt im ERC-finanzierten Projekt POLCON: Automatische Extraktion von Protestereignissen (2014–2018) Weiter
NCCR democracy: Automatische Medieninhaltsanalyse für Deutsch, Französisch und Englisch (2013–2017) Weiter

Sentimentanalyse und Opinion Mining

Korpuslinguistik

SPARCLING: grosses paralleles Korpus zur Untersuchung linguistischer Variation (2013–2017)Weiter
SMULTRON: parallele treebanks Deutsch-Englisch-SchwedischWeiter

Weitere Forschungsgebiete

Antwortextraktion. Wir versuchen, auf intelligente Art auf den Inhalt von Texten zuzugreifen, indem wir in Texten (exakte) Antworten auf sprachlich formulierte Fragen zu finden versuchen. Weiter
Kontrollierte Sprache. Wir erforschen, wie die Ambiguität natürlicher Sprache durch Einschränkung von Lexikon, Syntax und Semantik kontrolliert werden kann. Weiter
Koreferenzauflösung. Koreferenz bezeichnet das Phänomen, dass eine Entität durch unterschiedlichen Formen an der Textoberfläche referiert werden kann ("Obama" - "Der Präsident" - "er"). Wir erforschen automatische Verfahren, um diese Referenzen zu erkennen. Weiter
Linguistisch unterstütztes Redigieren – LingURed. Wir untersuchen, wie typische Fehler beim Schreiben und Redigieren von Texten (z.B. falsche Wortstellung, Sätze ohne Verb) vermieden werden können. Wir entwickeln Funktionen für Textverarbeitungsprogramme, die auf sprachlichen Einheiten und sprachlichem Wissen beruhen. Weiter
Maschinelle Stilprüfung. Wir betreiben Forschung im Bereich der maschinellen Stilprüfung. Unser Fokus liegt dabei speziell auf der domänenspezifischen Stilanalyse schweizerischer Gesetzestexte. Weiter
NLP für Quechua. Wir erstellen sprachtechnologische Ressourcen für Cuzco-Quechua, eine indigene Sprache mit ca. 1.5 Millionen Sprechern v.a. in Peru. Die Ressourcen reichen von Morphologie-Analyse-Werkzeugen über Rechtschreibeprüfer und maschinelle Übersetzung bis hin zu parallelen annotierten Korpora (Baumbanken). Weiter
Satzergänzungstests. Satzergänzungstests (SET) ähneln Multiple Choice Tests, sie erlauben dem Benutzer jedoch, sprachlich sehr komplexe Antworten zu formulieren, auf welche passende Kommentare generiert werden können.
Syntaxanalyse und Grammatikkonstruktion. Wir versuchen, auch grosse Textmengen automatisch syntaktisch zu analysieren und erstellen zu diesem Zweck hybride (teils regelbasierte, teils statistikbasierte) Syntaxanalyseprogramme (Parser), und wir entwickeln dazu geeignete Grammatiken verschiedener westeuropäischer Sprachen. Weiter

Institut für Computerlinguistik Texttechnologie

Quicklinks und Sprachwechsel

Hauptnavigation

Abgeschlossene Forschungsprojekte

Biomedizinisches Text Mining

Digital Humanities

Maschinelle Übersetzung

Medieninhaltsanalyse

Sentimentanalyse und Opinion Mining

Korpuslinguistik

Weitere Forschungsgebiete