Navigation auf uzh.ch
Das Institut für Computerlinguistik erforscht die Nutzung domänenspezifischer Korpora für die Statistische Maschinelle Übersetzung (SMT). Anstoss dafür sind Erfahrungen mit Industriepartnern, welche Übersetzungssysteme für spezifische Anwendungsszenarios wünschen, aber nur wenig eigenes Trainingsmaterial zur Verfügung haben. Wir verfügen über ein kleines paralleles Korpus (5 Millionen Tokens) von alpinen Texten: Die Publikationsreihen des Schweizer Alpen-Clubs (SAC) wurden im Projekt Text+Berg digital erfasst, Teile davon sind mehrsprachig (DE-FR). Im Projekt wurde die Kombination des Text+Berg Korpus mit verschiedenen anderen Übersetzungsressourcen untersucht, zum Beispiel zusätzliche monolinguale, parallele oder vergleichbare Korpora, oder andere Übersetzungssysteme.
Projektleiter:
Forschende:
Das Projekt wurde vom Schweizerischen Nationalfonds finanziert und lief 2010-2013.