Navigation auf uzh.ch

Suche

Institut für Computerlinguistik Texttechnologie

NCCR Democracy: How media report on political institutions beyond the state – a computer-based content analysis

Forschungsziele

Wir analysieren Zeitungstexte und Online-Medien mit automatisierten Zugängen. Bis vor kurzem wurde das Gros der Annotierungsleistung (Codierung) in sozialwissenschaftlichen Untersuchungen, z.B. die Klassifizierung von Text in Kategorien, manuell vorgenommen. Wir entwickeln computergestütze Methoden, die computerlinguistische Zugänge verwenden, von der Medienauswahl bis zur Inhaltsanalyse. Unsere Projekte (1) verwenden klassische Zugänge zur Erkennung von beteiligten Akteuren (Named Entity Recognition) (2) portieren Forschungsergebnisse aus dem Textmining für die Biomedizin zu einer neuen Domäne, (3) entwickeln genuin neue Antworten zu computerlinguistischen Herausforderungen, wie z.B. die Integration von Polaritätserkennung ins Relation Mining, und automatisierte Zugänge zum Framing-Ansatz.

Basierend auf Verzeichnissen von Organisationen und anderen beteiligten Entitäten die durch die Kooperationsprojekt definiert wurden, umfasst unsere Forschung die folgenden Aufgaben:

1.   Artikelauswahl: Wir sammeln unsere Texte in grossen Mediendatenbanken und bereiten die Texte auf.

2.   Nennung und Salienz: Eigennamenerkennung und statisitische Analysen von Vorkommenshäufigkeiten liefern Schlüsselwörter und Salienz. Diese Aufgaben sind computerlinguistische Klassiker.

3.   Tonalität, sentiment detection und opinion mining: Aufgrund unserer extensiven Erfahrung in der Sentimentanalyse ergänzen wir Zugänge auf Dokumenten- und Satzebene mit der Ebene einzelner Relationen. Dies erlaubt uns, herauszufinden wer eine positive oder negative Einstellung in Bezug auf die die involvierten Akteure hat (z.B. Regierungsorganisation, je nach Projekt) Dazu setzen wir Relation Mining Methoden ein, wozu wir uns auf unsere langjährige Erfahrung im biomedizinischen Text Mining stützen. Dort kombinieren wir syntaktsiche Zugänge und solche des maschinellen Lernens. Syntaktische Zugänge eignen sich besonders zur Erkenung der Polarität von Relationen.

4.   Framing: In der Politologie und in den Medienwissenschaften wird der Framing-Ansatz vielfach zur Analyse des politischen Diskurses und bestimmter Themengebiete verwendet. Dabei werden aber meist nur manuelle Untersuchungen durchgeführt; teil(automatisierte), datengetriebene Ansätze sind noch wenig erforscht. Der Framing-Ansatz, bzw. die Analyse von Frames stellen eine neue Herausforderung für die Computerlinguistik dar.

Details

Weitere Detaile zum nccr democracy finden sie auf der Projekt-Hauptwebseite und speziell auf unserer Sub-Projektwebseite.

Beteiligte

NCCR Democracy am Institut für Computerlinguistik der UZH

Michael Amsler (Doktorand)

Gerold Schneider (Ko-Projektleitung)

Ko-Projektleitung

Bruno Wüest (Institut für Politikwissenschaft, Universität Zürich)

Das Projekt ist finanziert durch den Schweizerischen Nationalfonds (SNF) im Zeitrahmen von 2013-2017.