NACH OBEN

Digitale Analyse großer Textkorpora


Hate-Speech-Erkennung in Telegram-Chatrooms? Metaphernanalyse in Superheldenfilmen? Automatisierte Transkription und Annotation historischer Texte? Die Lieblings-Emojis der Top-Influencer:innen auf Instagram? Wenn du Interesse an solchen Themen hast, dann ist dieses Seminar genau richtig für dich! Hier lernst du ohne Druck und ohne Vorkenntnisse die Programmiersprache Python kennen und erhältst Einblicke in Forschungsgebiete der Digital Humanities.

Die digitale Analyse großer Textkorpora zählt zu den wichtigsten Methoden der Digital Humanities. Die Korpusanalyse ermöglicht die Untersuchung von unterschiedlichsten Texten und Textsammlungen vor dem Hintergrund verschiedener disziplinärer Ausrichtungen – linguistisch, literaturwissenschaftlich, kulturwissenschaftlich – und bietet darüber hinaus zahlreiche Transfer- und Anwendungsoptionen: forensische Verwendung, soziologische Analyse, Politik- und Sprachberatung u.v.m.


Das Modul besteht aus drei Teilen:

  • 2-wöchiges Blockseminar Python zum Erwerb grundlegender Programmierkenntnisse (16.-20.09.2024 und 23.-27.09.2024, jeweils 10-16 Uhr)
  • Inputsitzungen mit Hands-on-Übungsphasen (WiSe 2024/25, 14-tägig freitags 10:15-13:15 Uhr, Beginn 25.10.2024)
  • Forschungs- oder Praxisprojektphase (SoSe 2025), in der du unter Anleitung eigenständig arbeitest. (Optional)

Das Modul kann kreditiert werden:

  • NEU: Die ersten beiden Teile (Programmierkurs und Inputsitzungen) können im Optionalbereich als 5-CP-Modul kreditiert werden
  • In allen Fächern der Philologie (außer VAMoS) und in der Sozialwissenschaft im Master (8-10 CP)

Für Anrechnungsmöglichkeiten wendet euch bitte an stephanie.heimgartner@rub.de und/oder eure Studienfachberatung, bei inhaltlichen Fragen an oliver.deck@rub.de.

Anmeldung ab sofort über eCampus, Veranstaltungsnr. 050010

Du lernst in diesem Modul:

  • die für das eigene Fach relevanten Methoden und digitalen Tools im Umgang mit großen Korpora und du erhältst Einblick in die Fragestellungen und Verfahrensweisen benachbarter Fächer.
  • Du lernst von Grund auf (keine Vorkenntnisse nötig!) Anwendungskenntnisse in der Programmiersprache Python mit Fokus auf korpusanalytische Verfahren und du wirst vertraut mit der Nutzung von relevanten Python-Bibliotheken (Spacy, NLTK, Pandas, etc.).
  • Du lernst verschiedene Datenerhebungs-, -aufbereitungs- und -analyseverfahren kennen: z.B. Webscraping, Tokenisierung, Annotation, Kookkurrenz-, Frequenzanalyse.
  • Du lernst Bearbeitungsmöglichkeiten für komplexe Korpora kennen (z.B. Transkription oraler oder sprachlich heterogener Korpora, multimodale Korpora, Übersetzung).

Das Modul ist geeignet für:

  • Studierende im M.A. und im fortgeschrittenen B.A. (inklusive Projektteil)
  • Studierende im B.A. über den Optionalbereich

Zeitrahmen und Inhalte:

Wintersemester 2024/25

  • 16.–20.09.2024 und 23.–27.09.2024 jeweils 10:00–16:00 Uhr Block-Workshop Python (Programmiersprache)

Ab dem 25.10.2024 freitags (14-tägig), 10.15-13.15 Uhr

  • 25.10.2024, 10:15–13:15 Uhr
  • 08.11.2024, 10:15–13:15 Uhr
  • 22.11.2024, 10:15–13:15 Uhr
  • 06.12.2024, 10:15–13:15 Uhr
  • 20.12.2024, 10:15–13:15 Uhr
  • 17.01.2025, 10:15–13:15 Uhr
  • 31.01.2025, 10:15–13:15 Uhr

Blocktermine mit Input von Forschenden der Fakultäten und Hands-on-Phasen mit Programmieraufgaben

  • ab Februar: Entwicklung eigener Forschungs- oder Praxisprojekte

Sommersemester 2025 (nicht für Studierende aus dem Optionalbereich)

  • Arbeit an den Forschungs- oder Praxisvorhaben
  • Regelmäßige Feedbackgespräche mit betreuenden Lehrenden
  • Juli 2025: Präsentation der Abschlussergebnisse der Projekte