Intern
Graduiertenschule für die Geisteswissenschaften

Calvo Tello, José

Dissertationsthema:
"Computational Analysis of Spanish Prose Genres between 1880 and 1939." 

Wir gratulieren herzlich zum bestandenen Kolloquium
am 17.9.2020.

Kontaktadresse an der Universität Würzburg:
Institut für Deutsche Philologie
Lehrstuhl für Computerphilologie
Am Hubland - 97074 Würzburg 

E-Mail an Herrn Tello

Erstbetreuer: Prof. Dr. Christof Schöch (Univ. Trier)

Zweitbetreuer: 

Prof. Dr. Fotis Jannidis

Prof. Dr. Angela Schrott (Univ. Kassel)

Klasse in der Graduiertenschule:  „Philosophie, Sprachen, Künste“

Promotion in der Graduiertenschule ab SS 2016.

Abstract:
Zwischen dem Ende des 19. Jahrhunderts und dem Ende des spanischen Bürgerkriegs 1939 bildete sich das sogennante silberne Zeitalter (Edad de Plata) in der Kunst Spaniens heraus. In der Literatur dieser Epoche wird ein ästhetischer Generationenwechsel vollzogen: Auf viele Darstellungsmittel des realistischen und naturalistischen Romans wird verzichtet und neue Ausdrucksformen werden entdeckt. Betreffende Werke werden von der Literaturgeschichte sehr umstritten klassifiziert und beschrieben.

Gegenstand dieser Studie sind die von der Literaturgeschichte als literarische Prosatexte bezeichneten Werke, die in Spanien von spanischen Autoren geschrieben wurden und die zwischen 1880 und 1939 veröffentlicht wurden. Insgesamt wird die Textsamlung ca. 200 Werke beinhalten.

Das Ziel der Studie ist es daher, mit computergestützten Verfahren folgende Fragen zu beantworten: Wie haben sich die Untergattungen des spanischen Romans und kürzere Erzählprosa zwischen 1880 und 1939 entwickelt? Welche stilistischen Merkmale und welche linguistischen Ebenen (Morphologie, Syntax, Lexik, Semantik oder Text) erweisen sich nützlich für die Untersuchung der literarischen Prosagattungen dieser Epoche?

Das Thema kann von zwei unterschiedlichen Perspektiven betrachtet werden. Zum einen, indem man von Hypothesen der Literaturgeschichte (bspw. Gattungsbegriffe) ausgeht und versucht zu überprüfen, ob sie quantitativ nachgewiesen oder aber widerlegt werden können. Es ergeben sich folglich weitere Fragen:

  • Die Literaturgeschichte hat zahlreiche unpräzise Begriffe für Untergattungen der Prosa dieser Epoche entwickelt (auto ficción, novela lírica, novela dialogada, novela de tesis, novela poema gelten als Beispiele). Selbst die Autoren erfanden Begriffe, um einige ihrer Werke zu benennen, wie die nivolas von Unamuno, novela impresionista von Azorín, greguerías von Serna, oder novela de aventuras von Baroja. Verfügen Texte, die unter einer gemeinsamen Gattungsbezeichnung veröffentlicht oder mit einer solchen gemeinsamen Bezeichnung benannt wurden, über kohärente stilistische Merkmale (unabhängig vom Autorenstil), und wenn ja, welche sind dies?

Zunächst ohne Rückgriff auf literaturwissenschaftliche Theorien, von dem stilistischen Merkmalen ausgehen, und unüberwachte computergestützte Verfahren anwenden, die in den letzten Jahren entwickelt wurden:

  • Welche stilische Merkmale führen zu welchen Gruppen von Texten, und wie korrelieren diese mit den Metadaten bezüglich des Autors (Epoche, ästhetische Gruppe), der Texte (Setting oder Epoche, in der die Handlung stattfindet) oder der Protagonisten (Gender, soziale Schicht)?
  • Welche von diesen Gruppen wurden schon von traditionellen Begriffen von Gattung der Literaturgeschichte abgedeckt? Welche könnten innovative Vorschläge von Gattungen dieser Epoche gelten?

Nach der Zusammenstellung des Korpuses, werden die Texte linguistisch durch Natural Language Processing Werkzeuge automatisch annotiert, um mit bestimmten morphologischen, syntaktischen, lexikalischen und semantischen Informationen arbeiten zu können. Für die erste oben genannte Perspektive werden Supervised Machine Learning Methoden und konstrastive Analyse eingesetzt. Für die zweite Perspektive werden unüberwachte Methoden wie Distanzmaße oder Principal Component Analysis angewendet.