'Video Task' oder 'Daily Soap Szenario'
Ein neues Verfahren zur kontrollierten Elizitation von Spontansprache
Einleitung
In den letzten Jahren wurde viel Arbeit
in die Erhebung und Annotation spontansprachlicher Korpora investiert.
Beispiele hierfür sind BAS (Tillmann et al, 1995; URL(1), The
Kiel Corpus (Kohler et al. 1997; URL(2), The HCRC Map Task Corpus
(Anderson
et al. 1991, URL(3), Swichboard (Godfrey et. al. 1992, URL(4). Diese
Korpora bieten die Möglichkeit, phonetische Hypothesen verschiedenster
Art zu erarbeiten und durch systematische Datenbankabfragen
zu überprüfen. Die Untersuchung spontansprachlicher Daten ist
auch in angrenzenden Forschungsbereichen von Interesse, die sich mit linguistischen,
psychologischen, soziologischen und technischen Aspekten der lautlichen
Kommunikation auseinandersetzen (z.B. Diskursanalyse, Gender
Studies, Sprachtechnologie).
Spontansprache ist als Sammelbegriff
für Sprache zu verstehen, die nicht einer orthographischen Vorlage
entstammt ('unscripted vs. scripted speech'). Spontanes Sprechen tritt
im Monolog, im Dialog oder im Gespräch in Gruppen auf, wobei der situative
Kontext verschiedene Stilebenen bedingt. Die meisten Daten, die bisher
auf dem Gebiet von 'unscripted speech' erhoben und ausgewertet wurden,
sind im Rahmen von 'Map Task' (Brown et al. 1983; Swerts & Collier
1992) oder im Terminabspracheszenario
(Pätzold &Simpson 1994) entstanden. Bei 'Map Task' beschreibt
ein Sprecher dem Dialogpartner eine Route , die auf einer stilisierten
Landkarte eingezeichnet ist. Der Dialogpartner soll die beschriebene Route
dann auf einer anderen Karte einzeichnen. Im Terminabspracheszenario geht
es darum, anhand fikiver Terminakalender eine Reihe von Terminen zu verabreden.
Beide Szenarien haben den Vorteil, daß das Auftreten bestimmter Wörter
relativ gut gesteuert werden kann. Im Terminabspracheszenario treten Wochentage,
Monatsnamen und Zahlen auf, in 'Map Task' die Ortsnamen, die auf den Landkarten
verzeichnet sind. Die Gesamtanzanzahl der lexikalischen Items, die elizitiert
werden, ist allerdings vergleichsweise gering. Das Auftreten einiger lexikalischer
Einheiten (z.B. einiger Personalpronomina) ist nahezu ausgeschlossen. Weiterhin
erzeugen die Szenarien in der Regel nur wenig emotionale Beteiligung bei
den Versuchspersonen und führen z.T. zu einer gekünstelten oder
gelangweilten Sprechweise. Das soll nicht bedeuten, daß diese Arten
der Elizitation von Spontansprache unbrauchbar wären, nur müssen
die Charakteristika der elizitierten Sprache, die aus dem Versuchsaufbau
resultieren, Eingang in die Bewertung der Ergebnisse finden und dürfen
nicht generalisiert werden. Weiterhin ist es wichtig, neue Möglichkeiten
zur kontrollierten Erhebung von Spontansprache zu entwickeln. In diesem
Zusammenhang soll hier ein neues Szenario vorgestellt werden, das Sprachdaten
liefert, die sich in einigen Punkten erheblich von bisher erhobenen Daten
unterscheiden.
Bedingungen der kontrollierten Elizitation
von Spontansprache
Die kontrollierte Erhebung spontansprachlicher
Daten unter Laborbedingungen ist unter folgenden Gesichtspunkten durchzuführen:
-
Wie veranlasse ich die Versuchspersonen
frei und ungezwungen zu sprechen?
-
Welche Stilebene (von förmlich
bis intim) wird das verwendete Szenario hervorrufen?
-
Welche Rollenverteilung wird durch das
Szenario bedingt?
-
In welcher emotionalen Situation befinden
sich die Versuchspersonen?
-
Welche lexikalischen Items sind zu erwarten?
-
Welche prosodische Gestaltung ist zu
erwarten?
-
Wie lang sollen die Dialoge sein?
-
Wie kann eine angemessene Qualität
der Aufnahme erzielt werden?
-
Für welche nachfolgenden Untersuchungen
können die erhobenen Daten verwendet werden?
Jedes Szenario wird in Bezug auf die
oben genannten Punkte spezielle Schwepunkte setzen und in der Lage sein,
einige der Parameter gut zu kontrollieren. Eine umfassende Kontrolle aller
Parameter ist durch kein denkbares Szenario zu gewährleisten. Bei
der Erhebung von Spontansprache wird es immer einen Kompromiß zwischen
dem Wunsch nach umfangreicher Kontrolle, wie man sie aus gelesener Laborsprache
kennt, und der Natürlichkeit von unbeobachteter Spontansprache geben
(Simpson 1998).
'Video Task'
Die Grundidee von 'Video Task' ist,
zwei Versuchspersonen ähnliches, aber nicht identisches Videomaterial
zu präsentieren und sie im Anschluß an die Präsentation
die Unterschiede und Gemeinsamkeiten des Gesehenen in einem Gespräch
erörtern zu lassen. Hierbei ist es möglich, verschiedenste Filmmaterialien
so aufzuarbeiten, dass sie für das Szenario verwendet werden können.
In den bisher durchgeführten
Datenerhebungen dienten als Ausgangsmaterial zwei manipulierte Versionen der bekannten deutschen TV-Serie "Die Lindenstraße" (URL(5)), die aus einer Reihe bereits ausgestrahlter Folgen zusammengeschnitten wurden. Das Szenario wird deshalb als 'Daily Soap Szenario` bezeichnet. Die Videosequenzen sind etwa 15 Minuten lang und weichen in folgenden Punkten
teilweise voneinander ab:
-
Auswahl und Abfolge der Szenen
-
Vollständigkeit von Szenen
-
Auftreten von Bild- und Tonstörungen
Im Vorfeld der Datenerhebung werden
Versuchspersonen gesucht, die mit der Handlung und den Charakteren der
Lindenstraße zumindest einigermaßen vertraut sind. Es wird
darauf geachtet, daß die Dialogpartner miteinander befreundet
sind. Vor der Durchführung der Aufnahme wird den Dialogpartnern
in verschiedenen Räumen je eine der beiden Fassungen zweimal hintereinander
gezeigt. Danach werden sie über Headsets miteinander verbunden und
bekommen die Aufgabe sich über die Unterschiede zwischen den "Folgen"
der Serie zu unterhalten. Es besteht kein Sichtkontakt. Auf die Benutzung
von schriftlichen Notizen soll verzichtet werden.
Die Vorteile, die dieses Szenario
in Bezug auf die oben genannten Bedingungen bietet, sind folgende:
Die Aufgabe,
die gestellt wird, ist
interessant. Das erleichtert es den Versuchspersonen, sich vollständig
auf die inhaltliche Fragestellung zu konzentrieren und dadurch weniger
an die Laborsituation zu denken. Der Verzicht auf schriftliche Notizen
entspricht eher einer Alltagssituation als eine Situation, in der alles
schriftlich festgehalten werden muß. Auch dies steigert die Natürlichkeit
der Kommunikation. In Interviews, die im Anschluß an die Dialoge
mit den Versuchspersonen geführt wurden, hat sich gezeigt, daß
diese in der Regel davon ausgingen, daß es bei dem Experiment tatsächlich
um eine inhaltliche Fragestellung bezüglich der Lindenstraße
geht. Dass das eigentliche Ziel des Experiments die Aufzeichnung von Sprachsignalen
ist, wurde praktisch nie bemerkt.
Die Vertrautheit der Dialogpartner
mit den Charakteren der Serie sorgt für eine persönliche Atmosphäre
des Gesprächs. Sich über die Personen aus einer lange verfolgten
und relativ realitätsnahen Fernsehserie zu unterhalten, kommt einem
Gespräch über reale Freunde oder Bekannte ziemlich nahe, und
gerade dieser Gesprächstyp ist in der alltäglichen Kommunikation
sehr verbreitet. Dieser Aspekt wird dadurch verstärt, daß die
Dialogpartner miteinander befreundet sind. Hinzu kommt, daß
die Aufgabe den Versuchspersonen sehr viel Freiraum in der Gestaltung des
Dialogs läßt. Die bisher erhobenen Dialoge sind entspannt, freundschaftlich,
humorvoll und stilistisch ungezwungen.
Die Aufgabenstellung von 'Video
Task' beinhaltet keine eindeutige Rollenverteilung. Die Aufgabe erfordert,
daß beide Dialogpartner sowohl Fragen stellen, als auch selber über
das Gesehene berichten. In den bisher mit 'Daily Soap' aufgenommenen Dialogen
sind die Gesprächsanteile beider Sprecher etwa gleich.
Durch die Auswahl bestimmter Szenen
kann das Auftreten emotional gefärbter Sprache hervorgerufen werden.
In bisher durchgeführten Erhebungen waren die Versuchspersonen meist
entspannt, interessiert und humorvoll. Es ist möglich, den Dialogpartnern
ein zeitliches Limit für die Lösung der Aufgabe zu setzen, um
deren sprachliches Verhalten unter Zeitdruck zu beobachten. Auch kann bei
der Auswahl der Dialogpartner der Grad der Vertrautheit zwischen den Versuchspersonen
variiert werden.
Das Szenario gewähleistet das
Auftreten etlicher lexikalischer Einheiten, die in 'Map Task' oder Terminabsprachen
nicht vorkommen. Bedingt durch das freie Sprechen und die offene Aufgabenstellung
verwenden die Versuchspersonen sehr viele unterschiedliche Wörter.
Eine gewisse Kontrolle über das Auftreten lexikalischer Items ist
dadurch gegeben, daß bestimmte Wörter und Namen, die im Filmmaterial
vorkommen, von den Versuchspersonen aufgegriffen werden.
Die humorvolle Einstellung der meisten
Lindenstraßen-Fans zur Serie und die komplexe Aufgabenstellung führt zu einer lebendigen
und vielseitigen prosodischen Gestaltung. Dass die Aufgabe nur in einem
wechselseitigen Abgleich zwischen den gesehenen Filmsequenzen zu lösen ist,
führt zu häufigen Sprecherwechseln und zum Einsatz verschiedenster
Mechanismen der Gesprächssteuerung.
Die Sprachdaten aus dem 'Daily Soap
Szenario' sind nicht auf eine bestimmte nachfolgende Untersuchung zugeschnitten.
Das Ziel der Datenerhebung war ein möglichst alltäglicher, lockerer
Dialog zwischen befreundeten Personen. Insofern können die Daten zur
Basis verschiedenster Untersuchungen gemacht werden, die sich auf diesen
Typ von Spontansprache beziehen. Die Kanaltrennung erlaubt hierbei das
getrennte Abhören der Kanäle und den Einsatz instrumenteller
akustischer Analysen auch in überlappenden Signalbereichen.
Zusammenfassend können die Sprachdaten
aus dem 'Daily Soap Szenario' als phonetisch reiche Daten charakterisiert
werden. Das Szenario fördert sprachliche Kreativität und bindet
das Interesse der Versuchspersonen. Dies führt zu komplexen Gesprächssteuerungsmechanismen
zwischen den Dialogpartnern, einem großen Lexikon und einer vielseitigen
prosodischen Gestaltung. Unter diesen Gesichtspunkten ist es sinnvoll, mit
dem beschriebenen Szenario neue Sprachdaten zu erheben und diese auf Abweichungen
und Gemeinsamkeiten mit bereits vorhandenen Daten zu untersuchen.
Audiobeispiele aus dem 'Daily Soap Szenario'
Über die fogenden Textlinks können
einige Audiobeispiele aus der 'Video Task' Datenerhebung abgespielt oder
heruntergeladen werden. Die Singaldateien liegen im WAV-Format vor.
 |
Hörbeispiel 1:
Zwei Schülerinnen der Oberstufe Abspielen |
 |
Hörbeispiel 2: Werbedesignerin
und Studentin
Abspielen |
 |
Hörbeispiel 3: Koch und
Schiffsbauer
Abspielen |
Literatur und Internetadressen
Anderson, A. H., Bader, M., Bard, E.
G., Boyle, E., Doherty, G.M., Garrod, S., Isard, S. D., Kowtko, J. C., McAllister, J., Miller, J., Sotillo,
C. F., Thompson, H. S. & Weinert, R. (1991): The HCRC Map Task
Corpus. In: Language and Speech 34, pp.
351-366
Brown, G., Anderson, A., Yule, G.
& Shillcock, R. (1983): Teaching Talk, Cambridge University Press
Godfrey, J. J., Holliman, E. C. &
McDaniel, J. (1992): SWITCHBOARD: Telephone speech corpus
for research and development. In: Proceedings IEEE Conference
on Acoustics, Speech and Signal Processing, Volume 1, San Francisco, pp.
517-520
Kohler, K. J., Pätzold, M. &
Simpson, A. P. (1997): From the acoustic data collection to a labelled
speech data bank of spoken Standard German. In: Arbeitsberichte des Instituts
für Phonetik und digitale Sprachverarbeitung Nr. 32 (AIPUK), Kiel,
pp. 1-30
Pätzold, M. & Simpson. A.,
(1994) Das Kieler Szenario zur Terminabsprache. Verbmobil Memo Nr. 53
Simpson, A. P. (1998): Phonetische
Datenbanken des Deutschen in der empirischen Sprachforschung und der phonologischen
Theoriebildung. =Arbeitsberichte des Instituts für Phonetik und
digitale Sprachverarbeitung Nr. 33 (AIPUK), Kiel
Swerts, M. & Collier, R. (1992):
On the controlled elicitation of spontaneous speech. In: Speech
Communication 11, pp.
463-468
Tillmann, H. G., Draxler, C., Kotten,
K. & Schiel, F. (1995): The phonetic goals of the new Bavarian
Archive for Speech Signals. In: Proc. XIIIth ICPhS, Volume 4,
Stockholm, pp. 550-553
URL(1): http://www.phonetik.uni-muenchen.de/Bas/BasHomeeng.html
URL(2): http://www.ipds.uni-kiel.de/forschung/kielcorpus.de.html
URL(3): http://www.hcrc.ed.ac.uk/dialogue/maptask.html
URL(4): http://www.ldc.upenn.edu/Catalog/LDC93S7.html
URL(5): http://www.lindenstrasse.de
© Benno Peters, IPdS Kiel, 2001