7.  Perspektiven der Bewertung sprachlicher Prüfungsleistungen

7.1 Einleitende Bemerkungen

In folgerichtiger Fortführung unserer bisherigen Reflexionen wird es nunmehr notwendig sein, die Bewertung sprachlicher Prüfungsleistungen perspektivisch aufzuzeigen und in praktikabler Art und Weise zu konkretisieren.

Die Bewertung sprachlicher Prüfungsleistungen ist in der Tat ein zentraler Aspekt prüfungsdidaktischer Forschung und Anwendung - und zwar sowohl in den modernen Philologien als auch in studienergänzenden Fremdsprachenprüfungen. Sie ist dabei in Parallelität zu den erbrachten Prüfungsleistungen selbst auf alle vier grundlegenden sprachlichen Fertigkeiten bezogen, also auf die Sprech- und die Schreibfertigkeit ebenso wie auf das Hör- und das Leseverstehen.

Auch im Rahmen dieser Ausführungen sind wir bestrebt, eine zugängliche und gut in die Praxis umzusetzende Darstellung zu geben, deren Ziel es ist, einen Beitrag dazu zu leisten, die Bewertungsqualität von Fremdsprachenprüfungen zu verbessern.

Zunächst wollen wir uns dem Lese- und Hörverstehen widmen.

  
7.2 Bewertung von Prüfungen zum Lese- und Hörverstehen

Zunächst ist es im gegebenen Zusammenhang notwendig, auf einige für die Bewertung genuiner Hörverstehensleistungen relevante Gesichtspunkte einzugehen, bevor wir uns mit solchen Aspekten befassen, die die Bewertung des Hörverstehens ebenso wie diejenige des Leseverstehens betreffen.


7.2.1     Lese- und Hörverstehensprüfungen[1]

7.2.1.1  Antwortmatrix

Hinsichtlich der Antwortmatrix (vgl. auch Kap. 6.4.2.2.1 und Tinnefeld 2002: 142f) sind im Wesentlichen zwei Konstellationen zu behandeln, die von grundlegendem Charakter sind:
  •   Es sind Ankreuzungen vorgenommen worden:
Hierbei geht es um die Frage, ob die gegebene Antwortmatrix in Gänze oder partiell ausgefüllt worden ist, also darum, ob dieser Aufgabentyp bearbeitet worden ist. Diese Konstellation wird hier lediglich der Vollständigkeit halber angesprochen, da nur durchgeführte Ankreuzungen auch zu einer inhaltlichen Bewertung führen können.

  • Es sind nicht auf dem Textverständnis aufgebaute, also gleichsam zufällig bzw. mechanisch Ankreuzungen vorgenommen worden:
   Bei einer Vornahme von Ankreuzungen in der Weise, dass sich dem Klausurkorrektor ein solcher Zusammenhang aufdrängt, kann mit erheblicher Wahrscheinlichkeit davon ausgegangen werden, dass der Ausgangstext nicht oder nicht adäquat verstanden worden ist. Ein solches Prüflingsverhalten wird beispielsweise dann deutlich, wenn einander kontradiktorische Attributionen zu ein und demselben Sachverhalt bzw. ein und derselben Person vorgenommen werden.

In einem solchen Falle kann es sich jedoch ebenso um ein Ankreuzen nach dem Zufallsprinzip handeln, das vollkommen unabhängig von der Rezeption des Ausgangstextes erfolgt: Der Prüfling flüchtet sich in eine mehr oder minder mechanistische Problemlösungsstrategie, die mit der Bewältigung der gestellten Aufgabe nichts mehr zu tun hat. Hat ein Klausurkorrektor einen begründeten Eindruck dieses Verhaltens, sollte er ein ernsthaftes Gespräch mit dem Prüfling führen und ihm die grundsätzliche Problematik seines Benehmens verdeutlichen. Zudem sollte er darüber nachdenken, die auf diese Weise zufällig korrekt angekreuzten Antworten nicht zu zählen, sondern den Prüfling vielmehr für die Gesamtprüfung zu disqualifizieren.


Kommen wir nun zu den True-False-Statements.


7.2.1.2 True-False-Statements

Im Rahmen der True-False-Statements (vgl. auch Kap. 6.4.2.2.2 und Tinnefeld 2002: 141f) kann die Ankreuzung der korrekten Lösung im gegebenen Zusammenhang vernachlässigt werden: Sie stellt die wünschenswerte Lösung dar und ist somit prüfungsdidaktisch unproblematisch.

Bei einer Aufgabenkonzeption, von der wir hier ausgehen und die bei diesem Typ methodisch vorzuziehen ist, bei der zusätzlich zu der Ankreuzung der beiden gegebenen Antwortalternativen vom Prüfling gegebenenfalls noch eine explizite inhaltliche Korrektur vorgenommen werden muss, geht im günstigsten Falle die korrekte Ankreuzung von false mit der Ergänzung der zutreffenden Korrektur einher. Eine solche Leistung ist entsprechend mit der vollen erzielbaren Punktzahl zu belohnen.

Prüfungsdidaktisch ungleich wichtiger sind diejenigen Situationen, in denen die gewünschte Lösung vom Prüfling nicht erreicht worden ist. Solche prüfungsdidaktisch problematischen Konstellationen ergeben sich beispielsweise in den folgenden Fällen.

  • Bei der Ankreuzung von false bezieht sich die vom Prüfling angeführte inhaltliche Korrektur der im Ausgangsstatement gegebenen Behauptung auf ein anderes als das vom Prüfer anvisierte Textdetail:
Eine solche  Konstellation kann auf das falsche Verständnis der Frage durch den Prüfling verweisen und ist dann entsprechend negativ - mit dem vollständigen Abzug der für dieses Item erzielbaren Punktzahl - zu sanktionieren.

Diese Konstellation kann jedoch ebenso auf dem Faktum basieren, dass in dem gegebenen Ausgangstext die gleiche oder eine ähnliche Information mehr als einmal figuriert. In diesem Falle ist die Beantwortung gegebenenfalls als korrekt zu akzeptieren und die volle Punktzahl zu vergeben.

Eine dritte Möglichkeit ergibt sich in der Hinsicht, dass der Klausurkonzeptor einen Fehler gemacht haben mag und die Ausgangsbehauptung nicht hinreichend eindeutig oder gar missverständlich formuliert hat. In diesem Fall liegt das Versehen bei ihm. Die Bewertung der Frage muss dann entweder in neutraler Form erfolgen - in dem Sinne, dass sie nicht gezählt wird und aus der Gesamtbewertung herausfällt -, oder die hierfür zu vergebenden Punkte sind dem Prüfling gutzuschreiben, da der Fehler nicht bei ihm liegt.

  • Vom Prüfling ist trotz seiner Ankreuzung von false keine Korrektur des Ausgangsstatements geliefert worden.
Schließt man die Möglichkeit aus, dass der Prüfling schlicht vergessen hat, eine inhaltliche Korrektur zu vermerken, so ergeben sich im Wesentlichen zwei Möglichkeiten:

    • Der Prüfling hat die Textstelle, die die für eine Korrektur der Ausgangsbehauptung relevante Information enthält, nicht verstanden oder
    • er hat bei der Beantwortung der Frage rein willkürlich die Alternative false angekreuzt, da er eine begründete Antwort nicht zu geben imstande war.

In beiden Fällen kann somit davon ausgegangen werden, dass die Aufgabe aufgrund von Verständnismängeln des Prüflings nicht beantwortet wurde, so dass diese Leistung durch einen vollständigen Abzug der erzielbaren Punkte zu sanktionieren ist.

Aus diesen Ausführungen wird implizit deutlich, dass die Bewertung von True-False-Statements prüfungsdidaktisch in aller Regel weitgehend unproblematisch ist.

  
7.2.1.3 Multiple-Choice-Aufgaben

Für Multiple-Choice-Aufgaben (vgl. auch Kap. 6.4.2.2.3 und Tinnefeld 2002: 140) ergeben sich im Wesentlichen die folgenden prüfungsdidaktisch relevanten Bewertungskonstellationen. Dabei wollen wir die erhoffte - also gleichsam unmarkierte - Situation der Beantwortung der korrekten Antwortalternative außer Acht lassen.

  • Es ist eine inkorrekte Antwortalternative angekreuzt worden. Diese hätte auf der Basis der Formulierung der Frage jedoch auch korrekt sein können:
In dieser Situation ergibt sich ein Problem für den Prüfer, nicht jedoch für den Prüfling. Dieses Problem liegt in der Konzeption und / oder der Formulierung der Frage. Hier ist die Fähigkeit des Prüfers zur Selbstkritik gefragt: Er sollte sich eingestehen können, dass seine Formulierung nicht adäquat und somit prüfungsdidaktisch nicht relevant ist. Aus dieser Schlussfolgerung kann dann nichts Anderes als die Neutralisierung der Frage in der Bewertung folgen. Eine negative Sanktionierung der vermeintlich unzureichenden Leistung des Prüflings darf hier keineswegs vorgenommen werden.

  • Mehrere Prüflinge haben eine vom Klausurkonzeptor nicht erwartete Antwortalternative angekreuzt. Unter diesen Prüflingen sind auch mehrere Studierende, die in der Regel gute Leistungen erbringen:
     Es ist nicht unbegründet, auch in einem solchen Falle einen Fehler des Prüfers in die Analyse dieser Konstellation zumindest mit einzubeziehen. Dabei ist mit großer Wahrscheinlichkeit davon auszugehen, dass die formulierte Frage und die ihr zugeordneten Distraktoren nicht hinreichend trennscharf sind. Auch ein solches Item ist dann nicht bewertungsrelevant: Es sollte aus der Gesamtbewertung herausgenommen und auf diese Weise neutralisiert werden.

Diese Reflexionen verweisen auf das Faktum, dass die Bewertung von Multiple-Choice-Aufgaben prüfungsdidaktisch tendenziell komplexer und gegebenenfalls problematischer sein kann als die Bewertung reiner True-False-Statements.


7.2.1.4 Detailfragen  

Im Rahmen der Bewertung des Aufgabentyps Detailfragen (vgl. auch Kap. 6.4.2.2.4  und Tinnefeld 2002: 138f) ergeben sich die folgenden Gesichtspunkte.

  • Der Prüfling benennt das erfragte Detail in expliziter Form:
  Ist diese Konstellation gegeben, so bedeutet dies, dass der Prüfling die entsprechende Frage des zugrunde liegenden Lese- oder Hörverstehenstextes in adäquater Weise mit diesem in Beziehung gesetzt und die dort aktualisierten Inhalte in den Text integriert hat. Hierin liegt die wünschenswerte Basisbehandlung dieses Aufgabentyps, die somit positiv zu bewerten ist: Die erzielbare Punktzahl ist vollständig zu vergeben.  

  • Das erfragte Textdetail wird vom Prüfling - zumindest ansatzweise -  in einen übergeordneten Zusammenhang gestellt:
     Wenn er diesen Schritt vornimmt, leistet der Prüfling mehr als von ihm in diesem Aufgabentyp erwartet wird. Er geht hier über die eigentliche Detailfrage hinaus und stellt in der Verarbeitung des Ausgangstextes intellektuelle Selbständigkeit unter Beweis. Dabei erkennt er intratextuelle Korrespondenzen. Dies geschieht dann in hierarchischer Sicht nicht von oben nach unten wie bei der Globalfrage, sondern von unten nach oben - eine Richtung, die im Sinne des Textverständnisses als nicht minder wertvoll anzusehen ist. Für eine solche Leistung sollte der Prüfling zusätzlich belohnt werden. Dies kann dadurch geschehen, dass für die reine Basisleistung, wie sie im vorhergehenden Punkt beschrieben worden ist, zwar die volle Punktzahl gegeben wird, da die Aufgabe ja gelöst worden ist, dass aber im Falle einer Zusatzleistung wie der hier dargelegten im Sinne eines Bonusses Zusatzpunkte im Umfang von etwa 10 % vergeben werden.

  • Es wird nicht das erfragte Detail beantwortet, sondern ein anderes Textdetail, das nicht in direktem, sondern lediglich in mittelbarem Bezug zu der gestellten Frage steht:
Unter der Bedingung, dass die Frage klar und unmissverständlich gestellt worden ist, erkennt der Prüflling in einem solchen Fall entweder die Beziehung zwischen Textdetail und Frage nicht oder er hat den zugrunde liegenden Lese- oder Hörverstehenstext - zumindest in Bezug auf das aktualisierte Detail - nicht verstanden. Die Frage hat somit als nicht beantwortet zu gelten und ist negativ zu sanktionieren; die für sie erzielbare Punktzahl ist abzuziehen.  

  • Es ist für den Prüfer nicht klar erkennbar, ob die gegebene Detailfrage aufgrund des Textverständnisses des Prüflings oder aufgrund seines Weltwissens beantwortet worden ist:
     Zunächst muss festgehalten werden, dass die hier beleuchtete Problematik nicht ohne Weiteres und in allen Fällen zweifelsfrei geklärt werden kann. Dennoch ist es vielfach auf indirekte Art und Weise möglich, eine Kausalattribuierung vorzunehmen. Ein in diesem Zusammenhang relativ eindeutiger Fall liegt dann vor, wenn ein Prüfling ein Beispiel anführt, das nicht mit den im Ausgangstext gegebenen Beispielen identisch bzw. diesen nicht zumindest ähnlich ist. Da von Prüflingen bei Textverständnisfragen - abgesehen von einer eventuellen Transferfrage pro Lese- oder Hörverstehensprüfung - im Allgemeinen nicht verlangt wird, über den vorgegebenen inhaltlichen Textrahmen hinauszugehen, ist bei einer solchen Art der Beantwortung davon auszugehen, dass der Prüfling sie mit Hilfe seines Weltwissens zu lösen versucht hat. Eine solche Strategie sollte nicht positiv bewertet werden. Auch wenn es im Einzelfall begrüßenswert sein mag zu erkennen, dass Prüflinge über eine ausgeprägte persönliche Bildung verfügen, geht es bei den hier beschriebenen Prüfungen nicht um die Testung von Allgemeinbildung, sondern um die rezeptive Fremdsprachenbeherrschung. Nur diese sollte daher auch in die Bewertung eingehen. Die für die gegebene Frage erzielbare Punktzahl sollte in einem Fall wie dem beschriebenen nicht vollständig abgezogen werden; sie ist jedoch um einen beträchtlichen Anteil - also mindestens um 50 % - zu mindern.

Im Folgenden wollen wir uns mit der Bewertung des logischen Gegenstücks von Detailfragen - den Globalfragen - beschäftigen.


7.2.1.5 Globalfragen

Für den Aufgabentyp Globalfragen (vgl. Kap 6.4.2.2.5 und Tinnefeld 2002: 136ff) ergeben sich im Wesentlichen die folgenden Konstellationen und Bewertungsgesichtspunkte.

  • Eine gestellte Globalfrage wird exakt und themenorientiert beantwortet, ohne dass inhaltlich vom Ausgangstext abgewichen wird:
  Eine Beantwortung wie die soeben dargestellte repräsentiert bei dem vorliegenden Aufgabentyp das erwünschte Verhalten und ist somit positiv zu sanktionieren.

Dies ist hingegen nicht der Fall, wenn deutlich wird, dass der Prüfling sich bei der Beantwortung der Frage nicht auf die eigentlichen, im Text gemachten Aussagen konzentriert hat. Dann kann dies - wie zuvor für den Aufgabentyp Detailfragen besprochen - darauf hindeuten, dass er für die Beantwortung der Frage sein Weltwissen zugrunde gelegt hat, was nicht wünschenswert ist. In einem solchen Falle muss eine negative Sanktionierung erfolgen: Die Frage ist dann nicht beantwortet; die gesamte erzielbare Punktzahl sollte abgezogen werden.

  • Die gestellten Globalfragen werden vom Prüfling nicht hinreichend allgemein beantwortet, sondern er konzentriert sich lediglich auf solche Details, die er verstanden zu haben glaubt, die jedoch nicht erfragt worden sind; er verfolgt somit eine Evasionsstrategie:
  Die Nichtbeantwortung einer gegebenen Globalfrage und die als Ersatz angebotene Beantwortung dieser anstelle einer nicht gestellten Detailfrage deutet in aller Regel darauf hin, dass die in der Globalfrage angesprochene, zentrale Aussage des Textes nicht rezipiert worden ist. Eine Konzentration des Prüflings auf Details an solchen Stellen, an denen sie nicht erfragt werden, ist negativ zu bewerten. Die Globalfrage ist dann nicht beantwortet, was zu dem Verlust der für diese vorgesehenen Punkte führt.

  • Die Diktion in der Beantwortung der Globalfrage ist nicht hinreichend allgemein:
    Da Globalfragen auf generelle Entwicklungen und Tendenzen abzielen, sollte deren Beantwortung in einer entsprechend allgemeinen Diktion und in hinreichender stilistischer Distanzierung vom Ausgangstext erfolgen. Eine allzu konkrete Ausdrucksweise, eine allzu starke Anlehnung des vom Prüfling verwendeten Stils an den Ausgangstext - möglicherweise noch mit partieller Übernahme der in diesem vorgenommenen Wortwahl - sollte in der Bewertung daher entsprechend negativ ausfallen. Dem einzelnen Prüfer ist dann anheimgestellt, ob er die gesamte, für diese Frage erzielbare Punktzahl abzieht oder trotzdem noch einen Teil der erzielbaren Punkte vergibt.  

  • Auf ein im Ausgangstext vorhandenes, relevantes Beispiel wird vom Prüfling stichwortartig verwiesen:
Diese Konstellation kann sich nicht nur auf den Aufgabentyp Globalfragen beziehen, sondern ist ebenso auf den Typ Zusammenfassung anwendbar, wo er auch ausführlicher behandelt werden soll (vgl. Kap. 7.1.2.6). An dieser Stelle daher nur soviel: Der Verweis auf ein im Ausgangstext gegebenes Beispiel, der in seiner Mikroform aus nicht mehr als einem Stichwort besteht, ist wünschenswert, da durch ihn erkennbar wird, dass der Prüfling die thematischen Bezüge innerhalb des Textes - seine Intratextualität - erfasst hat. Diese Leistung ist positiv zu bewerten und kann durchaus mit der Vergabe von Bonuspunkten gekoppelt werden.

  • Der globale Charakter der Frage wird vom Prüfling erkannt:
   Durch die Identifizierung der gestellten Frage als Globalfrage, die allgemeine Inhalte und Tendenzen anspricht, gibt der Prüfling zu erkennen, dass er deren thematische Tragweite erkannt hat und imstande ist, sie in angemessener Weise in das Textganze zu integrieren. Diese Leistung ist positiv zu sanktionieren, also mit der vollen erzielbaren Punktzahl zu belohnen.

Ein anderer Fall liegt vor, wenn der Prüfling zwar die Globalfrage als solche adäquat beantwortet, dieser jedoch zusätzlich solche Detailinformationen anlagert, die nicht unmittelbar zu ihrer Beantwortung beitragen. Ein solches Verhalten, mit dem der Prüfling - gleichsam zu seiner eigenen Sicherheit - im Kontext der Frage nicht primär relevante Informationen anführt, sollte mit einem Abzug von bis zu 25 % der erreichbaren Punktzahl belegt werden.

Nach Abschluss unserer Reflexionen zu den Globalfragen wollen wir uns nunmehr der Bewertung des Aufgabentyps Zusammenfassung zuwenden.


7.2.1.6 Zusammenfassung 

Für den Aufgabentyp Zusammenfassung (vgl. Kap. 6.4.2.2.6 und Tinnefeld 2002: 132ff) gilt allgemein, dass seine Bewertung vielen Prüfern Schwierigkeiten bereitet, da sie nicht oder nicht unproblematisch in der Lage sind, die von den Prüflingen angebotenen Inhalte mit dem jeweiligen Ausgangstext in Beziehung zu setzen.

Viele Prüfer mögen sich in diesem Dilemma aufgrund ihrer eigenen Bewertungsunsicherheit damit behelfen, die Leistungen ihrer Prüflinge - wo immer dies möglich ist - mit der vollen errechenbaren Punktzahl oder mit allenfalls geringen Punktabschlägen zu bewerten. Dies kann jedoch kein befriedigender Ansatz sein, da der Aufgabentyp Zusammenfassung dann jegliche Prüfungsrelevanz verliert. Dass dennoch Möglichkeiten bestehen, den Aufgabentyp Zusammenfassung adäquat zu bewerten, soll im Folgenden aufgezeigt werden.

Für einen gegebenen Ausgangstext ist es kaum möglich, alle in ihm enthaltenen Details als für dessen Zusammenfassung obligatorisch anzusetzen, da ein Prüfungstext normalerweise mehr Details enthält, als in jeder einzelnen Zusammenfassung aufgelistet werden können, ohne dass diese die quantitativen Grenzen[2] sprengt, die ihr als Textsorte inhärent sind. Somit ist es Prüfern in aller Regel unmöglich, eine Art Checkliste für die eigene Bewertung zugrunde zu legen, anhand derer sie dann beispielsweise die Punktzahl für diejenigen Aspekte abziehen, die der Prüfling in seiner Zusammenfassung nicht erwähnt hat. Bei einer solchen Bewertung ex negativo hätte kaum ein Prüfling jemals die Chance, die volle Punktzahl zu erzielen.

Ebenso unbefriedigend ist es für einen Prüfer, selbst eine Musterzusammenfassung des Ausgangstextes zu erstellen und diese als Folie zu verwenden, auf der er die Zusammenfassungen der Prüflinge bewertet. Ein solches Vorgehen ist im Wesentlichen aus zwei Gründen gegenüber dem Prüfling nicht fair:

  • Der Prüfer - als ausgebildeter Lehrer - muss zwingend in der Lage sein, bessere Zusammenfassungen zu erstellen als seine Schüler oder Studenten;
  • Eine Zusammenfassung eines gleichen Ausgangstextes stellt immer nur eine Möglichkeit dar, diesen zu resümieren, jedoch nicht die einzige existierende Möglichkeit. Für Prüflinge ist es dabei unmöglich vorherzusehen, welche Gesichtspunkte des Ausgangstextes ihr Prüfer als relevant empfindet. Wird der hier beschriebene Qualitätsstandard zugrunde gelegt, haben sie keinerlei Chance, den Aufgabentyp Zusammenfassung mit guten Ergebnissen abzuschließen.

Ein Vorgehen wie das hier skizzierte kann somit lediglich als eine der schlechtesten denkbaren Möglichkeiten der Bewertung eingestuft werden.

Als ein für den Prüfer ungleich besserer Weg erweist es sich in der beschriebenen Situation, eine Positiv-Checkliste zu erstellen, in der er alle diejenigen Aspekte des Ausgangstextes auflistet, die ihm in einem objektiv-textuellen Ansatz für die Erfassung des Ausgangstextes relevant erscheinen. Nennt ein Prüfling einen dieser Gesichtspunkte in seiner Zusammenfassung, so erhält er für diesen einen Punktwert. Je mehr Aspekte aus dieser Checkliste des Prüfers er nennt, desto mehr Punkte erhält er. Die Anzahl der in der Checkliste aufgeführten Punkte übersteigt intentional die vom Prüfling geforderte Zahl.

Nun ist es innerhalb dieses Ansatzes für einen Prüfling durchaus möglich, mehr als 100 % der erreichbaren Punkte zu erzielen, was jedoch nicht wünschenswert sein kann. Diese Problematik kann dann in der Weise ausgeglichen werden, dass Punkte für in der Zusammenfassung auftauchende, inkorrekte Details nicht lediglich neutral gewertet, sondern vielmehr von dem Gesamtergebnis abgezogen werden. Auf diese Weise kann auch dann der optimale Punktwert erzielt werden, wenn der eine oder andere sachliche Fehler in der Zusammenfassung auftaucht, jedoch durch eine entsprechende inhaltliche Mehrleistung ausgeglichen wird.

Insgesamt ergibt sich bei der Bewertung des Aufgabentyps Zusammenfassung dann die folgende Skala:

           
Bewertungsskala
Aufgabentyp Zusammenfassung

Punktbeispiel

Gesamtzahl der in der Zusammenfassung erzielbaren Punkte (= theoretisch erzielbare Punktzahl):

Anzahl der Punkte in der Checkliste des Prüfers (= für die Bestnote geforderte Punktzahl):

Anzahl der Punkte für die korrekte Nennung von Details durch den Prüfling, die mit der Gesamtliste der Details aus der Checkliste des Prüfers übereinstimmen (= konkrete Leistung des Prüflings):

Anzahl der abziehbaren Punkte für vom Prüfling nicht adäquat oder falsch benannte Textdetails:




16 Punkte


20 Punkte




14 Punkte

                        3 Punkte
             (von 14 abzuziehen)
Gesamtergebnis: 14 – 3
 11 / 16

                Abb. 74: Bewertungsskala Aufgabentyp Zusammenfassung


Auf die beschriebene Art und Weise lassen sich Zusammenfassungen mit  einem zufriedenstellenden Zuverlässigkeitsgrad bewerten.

Zudem kommen für den vorliegenden Aufgabentyp die folgenden Bewertungskonstellationen in Betracht. 

  • In der Zusammenfassung des Prüflings finden sich alle wichtigen, im Ausgangstext enthaltenen Informationen:
    Dieser Gesichtspunkt ist in der Prüfungspraxis nicht ohne Weiteres zu ermitteln. Zum einen können - wie weiter oben in diesem Abschnitt diskutiert - in der Zusammenfassung kaum alle wichtigen Punkte wiedergegeben werden, da sie ja erheblich kürzer ist als der Ausgangstext. Zum anderen wird nicht jeder Rezipient des Ausgangstextes exakt die gleichen Informationen mit der gleichen Rangstufe der Wichtigkeit belegen. In diesem prüfungsdidaktischen Dilemma bietet es sich an, mit der Punktwertmethode zu arbeiten. Diese funktioniert wie folgt: Der Korrektor ermittelt für sich selbst die aus seiner Sicht wichtigsten Informationen und vergibt für jede von diesen einen Punktwert. Sind alle für ihn gleich wichtig, so erhält jede Information den gleichen Punktwert. Sind in einem gegebenen Text alle Informationen mehr oder minder gleich wichtig, ergeben sich keine Probleme. Problematisch wird es jedoch, wenn der Ausgangstext Informationsbestandteile unterschiedlicher Wichtigkeit enthält. In diesem Fall erhält eine wichtigere Information einen höheren Punktwert. Da nun - wie erwähnt - verschiedene Leser in Abhängigkeit von ihrem eigenen Apperzeptionsschema in aller Regel unterschiedliche Informationsbestandteile als unterschiedlich wichtig werten, ist es notwendig, dass der Prüfer den Ausgangstext unter mindestens zwei oder drei verschiedenen Blickwinkeln liest, um auf der Basis der jeweiligen Verständnisperspektive ein jeweils unterschiedliches Verständnisprofil zu ermitteln. Für jedes dieser Verständnisprofile definiert er nun hinsichtlich jedes einzelnen Informationsbestandteils den ihm zukommenden Punktwert. Auf diese Weise ist es möglich, das potentielle Verständnis einer Vielzahl von Lesern nicht nur mit relativ hoher Zuverlässigkeit zu antizipieren, sondern es auch adäquat zu bewerten.

Von Bedeutung ist zudem, dass der Prüfer nicht alle von ihm ermittelten, wichtigen Informationsbestandteile für die Erzielung des optimalen Punktergebnisses zugrunde legt, sondern etwa 20 Prozent dieser als Marge lässt. Enthält ein Text aus der Sicht des Prüfers somit zehn relevante, der Einfachheit halber hier gleich gewichtete Informationsbestandteile, die insgesamt einen Punktwert von 20 ausmachen, legt er lediglich acht dieser unterschiedlich gewichteten Informationen für die Erzielung der Höchstpunktzahl - hier 16 Punkte - zugrunde, die zusammen eben diesen Wert von 16 Punkten ergeben. Benennt ein Prüfling acht dieser zehn Informationsbestandteile korrekt, erhält er bei entsprechender Gewichtung somit 100 Prozent der erreichbaren Punktzahl[3]. Zwei Informationsbestandteile fungieren als Marge. Auf diese Weise wird sichergestellt, dass der geringeren Länge der Textsorte Zusammenfassung Rechnung getragen wird. Zudem werden die Prüflinge jeweils andere Informationen als wichtig einstufen, so dass diese potentiell unterschiedliche Textrezeption somit auch quantitativ berücksichtigt wird.

Stellt der Prüfer im Laufe seiner Bewertung der Zusammenfassungen der Prüflinge fest, dass er den einen oder anderen Informationsbestandteil ungerechtfertigt als zu wichtig oder zu unwichtig angesehen hat, so sollte er in Erwägung ziehen, seine Bewertung an diese Perzeptionsverschiebung anzupassen.

Gegen diese Methode ist einzuwenden, dass sie für den Korrektor mit einem erheblichen Zeitaufwand einhergeht und daher in der Praxis nicht in allen Fällen durchführbar ist. Wenn dem auch so sein mag, so sollte dennoch sichergestellt werden, dass sie zumindest in wichtigen Prüfungen Anwendung findet: Das hier beschriebene Verfahren repräsentiert eine - angesichts aller vorhandenen Subjektivität der Bewertung von Inhalten - sehr objektive Methode.

  • Die zentrale Textaussage kommt nicht adäquat zum Ausdruck:
   Dieser Gesichtspunkt betrifft die Frage, ob der Prüfling die allgemeine thematische Ausrichtung des zugrunde liegenden Lese- bzw. Hörverstehenstextes erfasst hat. Die Frage verweist auf eine Bewertungsskala, die vom unzureichenden Bestehen dieses Aufgabentyps bis hin zu dessen Nichtbestehen reicht und dessen Ausmaß der Prüfer im Einzelfall zu entscheiden hat. Allgemein kann hier festgehalten werden, dass dieser Aufgabentyp dann als nicht bestanden angesehen werden sollte, wenn:

    • die zentrale Textaussage nicht eindeutig, nicht hinreichend klar oder überhaupt nicht formuliert werden konnte,
    • die Summe der in der Zusammenfassung benannten Einzeldetails nicht auf eine mehr oder minder korrekte Erfassung des Ausgangstextes schließen lässt und / oder
    • die thematische Grundaussage des Textes zwar mehr oder minder angemessen versprachlicht wurde, jedoch die an diese angelagerten Details nicht korrekt sind.  


  • Die Diktion der Zusammenfassung ist weder klar noch eindeutig:
Während eine klare und eindeutige Diktion auf die Souveränität des Textverständnisses des Prüflings zu schließen erlaubt und dann natürlich in der Punktevergabe entsprechend zu belohnen ist, ergeben sich dann Bewertungsprobleme, wenn eine gegebene Zusammenfassung sich als weitgehend unzusammenhängende Darstellung erweist. In einem solchen Falle ist davon auszugehen, dass die mentale Erfassung des Textes durch den Prüfling unzureichend ist und er es in der Prüfungssituation nicht leisten konnte, sich einen angemessenen Überblick über den Text zu verschaffen: Erfolgreiches Textverständnis und Klarheit in der schriftlichen Darstellung in Form der Zusammenfassung sind als zueinander proportional anzusehen. Aus diesem Grunde sollte eine unzusammenhängende oder gar konfuse Darstellung von Textinhalten in Zusammenfassungen mit deutlichen Punktabzügen zwischen 25 % bis 50 % - in Einzelfällen darüber - geahndet werden.

  • Passagen des Ausgangstextes werden wortwörtlich zitiert:
Das Problem wortwörtlicher Zitate aus dem zugrunde liegenden Text ist für den einsprachigen Ansatz von Bedeutung, also für denjenigen, nach dem der fremdsprachige Ausgangstext in der Fremdsprache zusammenzufassen ist - ein Prozedere, das sich in der Prüfungspraxis großer Beliebtheit erfreut[4]. Generell ist festzuhalten, dass die wortwörtliche Zitierung von Passagen des Ausgangstextes die Leistung des Prüflings in erheblichem Maße relativiert. Zwar kann der Sinn einer Zusammenfassung in der geprüften Fremdsprache nicht darin bestehen, zusätzlich zu dem Prüfungsbereich Textverständnis auch noch denjenigen der Schreibfertigkeit zu prüfen. Dennoch zeigt die Art und Weise, in der ein Prüfling sich mit dem Aufgabentyp Zusammenfassung auseinandersetzt, nicht nur auf direkte und explizite Weise, sondern auch mittelbar, inwieweit er den Ausgangstext verstanden hat. So kann die wortwörtliche Übernahme von Textpassagen beispielsweise aus zwei Gründen vorgenommen werden:

  • Dem Prüfling sind eigene, vom Ausgangstext losgelöste Formulierungen nicht in den Sinn gekommen. 
Dieser Gesichtspunkt mag gegen die fremdsprachlichen Enkodierungsfähigkeiten des Prüflings sprechen, die in dem vorliegenden Aufgabentyp jedoch nicht zu sanktionieren sind. Kommt der Prüfer also in seiner Analyse der Ergebnisse seines Prüflings zu dieser Schlussfolgerung, sollte er dessen wortwörtliche Textübernahme zunächst nicht negativ ahnden, sondern nach weiteren Indizien suchen, die diese Hypothese erhärten.

    Diese Argumentation zugunsten des Prüflings kann jedoch nur unter der Bedingung gelten, dass die wortwörtliche Textübernahme in der Aufgabenstellung nicht ausdrücklich untersagt worden ist. Ist sie untersagt worden, muss sie in jedem Falle negativ sanktioniert werden;

    Der Prüfling hat die entsprechende Passage des Ausgangstextes nicht oder nicht adäquat verstanden und wählt aus diesem Grunde die wortwörtliche Übernahme. In diesem Fall ist diese negativ zu sanktionieren: Der Prüfling macht deutlich, dass er gerade die Fertikgeit, die hier im Mittelpunkt besteht - das Textverstehen in der Fremdsprache - nicht oder nicht adäquat leisten kann. Die Folge dessen kann nur der Abzug der für die Wiedergabe der entsprechenden Textpassage erzielbaren Punkte sein. 

  • Die Informationen des Ausgangstextes werden chronologisch wiedergegeben:
  Gegen eine chronologische Darstellung der im Ausgangstext gegebenen Informationen ist im Grunde nichts einzuwenden, da eine korrekte inhaltliche Wiedergabe der Fakten in der Abfolge ihrer Behandlung im Ausgangstext bereits eine Leistung in sich darstellt.

Dennoch kann nicht bestritten werden, dass eine Darstellung der im Ausgangstext präsentierten Fakten in systematischer Form eine höhere Leistungsebene repräsentiert. Der Prüfling zeigt dadurch, dass er in der Lage ist, den Ausgangstext in seinen zentralen Aussagen und all seinen Details nicht nur zu verstehen, sondern ihn darüber hinaus in funktionaler Weise zu analysieren. Wenn eine solche Analyse innerhalb des Aufgabentyps Zusammenfassung zwar nicht als Standard zugrunde gelegt werden sollte, da eine solche Einschätzung die allgemein gültigen Maßstäbe ungerechtfertigt heraufsetzen würde, so sollten für eine systematisch angelegte Zusammenfassung dennoch Zusatzpunkte vergeben werden. Ob dies dadurch geschehen sollte, dass die erreichbare Optimalpunktzahl nur mittels einer systematischen Zusammenfassung erzielt werden kann und die beste, durch eine chronologisch angelegte Zusammenfassung erzielbare Note dann unterhalb dieser Punktzahl liegt oder ob auch die Optimalpunktzahl mittels einer chronologischen Zusammenfassung erreicht werden können soll und für eine systematische Zusammenfassung dann Bonuspunkte vergeben werden, sollte jeder Prüfer für sich selbst entscheiden. Wählt er jedoch die erste dieser beiden Varianten, sollte er unbedingt sicherstellen, dass er seinen Studierenden oder Schülern die Erstellung systematischer Zusammenfassungen beigebracht hat.   

  • In der Zusammenfassung werden Beispiele aus dem Ausgangstext in kurzer und bündiger Form zitiert:
    Natürlich kann es nicht Sinn einer Zusammenfassung sein, in ihrem Rahmen in nennenswerter Breite Beispiele zu zitieren. Dennoch ist zu bedenken, dass eine Zusammenfassung, die keinerlei Beispiele enthält - nicht einmal solche, auf die stichwortartig hingewiesen wird -, einen beachtlichen Teil ihres potentiellen Informationswertes einbüßt. In einem solchen Falle geht ihr illustrativer Charakter verloren und damit gerade der Bestandteil dieser Textsorte, der sie letztendlich lesenswert werden lässt. Aus diesem Grunde kann es in Zusammenfassungen durchaus begrüßenswert sein, in geringem Umfang Beispiele zu zitieren. Somit sollte die vereinzelte Berücksichtigung von im Ausgangstext gegebenen Beispielen bei der Bewertung dieses Aufgabentyps positiv sanktioniert werden. Auf diese Weise haben die Prüflinge nicht zuletzt die Chance, an anderen Stellen verlorene Punkte zu kompensieren.

  • Die Zusammenfassung ist nicht ohne die Kenntnis des Ausgangstextes zu verstehen:
    Die Prüflinge werden in ihrer späteren Berufstätigkeit in aller Regel nicht in die Lage geraten, Textzusammenfassungen erstellen zu müssen, die in vergleichender Lektüre mit dem jeweiligen Ausgangstext rezipiert werden. Aus funktionaler Perspektive ersetzt eine Zusammenfassung ihren Ausgangstext; sie wird an dessen Stelle gelesen. Jegliche Zusammenfassung muss somit klar aus sich heraus verständlich, sie muss in diesem Sinne autark sein. Zusammenfassungen, die diesen autarken Charakter nicht aufweisen, können nicht als solche gelten: Sie erfüllen ein grundlegendes Textsortenkriterium nicht.

Diese Zusammenhänge sind auf die Prüfungssituation übertragbar: Eine von einem Prüfling erstellte Textzusammenfassung kann nur unter der Bedingung als adäquat angesehen werden, dass sie aus sich heraus - unabhängig von dem ihr zugrunde liegenden Ausgangstext - verstanden werden kann. Nur dann hat sie eine Grundvoraussetzung erfüllt, um die optimal erzielbare Punktzahl zu erhalten. Ist eine Zusammenfassung nicht autark, so ist die Aufgabenstellung nicht erfüllt. In diesem Falle ist das Prüfungsergebnis negativ zu sanktionieren und ein entsprechender Wert von bis zu 25 % von der erzielbaren Punktzahl abzuziehen.

Für Prüfer bedeuten diese Zusammenhänge, dass sie das hier dargestellte Bewertungskriterium für den Aufgabentyp Zusammenfassung in ihre persönliche Checkliste aufnehmen und ihm einen entsprechenden Punktwert zumessen sollten.

  • Der Stil der Zusammenfassung ist weder dicht noch konzis, sondern bisweilen unpräzise und unökonomisch:
  Eine grundlegende Notwendigkeit der Textsorte Zusammenfassung besteht darin, diese gemäß des Kriteriums geringstmöglicher Länge zu gestalten: Die Zusammenfassung strebt nach einem verdichteten Stil. Wird dieser Stil vom Prüfling nicht entsprechend realisiert, so erfüllt sie ein wesentliches Textsortenkriterium nicht. Eine Zusammenfassung darf daher in aller Regel nicht länger sein, als es einem Drittel ihres Ausgangstextes entspricht. Überschreitet ein gegebener Text diese quantitative Grenze, so kann er nicht mehr als Zusammenfassung gewertet werden: Die gestellte Arbeitsaufgabe der Verfertigung einer solchen ist in diesem Falle nicht erfüllt. Mit Blick auf die Bewertung bedeutet dies, dass von der erreichbaren Höchstpunktzahl ein nennenswerter Anteil abzuziehen ist. Dieser mag durchaus einen Wert von bis zu 50 % ausmachen. Natürlich liegt auch diese Entscheidung im Einzelfall beim Korrektor; er wird jedoch ebenso erkennen, dass es sich bei Fällen wie dem beschriebenen um eine beträchtliche Abweichung vom gewünschten Prüfungsergebnis handelt, und dies entsprechend in seine Bewertung einfließen lassen.  

  • Inexakt ausgedrückte Textpassagen in der Zusammenfassung lassen auf mangelndes Verständnis des Ausgangstextes schließen:
    Existieren in der Textzusammenfassung eines Prüflings mehrere ungenau verbalisierte Passagen, in denen die Gegenstände des Ausgangstextes in unpräziser, bisweilen gar kryptischer Form wiedergegeben werden, so lassen diese auf ein mangelndes Textverständnis schließen. Der Prüfling vermag dann entweder die entsprechenden Passagen nicht exakter auszudrücken oder er verwendet eine Dissimulationsstrategie, um sein unzusammenhängendes bzw. unvollständiges Textverständnis zu kaschieren. Welche Strategie dem beschriebenen Ergebnis auch immer zugrunde liegen mag - die Schlussfolgerung, dass mangelndes Textverständnis deren Ursache ist, drängt sich bei ihnen allen auf. Entsprechend negativ ist ein solches Ergebnis zu werten. Dabei sei der Prüfer dazu angehalten, von dem auszugehen, was in den Formulierungen seines Prüflings steht. So obskur die einzelnen Formulierungen auch sein mögen, es ist nicht seine Aufgabe, gleichsam etwas Richtiges in diese hineinzulesen. In der Bewertung sollten diese unklaren Formulierungen des Prüflings somit als falsch eingestuft und der entsprechende Punktwert abgezogen werden.

  • Im Hinblick auf den Ausgangstext liegen in der Zusammenfassung inhaltliche Missverständnisse vor:
    Bei dieser Problematik stellt sich zunächst die Frage, ob diese Missverständnisse vernachlässigbar oder schwerwiegend sind. Sind sie zu vernachlässigen, so brauchen sie nicht sanktioniert zu werden bzw. die Sanktionen liegen im Bereich eines Punktabzugs von in der Regel nicht mehr als 20 % der für diesen Gesichtspunkt erzielbaren Gesamtpunktzahl.

Handelt es sich jedoch um schwerwiegende Missverständnisse, müssen diese entsprechend härter sanktioniert werden. Dafür ergeben sich im Wesentlichen zwei Möglichkeiten, die auf dem soeben beschriebenen Punktwertsystem basieren:

    • Für ein gegebenes inhaltliches Missverständnis wird kein Punkt vergeben oder
    • Für ein gegebenes Missverständnis wird nicht nur die volle Punktzahl abgezogen (s. oben), sondern es werden zudem noch Minuspunkte verteilt, d.h. die vom Prüfling bis dahin erworbenen Punkte werden um einen vom Prüfer zuvor bestimmten Wert vermindert.
    Von diesen beiden prinzipiellen Möglichkeiten wird hier dringend die Anwendung Ersterer empfohlen: Da in Prüfungen der Gesichtspunkt der Menschlichkeit eine nicht unwesentliche Rolle spielen sollte, würde der beschriebene, zusätzliche Abzug von Punkten eine zu harte Sanktion darstellen.

Der besseren Übersichtlichkeit halber sollen die verschiedenen Aufgabentypen in den hier beschriebenen Konstellationen noch einmal gesamthaft betrachtet werden.



7.2.2 Übersicht über die Bewertung der verschiedenen Aufgabentypen

Hinsichtlich der bisher angestellten Reflexionen ergibt sich die folgende Tendenz:


Die Anzahl der für einen gegebenen Aufgabentyp
zu berücksichtigenden Bewertungsgesichtspunkte steht in
umgekehrt proportionalem Verhältnis zu dessen Konkretheit.


Umgekehrt gilt: Mit der jeweils größeren Zuverlässigkeit eines Aufgabentyps werden immer weniger prüfungsdidaktische Erwägungen bzw. Leitfragen für seine adäquate Bewertung notwendig.

Prüfer können diese Tendenz allgemein in der Weise nutzen, dass sie solche Aufgabentypen wählen, die besser zu standardisieren sind als andere. Diese werden in aller Regel diejenigen Aufgabentypen sein, die für sie selbst - aber auch für den Prüfling - die geringstmöglichen inhaltlichen und handlungsbedingten Margen beinhalten.

Diese Empfehlung gilt in der Prüfungspraxis jedoch mit Einschränkungen: Solche Aufgabentypen wie beispielsweise die Zusammenfassung oder auch Globalfragen werden im Fremdsprachenbereich immer eine Rolle spielen. Es wird in Zukunft jedoch zu fragen sein, ob es nicht prüfungsdidaktisch fruchtbar wäre, sie in der Praxis weniger häufig zu verwenden.

Die hier aufgezeigten Zusammenhänge können graphisch wie folgt dargestellt werden[5]:


Aufgabentypen

Konstellationen

Bewertung
(Empfehlungen)

Antwortmatrix

Zielführende Ankreuzungen

Mechanische Ankreuzungen


Erteilung der vollen Punktzahl

Disqualifikation des Prüflings; Gespräch mit ihm.


True-False-Statements

Korrektur eines nicht anvisierten Textdetails

Keine Korrekturvornahme bei der Wahl von false


Voller Punktabzug (Ausnahme: Fehler des Prüfers)

Voller Punktabzug

Multiple-Choice-Aufgaben

Ankreuzung der korrekten Antwortalternative

Ankreuzung einer inkorrekten Antwortalternative, die auf der  Basis der Formulierung auch hätte korrekt sein können

Unrichtige Ankreuzung auch durch gute Studierende



Erteilung der vollen Punktzahl

Prüferfehler: Neutralisierung der Frage


Gefahr nicht hinreichender Trennschärfe: Neutralisierung der Frage


Detailfragen

Explizite Benennung des erfragten Textdetails

Übergeordnete inhaltliche
   Einordnung des erfragten
   Details

Beantwortung eines nur mittelbar relevanten Details

Beantwortung auf der Basis von Weltwissen


Erteilung der vollen
   Punktzahl

Bonus für den Prüfling



Voller Punktabzug


Punktabzug: mindestens 50 %

Globalfragen

Exakte, themenorientierte Beantwortung


Evasionsstrategie

Nicht hinreichend allgemeine Diktion

Stichwortartiger Verweis auf ein Textbeispiel

Erkennen des globalen Charakters der Frage


Volle Punktzahl; jedoch bei Beantwortung auf der Basis von Weltwissen: voller Punktabzug.

Voller Punktabzug

Punktabzug im Ermessen des Prüfers

Vergabe von Bonuspunkten

Erteilung der vollen Punkt zahl; jedoch bei sicherheitshalber Hinzufügung sekundärer Details: Punktabzug bis zu 25%


Zusammenfassung

Berücksichtigung aller wichtigen Informationen

Inadäquate Versprachlichung der zentralen Textaussage


Weder klare noch eindeutige Diktion

Wörtliches Zitieren des Ausgangstextes

Chronologische Wiedergab des Ausgangstextes



Kurze Zitierung von Beispielen

Lediglich ausgangstext abhängiges Verständnis der Zusammenfassung möglich

Zu ausführlicher Stil

Ungenaue Ausdrucksweise


Inhaltliche Missverständnisse


Anwendung der Punktwertmethode

Unzureichendes Bestehen oder Nichtbestehen: Punktabzug im Ermesse des Prüfers

Punktabzug zwischen 25 % und 50 %


Punktabzug bis zur vollen Höhe

Erteilung der vollen Punkt zahl: bei systematische Zusammenfassung: Zuweisung von Bonuspunkten

Positive Sanktionierung

Punktabzug bis zu 25 %



Punktabzug bis zu 50 %

Punktabzug im Ermessen des Prüfers

Punktabzug von 20 % aufwärts

                               
Abb. 75: Aufgabentypen zum Lese- und Hörverstehen:
                Bewertungskonstellationen und -empfehlungen



Am Anschluss an die Behandlung der Bewertung von Lese- und Hörverstehen widmen wir uns nunmehr derjenigen der Sprechfertigkeit.



7.3 Bewertung von Prüfungen zur Sprechfertigkeit


Während schriftliche Prüfungsleistungen - trotz der prinzipiellen, zum Teil erheblichen Probleme, die ihnen in prüfungsdidaktischer Perspektive inhärent sind - noch vergleichsweise zuverlässig bewertet und korrigiert werden können, reduziert sich diese Zuverlässigkeit im Rahmen der mündlichen Fehlerbewertung in beträchtlichem Umfang. Diese Problematik steht in engem Zusammenhang mit der prinzipiell geltenden Flüchtigkeit des gesprochenen Wortes. Auf diesen Gesichtspunkt wird im Folgenden zunächst kurz einzugehen sein.



7.3.1  Der ephemere Charakter des gesprochenen Wortes 

Gesprochene Sprache ist prinzipiell durch das Phänomen charakterisiert, dass sie gemeinhin nicht fixiert wird (vgl. zu diesen Aspekten auch Tinnefeld 2002: 105ff). Wohingegen in der schriftlichen Sprachäußerung der jeweilige Kommunikationskanal - das Papier, die Computer-Festplatte, der USB-Stick oder auch die CD-ROM - mehr oder minder durativen Charakter hat und eine gegebene sprachliche Äußerung im Idealfall auf Dauer festhält, ist eine gesprochene Äußerung in dem Moment obsolet, in dem sie getätigt wird: Sie ist gleichsam Geschichte, sobald sie ausgesprochen ist. Jegliches gesprochene Wort ist somit ephemer: Es ist vergänglich, und dies mit sofortiger Wirkung.

Aufgrund dieser Zusammenhänge ist es nicht möglich, gesprochene Sprache zu radieren; sie kann nicht nachträglich verändert werden. Daraus folgt, dass gesprochensprachliche Äußerungen nicht nachträglich korrigiert werden können. Korrekturen können zwar vorgenommen werden, jedoch einzig und allein durch eine vollkommene oder zumindest teilweise Wiederholung der fehlerhaften Äußerung unter gleichzeitiger Vermeidung des Fehlers. Fehlerhafte mündliche Äußerungen können im Gedächtnis des Rezipienten nur auf diese Art und Weise „überschrieben“ werden; sie können jedoch nicht getilgt und durch die korrekte Lösung ersetzt werden. Dieses Grundprinzip der Flüchtigkeit des gesprochenen Wortes beeinflusst jegliche Bewertung mündlicher fremdsprachiger Prüfungsleistungen nachhaltig[6]

Fehlerhafte schriftliche Äußerungen werden tendenziell in der Weise bewertet, dass sie als Ausdruck von Kompetenzfehlern angesehen werden, also solcher Fehler, die auf der mangelnden Sprachbeherrschung der Prüflinge beruhen: Der Schreiber hat ja - während oder nach der Niederschrift seiner Worte - hinreichend Zeit, diese nochmals durchzulesen und auf eventuelle Fehler hin abzuklopfen[7]. Die Unterscheidung zwischen solchen Kompetenzfehlern und den so genannten Performanzfehlern - solchen, die lediglich aus der Kommunikationssituation heraus passieren, bei denen der Sprecher jedoch bei genauerem Überlegen selbst erkennt, welche die korrekte Äußerung gewesen wäre - ist im Bereich der gesprochenen Sprache im Allgemeinen nicht klar zu treffen.

Ein Beispiel möge diesen Problempunkt verdeutlichen: Es bezieht sich auf die potentielle Bewertung der Äußerung eines Prüflings in einer mündlichen Englischprüfung, in der er den Satz sagt: I’m interested for music. Die Produktion einer derart fehlerhaften Äußerung mag als Antwort auf eine oder mehrere der sich in diesem Zusammenhang ergebenden Fragen zu sehen sein:

  • Verfügt der Prüfling über eine mangelnde fremdsprachliche Kompetenz und weiß nicht, dass die korrekte Lösung I’m interested in music lautet?
  • Leidet der Prüfling in dieser Prüfungssituation - oder gar immer in Prüfungssituationen - unter Nervosität, hat sich daher mental und / oder intellektuell nicht vollkommen unter Kontrolle und macht deswegen einen solchen Fehler?
  • Hat sein Prüfer ihn durch sein Verhalten oder eine Frage irritiert, was zu einer momentanen Unkonzentriertheit geführt hat, die diesen Fehler dann verursacht hat?
  • Ist der Prüfling gerade dabei, den Gedanken, den er ausführt, weiterzuentwickeln und plant die Fortführung seines Diskurses vor, so dass er im Moment dieser Äußerung eher inhalts- als sprachorientiert vorgeht und die Produktion dieses fehlerhaften Satzes spontan vielleicht gar nicht bemerkt?
    Es wäre durchaus denkbar, weitere Fragen dieser Art zu stellen. Letztendlich jedoch ist der eigentliche Grund für die Äußerung dieses inkorrekten Satzes nicht fassbar. Wie ausführlich eine solche Ursachenforschung auch vonstatten gehen mag, wird doch deutlich: Eine mehr oder minder schlüssige oder auch nur zufriedenstellende Kausalattribuierung für in mündlichen Prüfungen gemachte fremdsprachliche Fehler ist kaum auf eindeutige Art und Weise möglich.

Ein zuverlässiges Kriterium - wenn nicht sogar das einzige -, das einen Schritt hin zu einer zuverlässigeren Bewertung mündlicher Fremdsprachenleistungen darstellt, ist dasjenige der Wiederholung: Das mehr als einmalige Auftreten eines und desselben Fehlers verweist plausibel darauf, dass es sich bei diesem gerade nicht um einen Performanzfehler, sondern vielmehr um einen Kompetenzfehler handelt. Je höher dieses Auftreten des Fehlers während einer gegebenen Zeitspanne ist, desto zuverlässiger wird diese Aussage.

Diese Aussage ist dabei auf einzelne Fehler beziehbar - wie im gegebenen Beispiel  auf die Präposition in bei to be interested in.  Sie ist jedoch ebenso anwendbar auf breiter angelegte Fehlerbereiche wie beispielsweise das gerund im Englischen, den subjonctif im Französischen oder den Relativsatz im Spanischen: Treten in diesen oder ähnlichen Bereichen wieder und wieder die gleichen Fehler auf, kann mit erheblicher Wahrscheinlichkeit davon ausgegangen werden, dass es sich bei diesen um Kompetenzfehler handelt, die auf einer mangelnden Beherrschung der Fremdsprache beruhen, und nicht um solche, die aus mangelnder Konzentration oder einer temporären Fokussierung auf inhaltliche anstelle sprachlicher Diskursplanung beruhen. Dies bedeutet im vorliegenden Zusammenhang, dass ein für die Bewertung gesprochener Sprache äußerst zuverlässiger Fehlertypus derjenige des wiederholten Fehlers ist. Dabei kann davon ausgegangen werden, dass es sich bei diesem um einen der wenigen, für die Bewertung gesprochener Sprache zuverlässigen Fehlertypen handelt.

Mündliche Prüfungen laufen in demjenigen Register ab, das mit dem Begriff ‚gesprochene Sprache’ belegt wird. Charakteristisch für dieses Register ist das Faktum, dass dessen Norm eine breitere, tolerantere, offenere ist, als dies für die Norm der geschriebenen Sprache gilt: Gesprochensprachlich wird nicht nur ungleich spontaner formuliert - es ist ja für die Planung und Ausführung sprachlicher Äußerungen erheblich weniger Zeit vorhanden als in schriftsprachlicher Kommunikation -, es wird zudem eine im Vergleich saloppere Ausdruckweise gewählt, es werden Wörter und Wendungen verwendet, die in geschriebensprachlicher Norm nicht verwendbar sind, und es werden Fehler gemacht, die in schriftsprachlicher Kommunikation von denselben Kommunikanten gemeinhin vermieden werden. Bezeichnend ist, dass dieser Zusammenhang für Muttersprachler ebenso gilt wie für Nichtmuttersprachler. Er stellt somit ein Grundcharakteristikum gesprochener Sprache dar und muss als solches auch in die Bewertung mündlicher Prüfungen eingehen. Die Bewertungspraxis mündlicher Prüfungen muss daher an der Norm der gesprochenen Sprache orientiert sein. Eine Orientierung an geschriebener Sprache ginge an der sprachlichen Realität vorbei. Die Bewertungsnorm mündlicher Prüfungen muss also - wie dies dem Register der gesprochenen Sprache inhärent ist - eine breit angelegte sein, die saloppe Ausdrucksweisen zumindest toleriert und in der Fehler dann, wenn sie denen entsprechen, die auch Muttersprachler in gesprochener Sprache machen würden, nicht geahndet werden.  

In diesem Zusammenhang kann gegebenenfalls noch einen Schritt weiter gegangen werden: Die Fähigkeit eines Prüflings, sich im gesprochensprachlichen Register einer gegebenen Fremdsprache wie ein Muttersprachler auszudrücken, würde dann nicht nur nicht negativ, sondern vielmehr positiv gewertet. Diese Bewertungspraxis entspräche einer modernen, realitätsnahen linguistischen Sichtweise.

An einem Beispiel lässt sich die generelle, zwischen gesprochener und geschriebener Sprache herrschende Unterschiedlichkeit auf zugänglichere Art und Weise verdeutlichen als in rein theoretischer Darstellung. Verwendet ein Prüfling in einer Englischprüfung gehäuft die Wendung sort of und sagt beispielsweise Sätze wie This text is sort of difficult oder I’m sort of old-fashioned oder auch You are sort of right, so spricht er damit nicht nur korrektes gesprochenes Englisch - auch wenn die schriftliche Verwendung der zitierten Konstruktionen in seriösen Texten weitgehend inakzeptabel wäre -, sondern stellt darüber hinaus unter Beweis, dass er - bewusst oder unbewusst - in Bezug auf diese Wendung die Vertextungsnormen des gesprochnen Englisch beherrscht und sie einem Muttersprachler vergleichbar aktiv anzuwenden versteht. Eine solche Verwendung ist somit nicht negativ zu sanktionieren. Im Rahmen einer Bewertungspraxis, die den Prinzipien der Prüfungsdidaktik entspricht, sollte sie sogar honoriert, also positiv sanktioniert werden.[8].  

Als ein Beispiel aus dem Französischen sei die Verwendung des subjonctif herangezogen, der in der Schriftsprache ungleich häufiger verwendet wird als in der gesprochenen Sprache. Obwohl der subjonctif in Grammatiken des Französischen nicht selten unterschiedslos für die geschriebene als auch für die gesprochene Sprache behandelt wird - beispielsweise bei dem Vorhandensein verschiedener Auslöser oder zum Ausdruck bestimmter Inhalte -, verwenden Muttersprachler des Französischen diesen Modus des Verbs in der gesprochenen Sprache oft nicht oder nicht adäquat. In einer solchen Situation stellt sich nun die Frage, ob ein deutscher Student, der in einer mündlichen Prüfung solche subjonctif-Verwendungen, die Muttersprachler gesprochensprachlich nicht realisieren, ebenfalls nicht realisiert, negativ zu sanktionieren ist. Wenn ja, so würde von ihm verlangt, korrekter zu sprechen, als französische Muttersprachler es in gesprochener Sprache tun. Nun könnte argumentiert werden, dass eine mündliche Prüfung ja eine hochgradig formelle Kommunikationssituation darstelle und französische Prüflinge in dieser ebenfalls zum Gebrauch des subjonctif angehalten seien. Also müsse auch der deutsche Prüfling diesen Anspruch erfüllen. Verlangte man die Realisierung dieser gehobenen Norm jedoch auch in dieser Situation einer mündlichen Prüfung von ihm, so ermutigte man ihn dazu, nur diese Norm zu erlernen, weil ja nur diese prüfungsrelevant wäre. Damit würde dann der Effekt erzielt, dass dieser Prüfling immer dann, wenn er Französisch spräche, einen sehr formellen Stil wählen würde - und damit letztendlich nicht in der Lage wäre, in gesprochensprachlich adäquater Weise auf Französisch zu kommunizieren. Würde eine solch unrealistische, formale Norm des gesprochenen Französisch von ihm verlangt, so würde dies nichts Anderes bedeuten, als dass dadurch seine Chancen, mit Muttersprachlern in adäquatem gesprochenen Französisch zu kommunizieren, auf ein Mindestmaß reduziert würden. Dies kann nicht der Sinn der Fremdsprachenausbildung sein, und dies kann nicht der Sinn der Bewertung von Prüfungsleistungen sein. Die prüfungsdidaktisch konsequente Antwort auf die hier beschriebene Problematik kann also nur darin liegen, die subjonctif-Verwendung deutscher Prüflinge so zu sanktionieren, wie sie in realistischer Perspektive in der Mehrzahl der Kommunikationssituationen der Zielsprache auftritt. Dies bedeutet, die saloppere, breitere und tolerantere Norm der gesprochenen Sprache für die Bewertungspraxis zugrunde zu legen. Nur unter der Bedingung der Zugrundelegung dieser breiten Norm der gesprochenen Sprache ergibt sich letztendlich ein realistisches Leistungsbild der Prüflinge.

Mündliche Prüfungen beinhalten über die rein linguistische Seite hinaus jedoch auch außersprachliche Problemfelder, die von hoher Relevanz sind. Auf diese soll im Folgenden eingegangen werden.



7.3.2 Außersprachliche Aspekte mündlicher Prüfungen

Im vorliegenden Zusammenhang sind zusätzlich zu sprachlichen - bisweilen linguistischen - Fragen auch solche zu berücksichtigen, die in mündliche Prüfungen hineinspielen und diese gegebenenfalls stark beeinflussen können. Diese Fragen beziehen sich auf mündliche Prüfungen im Allgemeinen und nicht auf fremdsprachliche mündliche Prüfungen im Besonderen.

So wäre es für die Bewertung mündlicher Prüfungen durchaus zuträglich, den Grad an Nervosität, unter dem ein Prüfling leidet, in diese mit einzubeziehen. Natürlich kann argumentiert werden, dass es sich hierbei um ein Kriterium handelt, das nicht ein im engeren Sinne fachliches ist und daher keiner Berücksichtigung in der Bewertung bedarf. So legitim eine solche Argumentation auch sein mag - so trifft sie dennoch nicht die Realität: Menschen, die unter starker Nervosität leiden, sind im Allgemeinen nicht dazu in der Lage, optimale intellektuelle Leistungen zu erbringen. Die Nervosität, der sie sich ausgesetzt sehen, wirkt zwar nicht immer wie eine vollständige Blockade, jedoch mit an Sicherheit grenzender Wahrscheinlichkeit zumindest wie ein Hemmschuh. Diesen Zusammenhang unberücksichtigt zu lassen, bedeutet letztendlich, die menschliche Dimension des Prüflings außer Acht zu lassen und ihn wie einen Roboter, also ein unbeseeltes Wesen, zu behandeln. Dies kann keine befriedigende Lösung des Problems sein. Nervosität - im Unterschied zu einer begrenzten, als positiv, weil motivierend, anzusehenden Anspannung - wird in Prüfungen in der Regel also zu einer erhöhten Häufigkeit von Fehlern führen. Ohne die Existenz von Nervosität würden diese Fehler - umgekehrt formuliert - mit hoher Wahrscheinlichkeit nicht oder nicht in der gezeigten Häufung auftreten.  

Natürlich lässt sich nicht im Einzelfall nachweisen, welche Fehler bei nicht-vorhandener Nervosität nicht aufgetreten wären. Aus diesem Grunde ist dieses Kriterium außerordentlich unscharf. Zudem zeigt der eine Prüfling seine Nervosität offen, ein anderer ist dagegen in der Lage, denselben Grad an Nervosität so zu kaschieren, dass er vollkommen ruhig erscheint. Darüber hinaus kann prinzipiell angeführt werden, dass Nervosität mit einer gewissen Unreife des Kandidaten zusammenhänge oder aus Ursachen heraus entstehe, die gegebenenfalls auf eine schlechte Prüfungsvorbereitung verweisen, gleichsam nach dem Motto, wer gut vorbereitet sei, brauche nicht nervös zu sein. Argumentationen wie die hier aufgeführten sind unter prüfungsdidaktischem Gesichtspunkt unter allen Umständen zu vermeiden, weil sie nicht ein partnerschaftliches, faires Verhältnis zwischen Prüfer und Prüfling suggerieren, sondern vielmehr eines der Gegnerschaft und Konfrontation.

Diese Überlegungen bedeuten nichts Anderes, als dass die Nervosität des Prüflings in der Form in die Bewertung einer mündlichen Prüfung eingehen sollte, dass sie ihm zumindest nicht zur Last gelegt wird und gegebenenfalls gar in der Weise betrachtet wird, dass der Prüfer sich vergegenwärtigt, zu welcher Leistung der Prüfling imstande gewesen wäre, wenn er keiner Nervosität ausgesetzt wäre. Hinsichtlich der Bewältigung dieser Bewertungssituation ist es für den Prüfer hilfreich, seinen Prüfling gut zu kennen und ihn auch in solchen Situationen erlebt zu haben, in denen er nicht oder in ungleich geringerem Maße nervös war. Dann kann er diese Situationen mit denen der aktuellen Prüfungssituation vergleichen, aus dieser Diskrepanz die eigentliche Leistungsfähigkeit des Prüflings ermitteln und somit zu einer mehr oder minder realistischen Bewertung gelangen.

Wenn es also auch kaum möglich ist, in dieser Frage klare und wohldefinierte Leitlinien zu formulieren, so sei hier dennoch die prüfungsdidaktische Empfehlung ausgesprochen, in einer solchen Situation nach der Maßgabe in dubio pro studioso - entsprechend also zugunsten des Prüflings - zu entscheiden.  

Ähnlich wie die Problematik vorhandener Nervosität kann diejenige auftretender Unkonzentriertheit des Prüflings angegangen werden. Diese mag einerseits ein Resultat der Nervosität des Prüflings sein und dann in der Tat ähnlich gewertet werden. Der Eindruck von Unkonzentriertheit kann jedoch auch dadurch entstehen, dass der Prüfling seine Aufmerksamkeit so sehr auf die unterschiedlichen Aspekte seiner eigenen Diskursplanung richtet, dass er nicht mehr in der Lage ist, diese zielführend zu fokussieren und sich aus diesem Grunde in seinen Ausführungen verliert, also zerstreut wirkt. Ein solches mentales Tätigwerden auf verschiedenen Ebenen - derjenigen des zuvor vom Prüfling Gesagten, derjenigen seiner gegenwärtigen Ausführungen und derjenigen seiner in wenigen Augenblicken zu äußernden Reflexionen - ist ein Kennzeichen mündlicher Prüfungen. Diese, auf vermeintliche Unkonzentriertheit verweisende Sichtbarwerdung von Reflexionsprozessen darf dem Prüfling nicht zu Last gelegt werden; sie mag vielmehr ein Anzeichen hochgradig intensiven Nachdenkens sein und stellt dann sogar ein positives Kriterium dar. Zudem ist in mündlichen Prüfungen nicht selten das Phänomen zu beobachten, dass solche Prüflinge, die locker und lässig erscheinen, intellektuell auf viel niedrigerem Niveau operieren als solche, die sich in ihrer Prüfung hochgradig engagieren, dabei aber bisweilen fahrig oder unkonzentriert wirken, jedoch äußerst angespannt sind und auf hohe intellektuelle Leistung abzielen - und diese dann in vielen Fällen auch erreichen. Auch hinsichtlich der vermeintlichen Unkonzentriertheit von Prüflingen gilt somit, dass diese einer sehr sorgfältigen Analyse seitens der Prüfer bedarf. Sie undifferenziert negativ zu bewerten, führt in der Prüfungspraxis häufig in die Irre und kann dann für den Prüfling zu karriereschädigend wirken, als dass Prüfer leichtfertig mit diesem Phänomen umgehen sollten. Auch hier ist von Prüferseite somit höchste Sorgfalt in der Bewertung geboten.  

Unter prüfungsdidaktischem Gesichtspunkt sollte die sich in Phänomenen wie Nervosität und vermeintliche Unkonzentriertheit äußernde, prinzipielle Komplexität mündlicher Prüfungen somit eher zugunsten des Prüflings gewertet werden.


7.3.3 Objektivierungprobleme in der Bewertung mündlicher Fremdsprachenleistungen 


In engem Zusammenhang mit den Problemen des ephemeren Charakters gesprochener Sprache und der beschriebenen außersprachlichen Aspekte mündlicher Prüfungen steht die Problematik der prinzipiellen Nichtobjektivierbarkeit der Bewertung mündlicher Leistungen (vgl. hierzu auch Tinnefeld 2002: 110ff)[9]. In einem schriftlichen Prüfungstext ist es möglich, die Gesamtzahl der vom Prüfling in ihm gemachten sprachlichen Fehler zu ermitteln und sie - wenn dies gewünscht ist - in einem Fehlerquotienten festzumachen. Eine solche Ermittlung der in mündlichen Prüfungen gemachten Fehler ist dagegen prinzipiell mehr oder minder unmöglich. Diese Problematik soll hier im Mittelpunkt stehen.

Eine Möglichkeit, mündliche Prüfungen einer objektiveren Bewertungspraxis zuzuführen, liegt dabei zweifelsohne in deren Fixierung durch Video- oder Audiosysteme. Ein starkes Argument für diese Art der Aufzeichnung mündlicher Prüfungen ist sicherlich die Chance zur Objektivierbarkeit der Bewertung, die sie bietet: Aufzeichnungen ermöglichen es, die Prüfung noch einmal Revue passieren zu lassen und auf diese Weise die Anzahl der real vom Prüfling gemachten sprachlichen bzw. sachlichen Fehler zu eruieren und diese in ihrer Schwere zu qualifizieren. Theoretisch wäre es sogar möglich, eine Art mündlichen Fehlerquotienten zu ermitteln.

In der Praxis ist diese Form der Prüfungsdokumentation jedoch durch die folgenden, erheblichen Probleme charakterisiert:

  • Aufgrund der hohen Anzahl mündlicher Prüfungen, die an deutschen Hochschulen normalerweise in ein und demselben Prüfungsdurchgang stattfinden, wird es Prüfern im Alltag kaum möglich sein, sich die Prüfungen in ihrer Gesamtheit noch einmal anzuschauen, um danach die endgültige Note festzulegen. Das Problem besteht dabei noch nicht einmal darin, dass es im Rahmen dieses Verfahrens unmöglich ist, den Kandidaten unmittelbar nach ihrer Prüfung das Ergebnis mitzuteilen; dies könnte durchaus später geschehen. Das Problem liegt vielmehr in dem für diese retrospektive Arbeit notwendigen, enormen Zeitaufwand, den die Prüfer leisten müssten.
  • Die Fixierung mündlicher Prüfungen mag zwar durchaus zu gerechteren Ergebnissen führen. Diese müssen aus der Sicht des Prüflings jedoch nicht immer die besseren sein: Es ist durchaus möglich, dass die Prüfer in der retrospektiven Sicht der Prüfung, wenn sie die Video- oder Audioaufnahmen nochmals detailliert durchgehen, zu dem Ergebnis kommen, dass ihr erster Eindruck zu gut war und folglich die Note nach unten korrigieren.
  • Für Prüflinge kann das Wissen darum, dass sie gefilmt oder akustisch aufgenommen werden, eine erhebliche Irritation darstellen. Es ist allgemein bekannt, dass Individuen, die wissen, dass sie in einer gegebenen Situation durch Kamera und / oder Mikrofon in Sprache und Verhalten fixiert werden, sich anders verhalten als in solchen Situationen, in denen eine solche Fixierung nicht geschieht. Auf mündliche Prüfungen bezogen, bedeutet dieser Zusammenhang, dass Prüflinge, die mit Aufnahmegeräten konfrontiert werden, oft nicht ihre optimale Leistung erbringen können, da ihre ohnehin möglicherweise vorhandene Nervosität sich noch mehr steigert. Eine Entscheidung zugunsten der Aufnahme mündlicher Prüfungen bedeutet somit auch immer, eine potentielle Verminderung des Leistungspotentials der Prüflinge in Kauf zu nehmen. Dabei ist das Argument, dass dann ja alle Prüflinge dieser Situation ausgesetzt seien, nicht stichhaltig: Jeder Mensch reagiert anders auf Kamera und Mikrofon, den einen stören diese Dinge mehr, den anderen weniger. Dass aber jeder Mensch darauf reagiert, ist unstrittig.

Die Prüflinge nicht darüber zu informieren, dass sie während der Prüfung gefilmt werden oder dass das Prüfungsgespräch akustisch aufgezeichnet wird, um sie nicht zu irritieren, ist juristisch nicht zulässig. Käme ein solcher Fall vor, könnte die Prüfung umgehend angefochten werden und würde dann mit hoher Wahrscheinlichkeit für ungültig erklärt. Zudem würde man sich dann der Nichtachtung der Persönlichkeitsrechte des Prüflings schuldig machen. Hierin liegt also ebenfalls kein gangbarer Weg.

Die Aufzeichnung von Prüfungsleistungen hat - bei aller Gültigkeit der soeben angestellten Reflexionen - theoretisch jedoch ungeahnte Vorteile:

  • Die Chancen für eine gerechte Bewertung der Prüflinge sind aller Erwartung nach höher als ohne jegliche Fixierung. Wenn Prüfungsleistungen nicht nur aus der Erinnerung der Prüfer bewertet werden, sondern vielmehr auf der Basis konkreter Daten, die jederzeit erneut konsultiert werden können, da sie zeitlich unbegrenzt abrufbar sind, erhöhen sich die Chancen auf eine gerechte Bewertung von Leistungen.
  • Die Reihenfolge der Prüflinge an einem gegebenen Prüfungstag spielt keine Rolle mehr. Wenn die Prüfungen aufgezeichnet werden, ist Abfolge der einzelnen Prüflinge unerheblich, sie ist neutralisiert. So stellt sich den Prüfern das Problem der Bewertung des in der Reihenfolge ersten Prüflings, bei dem ja für die gegebenen Population von Prüflingen noch keine Vergleichsgrößen vorhanden sind, nicht mehr. Ebenso verhält es sich mit der Note des letzten Prüflings, während dessen Prüfung die Prüfer gegebenenfalls bereits müde sind. Wenn Prüfungsleistungen in ihrer endgültigen Ausprägung erst nach Abschluss aller mündlichen Prüfungen eines Durchgangs festgelegt werden, dann sind all diese Faktoren unerheblich: Die Bewertung wird durch die so geschaffenen Rahmenbedingungen gerechter. Das Problem dabei ist dann nur die Frage, ob die Prüfer die technisch prinzipiell gegebene Revue-Passierbarkeit der einzelnen mündlichen Prüfungen auch tatsächlich nutzen (s. oben). Zudem ergäbe sich für die Prüfer dann in etwa der doppelte Zeitaufwand: die Prüfung selbst und ihre erneute Sichtung anhand der entstandenen Video- oder Audio-Aufzeichnungen.
  • Mündliche Prüfungen, die visuell oder akustisch fixiert worden sind, bieten eine erheblich größere Rechtssicherheit als undokumentierte Prüfungen. Möglichen Beschwerden von Prüflingen hinsichtlich ihrer Note kann mit Hilfe von Aufzeichnungen - in positiver wie auch in negativer Form - wesentlich wirksamer begegnet werden als ohne dieses Medium. In diesem Gesichtspunkt ist ein starkes Argument zugunsten der Aufzeichnung mündlicher Prüfungen zu sehen.

Angesichts des aufgezeigten Dilemmas sprechen wir uns in prüfungsdidaktischer Perspektive hier für eine moderate Position aus: Solange die Vorteile der Verbindung mündlicher Prüfungen mit Aufzeichnungstechniken durch entsprechende Forschung nicht eindeutig verifiziert worden sind, sollten diese Techniken für mündliche Prüfungen nicht genutzt werden. Sollten die Vorteile eines Tages einer zweifelsfreien Verifizierung zugeführt werden, muss erneut diskutiert werden, ob unter den dann veränderten Umständen die bestehenden Nachteile der Aufzeichnung mündlicher Prüfungen in Kauf genommen werden sollen.

Eine ähnliche Problematik ergibt sich in abgeschwächter Form angesichts der in mündlichen Prüfungen gemeinhin beobachtbaren Tendenz, die Leistungen des Prüflings mittels detaillierter, vom Protokollanten aufgezeichneter Daten zu dokumentieren. Dies kann bisweilen mit einer gewissen Hektik von Seiten des Beisitzers vor sich gehen, besonders dann, wenn dieser bestrebt ist, die Prüfung gleichsam lückenlos zu protokollieren. Auch die Rolle des Protokollanten wirkt auf Prüflinge nicht selten irritierend und mag auf ihr Leistungspotential schädliche Auswirkungen haben. Bei Prüflingen ruft dieses Verhalten im Allgemeinen Verunsicherung hervor, was aus den verstohlenen Blicken deutlich wird, die sie in dieser Situation den Protokollanten bisweilen zuwerfen: Sie gehen eher davon aus, dass Fehler und negative Aspekte der Prüfung niedergeschrieben werden, als dass die Aufzeichnungen sich auf Positives beziehen. Allein durch diese partielle Absorption der Konzentrationsleistung des Prüflings geht wertvolles Leistungspotential verloren. Dies bedeutet für die Praxis mündlicher Prüfungen Folgendes:

  • Protokollanten bzw. protokollierende Beisitzer sollten während ihrer Arbeit niemals den Anschein von Hektik entwickeln. Ihre Aktivität des Mitschreibens sollte so diskret erfolgen wie möglich. Dabei sollten sie hektische Bewegungen vermeiden. Ihre Dokumentationsaufgabe sollte dem Prüfling gegenüber so gut wie möglich dissimuliert werden.
  • Bei ihrer Arbeit der Protokollführung sollten sie jegliche Reaktionen vermeiden, die den Prüfling in negativer Weise auf die eigene Leistung schließen lassen. Dazu gehören Stirnrunzeln, leises Aufstöhnen, der vermeintlich nicht bemerkbare Austausch von Blicken mit dem oder den Prüferkollegen, Kopfschütteln und Ähnliches. Ungleich besser ist es, einen neutralen Gesichtsausdruck zu wahren und von Zeit zu Zeit dem Prüfling ein wenig aufmunternd zuzulächeln.
  • Die schriftliche Dokumentation der Prüfung sollte kein Verlaufsprotokoll sein, denn dann können alle oben genannten Aspekte des diskreten Beisitzerverhaltens nicht erfüllt werden. Sie sollte vielmehr im Sinne eines Ergebnisprotokolls erstellt werden, in dem die wichtigsten positiven und negativen Ergebnisse der Prüfung vermerkt werden. Diese Reduktion des entstehenden Textes auf einige wenige Stichwörter gestattet die hier skizzierte diskrete Protokollführung in zufriedenstellender Form.

Auf der Basis der bisher zu diesem Themenkomplex angestellten Überlegungen kann die folgende Feststellung getroffen werden:


Wann immer der Versuch unternommen wird, in mündlichen Prüfungen
die (fremdsprachlichen) Leistungen von Prüflingen
durch eine entsprechende Dokumentation zu objektivieren,
ergeben sich potentiell mehr Probleme der Leistungsverfälschung
als Meriten der Leistungsobjektivierung.


Dieser Zusammenhang gilt:

  • in psychischer Hinsicht: Dann, wenn potentiell effiziente Dokumentationstechniken angewandt werden, besteht die Gefahr, dass der Prüfling unterhalb seines Leistungspotentials bleibt. In diesem Fall entspricht die von ihm erzielte Note nicht seinem intellektuellen Vermögen - die vergebene Note ist nicht zufriedenstellend zuverlässig;
  • in technischer Hinsicht: Wird auf die Dokumentation mündlicher Prüfungsleistungen verzichtet, kann der Prüfling sein Leistungspotential besser ausschöpfen, da er durch die eigentliche Prüfungsdokumentation nicht irritiert werden kann. In diesem Fall ist die Vergabe der Note jedoch kaum beweisbar - ihre Nachvollziehbarkeit ist nicht zuverlässig. Zudem sind die Prüfer juristisch angreifbar.

Dies bedeutet, dass mündliche Prüfungsleistungen kaum objektivierbar sind, unabhängig davon, ob sie in audio(visueller) Weise aufgezeichnet oder schriftlich dokumentiert werden. Diese Gesichtspunkte sollten unbedingt im Blick behalten werden, wenn es darum geht, die Frage der Video- oder Audioaufzeichnung in der konkreten Prüfungspraxis zu entscheiden.

In dieser prinzipiell unbefriedigenden Situation ist es für Prüfer von entscheidender Bedeutung, sich auf ihre Bewertungsintuition zu verlassen und - wenn vorhanden - auf ihre Bewertungserfahrung zurückzugreifen. Dabei sollten sie sich in der Prüfungssituation permanent Fragen wie die folgenden vergegenwärtigen:

  • Wie erfolgreich und wie authentisch erfolgt die Kommunikation mit dem Prüfling in der Fremdsprache?
  • Wie erfolgreich wäre das in der Prüfung gezeigte Verhalten in Kommunikationssituationen im Land oder in den Ländern der Zielsprache?
  • Wie ist - in mündlichen Prüfungen in den modernen Philologien  - das Sachwissen des Prüflings über Linguistik, Literaturwissenschaft und / oder Fachdidaktik einzustufen?
  • Sind einzelne sachliche oder sprachliche Fehler derart gravierend, dass der Gesamteindruck der Prüfung nachhaltig negativ beeinflusst wird?

Die Bewertung von einzelnen Fehlern und deren Schwere ist für die Bewertung mündlicher Prüfungsleistungen aus den aufgezeigten Gründen zum einen kaum leistbar und zum anderen nahezu irrelevant. Daher können in diesen Bereichen realistisch lediglich Näherungswerte - Tendenzen - ermittelt werden:

  • Tendenzen der allgemeinen Kommunikationsfähigkeit,
  • Tendenzen der Fehlerhäufung allgemein und in bestimmten, besonders auffälligen Bereichen,
  • Tendenzen des präsentierten Sachwissens und dessen intellektuelle Tiefe - soweit dies für die Bewertung relevant ist.

Für Prüfer ist es von Bedeutung, sich die hier aufgezeigten Zusammenhänge zu vergegenwärtigen. Sie sollten erkennen, dass sie sich in einer prinzipiell unbefriedigenden Bewertungssituation befinden, und das Ausmaß dieser  einschätzen können. Der nächste Schritt besteht dann darin, diese - prinzipiell kaum veränderbare - Situation als solche zu akzeptieren und sie prüfungsdidaktisch so gut wie möglich in die Praxis umzusetzen.

Dabei bedeutet die Notwendigkeit, sich als Prüfer auf die eigene Bewertungserfahrung und die eigene Bewertungsintuition zu verlassen, nicht, vor der Situation zu kapitulieren. Dies bedeutet ebenfalls nicht, dass auf diese Weise tendenziell solche Noten vergeben werden, die als ungerecht eingestuft werden können oder die den Leistungsstand des Prüflings nicht zuverlässig reflektieren. Dies bedeutet lediglich, zu der Einsicht zu gelangen, dass die geschilderte Bewertungssituation grundsätzlich nicht objektivierbar ist.

Auch in einer Situation, in der es mehr oder minder unmöglich ist, eine exakte Bewertung sprachlicher Fehler in Form quantifizierbarer Methoden, beispielsweise eines Fehlerquotienten, vorzunehmen, ist es dennoch möglich, das Sprachverhalten des Prüflings im Sinne der Kategorie Sprachliche Korrektheit zu bewerten, jedoch nicht mit befriedigender statistischer Genauigkeit, sondern lediglich tendenziell. Auf diesen Gesichtspunkt soll im Folgenden eingegangen werden.


7.3.4  Das Kriterium Sprachliche Korrektheit 

Dem Kriterium Sprachliche Korrektheit (vgl. auch Tinnefeld 2002: 113) kommt im Rahmen der Bewertung mündlicher Fremdsprachenleistungen die größte Bedeutung zu. Es wird daher hier mit einem Anteil von 40 % an der Gesamtnote der mündlichen Prüfung belegt. Von Bedeutung ist in diesem Zusammenhang, dass die Fehlerhaftigkeit der Äußerungen der Prüflinge innerhalb dieses Ansatzes mit weniger als der Hälfte der Gesamtnote gewertet wird. Dies geschieht mit Absicht, da dieser negative Aspekt nicht nur nicht die Oberhand in der Bewertung gewinnen sollte, sondern ihm bei einem Anteil von weniger als 50 % nicht zuletzt eine symbolische Beschränkung zuteil wird. Zusammen mit dem ebenfalls normativen Zusatzkriterium Aussprache (vgl. Kap. 7.2.5.3), das einen Anteil von 10 % ausmacht, umfassen diejenigen Bewertungskriterien, bei denen auf einem gedachten Kontinuum erwartbarer Leistungen gemeinhin von einem Optimalzustand ausgegangen werden kann[10] - Fehlerfreiheit einerseits und muttersprachliche Aussprache andererseits - insgesamt nicht mehr als die Hälfte der Gesamtnote.

Angesichts der beschriebenen, grundsätzlichen Bewertungsproblematik mündlicher Fremdsprachenprüfungen kann es an dieser Stelle nicht darum gehen, dezidierte Fehlerbereiche auszuweisen und diese mit detaillierten Gewichtungsempfehlungen zu versehen, wie wir dies für den Bereich der Schreibfertigkeit tun werden (vgl. Kap. 7.4).

Da es zudem nicht möglich ist, die Norm der Schriftsprache unproblematisch auf die gesprochene Sprache zu übertragen (vgl. Kap. 7.3.1), wäre die Konsultation von Grammatiken des gesprochenen Englisch, Französisch und Spanisch hilfreich. Das Problem ist jedoch, dass gegenwärtig keine zu diesem Zwecke brauchbare Grammatik zu diesen drei - in Deutschland gängigsten - Fremdsprachen existiert, die hinreichend aktuell wäre, um zuverlässige Bewertungsinformationen bereitzustellen. Dies bedeutet, dass trotz der grundsätzlichen Problematik, die mit diesem Vorgehen verbunden ist, von gängigen Schulgrammatiken ausgegangen werden und in diesen entweder nach auffindbaren Hinweisen zu der gesprochenen Varietät der jeweiligen Fremdsprache gesucht werden muss oder die dort gegebenen allgemeinen Aussagen in relativ hoher Toleranzbreite ausgelegt werden sollten, um zu einer realistischen Bewertungspraxis zu gelangen.

Für Prüfer, die längere Zeit in einem Land der jeweiligen Zielsprache verbracht haben, dürften sich hier keine großen Probleme ergeben: Sie kennen die für das gesprochene Register der jeweiligen Sprache zugrunde zu legenden Normen, auf der Basis derer sie die mündlichen Fremdsprachenleistungen ihrer Prüflinge zu bewerten haben. Für solche Prüfer hingegen, die über diese Spracherfahrung nicht verfügen, ergibt sich hier jedoch in der Tat ein Problem. Für sie gilt, dass sie entweder in regelmäßigen Abständen Zeit in einem Land der jeweiligen Zielsprache verbringen oder, wenn dies nicht möglich ist, sich intensiv mit der oralen Mediensprache - insbesondere denjenigen Sprachvarietäten, die in Fernsehen oder Radio verwendet werden - auseinandersetzen sollten. Sofern sie sich dort nicht nur auf die Nachrichtensprache konzentrieren, sondern auch informellere Programme verfolgen, bekommen sie ein Gefühl für die jeweils aktuelle gesprochensprachliche Norm.

Eine andere Möglichkeit besteht darin, regelmäßig Internetforen zu unterschiedlichen Thematiken zu verfolgen: Die dort verwendete, schriftlich fixierte Sprache weist eine große Nähe zu der jeweiligen oralen Norm dieser Sprache auf, so dass auch auf diesem Wege bei Prüfern ein Sprachgefühl entsteht, das auf die Bewertung der mündlichen Fertigkeiten seiner Prüflinge übertragbar ist.

Wenn die hier gegebenen Empfehlungen auch keine optimale Lösung darstellen, sind sie dennoch von prinzipieller Hilfe in der sich stellenden Situation: Sie ermöglichen es trotz der dargestellten Probleme, die fremdsprachlichen Leistungen von Prüflingen relativ zuverlässig zu bewerten.

Von erheblicher Hilfe kann auch der intensive Austausch mit Kollegen sein: Deren Einschätzung mit der jeweils eigenen zu vergleichen, führt im Allgemeinen zu einer relativierten Interpretation der eigenen Position und somit nicht selten auch zu einer gemäßigten Bewertung, der ihrerseits eine recht hohe Wahrscheinlichkeit auf Zuverlässigkeit inhärent ist.

Die regelmäßige Lektüre linguistischer Literatur zur gesprochen Ausprägung der zu prüfenden Fremdsprache könnte das autodidaktische Programm der Prüfer abrunden und somit die Zuverlässigkeit ihrer Bewertung weiter erhöhen. 

Unsere Ausführungen lassen deutlich werden, was zwar prüfungsdidaktisch allgemeingültig und theoretisch evident, in der Praxis jedoch keineswegs selbstverständlich ist:


Ein guter Prüfer ist immer auch ein informierter Prüfer,
der sich ständig auf dem Laufenden hält und die aktuelle wissenschaftliche 
Diskussion zu der von ihm vertretenen Fremdsprache verfolgt.


Die Bewertungsobjektivität der Kategorie Sprachliche Korrektheit kann insgesamt - trotz aller beschriebenen Anstrengungen von Prüfern - nicht zufriedenstellen, solange nicht zu der jeweiligen geprüften Fremdsprache zumindest eine gesprochensprachliche Grammatik existiert, die alle fünf Jahre neu aufgelegt wird und die den jeweils aktuellen Sprachstand, dessen Halbwertzeit in der gesprochensprachlichen Norm ja sehr kurz ist, widerspiegelt.

Stellt man der Kategorie Sprachliche Korrektheit jedoch noch andere Zusatzkriterien zur Seite, so erhöht sich die Bewertungsobjektivität dadurch erheblich: Der Gesamteindruck der sprachlichen Leistung wird dann nicht auf das negative Phänomen Fehler reduziert, sondern durch zwei grundsätzlich positiv angelegte Zusatzkriterien – Ausdrucksvermögen (vgl. Kap. 7.3.5.1) und Redefluss (vgl. Kap. 7.3.5.2) - ergänzt. Dieser Ansatz wird hier als wünschenswerte Bewertungsgrundlage für mündliche Fremdsprachenprüfungen beschrieben.


7.3.5 Zusatzkriterien der Bewertung: Ausdrucksvermögen, Redefluss und Aussprache (60%)

Die zu der Sprachlichen Korrektheit hinzutretenden Zusatzkriterien AusdrucksvermögenRedefluss und Aussprache (vgl. hierzu auch Tinnefeld 2002: 113ff) sind in prüfungsdidaktischer Hinsicht im Rahmen der mündlichen Fehlerbewertung funktionsidentisch mit den Kriterien Ausdrucksvermögen (vgl. Kap. 7.4.5.1) und Inhaltliche Gestaltung (vgl. Kap. 7.4.5.2) im Rahmen der schriftlichen Fehlerbewertung: Sie mildern die Note der Sprachlichen Korrektheit ab und bereichern das Bewertungsspektrum, um auf diese Weise die Leistung des Prüflings ganzheitlich abzubilden. Im Folgenden wird auf diese drei Zusatzkriterien mündlicher Fremdsprachenprüfungen eingegangen.


7.3.5.1 Ausdrucksvermögen

Das Bewertungskriterium Ausdrucksvermögen, das 25 % der Gesamtnote der mündlichen Prüfung ausmacht, kann als Gesamtheit mehrerer Gesichtspunkte beschrieben werden, auf die nachfolgend detaillierter eingegangen wird - mit dem Ziel der inhaltlichen Konkretisierung dieses recht vagen Begriffs, um Prüfern die eigentliche Bewertungsarbeit zu erleichtern (vgl. hierzu auch Tinnefeld 2002: 114ff). Diese Gesichtspunkte sind im Sinne einer Faktorenkomplexion zu verstehen, konkretisieren die Korrekturarbeit des Prüfers und führen sie dadurch einer erhöhten Zuverlässigkeit zu, weil sie - wenn sie als Orientierungsgröße herangezogen werden - zu einer überindividuell gültigen Bewertung dieses Kriteriums führen können.

Im Einzelnen handelt es sich um die folgenden Faktoren:
·        Eleganz des Ausdrucks
·        Reaktion auf Fragen
·        Gesprochensprachliche Authentizität
·        Aufbau der Rede
·        Signalisieren eigenen Interesses am Thema
·        Prüfungssteuerndes Verhalten  und
·        Dynamik im Ausdruck


7.3.5.1.1 Eleganz des Ausdrucks

Der Faktor Eleganz des Ausdrucks stellt eine Art Sammelbecken dar für die Verwendung solcher Ausdrücke und Konstruktionen durch den Prüfling, die auf dessen gute Beherrschung der Fremdsprache verweisen. Hierzu zählen sowohl die Kenntnis kontextuell relevanter Einzelvokabeln - beispielsweise Fachtermini - als auch die Verwendung längerer Einheiten wie komplexer Syntagmen oder für die jeweilige Fremdsprache typischer Kollokationen. Ebenso eingeschlossen ist die korrekte Verwendung der fortgeschrittenen Grammatik, wie beispielsweise der Partizipialkonstruktionen oder des Subjunktivs in den romanischen Sprachen.

Eine gehäufte Verwendung entsprechender Konstruktionen sollte nachhaltig positiv bewertet werden. Fehlen solche Strukturen, die auf eine elegante Verwendung der Fremdsprache verweisen, gänzlich, so sollte dieser Einzelfaktor lediglich mit der Note befriedigend bewertet werden.


7.3.5.1.2 Reaktion auf Fragen

Im vorliegenden Zusammenhang stehen die Art und Weise, in der der Prüfling auf den oder die Prüfer eingeht, die Strategien, die er einsetzt, und die Sprachmittel, die er verwendet, im Mittelpunkt. Wenn er beispielsweise in leicht abgewandelter Form das Vokabular benutzt, das der Prüfer in seiner Frage verwendet hat, so zeigt dieses sprachliche Verhalten, dass der Prüfling die gestellte Frage verstanden hat und darum bemüht ist, eine gewisse Kohärenz zwischen der Frage und seiner eigenen Antwort aufzubauen. Nur dann, wenn beide Gesprächspartner auf der gleichen kommunikativen Ebene agieren, kann sich ein wirklicher Dialog entwickeln. Nur dann entfernt man sich von einem reinen Frage-Antwort-Spiel, das im Vergleich zum Dialog gemeinhin als qualitativ weniger anspruchsvoll angesehen wird (vgl. Kap. 4.3.4.5). Diese Dialogfähigkeit des Prüflings stellt ein wichtiges Kriterium für seine Leistung in einer mündlichen Prüfung dar: Sie veranschaulicht, wie spontan er mit der Fremdsprache umzugehen imstande ist.

Ein Verhalten des Prüflings, das auf die beschriebene Dialogfähigkeit verweist, sollte mit der Bestnote - in minder deutlicher Ausprägung mit der zweitbesten Note - bewertet werden. Ist dieser Faktor nicht hinreichend erfüllt, sollte die ermittelte Note nicht über einem Befriedigend liegen.


7.3.5.1.3 Gesprochensprachliche Authentizität

Dieser Bewertungsfaktor, der sich auf die Berücksichtigung von für die gesprochene Sprache relevanten Strukturen bezieht (vgl. hierzu auch Söll 1985), lässt sich in die folgenden Ausprägungen untergliedern:
· Hesitationsphänomene
· Abtönungspartikeln
· Gesprochensprachlich adäquate quantitative Repräsentationen einzelner Konstruktionen
· Beherrschung der jeweiligen, in der gesprochenen Sprache präferierten Konkurrenzkonstruktionen und
· Dialogunterstützende Konstruktionen

Auf diese soll im Folgenden eingegangen werden.


a)  Hesitationsphänomene

Hesitationsphänomene sind - auf das Deutsche bezogen - beispielsweise solche Elemente wie Leerstellen im Diskurs, aber auch Interjektionen wie ähoh oder nun ja sowie gefüllte Pausen im Allgemeinen. Da Hesitationsphänomene für gesprochene Sprache typisch und in muttersprachlicher Kommunikation mehr oder minder unvermeidbar sind, erlauben sie - wenn dort in authentischer Form angewandt - wichtige Aussagen über den Grad der Beherrschung einer Fremdsprache. In mündlichen Fremdsprachenprüfungen stellen sie somit nicht nur kein negativ zu sanktionierendes Element dar, sondern können ganz im Gegenteil einen Qualitätsausweis für die Sprachbeherrschung des Prüflings und die Authentizität, mit der er die Fremdsprache verwendet, darstellen.


b)  Abtönungspartikeln

Der Eindruck von Authentizität wird ebenfalls durch den Gebrauch von Abtönungspartikeln gefördert. Somit stellt auch ihre Okkurrenz ein Indiz für die Qualität gesprochensprachlicher Äußerungen dar. Funktional dienen Abtönungspartikeln der Relativierung von Aussagen, indem sie ihnen die potentiell missverständliche Direktheit nehmen oder den Aufbau von Distanz zum Gesagten ermöglichen. Der Verdeutlichung dieser Zusammenhänge möge je ein Beispiel aus dem Deutschen, Englischen und Französischen dienen:
  • Angenommen, in einem Gespräch zwischen Vorgesetztem und Untergebenem lässt Letzterer Wissenslücken hinsichtlich einer Sachlage erkennen. Der Vorgesetzte möchte ihn darauf hinweisen. Nun wird er jedoch beispielsweise nicht einen Satz sagen wie: Dann informieren Sie sich darüber. Er wird vielmehr eine Konstruktion bevorzugen wie Dann informieren Sie sich doch mal darüber. Die Abtönungspartikeln doch und mal - hier in Kombination miteinander verwendet - haben dann Appellfunktion und unterstreichen die Aussage des Sprechers sowie seine Autorität.
  • In einem englischen Dialog wird ein Sprecher die Tatsache, dass eine Aufgabe schwierig zu bewältigen ist, weniger mit Hilfe des Satzes That’s difficult ausdrücken als vielmehr mittels einer Äußerung wie That’s sort of difficult. Auch die Abtönungspartikel sort of - oder alternativ kind of - verweist auf eine gewisse Distanz des Sprechers zum Gesagten und relativiert sein eigenes Unwissen.
  • Im Französischen wird man dann, wenn man auf einen Brauch oder eine gewisse Gewohnheit verweist, die überall üblich ist, nicht sagen Ça se fait partout, sondern vielmehr Ça se fait un peu partout. Im Unterschied zum geschriebenen Französisch heißt überall im gesprochenen Französisch nicht partout, sondern vielmehr un peu partout. Auch hier liegt die Funktion der Abtönungspartikel un peu darin, die Aussage - bzw. das Ortsadverb partout - zu relativieren.

c) Gesprochensprachlich adäquate quantitative Repräsentationen einzelner Konstruktionen

Ein weiterer Faktor, der zu der Bewertung der fremdsprachlichen Ausdrucksfähigkeit gehört, ist in der adäquaten Distribution einzelner sprachlicher Mittel zu sehen, die von Muttersprachlern in annähernd ähnlicher Frequenz realisiert werden. Zwar ist dieses Phänomen in mündlichen Fremdsprachenprüfungen nicht statistisch untermauerbar, sondern dem subjektiven Eindruck der Prüfer unterworfen. Dennoch sollte es, so es von Prüflingen adäquat realisiert wird, mit einem Bonus in der Leistungsbewertung verknüpft werden, da gerade dieses Phänomen von Nichtmuttersprachlern sehr schwer zu realisieren ist und im Allgemeinen - wenn überhaupt - erst nach einem längeren Auslandsaufenthalt erworben wird. Prüfer sollten somit auf die jeweils adäquate Repräsentation solcher Konstruktionen achten wie des Passivs, der Partizipialkonstruktionen, des Gerundivs oder auch des Subjunktivs (in den romanischen Sprachen).


d)  Beherrschung der jeweiligen, in der gesprochenen Sprache präferierten Konkurrenzkonstruktionen

In Abhängigkeit von dem jeweils verwendeten Register - und hier haben wir die gesprochene im Vergleich zur geschriebenen Sprache im Blick - existieren Sprachformen, die von einzelnen Lexemen über grammatische Konstruktionen bis hin zu (nicht selten formelhaften) Satzmustern reichen und die in der gesprochenen Sprache anders realisiert werden als in der geschriebenen. Solche Konstruktionen adäquat in der gesprochenen Fremdsprache zu verwenden, also abschätzen zu können, welche von ihnen eher zur gesprochenen und welche eher zur geschriebenen Sprache tendieren, stellt eine wichtige Fähigkeit dar. Diese sollte unbedingt in die Leistungsbewertung mündlicher Prüfungen einfließen. Exemplarisch kann in diesem Zusammenhang auf der Ebene der grammatischen Konstruktionen die jeweils präferierte gesprochensprachliche Realisierung des Passivs genannt werden: als verallgemeinertes you + aktivisches Verb im Englischen, als on + aktivisches Verb im Französischen und als se + aktivisches Verb im Spanischen. Nicht zuletzt durch ihre adäquate Auswahl in diesem Bereich lassen Prüflinge die Qualität und Ausprägung ihres Sprachgefühls erkennen.


e)  Dialogunterstützende Konstruktionen

Als letzten Gesichtspunkt im Rahmen der Einbeziehung gesprochensprachlicher Authentizität in die Bewertung mündlicher Prüfungsleistungen sei der Gebrauch dialogunterstützender Konstruktionen angeführt. Dies sind beispielsweise appellative Konstruktionen wie im Deutschen die antwortheischende Frage Finden Sie nicht auch?, im Englischen What do you think?, im Französischen der Zusatz ...si vou voyez ce que je veux dire oder im Spanischen ¿Qué piensa usted?. Ebenso können Schlusssignale wie nicht wahr?isn’t it?n’est-ce pas? oder ¿no? angeführt werden. Die Verwendung solcher Gliederungssignale der mündlichen Rede stellt einen wichtigen Aspekt der Beherrschung einer Fremdsprache dar. Wenn ihr Fehlen auch nicht negativ sanktioniert werden sollte, sollte ihr Vorhandensein in den mündlichen Ausführungen eines Prüflings unbedingt positiv bewertet werden, da hier ein wichtiges Kriterium lebendiger und wohlmodulierter Sprachverwendung erfüllt ist.

Die Realisierung der hier beschriebenen Sprachphänomene durch den Prüfling sollte mit der Bestnote belegt werden. Vermag er nicht, diese adäquat zu produzieren, so sollte dies in der Bewertung jedoch nur mäßige Sanktionen nach sich ziehen, etwa dergestalt, dass die ermittelte Gesamtnote um eine Notenstufe - also beispielsweise von einem ‚Gut’ (2,0) auf ein ‚Gut (minus)[11]’ (2,3) - herabgestuft wird.


7.3.5.1.4      Aufbau der Rede  

Der Faktor Aufbau der Rede umfasst in mündlichen Fremdsprachenprüfungen mehrere Einzelfaktoren, und zwar
  • Logische Satzverknüpfung
  • Strukturiertheit der Aussage
  • Signalisieren eigenen Interesses am Thema
  • Prüfungssteuerndes Verhalten und
  • Dynamik im Ausdruck
Diese sind  im Folgenden kurz zu beschreiben.          


a)  Logische Satzverknüpfung

Nicht nur bei der Erstellung schriftlicher Texte, sondern auch in Planung und Realisierung mündlicher Rede stellen logische Satzverknüpfungen ein relevantes Element der Sprachbeherrschung dar. Auch in der gesprochenen Sprache sind Sätze nicht als Einzelphänomene zu betrachten, sondern sie sind zu einer Textur verwoben, also mit anderen Sätzen ineinander verschränkt. Diese Textur wird durch kataphorische (vorverweisende) und anaphorische (rückverweisende) Elemente realisiert. Erst durch diese Elemente entsteht ein Text. Im Deutschen lassen sich als Satzverknüpfungen dieser Art Ausdrücke benennen wie deshalbdeswegenalsofolglichsomitwie schon erwähntwie gesagt. Im Englischen sind dies beispielsweise Ausdrücke wie therefore, for this reason, so, thus, as (has been) mentioned before, as aforementioned, für das Französische sind zu nennen: c’est pourquoic’est pour cela quedoncpar conséquentc’est pourquoipour cette raison, oder auch comme je l’ai déjà dit. Für das Spanische schließlich seien hier genannt: así, por lo tanto, en consecuencia, por eso, por esta razón  oder auch tal como ha sido mencionado. Die Fähigkeit der adäquaten Verwendung solcher und ähnlicher Konstruktionen der logischen Satzverknüpfung sollte in mündlichen Prüfungen positiv bewertet werden. Sie können im Rahmen der Gesamtbewertung der Leistungen eines Prüflings in funktionaler Weise fehlerkompensierend wirken.


b)  Strukturiertheit der Aussage

Der vorliegende Faktor bezieht sich auf die inhaltliche Strukturiertheit der Aussagen des Prüflings. Er kann sowohl auf referatsähnliche Prüfungsteile angewandt werden als auch auf Antworten des Prüflings auf Prüferfragen. Bewertungskriterium ist hier, ob die Aussagen des Prüflings inhaltlich in adäquater hierarchischer Form gegliedert sind oder ob er inhaltlich unübersichtlich oder diffus argumentiert. Eine geordnete Struktur der dargestellten Inhalte ist für deren Qualität von erheblicher Bedeutung und bedarf der Mitberücksichtigung in der Gesamtnote. Daher sollte eine Nichtbeachtung dieses Faktors durch den Prüfling mit negativen Sanktionen in der Bewertung einhergehen: Es handelt sich hier um einen zwingend relevanten Aspekt mündlicher Darstellung.


c)  Signalisieren eigenen Interesses am Thema

Für den Ablauf einer mündlichen Prüfung ist es von entscheidender Bedeutung, dass der Prüfling Interesse an seinem Prüfungsthema hat oder dieses zumindest vorgibt. Es muss dieses Interesse nicht von Grund auf haben, aber er sollte seine(n) Prüfer zumindest glauben machen, dass es existiert: Es kann prinzipiell von der Tendenz ausgegangen werden, dass solche Prüfungen, in denen der Prüfling ein gewisses Gelangweiltsein ausstrahlt, ungleich schlechter verlaufen als solche, in denen er persönliches Interesse bekundet, in denen er persönliches Engagement an den diskutierten Fragen zeigt. Eine solche, positive Einstellung schuldet ein Prüfling nicht zuletzt dem Respekt vor seinen Prüfern. Weist er eine solche Einstellung nicht auf, so sollte dies in erheblichem Maße negativ sanktioniert werden, denn mit einer solchen Einstellung wird der Prüfling nicht in der Lage sein, in seinem späteren Berufsleben zu bestehen. Zudem sollte im Anschluss an die Prüfung mit ihm ein Gespräch über sein Verhalten geführt werden, um ihm deutlich zu machen, dass er unbedingt auf eine Veränderung seines Umgangs mit mündlichen Prüfungen hinarbeiten sollte.  


d)  Prüfungssteuerndes Verhalten

Bei diesem Faktor geht es um die Frage, ob der Prüfling in der Lage ist, die Prüfung in seinem Sinne - und gegebenenfalls auch zu seinen Gunsten - zu steuern. Wenn dies der Fall ist, dann gelingt es ihm, die Dialogsituation als solche aufrechtzuerhalten und darüber hinaus auf andere thematische Gesichtspunkte oder Fragestellungen überzuleiten, deren Berücksichtigung ihm wünschenswert erscheint. Dies kann durch eine geschickte Mischung von appellativem, kommentierendem und illustrierendem Verhalten geschehen, das die Prüfer dazu bringt, ihm zu folgen. Hier wird zugegebenermaßen ein recht hoher Anspruch formuliert. Es kommen hier zudem Aspekte ins Spiel, die über rein sprachliche Phänomene hinausgehen und in direkter Linie den Charakter und die Persönlichkeit des Prüflings betreffen. Gelingt einem Prüfling jedoch das hier beschriebene Verhalten, so zeigt er damit eine hohe persönliche und nicht zuletzt akademische Reife. Diese sollte in Form einer positiven Sanktion in die Gesamtbewertung der Prüfung eingehen.


e)  Dynamik im Ausdruck

Der vorliegende Gesichtspunkt bezieht sich auf die Fähigkeit des Prüflings, in seinem mündlichen Vortrag oder auch in seinen Antworten auf gestellte Fragen einen Spannungsbogen herzustellen, über eine gewisse Zeit zu halten und dann logisch zu Ende zu führen, was sowohl inhaltliche Kenntnisse als auch sprachliche Fertigkeiten erfordert. Dabei geht dieser Gesichtspunkt beträchtlich über das Signalisieren eigenen Interesses am Thema (vgl. Punkt c) hinaus. Hier geht es um die Kombination von Interesse am Thema, fundierter Sachkenntnis, sprachlichen Fertigkeiten und kommunikativen Fähigkeiten des Prüflings. Erst die Kombination dieser ermöglicht ein Ergebnis wie das hier beschriebene, das die Gesamtqualität einer mündlichen Prüfung in entscheidender Form positiv beeinflussen kann. Prüflinge, die ein solches Verhalten an den Tag zu legen fähig sind, sollten mit einem entsprechenden Bonus in der Bewertung belohnt werden.

Insgesamt sollte der Bewertungsfaktor Aufbau der Rede natürlich positiv sanktioniert werden, wenn er mit einer guten Leistung erfüllt wird. Dies könnte in einem Umfang von bis zu zwei Notenstufen geschehen, also beispielsweise unter Aufwertung der Gesamtnote von einem Gut (minus) auf ein Gut (plus), also von 2,3 auf 1,7. Analog dazu sollte die Leistung jedoch negativ sanktioniert werden, wenn sie nicht oder nicht mit hinreichender Qualität erfüllt wird, da es sich hier - mit Ausnahme allenfalls des prüfungssteuernden Verhaltens - um fundamentale Leistungsgesichtspunkte mündlicher Prüfungen handelt.

Im Folgenden beschäftigen wir uns auf methodisch analoge Art und Weise mit dem Bewertungsfaktor Redefluss.


7.3.5.2 Redefluss  

Der Bewertungskriterium Redefluss (vgl. Tinnefeld 2002: 120ff), das 25 % der Gesamtnote und zusammen mit dem Kriterium Ausdrucksvermögen die Hälfte der Gesamtnote ausmacht, lässt sich in die folgenden Einzelaspekte untergliedern.

  • Bereitschaft zum Sprechen
  • Initiative im Gespräch
  • Überlegungsphasen
  • Spontaneität
  • Sprechgeschwindigkeit und
  • Ausführlichkeit der Antworten
Auf diese Kriterien soll im Folgenden kurz eingegangen werden.


7.3.5.2.1  Bereitschaft zum Sprechen

Bei diesem Gesichtspunkt geht es um die Fähigkeit und auch um den Willen des Prüflings, die Fremdsprache frei und offen zu verwenden. Es geht dabei nicht so sehr um die sprachlichen Fertigkeiten, sondern vielmehr um seinen Persönlichkeitstyp. Ein offener Persönlichkeitstyp wird sich in mündlichen Prüfungen auch dann spontan und ungezwungen äußern, wenn er viele Fehler macht und auch um dieses Problem weiß. Dagegen wird ein verschlossener Persönlichkeitstyp selbst dann nicht viel sagen, wenn er eine gute Sprachbeherrschung vorweisen kann. Natürlich gelangen solche Prüfungstypen, die ohne Hemmungen sprechen können, leichter zu guten Noten also solche, die wortkarg interagieren. Gerade Letztere stellen daher für die Bewertung ein grundsätzliches Problem dar. Das Dilemma, in dem Prüfer sich in solchen Fällen befinden, besteht darin, diese Prüflinge einfach schlechter zu bewerten als die freien und selbstbewussten Typen, was sicherlich die einfachste Lösung ist, jedoch bei weitem nicht die beste. Ein anderer Ansatz besteht darin, auch die stillen Prüflinge in ihrem persönlichen, intellektuellen und auch sprachlichen Wert zu erkennen und diesen Wert entsprechend in der Bewertung zu würdigen. Wir sprechen uns hier für den letztgenannten Ansatz aus. Von Prüfern wird dabei die Fähigkeit gefordert zu erkennen, in welchen Fällen sie es mit einem Prüfling zu tun haben, der im Grunde hohe Fähigkeiten und Fertigkeiten besitzt, diese jedoch nicht adäquat zur Schau stellen kann. Solche Studierenden sollten ob ihres Verhaltens nicht negativ bewertet werden. Von den Prüfern sollte in solchen Fällen vielmehr der Inhalt dessen bewertet werden, was sie sagen als die Menge dessen, was sie nicht sagen. Diese Prüflinge setzen in ihrer eigenen Wertedefinition Qualität vor Quantität. Diesen persönlichen Ansatz dieser Prüflinge sollten die Prüfer zu erkennen in der Lage sein und ihn entsprechend bewerten.


7.3.5.2.2 Initiative im Gespräch

Der vorliegende Gesichtspunkt scheint auf den ersten Blick eng mit dem vorhergehenden verbunden zu sein, ist jedoch durchaus unterschiedlich. Während es soeben um die generelle Bereitschaft zum Sprechen allgemein ging, steht hier ein Verhaltensmerkmal im Mittelpunkt, das sich auf die Fähigkeit zu partieller Antizipation des Prüferverhaltens bezieht und somit darauf, auf logisch aus dem Prüfungsgespräch entwickelbare Zusatzaspekte einzugehen und Fragen zu beantworten, die der Prüfer noch nicht gestellt hat.

Die Fähigkeit der Antizipation von Gesprächsabläufen hängt neben der (emotionalen) Intelligenz der Prüflinge in starkem Maße von deren Beherrschung der geprüften Fremdsprache ab: Prüflinge, die die Fremdsprache gut beherrschen, übernehmen im Gespräch im Allgemeinen eher die Initiative, da sie sich weniger auf die eigentliche fremdsprachliche Enkodierung zu konzentrieren brauchen und mehr Aufmerksamkeit auf den Gesprächsverlauf und die inhaltliche Seite des Prüfungsgesprächs legen können. Die hier beschriebene Fähigkeit sollte daher - so sie von Prüflingen an den Tag gelegt wird - , in der Bewertung positiv sanktioniert werden. Ihr Fehlen sollte dagegen nicht negativ bewertet werden.  


7.3.5.2.3 Überlegungsphasen  

Die Frage, ob ein Prüfling während des Prüfungsgesprächs übermäßig häufig und übermäßig lange überlegen muss, ist ebenfalls für die Bewertung seiner Leistung im Rahmen des Kriteriums Redefluss relevant. Solche Überlegungsphasen unterscheiden sich von den zuvor beschriebenen Hesitationsphänomenen (vgl. Kap. 7.3.5.1.3) dadurch, dass diese in natürlicher Form zu unmarkierter oraler Kommunikation gehören, was leicht daran erkennbar wird, dass sie bei Muttersprachlern zu beobachten sind und bei diesen den Normalfall der Kommunikation darstellen. Wie wir weiter oben beschrieben haben, sollte das Vorhandensein von Hesitationsphänomenen bei Fremdsprachenprüflingen somit also positiv bewertet werden.

Die hier im Mittelpunkt stehenden, frequenten und / oder langen Überlegungsphasen unterscheiden sich von den Hesitationsphänomenen dadurch, dass sie in ihrer Okkurrenz bei Nichtmuttersprachlern deutlich häufiger auftreten als bei Muttersprachlern. Ein augenfälliges Merkmal ihrer liegt darin, dass sie beispielsweise immer dann vorkommen, wenn nichtmuttersprachliche Sprecher ein Wort nicht wissen. Diese lexikalischen Einheiten sind im Allgemeinen andere als diejenigen, auf die Muttersprachler zufällig einmal im Gespräch nicht kommen. Muttersprachler versuchen erfahrungsgemäß zudem tendenziell, die entstehende Pause in irgendeiner Form zu füllen, während Nichtmuttersprachler tendenziell eher schweigen. Die Unterschiede zwischen Hesitationsphänomenen und Überlegungsphasen - so vermeintlich ähnlich sie in der Gesprächssituation auch erscheinen mögen - lassen sich somit in aller Regel auf Plausibilitätsebene mehr oder minder eindeutig voneinander unterscheiden: Häufige und lange Überlegungsphasen sind auf mangelnde Sprachbeherrschung zurückführbar und daher Indikator dafür, dass die Fremdsprache nicht zu fester Gewöhnung gebracht worden ist. Sie zeigen an, dass der Prüfling - zumindest stellenweise - nicht in der Lage ist, die Fremdsprache fließend zu sprechen. Solche Überlegungsphasen sollten daher in der Bewertung der Leistungen des Prüflings - besonders dann, wenn sie gehäuft auftreten - negativ sanktioniert werden.  


7.3.5.2.4 Spontaneität  

Den entgegengesetzten Pol zu den soeben behandelten Überlegungsphasen stellt auf einem gedachten Kontinuum der Faktor Spontaneität dar. Und dieser Faktor bedeutet ungleich mehr als die weiter oben behandelte Initiative im Gespräch (vgl. Punkt b). Spontaneität steht für die Fähigkeit eines Prüflings, unmittelbar und unverzüglich auf gestellte Fragen zu antworten. Die Zeit, die er - wie in der Muttersprache auch - dazu benötigt, über die gestellte Frage nachzudenken, füllt er bereits. Er spricht also bereits, während er den weiteren Verlauf seiner Antwort vorbereitet, und entwickelt diese Schritt für Schritt weiter - genau so, wie es ein Muttersprachler auch tut. In dieser Reflexionsphase ist er jedoch ständig sprachlich aktiv, denkt inhaltlich weiter und plant seinen gerade aktuellen Satz vor, artikuliert das gerade in dem Moment gesprochene Wort und behält das bereits Gesagte in Erinnerung. Dies bedeutet nichts Anderes, als dass dieser Prüfling sich in der Fremdsprache exakt in der gleichen Weise verhält wie in seiner Muttersprache oder wie ein Muttersprachler es in der Sprache, die für den Prüfling die Fremdsprache ist, ebenfalls tut. In einem solchen Fall wird die Klimax oraler fremdsprachlicher Leistungsfähigkeit erreicht.

Spontaneität bedeutet des Weiteren, dass der Prüfling auf Zwischenfragen, Denkanstöße oder Einwürfe der Prüfer unmittelbar zu reagieren vermag und somit die Dynamik des Prüfungsgesprächs funktional unterstützt. Diese Art von Verhalten kann nicht von Prüflingen realisiert werden, die eine Fremdsprache nicht wirklich gut beherrschen. Sie repräsentiert in aller Regel eine Kombination sehr guten fremdsprachlichen Wissens mit einem erheblichen Sprachkönnen. Wird die beschriebene Art von Spontaneität von Prüflingen an den Tag gelegt, sollte sich dies in der Bewertung durch einen erheblichen notensteigernden Effekt bemerkbar machen.


7.3.5.2.5 Sprechgeschwindigkeit

Der Faktor Sprechgeschwindigkeit bezieht sich auf die Frage, ob der Prüfling dazu fähig ist, die Fremdsprache auf der Basis seiner phonetischen Fertigkeiten und der Reproduktionsgeschwindigkeit seines mentalen Lexikons in einem adäquaten nahezu muttersprachlichen Tempo zu verwenden.

Eine Fremdsprache relativ schnell sprechen zu können, hängt unter rein technischen Gesichtspunkten zunächst von den Fertigkeiten des Sprechers ab, die für die Fremdsprache relevanten Phoneme - idealerweise, jedoch nicht notwendigerweise, bis hin zu der Ebene der Allophone - rasch formen und ohne nennenswerte Stockungen produzieren zu können. Zur Erreichung dieser Fertigkeit bedarf es eines intensiven Trainings in dieser Fremdsprache sowie langjährigen Übens.

Zudem ist es von Bedeutung, über eine Reproduktionsgeschwindigkeit des fremdsprachlichen Vokabulars zu verfügen, die einen regelmäßigen Sprechrhythmus ermöglicht, also die Fähigkeit, beim Sprechen nicht ständig absetzen zu müssen, um die eigenen Worte zu finden. Auch diese Fertigkeit setzt langjährige Praxis in der entsprechenden Fremdsprache voraus.

Angesichts dieser Zusammenhänge ist ein langsames, aber rhythmisches Sprechen, dass stetig ist und nicht nennenswert unterbrochen wird, als höherwertig einzustufen als ein gezwungen schnelles Sprechen, das immer wieder durch Stockungen des Sprachflusses unterbrochen wird. Das Optimum dieses Kontinuums stellt die authentische Sprechgeschwindigkeit des Muttersprachlers dar, die jedoch nicht als Bewertungsmaßstab zugrunde gelegt werden sollte. Erreicht ein Prüfling diese, so sollte dies jedoch durch einen erheblichen Bonus in der Notenvergabe honoriert werden.  


7.3.5.2.6      Ausführlichkeit der Antworten 

Schließlich ist die Ausführlichkeit der vom Prüfling gegebenen Antworten ein für das Kriterium Redefluss bewertungsrelevanter Gesichtspunkt, da sie in direkter Linie auf die Qualität der Sprachbeherrschung verweist. Ein Prüfling, der die Fremdsprache gut beherrscht, neigt eher zu ausführlichen Antworten als einer, der die Fremdsprache weniger gut spricht. Ein solcher Prüfling wird eher versuchen, seine Antworten kurz zu halten. Wenn also keine in der Persönlichkeit des Prüflings liegenden Argumente gegen einen solchen Zusammenhang sprechen (vgl. die Punkte a und b in diesem Abschnitt), dann sollte die Ausführlichkeit der Antworten als Bewertungskriterium herangezogen werden, und zwar in der Weise, dass sie sowohl positiv als auch negativ sanktioniert wird, was jeweils im Rahmen von bis zu zwei Notenstufen geschehen sollte.

Diese Gesichtspunkte sollten dazu dienen, das Bewertungskriterium Redefluss greifbarer zu machen. Wie dies allgemein für die vorliegende Monographie gilt, wird hier nicht auf Vollständigkeit abgezielt: Die angestellten Überlegungen sollen lediglich Anregungscharakter haben und Prüfern aufzeigen, auf welche Weise Kriterien wie die hier beschriebenen festgelegt und weitergehend operationalisiert werden können. Fremdsprachenprüfer sollen durch die hier vorgelegten Reflexionen dazu angeregt werden, sich selbst Gedanken zu machen und auf der Basis ihrer eigenen Prüfungserfahrung gegebenenfalls Bewertungskriterien zu entwickeln, die für die von ihnen abgenommenen Prüfungen relevant sind und sie in ihrer Bewertung objektiver und zuverlässiger gestalten. Auch hierin - in der Hilfe zur Selbsthilfe - liegt ein grundlegendes Prinzip der Prüfungsdidaktik.

In diesem Sinne widmen wir uns nun dem noch verbleibenden Zusatzkriterium Aussprache.  


7.3.5.3 Aussprache

Das Bewertungskriterium Aussprache, das in unserem Modell 10 % der Gesamtnote mündlicher Fremdsprachenprüfungen ausmacht, lässt sich durch die folgenden Einzelfaktoren operationalisieren:
·        Phonematische Korrektheit
·        Korrektheit der Suprasegmentalia
·        Korrektheit der Satzwörter
·        Ausmaß der ausländischen Akzents
Diese sollen im Folgenden kurz beschrieben werden.


7.3.5.3.1      Phonematische Korrektheit

Die korrekte Realisation der Phoneme einer Sprache ist in produktiver Hinsicht unabdingbar für eine adäquate Sprachbeherrschung (vgl auch Tinnefeld 2002: 123f). Die korrekte orale Produktion dieser kleinsten bedeutungsunterscheidenden Merkmale einer Sprache ist in rezeptiver Hinsicht von entscheidender Bedeutung für die Verständlichkeit von Äußerungen. Bereits die Nichtbeherrschung einer geringen Anzahl der Phoneme einer Fremdsprache kann zu einem erheblichen Verlust an Verständlichkeit führen und somit den Kommunikationserfolg gefährden. Die korrekte Realisierung der Phoneme der geprüften Fremdsprache sollte daher auf jeden Fall mitbewertet werden. Ist sie gegeben, so sollte die Leistung in dieser Kategorie mindestens mit der Note „gut“ belohnt werden.

In einem weiteren Schritt - der jedoch von der Mehrzahl der Prüflinge in aller Regel nicht erreicht wird, weil er in der Aussprache ein nahezu muttersprachliches Leistungsniveau voraussetzt - besteht in der Beherrschung der Allophone, also der Varianten der Phoneme. Als Beispiele für Allophone können im Deutschen das lange /o/ in geschlossener (Standard) und offener Realisierung / ɔ/ gelten (z.B. in Obst), im Englischen das kurze /ʌ/, das im britischen Englisch in dialektaler Ausprägung von einem kurzen /ø/ bis zu einem kurzen /u/ reichen kann (z.B. in love), im Französischen das a antérieur und das a postérieur (z.B. in pas) und schließlich im Spanischen das /b/, das am Wortanfang als stimmhafter Plosiv und im Wortinnern als Reibelaut /β/ realisiert wird. Zwar gilt nicht für alle Allophone, dass sie in dem von nichtmuttersprachlichen Prüflingen auf keinen Fall zu verlangenden dialektalen Bereich anzusiedeln sind - dennoch sollte die Beherrschung der Allophone einer Sprache in mündlichen Fremdsprachenprüfungen nicht erwartet werden. Sollte es hingegen Prüflinge geben, deren Aussprache in der geprüften Fremdsprache so gut ist, dass sie einige für diese relevante Allophone korrekt zu realisieren imstande sind, sollte dieses Können durch eine entsprechend hohe Benotung - in der Regel mit einem ‚Sehr gut’  - belohnt werden.  


7.3.5.3.2 Korrektheit der Suprasegmentalia

Der zweite, für die Aussprache essentielle Gesichtspunkt besteht in der Beherrschung der Suprasegmentalia. Suprasegmentalia betreffen die Prosodie einer Sprache und gehen über den einzelnen Laut hinaus. Sie sind entscheidend für die Satzmelodie (Intonation). Suprasegmentalia können beispielsweise in verschiedenen Sprachen unterschiedlich darüber entscheiden, ob es sich bei einer Äußerung um einen Aussagesatz, einen Fragesatz oder einen Befehl handelt, oder welches kommunikationsbedingt das wichtigste Wort in einem Satz oder einem Syntagma ist. Entsprechend wird die jeweilige Intonation angepasst.

Beherrscht ein Prüfling die Suprasegmentalia einer gegebenen Fremdsprache nicht, wird es zwar weniger wahrscheinlich sein, dass er unverständliche Äußerungen produziert, als wenn er die Phoneme dieser Sprache nicht beherrscht. Durch die Nichtbeachtung oder die inkorrekte Realisierung der Suprasegmentalia können jedoch Äußerungen entstehen, die für die Gesprächspartner zumindest ungewohnt sind, bisweilen aber auch Missverständnisse hervorrufen können. So ist es durchaus möglich, dass Kommunikationsabsichten unklar bleiben, dass also beispielsweise ein Aussagesatz gemeint ist, aber ein Befehl verstanden wird, oder dass ein Aussagesatz verstanden wird, jedoch eine Frage gemeint war. Für die Bewertung der Aussprache eines Prüflings gilt daher: Je besser er die Suprasegmentalia beherrscht, desto besser ist das Resultat seiner Aussprache und desto besser sind auch seine Chancen, die Fremdsprache in einer Weise zu verwenden, die seinen eigenen Kommunikationsabsichten entspricht. Umso besser muss somit auch seine Bewertung ausfallen: Die korrekte Beherrschung der Suprasegmentalia sollte somit unbedingt in die Bewertung der Aussprache einbezogen und in Fällen ihrer Beherrschung entsprechend positiv honoriert werden. In schweren Fällen ihrer Nichtbeherrschung sollte dieser Bereich durchaus negativ sanktioniert werden. Für Prüfer gilt somit, dass sie sich in ihrer Bewertung nicht nur auf die korrekte Realisierung der Phoneme zu konzentrieren haben, sondern ebenfalls auf die Suprasegmentalia und ihre Umsetzung achten müssen.


7.3.5.3.3 Korrektheit der Wortverbindungen 

Mit dem Begriff Wortverbindung sind hier zwei unterschiedliche Phänomene gemeint, die jedoch erhebliche Parallelen zueinander aufweisen: dasjenige, das wir hier - in Anlehnung an den französischen Begriff mot phonétique - als Satzwort bezeichnen wollen, und das im Französischen gemeinhin bekannte Phänomen der sprachlichen liaison.


a) Satzwort (mot phonétique):

Das Phänomen Satzwort (mot phonétique) stellt ein Merkmal beispielsweise der romanischen Sprachen dar und tritt partiell auch im Englischen, nicht jedoch im Deutschen, auf. Es entsteht dadurch, dass in der Schreibung selbständige Wörter in der Aussprache wie ein einziges Wort ausgesprochen werden. Dies führt dazu, dass ein gegebenes Syntagma so ausgesprochen wird, als bestünde es aus einem einzigen Wort. Selbst ganze Sätze, wenn sie denn kurz genug sind, können in dieser Weise ausgesprochen werden. Die Begrenzungen dieser Satzwörter bestehen entweder in Sinneinheiten oder in der Notwendigkeit des Sprechers, dem Erfordernis des Atemholens nachzugeben. Im Deutschen existiert dieses Phänomen nicht: Hier wird jedes Wort in der Aussprache deutlich vom nächsten Wort getrennt wiedergegeben. Geschieht dies nicht - beispielsweise bei ausländischen Sprechern -, so resultiert dies in einem Akzent. Ebenso haben deutsche Muttersprachler beispielsweise im Französischen einen Akzent, wenn sie die Satzwörter nicht adäquat umsetzen.

Die Nichtbeherrschung der korrekten Wiedergabe von Satzwörtern, die zwar in einem ausländischen Akzent resultiert, jedoch in der Regel nicht zu Kommunikationsproblemen führt, stellt kein schwerwiegendes Problem dar. Aus diesem Grunde sollte sie in mündlichen Prüfungen nicht negativ sanktioniert werden. Umgekehrt sollte jedoch die Beherrschung der Realisierung von Satzwörtern - im Sinne eines Bonus - unbedingt positiv sanktioniert werden.  


b) Liaison

Die liaison kommt auf der Basis der gängigen Fremdsprachen vordringlich im Französischen vor. Im Englischen ist sie zu vernachlässigen - wenn auch nicht inexistent -, aber sie ist weniger augenfällig, da sie sich in der Lautfolge gleichsam natürlich ergibt [12]. Im Spanischen und Italienischen ist die liaison zwar ebenfalls existent, fällt jedoch durch die ohnehin vorgenommene Aussprache der jeweiligen Endkonsonanten kaum auf. Im Folgenden wollen wir uns somit auf das Französische beschränken.

Die korrekte Realisierung der französischen liaison stellt aus dem Grunde ein Problem dar, weil sie in aller Regel von deutschen Muttersprachlern übertrieben wird. In dem Streben nach sprachlicher Korrektheit setzen sie die Mehrzahl der sich theoretisch bietenden liaisons konsequent um. Französische Muttersprachler setzen dagegen die Minderheit der sich theoretisch bietenden liaisons um. Aus diesem Verhältnis ergibt sich eine Diskrepanz, die deutsche Muttersprachler gegenüber Franzosen oft unmittelbar verrät.

Für die Bewertung der liaison ergibt sich daher Folgendes: Eine allzu frequente Realisierung sollte nicht negativ gewertet werden, da deutsche Lehrer ihren Schülern tendenziell immer noch die Realisierung zu vieler liaisons beibringen. Die Null-Realisation von liaisons sollte ebenfalls nicht negativ gewertet werden, da diese so interpretiert werden kann, dass der Prüfling eine Überbetonung dieses Phänomens vermeiden möchte. Realisiert ein Prüfling hingegen das Phänomen der französischen liaison mehr oder minder adäquat - und zwar so, wie es einer saloppen bis medio-formalen Kommunikationssituation entspricht -, so sollte er dafür eine sehr positive Bewertung bekommen: Dann hat er den phonetischen Geist des Französischen verstanden.


7.3.5.3.4 Ausmaß des ausländischen Akzents

Das Ausmaß des ausländischen Akzents (vgl. auch Tinnefeld 2002: 125f) eines Individuums resultiert im Wesentlichen aus der Korrektheit bzw. der Inkorrektheit der zuvor beschriebenen Bewertungsfaktoren – der Phoneme und Allophone, der Suprasegmentalia und der Satzwörter. Unsere Beschreibung erlaubt eine relativ exakte bewertungstechnische Eingrenzung des Phänomens Akzent, das im Allgemeinen diffus erscheint und sich in weiten Teilen einer begründeten Beurteilung verschließt. Beurteilen Prüfer die zuvor behandelten Faktoren, dann gelangen sie in einer Gesamtschau dieser in aller Regel zu einer mehr oder minder zuverlässigen Bewertung des fremdsprachlichen Akzents ihrer Prüflinge. Es ergibt sich für Prüfer hier also eine konkrete, fundierte Bewertungsbasis, auf der sich eine gerechte Note festlegen lässt. Es ergibt sich damit zugleich ein wichtiger Schritt in Richtung auf eine Verbesserung der Bewertungsobjektivität in einem Bereich, der naturgemäß durch erhebliche Subjektivität charakterisiert ist.  


7.3.6 Übersicht über die Bewertungskriterien 

Insgesamt resultiert aus unseren Reflexionen die folgende Übersicht[13] für die Bewertung mündlicher Prüfungen:




Kriterium

Faktor

Bewertung
(Empfehlungen)


Ausdrucksvermögen  
               (25 %)


Eleganz des Ausdrucks



Reaktion auf Fragen

Gesprochensprachliche
   Authentizität


Aufbau der Rede


Positive Sanktionierung;
Fehlen eleganter Ausdrücke:
Note ‚befriedigend’

Bewertung mit der Bestnote

Positive Ausprägung: Bestnote. Nichtrealisierung: Verringerung der Note um eine Stufe (z.B. 2,0 → 2,3)

Positive bzw. negative Sanktionierung um bis zu zwei Notenstufen (z.B. 1,7 → 2,3 oder umgekehrt)


Redefluss (25 %)

Bereitschaft zum Sprechen

Initiative im Gespräch



Überlegungsphasen


Spontaneität


Sprechgeschwindigkeit



Ausführlichkeit der Antworten


Individuelle Bewertung auf der Basis der Persönlichkeit des Prüflings

Positive Bewertung bei guter Leistung, bei schlechter Leistung jedoch nicht negativ zu sanktionieren

Negative Sanktionierung, besonders bei gehäuftem Auftreten

Wenn vorhanden, erheblicher
 notensteigernder Effekt

Erheblicher Bonus bei Erreichen authentischer Sprechgeschwindigkeit

Positive bzw. negative Sanktionierung im Rahmen von bis zu zwei Notenstufen


Aussprache (10 %)


Phonematische Korrektheit



Korrektheit der Suprasegmentalia


Korrektheit der Wortverbindungen



Ausmaß des ausländischen Akzents


Adäquate Realisierung: Benotung mit mindestens ‚Gut’  (2,0); bei allophonischer Korrektheit: Belohnung durch die Bestnote

Positive Sanktionierung. Bei nachhaltiger Nichtbeherrschung: negative Sanktionierung

Inadäquate Realisierung: keine negative Sanktionierung;
adäquate Realisierung:  sehr  positive Bewertung bzw. Bonus

Bewertung auf der Basis der vorhergehenden Gesichtspunkte dieses Bewertungsfaktors


                                          Abb. 76: Bewertungskriterien zur Sprechfertigkeit

Nach der Behandlung der Sprechfertigkeit wollen wir uns im Folgenden der Bewertung der Schreibfertigkeit widmen.
.



[1] Da die Bewertung genuiner Hörverstehensaufgaben (vgl. Kap. 6.4.1) sich prinzipiell nicht von derjenigen der hier beschriebenen Aufgabentypen unterscheidet, braucht sie an dieser Stelle nicht gesondert dargestellt zu werden.
[2] Allgemein wird bei der Textsorte Zusammenfassung davon ausgegangen, dass diese höchstens 30 % der Länge des ihr zugrundeliegenden Ausgangstextes umfassen sollte.
[3] Vgl. hierzu auch unser Berechnungsbeispiel weiter oben in diesem Abschnitt (Abb.72).
[4] In solchen Fällen dagegen, in denen eine Zusammenfassung des fremdsprachigen Ausgangstextes in der Muttersprache der Prüflinge gefordert wird, erübrigen sich die zu dem vorliegenden Punkt angesprochenen Überlegungen.
[5] Dabei ist es naturgemäß nicht möglich, die Differenziertheit unserer obigen Ausführungen exakt in dieser Übersicht abzubilden. In dieser kann es nur darum gehen, die wichtigsten Tendenzen deutlich zu machen.
[6] Vgl. zu diesen Grundcharakteristika gesprochener Sprache z.B. Söll (1985) und Fiehler et al. (2004, dort insbesondere 52ff).
[7] Es soll an dieser Stelle keineswegs verkannt werden, dass dieser Zeitfaktor auch in schriftlichen Prüfungen im Einzelfall bis auf Null absinken kann, so dass ein solcher Kontroll- und ggf. Korrekturvorgang nicht immer und ausnahmslos möglich ist.
[8] Dabei kann die Tatsache, dass eine Wendung wie die zitierte dem Formalitätsgrad einer hochschulischen Prüfung entgegensteht, bewertungstechnisch als zweitrangig betrachtet werden.
[9] Auch die hier beschriebene Problematik ist grundsätzlich nicht auf mündliche Fremdsprachenprüfungen beschränkt, sondern lässt sich durchaus auf mündliche Prüfungen allgemein erweitern.
[10] Ein solcher Optimalzustand ist für solche Kriterien wie Ausdruck (vgl. Kap. 7.2.5.1) und Redefluss (vgl. Kap. 7.2.5.2) weniger klar festlegbar.
[11] Der besseren Übersichtlichkeit halber schreiben wir hier die jeweils halben Notenstufen  ‚plus’ und ‚minus’ aus.
[12] So tritt dieses Phänomen beispielsweise in dem Satz Her English friends are very nice people auf, in dem das r von her zu dem Folgewort English hinübergezogen wird. Im britischen Englisch kann zu dem Phänomen der liaison auch das dort bisweilen verwendete intrusive-r gerechnet werden, das in schriftlicher Fixierung nicht auftritt, jedoch mündlich realisiert wird. Als Beispiel möge hier der Satz All my English friends are very nice people genügen, in dem die Wortfolge my + English als my(r) English realisiert wird.
[13] Auch hier ist es realistischerweise nicht möglich, die Differenziertheit der Darstellung in dieser Übersicht abzubilden. Hinsichtlich des Kriteriums Sprachliche Korrektheit, das 40 % der Bewertung ausmacht, verweisen wir auf Kap. 7.3.4.