Bewegung beobachten und bewerten:
Nutzen und Grenzen einer Diagnostik des Werfens
Andreas Wilhelm, Dirk Büsch
Doi: 10.25847/zsls.2022.065
ZUSAMMENFASSUNG
Die Beurteilung einer Bewegungsfertigkeit im Sportunterricht bzw. einer Technik im Sport erfordert Beobachtungskriterien und eine geeignete Diagnostik relevanter Bewegungsmerkmale. Während quantitative Analyseverfahren mit einem hohen technisch-apparativen Aufwand verbunden sind, können objektive und zuverlässige Aussagen auch mit praktikablen qualitativen Analyseverfahren getroffen werden, wenn Lehrer:innen und/oder Trainer:innen zu identischen Bewertungen kommen. Eine wesentliche Voraussetzung dafür sind Beobachtungsinstrumente, die auf einer theoretisch-inhaltlichen Begründung der Beobachtungsmerkmale und einer sachlichen, nicht beeinflussenden (standardisierten) Instruktion beruhen. Am Beispiel einer Wurfbewegung wird ein Beobachtungsbogen zu 15 Bewe- gungsmerkmalen des Schlagwurfs im Handball vorgestellt, der sich an den Funktionsphasen des Wurfs orientiert. Der Beobachtungsbogen wurde hinsichtlich der Beurteiler:innenübereinstimmung (Inter-Rater-Objektivät) geprüft. Im Rahmen einer Untersuchung bewerteten 121 Sportstudierende mit Hilfe des Beobachtungsbogens zwei Schlagwürfe in unterschiedlicher Ausführungsqualität, die den Sportstudierenden zum Selbststudium als Video zur Verfügung gestellt wurden. Die Ergebnisse zeigen für den größten Teil der 15 Bewegungsmerkmale hohe Beurteiler:innenübereinstimmungen. Als Ursache geringer Überstimmungen kann eine Wechselwirkung der Güte des Beobachtungsbogens, des Präsentationsmodus und Beobachtungskompetenz angenommen werden, die in weiteren systemati- schen Studien zu prüfen sind, da kriterienorientierte Beobachtungsinstrumente eine wesentliche Voraussetzung für zuverlässige und valide Beurteilungen in Schul- und Trainingskontexten darstellen.
DER DIAGNOSTISCHE BLICK
Beim Aneignen und Lernen sportmotorischer Fertigkeiten im Sportunterricht sowie zur Leistungsoptimierung im Sport sind beim Techniktraining geeignete Diagnostiken relevanter Technikmerkmale üblich, um diese gezielt verbessern zu können. Dazu gehört auch die kritische, möglichst objektive Beobachtung, also eine kriterienabhängige Einschätzung, wie weit eine Bewegung funktional ist oder einer Zielvorstellung der Bewegung entspricht. Im Handball ist der Torwurf eine wichtige Technik, bei der möglichst hohe Ballabfluggeschwindigkeiten erzielt werden sollen, um Torhüter:innen wenig Zeit für die Abwehr des Balls zu geben. Welche Merkmale sind für einen Wurf mit hoher Ballabfluggeschwindigkeit erforderlich und wie gut lassen sich diese beobachten? Hierzu wurde ein Verfahren zur Diagnostik des Schlagwurfs im Handball entwickelt. Bei der Konzeption und Überprüfung eines derartigen Beobachtungsverfahrens mit dem Ziel einer Diagnostik sind die Gütekriterien der klassischen Testtheorie zu berücksichtigen. Gerade für die Bewegungsbeobachtung im Sport ist hier die Inter-Rater-Objektivität[1] , also die Urteilsübereinstimmung mehrerer unabhängiger Beobachter:innen, eine wesentliche Voraussetzung, um qualifizierte Bewegungsbewertungen vornehmen zu können. Trotz des „täglichen“ Bedarfs im Schul- und Trainingskontext fehlen derartige Beobachtungsmodelle („observational mo- dels“, Gangstead & Beveridge, 1984) und scheinen auch aufgrund der einfachen Verfügbarkeit von mobilen Endgeräten mit Kamerafunktion in Vergessenheit geraten zu sein. Dem entgegenstehend soll exemplarisch eine geeignete Diagnostik für den „Schlagwurf im Handball“ konzipiert und geprüft werden sowie Konsequenzen aus dem Vorgehen für andere Würfe sowie andere Ziele der qualitativen Bewegungsbeobachtung abgeleitet werden.
[1] Der in der testtheoretischen Literatur überwiegend verwendete Begriff der Inter-Rater-Reliabilität ist trotz der irreführenden Verwendung des Reliabilitätsbegriffs ein Objektivitätsmaß. Im Text wird daher der eher unübliche, aber korrekte Begriff Inter-Rater-Objektivität (oder Beurteiler:innenübereinstimmung, s. o.) verwendet (Lienert & Raatz, 1994).
OHNE SYSTEMATISCHE BEOBACHTUNG KEINE ZUVERLÄSSIGE BEURTEILUNG
Eine objektive Beobachtung einer Bewegung sollte unabhängig von der Person erfolgen, die diese durchführt. Die quantitative Erhebung im Sinne einer Messung gilt daher als bevorzugtes Verfahren. Dennoch lassen sich nicht alle Merkmale einer Bewegung messen bzw. ist der Aufwand einer Messung unverhältnismäßig hoch. Für jeden Wurf können zwar Ballabfluggeschwindigkeit, Ballabflugwinkel und Ballabflughöhe erfasst werden, dennoch erklären die Größen dieser Merkmale nicht, wie es zu den entsprechenden Werten gekommen ist bzw. warum der Wurf erfolgreich oder nicht erfolgreich war. Für Lehrende bildet hier die Bewegungsbeobachtung die Grundlage, um die Ursachen eines Wurfergebnisses einschätzen zu können. Warum eine bestimmte Wurfweite beim Speerwurf oder eine bestimmte Ballfluggeschwindigkeit beim Handball erzielt wurde, erschließt sich systematisch aus einer qualitativen Bewegungsanalyse. Grundlage dieser Analyse ist eine kriteriengeleitete Beobachtung der Bewegungsausführung (Knudson & Morrison, 1997). Qualitative Urteile lassen sich quantifizieren, indem die Bewegung in beobachtbare Segmente unterteilt wird, die dann entweder als vorhanden oder nicht vorhanden charakterisiert und mit den Werten 1 oder 0 kodiert werden oder über mehrstufige Ausprägungen als mehr oder weniger vorhanden mit Ratingskalen eingeschätzt werden. Über die ausgewählten Bewegungssegmente entsteht dann ein Gesamturteil der Einzelwertungen jedes Segments. Für Beobachtungen und Analysen ergeben sich nun die Fragen: Welche Bewegungssegmente sollen ausgewählt werden und sind diese objektiv zu beobachten? Dieser Ansatz soll vor dem Hintergrund wissenschaftlicher Theorien der Bewegungswissenschaft vertieft werden und mündet in einer kritischen Reflexion einer gängigen Beobachtungs- und Bewertungspraxis.
Was kennzeichnet einen Wurf im Handball, in der Leichtathletik oder im Wasserball? Oft werden herausragende, erfolgreiche Sportler:innen herangezogen und deren Bewegung in Videos präsentiert oder in Standbildern wesentliche Merkmale der Bewegung aus Sicht von Expert:innen verdeutlicht (Krombholz, 2020). Die Darstellung enthält dann nach Auffassung der Expert:innen weitgehend ein Idealbild. Erfahrungsgemäß existieren dabei unterschiedliche Auffassungen zwischen Expert:innen, welche Sportler:innen „optimale Bewegungen“ präsentieren. Zusätzlich werden dazu aus Sicht der Expert:innen bestimmte, typische Fehler genannt. Im Konsens der Expert:innen kann aus den aktuell üblichen Sichtweisen ein Leitbild zur Bewegungsausführung als Übereinkunft vor dem Hintergrund biomechanischer Grundlagen entstehen (Neumaier & Krug, 2003). In Fachbüchern und -zeitschriften sowie Rahmenkonzeptionen und Lehrplänen der Sportfachverbände werden Ideal- oder Leitbilder bildlich dargestellt und möglichst umfassend beschrieben. Für die Beurteilung und Bewertung ist es entsprechend vorteilhaft, die Bewegung in Segmente zu unterteilen, um die Qualität bzw. die Güte einer Bewegung differenziert einschätzen zu können.
OHNE THEORIE KEINE BEWEGUNGSANALYSE
Welche Segmente sollen berücksichtigt werden und sind mehr oder weniger wichtig für die Ausführung? Denkbar wäre es, erfahrene Lehrende zu befragen und eine konsensuale Entscheidung zu treffen. Eine andere Möglichkeit der Bewegungsanalyse wäre es, eine sportwissenschaftliche Theorie heranzuziehen, die aus der Bewegungswissenschaft bekannt ist. Eine Einteilung in relevante Bewegungssegmente nimmt Göhner (1992) in seiner funktionalen Bewegungsanalyse vor und wendet diese u. a. auf Wurfbewegungen an (Göhner, 2006). Dazu unterscheidet Göhner Aktionen und Funktionen der Bewegung. Aktionen umschreiben die Bewegungen in Gelenken oder Körperabschnitten. Um diese zu verstehen, betrachtet Göhner (1992) das Ziel der Bewegung und hinterfragt deren Zweck: Wozu dient der Schlagwurf im Handball, bei welcher Anforderung des Handballspiels wird er benötigt, welche Aufgabe sollen Spieler:innen damit lösen? Neben einem präzisen Zuspiel zu Mitspieler:innen soll ein Torwurf verwirklicht werden. Eine Komponente dieses Ziels ist oftmals eine hohe Ballabfluggeschwindigkeit. Nach dieser Aufgabenanalyse richtet sich die weitere Betrachtung auf Aktionen und Aktionsmodalitäten sowie die Funktion jeder Aktion.
Eine bildliche Darstellung einer Bewegung lässt sich durch eine Beschreibung einzelner Bewegungselemente differenzieren. Göhner (1992) nennt solche Bewegungselemente Aktionen, z. B. die Aktion „linke Schulter vor“. Die linke Schulter soll also bei Rechtswerfer:innen zu Beginn der Bewegung nach vorn und damit die rechte Schulter nach hinten zeigen. Auf diese Art und Weise werden eine Reihe typischer Aktionen des Schlagwurfs benannt und in eine Reihenfolge gebracht werden. Eine Aktion ist früher, eine andere gleichzeitig und eine dritte später. Diesen Ablauf der Bewegungselemente und damit deren zeitliche Abfolge bezeichnet Göhner (1992) als Aktionsmodalitäten. Zu fragen wäre, wie weit die Gesamtbewegung untergliedert werden muss: Welche Aktionen einer Bewegung wären eigenständig und sinnvoll zu trennen? Ob die Bewegung jedes einzelnen Fingers beim Halten des Balls getrennt werden soll, wäre dann zu begründen.
Die Unterteilung in Aktionen und Aktionsmodalitäten verdeutlicht, was Werfer:innen beim Wurf tun. Bei dieser Frage belässt es Göhner (1992) nicht, sondern hinterfragt den Nutzen und den Zweck jeder Aktion und der Aktionsmodalitäten. Dabei gilt es zu klären, warum eine Aktion eher in dieser Art und weniger oder nicht auf eine andere Weise ausgeführt werden sollte. Eine Antwort sollte physikalische Gesetzmäßigkeiten und biomechanische Überlegungen berücksichtigen. Damit verbunden ist die Vorstellung, dass bestimmte Aktionen nicht variabel sein können, andere Aktionen jedoch unterschiedlich auszuführen seien. Gibt es also Aktionen, die unmittelbar mit dem Ziel der Aufgabe verbunden sind, die bei allen Spitzenathlet:innen nahezu identisch sind? Göhner (1992) schließt aus seinen Beobachtungen, dass dies im Grundsatz möglich bzw. wünschenswert wäre.
Beim Werfen könnte es die Bewegung des Wurfarms sein. Kurz bevor das Wurfgerät die Hand verlässt, müssten die Bewegungen ähnlich sein, um vergleichbare Ballabfluggeschwindigkeiten und -winkel zu erzielen, ansonsten könnte das Wurfgerät physikalisch nicht die gleichen Flugeigenschaften besitzen. So ließe sich mit einem über die gesamte Armbewegung stark gebeugten oder vollständig gestreckten Ellenbogengelenk beim Wurf eines Handballs mit einem Gewicht von ca. 400 g nur eine geringere Ballgeschwindigkeit erzielen. In der vorausgehenden Ausholbewegung lassen sich Bewegungsunterschiede beobachten, wobei beim Torwurf im Handball der Effekt auf den Wurf (Ballabfluggeschwindigkeit) und die Funktion des Wurfes (ein Tor zu erzielen) zu unterscheiden wären. Aus dieser Idee heraus nennt Göhner (1992) die Aktion, die unmittelbar mit dem Zweck zusammenhängt und kaum variabel ist, Hauptfunktionsphase. Aktionen, die dieser vorausgehen oder nachfolgen, bezeichnet er als Hilfsfunktionsphasen. Sind diese sehr wichtig für die Hauptfunktionsphase, so klassifiziert er diese als Hilfsfunktionsphase 1. Ordnung, unwichtige als 2. oder 3. Ordnung (s. Tabelle 1). Es könnte also die Ausholbewegung des Armes als eine Hilfsfunktionsphase und die gleichzeitige Bewegung des Stemmbeins als eine weitere Hilfsfunktionsphase getrennt werden. Diese Trennung wäre bei Meinel und Schnabel (1998) nicht vorgesehen, denn beide Bewegungen werden der Vorbereitungsphase zugeordnet. Meinel und Schnabel (1998) untergliedern bei azyklischen Bewegungen keine einzelnen Aktionen, sondern eine Grundstruktur mit einer zeitlichen Abfolge von drei Phasen der Gesamtbewegung: Die Bewegung als Ganzes beginnt mit der Vorbereitungsphase und anschließend folgen Haupt- und Endphase. Bereits vor dem Hintergrund dieser beiden Ansätze zur Bewegungsanalyse ergeben sich unterschiedliche Kriterien zur Bewegungsbeobachtung. Bewegungsaktionen mit Funktionen auf der einen Seite und beispielsweise Bewegungsrhythmus und -fluss auf der anderen Seite.
OHNE BEOBACHTENDE KEINE BEOBACHTUNG
Die Objektivität der Bewegungsbeobachtung hängt maßgeblich von der visuellen Wahrnehmung der Beobachtenden ab. Grenzen des visuellen Systems von Beobachtenden ergeben sich bei hohen Bewegungsgeschwindigkeiten und hoher Komplexität, indem eine Vielzahl von Bewegungselementen gleichzeitig auftreten. Details der präsentierten Bewegung können dann ohne Hilfe nicht zeitsynchron von Beobachtenden wahrgenommen, beurteilt und dokumentiert werden. Nur in nachträglichen Videoanalysen in Echtzeit, in Zeitlupe und mit Standbildern lässt sich die Vielzahl relevanter Merkmale auswerten, sofern Kriterien gegeben sind (Daugs et al., 1990; 1991; 1996; Put et al., 2016).
Die Beobachtungsgüte wird zusätzlich von der Kompetenz und der Erfahrung der Beobachtenden bestimmt, Video- und Bildmaterial geeignet zu nutzen, um vor dem Hintergrund der Kriterien den Blick auf die bedeutsamen Merkmale zu richten und diese zu dokumentieren (Betsch, Funke & Plessner, 2011). Welche Beobachtungserfahrungen sind notwendig, um eine Bewegung mit Hilfe eines Beobachtungsverfahrens zu beurteilen oder zu bewerten? Und welche Maßnahmen zur Schulung und Instruktion optimieren die Güte der Einschätzung seitens der Beobachtenden?
OHNE OBJEKTIVITÄT KEINE VALIDE BEOBACHTUNG
Die Beurteilung oder Benotung einer Bewegung kann subjektiv und erfahrungsbasiert im Sinne einer ideografischen Methode erfolgen. Das Ergebnis der Einschätzung lässt sich im Einzelfall umsetzen, so könnte sich durch das nachfolgende Feedback und die Interaktion von Lehrerenden und Schüler:innen sowie Athlet:innen die Leistung verbessern. Das Vorgehen wäre allein durch die Wirksamkeit bzw. das Ergebnis in diesem einzelnen Fall gerechtfertigt. Ob das Erfolgsmodell auf andere Lehrende und Schüler:innen oder Athlet:innen übertragbar ist, muss nicht geklärt oder gerechtfertigt werden. Dagegen sollen als Ziel einer Diagnostik inter- und intraindividuelle Unterschiede aufzudecken sein, um das „Besondere“ einer Person hervorzuheben und zwar unabhängig von Beobachtenden. Ein standardisiertes Beobachtungsverfahren, das im Rahmen einer Evaluation und im Sinne einer Diagnostik eingesetzt werden soll, müsste u. a. die Kriterien der klassischen Testtheorie erfüllen. Daraus ergibt sich die Erwartung, zuerst die Objektivität des Verfahrens zu prüfen, um letzten Endes eine valide Beobachtung sicherstellen zu können.
SYSTEMATISCH ZUM ZIEL
Forschungsfrage und Untersuchungsdesign
Zur Bewegungsbeobachtung des Schlagwurfs liegt ein standardisierter Beobachtungsbogen vor, der 15 Bewertungsmerkmale beinhaltet. Für jedes Merkmal muss entschieden werden, ob es vorhanden ist (Kreuz setzen) oder ob es fehlt (kein Kreuz setzen). Für ein objektives Beobachtungsverfahren ist dabei zu erwarten, dass verschiedene Nutzer:innen des Verfahrens bei der Beobachtung eines konkreten Wurfs zu einheitlichen Bewertungen kommen.
Das Verfahren wird an zwei unterschiedliche Präsentationen des Schlagwurfs geprüft (s. Abbildung 1 und Abbildung 2). Die erste Präsentation zeigt einen Schlagwurf, die über das Kompetenznetzwerk Sportunterricht KNSU als Grundtechnik Schlagwurf unter www.youtube.com/watch angeboten und von den Anbieter:innen der Website für die Analyse zur Verfügung gestellt wurde. Die Darstellung beinhaltet eine seitliche Ansicht (Perspektive 90° zur Bewegungsebene). Die zweite Videopräsentation zeigt eine Studentin einer Lehrveranstaltung eines vorangegangenen Semesters, die den Studierenden nicht bekannt war. Die Aufnahme erfolgt schräg von vorn, wie sie in Prüfungssituationen oftmals gegeben ist (Perspektive 45° zur Bewegungsebene). Beide Konstellationen kennzeichnen typische Schul- bzw. Trainingsbedingungen. Das Beobachtungsverfahren soll sich entsprechend nicht nur unter kontrollierten, sondern auch unter realitätsnahen Bedingungen bewähren, wobei zu berücksichtigen ist, dass die 90°-Perspektive als idealtypisch anzusehen wäre (Nowoisky et al., 2012), die mit einer höheren Objektivität einhergehen sollte.
Stichprobe
121 Sportstudierende (54 Studentinnen, 67 Studenten) des 6. Semester des BA Studiengangs Sportwissenschaft der Universität zu Kiel besuchten die Pflichtlehrveranstaltung Handball und wurden gebeten, zwei Videos zu beurteilen. Die Studierenden kennen Videoanalysen, da diese als Methode wiederholt in anderen Lehrveranstaltungen als Teil eines umfassenden Curriculums gezielt eingesetzt werden.
Datenerhebung
Der Bewertungsbogen unterscheidet 15 Merkmale des Schlagwurfs, die in einer Expertenrunde, d. h. im Rahmen einer diskursiven Validierung gewonnen wurden. Jedes Merkmal wird kurz charakterisiert (Aktion und ergänzende Erläuterung, vgl. Tabelle 1). Die 15 Merkmale liegen als Fragebogen vor und sind jeweils mit einem Kästchen versehen, um anzukreuzen, ob das jeweilige Merkmal beim jeweiligen Wurf vorhanden ist (1 Punkt). Fehlt das Merkmal oder ist es nicht zu erkennen, so bleibt das Kästchen leer, es wird kein Kreuz gesetzt (0 Punkte).
Untersuchungsdurchführung
Die Studierenden erhielten zwei sehr unterschiedliche Videopräsentationen zum Schlagwurf (s.o.). Die erste Präsentation zeigt einen Schlagwurf aus, seitlicher Perspektive. Die zweite Videopräsentation zeigt eine Aufnahme schräg von vorn. Für die Bewertung der beiden Würfe wurden die Beobachtungsmerkmale in eine Online-Befragung überführt. Die Studierenden hatten eine Woche Zeit, die Präsentationen selbstständig zu analysieren. Die Art der Videoanalyse war nicht vorgegeben, die Studierenden konnten nach eigenem Ermessen die Videos in Echtzeit, in Zeitlupe und/oder als Standbilder betrachten. Die Videos zeigen die Bewegungen in einer alltagsüblichen, durchschnittlichen räumlichen (480 p) und zeitlichen Auflösung (25 fps) für Videos. Am Ende der Woche wurden die Studierenden gebeten, ihr Urteil online abzugeben. Die Teilnahme war freiwillig. Die anonyme Auswertung der Daten wurde für die nachfolgende Lehrveranstaltung angekündigt.
Auswertung der Beurteiler:innenübereinstimmung (Inter-Rater-Objektivität)
Unter welchen Bedingungen stimmen Urteile der Beobachtenden hinsichtlich eines Merkmals überein und wann fallen der Urteile unterschiedlich aus? Um die Inter-Rater-Objektivität zu bestimmen, besteht eine Option darin, dass mindestens zwei Personen (Beobachter:innen) Urteile über viele Personen oder Ereignisse abgeben. So könnten bspw. zwei Personen eine Gruppe von 100 Schüler:innen hinsichtlich eines Merkmals bewerten, z. B. Sportnote für eine Bewegungsdemonstration. Stimmen die Urteile der beiden Beobachter:innen überein, so wird daraus geschlossen, dass die Kriterien der Benotung oder der Bewertung geeignet, d. h. objektiv sind. Zu bedenken ist dabei allerdings, dass hier nur zwei Beobachter:innen bzw. Beurteiler:innen verglichen werden. Und geprüft wird, ob die beiden Beurteiler:innen die gleiche Interpretation des Beobachtungsverfahrens haben. Es handelt sich also um zwei Einzelfallurteile, die zufällig übereinstimmen können. Um bei dieser Stichprobe von N = 2 Beurteiler:innen eine überzufällige Übereinstimmung anzunehmen, wird das Übereinstimmungsmaß, z. B. r oder der ICC extrem hoch mit einem Wert größer als .90 festgesetzt. Dennoch bleibt es fraglich, ob bei einer derart kleinen Stichprobe die Hypothese, es handele sich um ein objektives Beobachtungsverfahren, bestätigt werden kann. Stattdessen könnte im Sinne einer ideothetischen Methode (Lamiell, 1981) lediglich eine fehlende Übereinstimmung aussagekräftig sein, indem der fehlende Konsens der beiden Beurteiler:innen auf mangelnde Objektivität hinweist. Auch wenn das Vorgehen üblich ist, scheint eine wissenschaftstheoretische Fundierung zu fehlen. Das Vorgehen ist aus Beurteilungen und Bewertungen des Prüfungsalltags bekannt, indem oftmals zwei Beurteiler:innen, z. B. die Bewegung einer Person bewerten müssen. Im Alltag kommt es dann zum Gespräch über die unterschiedlichen oder übereinstimmenden Sichtweisen im Sinne einer „kommunikativen Validierung“, um ein einheitliches Urteil fällen zu können.
Im vorliegenden Ansatz zur Beurteiler:innenübereinstimmung wird die Anzahl der Beobachter:innen daher deutlich erhöht. Hierzu sollen 121 Beobachter:innen die Merkmalsausprägungen von nur 2 Personen bzw. zwei unterschiedlichen Bewegungen einschätzen. Sollte hier ein einheitliches Urteil erreicht werden, so kann eher auf die Güte, d. h. die Qualität des Beobachtungsverfahrens geschlossen werden. Wie kann nun für diese Stichprobe der Beobachter:innen die Beurteiler:innenübereinstimmung bestimmt werden. Wieder trifft jede:r Beobachter:in die Entscheidung zwischen „Merkmal vorhanden“ (Wert 1) und „Merkmal nicht vorhanden“ (Wert 0). Für jedes Beobachtungsmerkmal ergibt sich durch die bewertenden Studierenden nun eine Verteilung über die Werte 0 und 1. Im Idealfall sollte das Urteil der Studierenden einstimmig ausfallen, also 100 % der Studierenden stellen fest, dass das jeweilige Merkmal bei den beiden Würfen vorhanden respektive nicht vorhanden ist. Welche Grenzen könnten nun festgelegt werden, falls die Beurteiler:innen sich nicht 100 % einig sein sollten. In Anlehnung an den Chi-Quadrat-Test zur Prüfung der Abweichung von einer Gleichverteilung, also 50 % wählen „Merkmal vorhanden“ und 50 % wählen „Merkmal nicht vorhanden“ könnte folgende Modellrechnung für 100 und mehr Beurteiler:innen zu Grunde gelegt werden, indem ein Hypothesentest mittels Chi-Quadrat-Verteilung gewählt wird.
Bei einem Wert von 60 % und größer (also einer 60:40-Verteilung) besteht ein signifikanter Unterschied (Chi2-Test, p < .05) zur Gleichverteilung (50:50-Verteilung), sodass eine überzufällige Übereinstimmung der Urteile angenommen werden kann. Der Wert entspricht der Effektgröße w = 0,2 – also einem „schwachen“ Effekt (Cohen, 1988). Ein „starker“ Effekt wäre für eine Zustimmung von 90 % respektive einer 90:10-Verteilung gegeben. Dagegen ist bei Werten von 50 % bis 53 % davon auszugehen, dass kein Unterschied zur Gleichverteilung besteht (Chi2-Tests, p > .50). Das Urteil, ob ein Merkmal vorhanden ist oder nicht vorhanden ist, wäre zufällig. Für Werte zwischen 54 % und 59 % würde vor dem Hintergrund des Hypothesentests (Alpha- und Beta-Fehler, .50 > p > .05) keine Entscheidung gefällt werden können.
ERGEBNISSE
Wie einheitlich fallen die Urteile hinsichtlich der 15 Beobachtungsmerkmale aus? Dazu wurden die Absolutwerte der Zustimmungen (Häufigkeiten) der 121 Beurteiler:innen in Prozentwerte (prozentuale Häufigkeiten) überführt (prozentuale Übereinstimmung, Wirtz & Caspar, 2002). Vor dem Hintergrund der Überlegungen zur Beurteiler:innenübereinstimmung (s.o.) lassen sich damit zwei Bezugswerte zur Beurteilung erstellen. Als objektiv könnte ein Item gelten, wenn
- eine prozentuale Übereinstimmung (PÜ) von mehr als 90 % (Merkmal vorhanden) bzw. weniger als 10 % (also Ablehnung: Merkmal nicht vorhanden) erreicht wird, die als strenge Prüfung bezeichnet werden könnte, oder
- mindestens eine prozentuale Übereinstimmung (PÜ) von mehr als 60 % Zustimmung bzw. weniger als 40 % Zustimmung erreicht wird, die als tendenzielle Prüfung bezeichnet würde.
Mit diesen Kriterien können eine Reihe von Beobachtungsmerkmalen zur Bewertung des Schlagwurfs als objektiv identifiziert werden, da diese Items bei beiden Präsentationen angemessene Werte erreichen (Tabelle 2).
Für die seitliche Ansicht des Schlagwurfs (Wurf 1), die als idealtypische Perspektive angesehen werden kann, können für sechs Merkmale (Items1, 5, 6, 7, 9, 10) hohe prozentuale Übereinstimmungen nachgewiesen werden, für die weiteren Merkmale ist mit Ausnahme für das Item 2 die prozentuale Überstimmung zumindest tendenziell gegeben. Für das Item 2 ist die Güte der Diagnostik als indifferent einzustufen. Damit wird für die seitliche Ansicht eines Leitbilds eine hohe Güte respektive weitgehende Objektivität der Beurteilung erreicht.
Bei Wurf 2 erfolgt die Ansicht schräg von vorn. Bei der Beurteilung wird nur für das Merkmal 8 eine „strenge“ Objektivität erzielt. Jedoch besteht für 9 Merkmale (2, 3, 4, 6, 7, 9, 12, 13, 15) eine „tendenzielle“ Objektivität. Für drei Merkmale (1, 5, 11) konnte nur eine indifferente Entscheidung zur Güte des Verfahrens identifiziert werden. Die Beurteilungen des Merkmals 10, ob eine Drehung des Oberkörpers bei Wurf 2 vorhanden sei, und des Merkmals 14, ob eine peitschenartiger Armzug vorliegt, erfolgen zufällig. Zusammenfassend kann bei einer 45°-Perspektive nur von einer eingeschränkten Güte respektive „tendenziellen“ Objektivität des Verfahrens ausgegangen werden.
Wie wirken sich die Einzelbewertungen der Merkmale auf die Einschätzung der Gesamtgüte beider Schlagwürfe aus?
Für die Präsentation 1 resultiert eine hohe Bewertung (M = 12,7; SD = 1,9; SE = 0,17) mit Hilfe des Beobachtungsverfahrens. Der Mittelwert von M = 12,7 von 15 Punkten (alle Merkmale sind erfüllt) dokumentiert, dass bereits 85 % der vorgegebenen Kriterien eines Schlagwurfs erfüllt sind. Die geringe Streuung (SD = 1,9) verdeutlicht dabei die Stabilität des Urteils. Die weitgehend übereinstimmende Beurteilung mit einem hohem Punktwert und einer geringen Streuung indiziert eine hohe Güte der Bewegungsausführung des Schlagwurfs.
Die Präsentation 2 des Schlagwurfs erzielt eine geringe Bewertung mit einer größeren Streuung (M = 9,4; SD = 2,8; SE = 0,26). Mit 9,4 von 15 Punkten sind 63 % der Kriterien des Wurfes erfüllt, wobei ein Großteil der Beobachter:innen die Kriterien im Bereich von 9,4 + 2,8, also zwischen 44 % (6,6 Punkten) und 81 % (12,2 Punkten) als erfüllt ansehen. Der geringere Punktwert kennzeichnet die niedrigere Güte der Ausführung. Vor dem Hintergrund der größeren Streuung handelt es sich somit um eine weniger sichere Einschätzung.
DISKUSSION
Die Merkmale des Schlagwurfs konnten mit dem Beobachtungsverfahren aus der 90°-Perspektive (seitliche Ansicht) einheitlich durch die Beurteiler:innen identifiziert werden, sodass eine hohe bis sehr hohe Beurteiler:innenübereinstimmung unter dieser Bedingung zu konstatieren ist. Demgegenüber ergeben sich aus der 45°-Perspektive (Ansicht schräg von vorn) weniger einheitliche Einschätzungen bei einzelnen Merkmalen, z. B. ob „ein Überstellschritt vorhanden sei“, „die linke Schulter in Wurfrichtung zeige“, eine „Drehung des Oberkörpers erfolge“, die „Drehung des Oberkörpers abgestoppt wird“ und ein „peitschenartiger Armzug“ gegeben sei. Bei Wurf 1 ist nur das Urteil uneindeutig, ob eine „geradlinige Ausholbewegung“ erfolge.
- Wie ließen sich die unterschiedlichen Übereinstimmungen von Wurf 1 und Wurf 2 interpretieren?Die Präsentation 1 zeigt einen Schlagwurf in seitlicher Perspektive (im Winkel von 90 Grad zur Bewegungsebene), der einen unverzerrten Blick auf die Bewegungsmerkmale ermöglicht. Die vorgegebenen Kriterien sind mit dieser seitlichen Sicht kompatibel. Damit wäre die seitliche Ansicht der Bewegungsausführung ein wesentliches Attribut für eine hohe Durchführungsobjektivität des Beobachtungsverfahrens.
- Die Präsentation 2 des Schlagwurfs erfolgt im Video nicht seitlich (im Winkel von 90 Grad zur Bewegungsebene), sondern schräg von vorn (im Winkel von 45 Grad zur Bewegungsebene). Damit könnte die Beobachtung der Merkmale erschwert sein. Die verzerrte Beobachtungsperspektive scheint bei der Präsentation 2 zu unsicheren Urteilen geführt zu haben. Einige Beurteiler:innen bewerten die Merkmale eher kritisch, andere entscheiden im Zweifel für das Vorhandensein. Damit wäre die Durchführungs- oder Interpretationsobjektivität des Beobachtungsverfahrens aus einer Perspektive schräg von vorn in Frage zu stellen.
Warum werden einzelne Bewegungsmerkmale nicht eindeutig erkannt? Die Ausholbewegung bei Wurf 1 wäre aus Sicht der Autoren eindeutig als kreisförmig zu klassifizieren. Warum stufen 56 % der Beurteiler:innen diese dennoch als geradlinig ein? Ferner sehen nur 55 % einen Überstellschritt bei der Wurf 2. Beide Merkmale können eher in extremer Zeitlupe und einer Abfolge von Standbildern beobachtet werden. Haben alle Beurteiler:innen dieses aufwändige Vorgehen der Videoanalyse genutzt?
Das Abbremsen der Vorwärtsbewegung bei Wurf 1 erfolgt aus Sicht der Autoren zu spät, was für einen Speerwurf üblich, aber für einen Schlagwurf nicht funktional wäre, da auf diese Weise eine Verletzung von Abwehrspieler:innen möglich wäre (Offensivfoul). Diese Art des Abbremsens wird in der Erläuterung jedoch nicht adäquat beschrieben, sodass die Beurteiler:innen hier zwar zu einem nahezu objektiven Urteil kommen, dieses aber im Fall von Wurf 1 nicht mit der Funktion des Schlagwurfes zu vereinbaren ist.
FAZIT UND HANDLUNGSEMPFEHLUNGEN
Das Beobachtungsverfahren für eine handballspezifische Wurfbewegung erreicht für die überwiegende Anzahl der Merkmale aus der seitlichen Perspektive eine gute und für wenige Merkmale eine zufriedenstellende Inter-Rater-Objektivität, nur im Hinblick auf das Item „geradlinige Ausholbewegung“ kann die Objektivität in Frage gestellt werden. Lässt sich die fehlende Objektivität für das Item „geradlinige Ausholbewegung“ aus der seitlichen Perspektive erklären? Die kreisförmige Ausholbewegung gilt in der Sportpraxis vielfach als typisch für den Schlagwurf und für etliche andere Wurf- und Schlagbewegungen. Eventuell haben einige Beurteiler:innen hier vorschnell die Qualität der Ausholbewegung als gegeben angesehen. Die Funktion einer kreisförmigen Ausholbewegung ergibt sich aus einem längeren Beschleunigungsweg, der aber mehr Zeit in Anspruch nimmt und im Handball von Abwehrspieler:innen leichter zu stören ist. Dagegen reduziert eine geradlinige Ausholbewegung die Dauer der Ausholbewegung. Die schnellere Wurfausführung kann Abwehrspieler:innen und Torhüter:innen überraschen, was die wesentliche Funktion des Schlagwurfs unterstützt. Hierzu könnte dann eine gezielte Schulung sinnvoll sein, wodurch die Objektivität vermutlich erhöht wird. Schließlich ergibt sich für das Beobachtungsverfahren aus der seitlichen Perspektive ein Hinweis auf die Validität des Verfahrens, da der vorgestellte Schlagwurf (Wurf 1) als eine Art Leitbild angesehen werden kann. Die Perspektive schräg von vorn (im Winkel von 45 Grad zur Bewegungsebene) lieferte keine zufriedenstellende Objektivität und erscheint für das Beobachtungsverfahren nicht empfehlenswert.
Übergreifend verweist die vorliegende Untersuchung zur Güte eines Beobachtungsverfahrens auf verschiedene Probleme, die im Rahmen einer Bewegungsbewertung zu beachten wären:
- Die Beschreibung der zu beobachtenden Kriterien kann unvollständig oder missverständlich sein. In der Konstruktion und Entwicklung von Item und Erläuterung sind die zukünftigen Nutzer:innen einzubeziehen (kommunikative Validierung).
- Unterschiedliche Präsentationsmodi einer Videoanalyse von Echtzeit, Zeitlupe, Standbild-Darbietung sind notwendig, um dynamische Bewegungen objektiv beobachten zu können. Dies zeigen bereits die Beiträge zum visuomotorischen Lernen (Daugs et al., 1989), in dem bei einer vierfach verlangsamten Zeitlupen-Darstellung mehr Merkmale eindeutig identifiziert werden als in einer Echtzeitdarstellung.
- Die Objektivität eines Beobachtungsinstruments kann durch eine fehlende Passung zwischen Präsentationsperspektive und Beobachtungskriterien vermindert werden und sollte daher für jede systematische Beobachtung vorab geprüft bzw. sichergestellt werden.
- Die Güte der Videoaufzeichnung ermöglicht mehr oder weniger detailgenau Bewegungen abzubilden. Dabei ist nicht allein die Anzahl der Bilder entscheidend, sondern auch, ob ein weitgehend scharfes Standbild erzeugt werden kann. Manchmal werden wesentliche Bewegungsmerkmale unscharf abgebildet und können nur bedingt bewertet werden.
Die Schwierigkeit der Bewegungsbewertung ergibt sich also aus der Wechselwirkung von Beobachtungsinstrument, Präsentationsqualität, Präsentationsperspektive und Beobachtungskompetenz der Beurteiler:innen. Im vorliegenden Fall wurden die Beurteiler:innen hinsichtlich des Beobachtungsinstruments instruiert. Die Kriterien wurden erläutert und am Beispiel einer Idealbewegung des Schlagwurfs mittels Standbildpräsentationen verdeutlicht. Zudem hatten die Beurteiler:innen Erfahrungen mit der Videoanalyse anderer Bewegungen des Gerätturnens und Ruderns. Schließlich erhielten sie eine praktische Einweisung zur Schlagwurfausführung, zur Eigenrealisation und zur gegenseitigen Fehlerkorrektur. Es fehlte eine Kontrolle und eine Instruktion, ob die Studierenden unterschiedliche Präsentationsmodi der Videoanalyse nutzen. Weitergehend hätte die Übungsphase zum Einsatz des Bewertungsbogens für den Schlagwurf verlängert und durch ein Feedback ergänzt werden können. Vor diesem Hintergrund einer eher kürzeren, weniger operationalisierten Beobachtungsschulung können die Ergebnisse aus einer seitlichen Beobachtungs- bzw. Präsentationsperspektive als zufriedenstellend eingestuft werden. Das Verfahren kann mit entsprechenden Schulungshinweisen sowie einer fortzuführenden Prüfung der Testgütekriterien als geeignet für den Einsatz in der Praxis des Schul- und Trainingsalltags empfohlen werden.
DANKSAGUNG
Wir danken den Studierenden Fabian Sérgio Lögers da Silva und Marc-Philipp Klaus für anregende Diskussionen und den Gutachter:innen für Hinweise und Anregungen. Wir danken den Anbieter:innen von KNSU für das Videomaterial.
Betsch, T., Funke, J., & Plessner, H. (2011). Denken - Urteilen, Entscheiden, Problemlösen . Berlin Heidelberg: Springer.
Cohen, J. (1988). Statistical power analysis for the behavioral sciences. Hillsdale: Lawrence Erlbaum Associates.
Daugs, R., Blischke, K., Marschall, F., & Müller, H. (1990). Videotechnologien für den Spitzensport, Teil 1. Leistungssport, 20(6), 12-17.
Daugs, R., Blischke, K., Marschall, F., & Müller, H. (1991). Videotechnologien für den Spitzensport, Teil 2. Leistungssport, 21(1), 50-55.
Daugs, R., Blischke, K., Olivier, N., & Marschall, F. (1989). Beiträge zum visuomotorischen Lernen im Sport (Vol. 65). Verlag Karl Hofmann.
Daugs, R., Blischke, K., Marschall, F., Müller, H., & Olivier, N. (1996). Sportmotorisches Lernen und Techniktraining - ein Werkstattbericht. Leistungssport, 26(4), 32-36.
Gangstead, S. K., & Beveridge, S. K. (1984). The Implementation and Evaluation of a Methodological Approach to Qualitative Sport Skill Analysis Instruction. Journal of Teaching in Physical Education, 3(2), 60-70. doi.org/10.1123/jtpe.3.2.6010.1123/jtpe.3.2.60
Göhner, U. (1992). Einführung in die Bewegungslehre des Sports. Teil 1: Die sportlichen Bewegungen. Schorndorf: Hofmann.
Göhner, U. (2006). Bewegungslehre und Biomechanik des Sports. Fundamentum mit Kugelstoß und Speerwurf. Tübingen: Eigenverlag.
Knudson, D. V. & Morrison, C. S. (1997). Qualitative Analysis of Human Movement. Champaign, IL: Human Kinetics.
Krombholz, A. (2020). Techniktraining. In A. Ferrauti (Ed.), Trainingswissenschaft für die Sportpraxis (pp. 405-454). Berlin Heidelberg: Springer.
Lamiell, J. T. (1981). Toward an idiothetic psychology of personality. American Psychologist, 36(3), 276-289. doi.org/10.1037/0003-066X.36.3.276
Lienert, G. A. & Raatz, U. (1994). Testaufbau und Testanalyse. Psychologie Verlags Union.
Meinel, K. & Schnabel, G. (1998). Bewegungslehre – Sportmotorik. Abriß einer Theorie der sportlichen Motorik unter pädagogischem Aspekt (9. Aufl.). Berlin: Sportverlag.
Neumaier, A., & Krug, J. (2003). Techniktraining. In H. Mechling & J. Munzert (Eds.), Handbuch Bewegungswissenschaft - Bewegungslehre (pp. 443-460). Hofmann.
Nowoisky, C., Beyer, C.-N., Zepperitz, S., & Büsch, D. (2012). Ein trainingsmethodisches und technologisches Konzept zum Video-Feedback im Techniktraining. Leistungssport, 42(6), 19-25.
Put, K., Wagemans, J., Pizzera, A., Williams, A. M., Spitz, J., Savelsbergh, G. J. P., & Helsen, W. F. (2016). Faster, slower or real time? Perceptual-cognitive skills training with variable video speeds. Psychology of Sport and Exercise, 25, 27-35. doi.org/http://dx.doi.org/10.1016/j.psychsport.2016.03.007