Get 20M+ Full-Text Papers For Less Than $1.50/day. Start a 14-Day Trial for You or Your Team.

Learn More →

Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern

Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern J Math Didakt (2022) 43:67–99 https://doi.org/10.1007/s13138-022-00204-y ORIGINALARBEIT/ORIGINAL ARTICLE Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern Patrizia Enenkiel · Marie-Elene Bartel · Moritz Walz · Jürgen Roth Eingegangen: 21. Dezember 2020 / Angenommen: 1. März 2022 / Online publiziert: 15. März 2022 © Der/die Autor(en) 2022 Zusammenfassung Ziel des vorliegenden Forschungsprojekts ist es, zu untersu- chen, ob diagnostische Fähigkeiten von Mathematiklehramtsstudierenden mit der vi- deobasierten Lernumgebung ViviAn (https://vivian.uni-landau.de) gefördert werden können. Für die Entwicklung von ViviAn wurden kurze Videovignetten aus video- grafierten Gruppenarbeiten im Mathematik-Labor „Mathe ist mehr“ zugeschnitten und mit entsprechenden Kontextinformationen in der dazu entwickelten Lernumge- bung ViviAn implementiert. Die Videovignetten zeigen Schülerinnen und Schüler der Klassenstufen 5, 6 und 11 bei der Bearbeitung von Aufgaben zur Bestimmung von Längen, Flächen- und Rauminhalten geometrischer Figuren. Entsprechend um- fasst der Diagnosegegenstand die Fähigkeiten, die die Schülerinnen und Schüler bei der Bearbeitung der Aufgaben zeigen und die Schwierigkeiten, die sie beim Lö- sen dieser Aufgaben haben. Ausgehend vom Diagnosegegenstand und dem Ziel der Förderung der Schülerinnen und Schüler leiten inhaltlich abgestimmte Diagnose- aufträge die Studierenden durch die Videoanalysen. Die diagnostischen Fähigkeiten wurden hierbei durch die Teilkomponenten Beschreiben, Deuten, Ursachen finden und Konsequenzen ableiten operationalisiert. Um den Studierenden die Möglichkeit zu geben, mit Hilfe der Lernumgebung ihre diagnostischen Fähigkeiten zu entwi- ckeln, können sie ihre Antworten mit Musterlösungen zu den Diagnoseaufträgen vergleichen. Zur Prüfung der Wirksamkeit der videobasierten Lernumgebung wurde eine quasi-experimentelle Studie mit einer Kontrollgruppe durchgeführt. Die Er- gebnisse zeigen, dass die Arbeit mit der videobasierten Lernumgebung zu einer signifikanten Lernentwicklung der Mathematiklehramtsstudierenden hinsichtlich ih- rer diagnostischen Fähigkeiten in diesem mathematikdidaktischen Bereich beiträgt. Bei der Kontrollgruppe hingegen konnte kein Lerneffekt verzeichnet werden. Wir Patrizia Enenkiel () · Marie-Elene Bartel · Moritz Walz · Jürgen Roth Campus Landau, Universität Koblenz-Landau, Fortstraße 7, 76829 Landau, Deutschland E-Mail: enenkiel@uni-landau.de K 68 P. Enenkiel et al. schließen daraus, dass die Arbeit mit ViviAn Studierende dabei unterstützen kann, diagnostische Fähigkeiten zu entwickeln. Schlüsselwörter Förderung diagnostischer Fähigkeiten · Videobasierte Lernumgebung · Quasi-experimentelle Studie · Mathematiklehramtsstudierende Promoting Diagnostic Skills with the Video-Based Learning Environment ViviAn Abstract The aim of the present research project is to investigate whether diagnos- tic skills of pre-service mathematics teachers can be enhanced by using the video- based learning environment ViviAn (https://vivian.uni-landau.de). For this purpose, short video vignettes which show different groups of students working in the math- ematics lab “math is more” were recorded. The video vignettes show students of class 5, 6 und 11 working on different tasks. To solve the tasks the students have to determine lengths, areas and spatial volume of geometric figures. Those video vignettes were cut and implemented with appropriate contextual information in the learning environment ViviAn (https://vivian.uni-landau.de). The pre-service teachers are supposed to diagnose how the students solve the tasks and which difficulties they have in doing so. Content-based diagnostic assignments guide the pre-service teach- ers through the video analyses. The diagnostic skills were operationalized through the subcomponents of describing, interpreting, finding causes and deriving conse- quences. The pre-service teachers can compare their answers to expert solutions. Thus, the development of their diagnostic skills should be supported. To test the effectiveness of the video-based learning environment a quasi-experimental study with a control group was conducted. The results show that working with the video- based learning environment contributes to a significant learning development of the pre-service teachers in terms of their diagnostic skills. In contrast, no learning effect was measured for the control group. We conclude that working with the video-based learning environment ViviAn can support students by developing their diagnostic skills. Keywords Promotion of diagnostic skills · Video-based learning environment · Quasi-experimental study · Pre-service teachers 1 Einleitung Die Anforderungen, die eine Lehrkraft im Schulalltag bewältigen muss, sind viel- fältig. Insbesondere in Unterrichtsprozessen, die von Interaktionen geprägt sind, müssen Lehrkräfte, oftmals unter großem Handlungsdruck, lernrelevante Merkmale von Schülerinnen und Schülern wahrnehmen und interpretieren, um anschließend den Lehr-Lernprozess adäquat gestalten zu können. Diese Fähigkeiten können un- ter dem Begriff diagnostische Fähigkeiten gefasst werden (Leuders et al. 2018). Es wird angenommen, dass solche handlungsrelevanten Fähigkeiten erst durch um- fangreiche Praxiserfahrungen entwickelt werden (Berliner 1986; Gruber 2001). Vor K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 69 dem Hintergrund, dass das erworbene Wissen von Lehramtsstudierenden oftmals nur unzureichend in praktischen Phasen umgesetzt wird (Wahl 2002), sind praxis- nahe Möglichkeiten zur Förderung dieser Fähigkeiten sehr bedeutsam. Diese sind in der Realität der universitären Lehrerbildung sowohl bei didaktischen Großveran- staltungen als auch bei inhaltsspezifischen Seminaren jedoch nur bedingt gegeben. Aus diesem Grund kommt der Analyse von videografierten Unterrichtsprozessen als Ergänzung zum theoretischen Input eine große Bedeutung zu. Videos haben den Vorteil, authentische Unterrichtsprozesse abzubilden und dennoch die Komplexität des Unterrichtsalltags zu reduzieren, wodurch handlungssteuernde Prozesse bewusst erarbeitet werden können (Wahl 2002). In bisherigen Studien wurden Videos insbe- sondere im Rahmen von Seminaren (etwa Sunder et al. 2016) eingesetzt. Um Videos mit den beschriebenen Potenzialen auch in Großveranstaltungen zu nutzen, haben wir die videobasierte Lernumgebung ViviAn „Videovignetten zur Analyse von Un- terrichtsprozessen“ (vgl. https://vivian.uni-landau.de) entwickelt. Hier sind neben einem kurzen Videoausschnitt weitere Hintergrundinformationen implementiert, die die Studierenden vor, während und nach der Betrachtung des Videos im Rahmen der eigenständigen Auseinandersetzung mit den Unterrichtsprozessen nutzen können (vgl. Abschn. 4.1). Ziel des vorliegenden Forschungsvorhabens ist es, zu untersu- chen, ob diagnostische Fähigkeiten von Studierenden mithilfe der videobasierten Lernumgebung ViviAn gefördert werden können. 2 Theoretische Grundlagen 2.1 Diagnostische Fähigkeiten Für eine gezielte, individuelle Förderung von Schülerinnen und Schülern erscheinen adäquate Diagnosen seitens der Lehrenden nicht nur notwendig, sondern vielmehr essenziell (Horstkemper 2006; Leuders et al. 2018). In diesem Abschnitt werden zunächst die dazu erforderlichen diagnostischen Fähigkeiten als zentrale Kompo- nente diagnostischer Kompetenz dargestellt und im Kontinuum-Modell nach Blö- meke et al. (2015) verortet. Da Lehramtsstudierende kaum Möglichkeiten haben diese bedeutenden Fähigkeiten in der Unterrichtspraxis zu entwickeln, werden in der Hochschule vermehrt Videos eingesetzt. Deren vielfältiges Potenzial ist ebenfalls in diesem Abschnitt dargestellt. Um dieses Potenzial zu nutzen, ist eine strukturierte Analyse der Videos vonnöten. Diese kann durch fokussierende Aufgaben, die sich auf unterrichtsrelevante Aspekte beziehen, realisiert werden. Die Aufgaben wurden in Anlehnung an ein Modell für einen Diagnoseprozess von Beretz et al. (2017) entwickelt, das abschließend vorgestellt wird. 2.1.1 Begriffsklärung Die anfallenden Diagnoseaufgaben einer Lehrkraft sind vielfältig. Sowohl bei der Erstellung von Zeugnisnoten oder Schullaufbahnempfehlungen als auch bei der Pla- nung und Durchführung des Unterrichts müssen Lehrkräfte diagnostische Leistungen erbringen (Schrader 2011). Die Gesamtheit der Fähigkeiten, die für die Bewältigung K 70 P. Enenkiel et al. der Diagnoseaufgaben notwendig sind, bezeichnet Schrader (2011)als Diagnos- tische Kompetenz. Die Untersuchung dieses Konstrukts wurde in Deutschland in den vergangenen Jahrzehnten, insbesondere infolge des schlechten Abschneidens Deutschlands in internationalen Vergleichsstudien, deutlich intensiviert. Vor diesem Hintergrund gibt es eine Reihe von Ansätzen zur Konzeptualisierung des Konstrukts der diagnostischen Kompetenz. Einer dieser Ansätze führt über den allgemeinen Kompetenzbegriff und kann durch das Kompetenzmodell von Blömeke et al. (2015) beschrieben werden. Bei der Modellierung werden zwei in der Forschung existierende kontroverse Perspek- tiven auf den Kompetenzbegriff berücksichtigt. Die erste Perspektive betont die Bedeutsamkeit des erfolgreichen Handelns in spezifischen Situationen. Die zwei- te Perspektive stammt aus der Bildungsforschung und legt ihren Schwerpunkt auf die kognitiven, motivationalen und affektiven Voraussetzungen, die einem Verhalten zugrunde liegen (Blömeke et al. 2015). Eine Möglichkeit zur Überwindung dieser Dichotomien besteht in der Berücksichtigung beider Perspektiven. Das Kompetenz- modell ist demnach als eine Art Kontinuum zu verstehen, wobei die kognitiven und affektiv-motivationalen Dispositionen und die Performanz durch situationsspezifi- sche Fähigkeiten mediiert werden (Blömeke et al. 2015). Dieses Kompetenzmodell wurde von Leuders et al. (2018) auf die diagnostische Kompetenz übertragen (vgl. Abb. 1) und gliedert sich in die Kompetenzfacetten dia- gnostische Dispositionen, diagnostische Fähigkeiten und diagnostische Performanz. Die diagnostischen Dispositionen umfassen die personenbezogenen Voraussetzun- gen, die es einer Lehrkraft ermöglichen, in diagnostischen Situationen adäquat zu handeln. Diagnostische Fähigkeiten können als kognitive Prozesse beschrieben wer- den, die sich in dem Modell von Leuders et al. (2018) bzw. von Blömeke et al. (2015) aus dem Wahrnehmen, Interpretieren und Entscheiden zusammensetzen. Die diag- nostischen Fähigkeiten basieren auf der einen Seite auf den diagnostischen Disposi- tionen und münden auf der anderen Seite in die diagnostische Performanz, welche das beobachtbare Verhalten in diagnostischen Situationen darstellt. Bei der Betrachtung diagnostischer Kompetenz schreiben viele Autorinnen und Autoren den diagnostischen Fähigkeiten eine hohe Relevanz zu. „Werden einzelne oder mehrere [...] Teilschritte nicht adäquat vollzogen, ist von mehr oder weniger starken Verzerrungen im Urteil auszugehen“ (Behrmann und Glogger-Frey 2017, S. 137). Welche kognitiven Prozesse dabei genau durchlaufen werden, hängt in ho- hem Maß von der diagnostischen Situation ab, in der sich eine Lehrkraft befindet, und lässt keine allgemeingültige Konzeptualisierung zu (Herppich et al. 2017;Het- manek und van Gog 2017; Karst et al. 2017; Loibl et al. 2020). So wird eine Lehrkraft Abb. 1 Diagnostische Kompe- tenz als Kontinuum (Leuders Diagnossche Diagnossche Diagnossche et al. 2018) Disposionen Fähigkeiten Performanz Wissen Wahrnehmen Überzeugungen Beobachtbares Interpreeren Movaon Verhalten Entscheiden Emoonen K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 71 den diagnostischen Prozess bei einer Übergangsempfehlung, aufgrund der verbind- lichen und weitreichenden Konsequenzen ihrer Empfehlung, sehr strukturiert durch- laufen und dabei auf viele Informationen zurückgreifen, um dann letztendlich eine Übergangsempfehlung auszusprechen. Hingegen werden Lehrkräfte in alltäglichen Unterrichtssituationen, aufgrund des großen Handlungsdrucks, den kognitiven Pro- zess weniger strukturiert und vermutlich eher heuristisch durchlaufen, um etwa den Unterricht kurzfristig an den Lernstand der Schülerinnen und Schüler anzupassen . Studien zeigen, dass Lehrkräfte zwischen mehreren Informationen abwägen und tendenziell eine hohe Anstrengungsbereitschaft bei der Verarbeitung von Informa- tionen zeigen, wenn mit dem Urteil eine hohe Konsequenz einhergeht, wie beispiels- weise eine Schullaufbahnempfehlung (Böhmer et al. 2017). Die Autoren schluss- folgern daraus, dass Lehrkräfte, abhängig von der jeweiligen diagnostischen Situa- tion, zwischen heuristischer und strukturierter Informationsverarbeitung wechseln. Bisherige Forschungsergebnisse führen zur Annahme, dass sich erfahrene und un- erfahrene Lehrkräfte hinsichtlich der Wahrnehmung und Verarbeitung von Informa- tionen unterscheiden (Berliner 2001). So zeigt eine Studie von Star und Strickland (2008), dass Mathematiklehramtsstudierende bei der Analyse von Unterrichtsvideos lediglich unspezifische Aussagen zu der videografierten Unterrichtssituation machen konnten und hinsichtlich des mathematischen Themas nur wenige Fragen richtig beantworteten. Die Ergebnisse können von weiteren Autoren gestützt werden. So zeigen die Ergebnisse einer Studie von Seidel und Prenzel (2007), dass Lehrkräfte mit Berufserfahrung besser in der Lage sind, Unterrichtsaspekte zu bewerten und zu interpretieren, als Lehramtsstudierende. Sabers et al. (1991) kommen zu ähnli- chen Schlussfolgerungen. So nehmen unerfahrene Lehrkräfte häufiger Wertungen vor und sind weniger in der Lage, Ursachen für das Verhalten der Schülerinnen und Schüler zu identifizieren, als erfahrene Lehrkräfte. Die Ergebnisse werden häu- fig damit begründet, dass Lehramtsstudierende noch nicht in der Lage sind, auf ihr fachliches und fachdidaktisches Wissen zurückzugreifen und dieses in praxis- nahen Unterrichtssituationen anzuwenden. Die Ergebnisse stützen die Annahme, dass Studierende bereits im Lehramtsstudium die Möglichkeit erhalten sollten, ihr erworbenes Wissen anzuwenden, um so der Theorie-Praxis-Kluft im Studium entge- genzuwirken. So beschreiben Sabers et al. (1991): „Because the performance of the advanced beginners was not equal to the experts in a number of domains, perhaps policymakers need to rethink the content and structure of typical teacher education programs. Perhaps we need to structure experiences for preservice and practicing teachers that will facilitate the development of expertise.“ (S. 85). Ob die pädagogischen Handlungen, wie sie im Modell von Leuders et al. (2018) als diagnostische Per- formanz aufgeführt sind, noch Teil der diagnostischen Kompetenz sind, wird kontrovers diskutiert. Kaiser et al. (2017) beschreiben, dass die Verknüpfung von diagnostischen und pädagogischen Handlungen von der jeweiligen Situation abhängt. So lässt sich bei einer Übergangsempfehlung die Diagnose von der pä- dagogischen Handlung trennen. In einer diagnostischen Situation im Unterricht muss eine Lehrkraft un- mittelbar reagieren, weshalb die Diagnose in den meisten Fällen direkt in eine pädagogische Handlung mündet. K 72 P. Enenkiel et al. 2.1.2 Analyse von Unterrichtsvideos Eine Möglichkeit zur Überwindung der beschriebenen Theorie-Praxis-Kluft bietet die Analyse von Unterrichtsvideos. So können die im Lehramtsstudium vermittelten theoretischen Grundlagen illustriert werden. Videos bilden durch visuelle, auditi- ve und nonverbale Informationen authentische Unterrichtssituationen ab (Krammer und Reusser 2005). Sie können jedoch aufgrund der Parallelität der Handlungen und Aussagen Studierende kognitiv stark beanspruchen, was durch bisherige Stu- dien belegt werden konnte (z. B. Syring et al. 2015). Um Studierende kognitiv zu entlasten, bietet sich der Einsatz von Videovignetten an, die kurze Unterrichtssze- nen darstellen (Rehm und Bölsterli 2014). Dadurch beschränkt sich die Analyse auf kurze Unterrichtssequenzen, wodurch der Fokus auf inhaltlich relevante Aspekte ge- legt werden kann. Zudem bieten Videos den Vorteil, dass sie ohne Handlungsdruck mehrmals analysiert werden können, wodurch die Komplexität, die in realen Unter- richtssituationen auftritt, reduziert wird (Heitzmann et al. 2019). Um das Potenzial von Videoanalysen für das Lehramtsstudium ausschöpfen zu können, bedarf es der Gestaltung geeigneter Lernumgebungen (Krammer und Reusser 2005), die mehre- re Aspekte berücksichtigt sollten. Der wohl wichtigste Aspekt ist die Festlegung des Lernziels, das mit der Videoanalyse erreicht werden soll (Blomberg et al. 2013). Vor dem Hintergrund der Zielperspektive werden dann entsprechende Videos erstellt und Aufgaben zur Analyse entwickelt (von Aufschnaiter et al. 2017). Soll beispiels- weise das Handeln von Lehrkräften und die resultierenden Auswirkungen auf den Lernprozess der Schülerinnen und Schüler analysiert werden, eignen sich Videovi- gnetten, in denen Interaktionen von Lehrkräften und Lernenden zu beobachten sind. Steht hingegen die Analyse von Lernprozessen von Schülerinnen und Schüler im Vordergrund, eignen sich Videovignetten, die Lernende bei Aufgabenbearbeitungen zeigen (von Aufschnaiter et al. 2017). Zur Reflexion der eigenen Wahrnehmung und des eigenen Handelns bietet sich in der Weiterbildung von Lehrkräften die Analyse von Videos des eigenen Unterrichts an. Da Studierende jedoch nur selten die Möglichkeit haben, eigenständigen Unterricht durchzuführen, der videografiert werden kann, werden im Lehramtsstudium häufig fremde Videos analysiert. Durch die Analyse von solchen kann eine kritische Distanzhaltung eingenommen werden, da die videografierten Schülerinnen und Schüler und gegebenenfalls die videogra- fierte Lehrkraft den Studierenden unbekannt sind. Jedoch fehlen den Studierenden dadurch auch entsprechende Kontextinformationen, wodurch die Analyse erschwert wird (Blomberg et al. 2013). Um dieser Problematik entgegenzuwirken, sollten den Studierenden neben der Videovignette weitere Informationen bereitgestellt werden, über die auch die betreuende Lehrperson in der Regel verfügt (Blomberg et al. 2013). Bisherige Studien weisen darauf hin, dass die Analyse von Videovignetten für die Wahrnehmung und Verarbeitung relevanter Unterrichtsaspekte ertragreich sein kann (z. B. Krammer et al. 2016; Sunder et al. 2016). Die Ergebnisse einer Studie im Pre-Post-Design von Sunder et al. (2016) lassen jedoch darauf schließen, dass eine Förderung durch Videoanalysen nicht nur fachabhängig, sondern auch themenab- hängig ist. Die Studierenden in der Studie konnten sich nämlich nur bei der Analyse von solchen Videovignetten verbessern, die das Thema der Videovignetten in der Intervention abbildeten. Dies lässt darauf schließen, dass diagnostische Leistungen K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 73 in hohem Maß vom Diagnosegegenstand abhängen. Im Rahmen dieser Studie wurde das Erarbeiten von Längen, Flächen- und Rauminhalten durch Schülerinnen und Schülern als Diagnosegegenstand gewählt (vgl. Abschn. 2.2). Um die Studierenden im Zuge der Analyse der Unterrichtsvideos bei der Fokus- sierung auf den gewählten Diagnosegegenstand zu unterstützen, muss dieser sich in den konzipierten Aufgaben wiederfinden. Zudem müssen die Aufgaben zu einer aktiven Auseinandersetzung mit den in den Videovignetten dargestellten relevanten Unterrichtsaspekten anregen und somit Facetten abbilden, die einen Diagnoseprozess anregen. Um Studierende beim Aufbau diagnostischer Fähigkeiten zu unterstützen, haben Beretz et al. (2017) und von Aufschnaiter et al. (2018) ein Modell für einen Diagnoseprozess entwickelt, der folgende Schritte beinhaltet: (1) Daten erheben/ sichten, (2) Beobachtungen beschreiben, (3) Beobachtungen deuten, (4) Ursachen ergründen und (5) Konsequenzen ableiten. Im ersten Schritt wird auf geeignete Da- ten zurückgegriffen, die vor dem Hintergrund einer diagnostischen Fragestellung selbst erhoben oder aus vorhandenen Quellen extrahiert wurden. Welche Daten er- fasst werden sollen, hängt vom intendierten Ziel der Diagnostik ab. Im zweiten Schritt werden die anhand der Daten getätigten relevanten Beobachtungen beschrie- ben. Dieser Schritt dient primär der Zusammenstellung relevanter Informationen, die aus den Beobachtungen gewonnen werden können. Anhand dieser Beschrei- bungen können dann lernrelevante Beobachtungen differenziert gedeutet werden. Das kann z. B. die Analyse von Fähigkeiten, Fertigkeiten sowie Schwierigkeiten der Schülerinnen und Schüler beinhalten. In der Regel wird dazu fachdidaktisches Wissen genutzt, indem etwa auf das Wissen über typische Fehlvorstellungen von Schülerinnen und Schüler zurückgegriffen wird. Für die getätigten Deutungen wird im nächsten Schritt nach Erklärungen und Ursachen gesucht. Beretz et al. (2017) schreiben diesem Schritt eine hohe Relevanz zu, da er „[...] zu einer intensiveren Auseinandersetzung mit dem Denken und Handeln der Schülerinnen und Schüler und einer positiven Einstellung gegenüber den Lernenden führen [...]“ kann (S. 151). Die möglichen Ursachen geben auch wertvolle Anhaltspunkte für die anschließende Ableitung von Konsequenzen, da eine Interventionsmaßnahme maßgeblich davon abhängt, welche Ursache den Aussagen und Handlungen der Lernenden zugrun- de liegt. Die resultierenden Konsequenzen beinhalten Hinweise, wie die Lernenden im weiteren Lernprozess unterstützt werden können und bilden den Ausgangspunkt für die Gestaltung adäquater Fördermaßnahmen. Von Aufschnaiter et al. (2018) fassen die Gestaltung der Fördermaßnahme, wie andere Autorinnen und Autoren (vgl. Abschn. 2.1.1) jedoch nicht mehr unter die Diagnostik. Wie bereits dargestellt, bedarf die Analyse von Unterrichtsvideos einem eindeutigen Diagnosegegenstand, welcher im Folgenden erläutert wird. 2.2 Bestimmung von Längen, Flächen- und Rauminhalten Das Bestimmen von Längen, Flächen- und Rauminhalten ist ein wichtiges Themen- gebiet in der Mathematik und wird im Sinne des Spiralprinzips über die Jahrgangs- stufen hinweg mehrfach aufgegriffen und erweitert sowie vertieft. Durch den di- rekten Alltagsbezug, beispielsweise das Messen von Körpergrößen, besitzen bereits Schulanfänger Kenntnisse über Größenbereiche und Maßeinheiten (z. B. Lafrentz K 74 P. Enenkiel et al. und Eichler 2004;Ruwisch 2003). In der Primarstufe machen Schülerinnen und Schüler erste Erfahrungen mit dem Vergleichen und Messen von Längen, Flä- chen- und Rauminhalten (Ministerium für Bildung, Wissenschaft, Jugend und Kultur Rheinland-Pfalz 2015). In der Sekundarstufe I werden dann entsprechende Formeln hergeleitet, um Längen sowie Flächen- und Rauminhalte von geometrischen Figu- ren zu berechnen. In diesem Zusammenhang wird erstmals das Umrechnen von Maßeinheiten behandelt (Ministerium für Bildung, Wissenschaft, Jugend und Kul- tur Rheinland-Pfalz 2007; Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland 2004). In der Sekundarstufe II wer- den die Vorerfahrungen schließlich aufgegriffen, um die Integralrechnung durch die Approximation der Ober- und Untersumme einzuführen (Ministerium für Bildung, Wissenschaft, Jugend und Kultur Rheinland-Pfalz 2015; Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland 2012). Für die Erarbeitung von Größen bzw. Größenbereichen im Unterricht wird häu- fig auf didaktische Stufenmodelle verwiesen, in denen das Rechnen mit Größen in mehreren Schritten erarbeitet wird (z. B. Radatz und Schipper 2007). Über die Vorer- fahrungen der Schülerinnen und Schüler werden Repräsentanten erst direkt und an- schließend indirekt über selbstgewählte und standardisierte Maßeinheiten verglichen (vgl. Abb. 2). Darauf folgt das Umwandeln der Maßeinheiten des entsprechenden Größenbereichs, bis schließlich die Größen miteinander verrechnet werden. Solche Stufenmodelle stehen häufig in der Kritik, da eine sukzessive Abfolge nicht immer sinnvoll und oftmals auch nur bedingt möglich ist (Krauthausen 2018). So erscheint etwa das indirekte Vergleichen mit selbstgewählten Maßeinheiten oft künstlich, da Schülerinnen und Schüler bereits Vorerfahrungen zu standardisier- ten Maßeinheiten besitzen (Peter-Koop 2001). Darüber hinaus kann es in einigen Situationen durchaus sinnvoll sein, Vergleiche von Repräsentanten durchzuführen, auch wenn Lernende bereits mit standardisierten Maßeinheiten messen können. Je- de Vorgehensweise führt zu einem eigenen Erkenntnisgewinn und trägt zu einem umfassenden Verständnis des jeweiligen Größenbereiches bei (Schmidt 2014). Es erscheint daher weitaus zielführender, dass Lernende selbst erkennen, in welchem Kontext welche Vorgehensweise sinnvoll anzuwenden ist und welche Maßeinheiten genutzt werden sollten. Vor diesem Hintergrund wurden die Vorgehensweisen beim Bestimmen von Län- gen, Flächen- und Rauminhalten im Sinne von Strategien kategorisiert und die- se Strategien beschrieben (Enenkiel und Roth 2018). Neben dem Vergleichen und Messen wird in der Kategorisierung auch das Berechnen von Größen aufgeführt, so dass Vorgehensweisen zur Bestimmung von Längen, Flächen- und Rauminhalten in ihrer ganzen Breite abgedeckt werden. Diese Vorgehensweisen erfordern zum Teil arithmetische Fähigkeiten sowie Kenntnisse über geometrische Figuren, weshalb das Themengebiet auch in der Schnittmenge der Arithmetik und der Geometrie einge- ordnet werden kann (Peter-Koop und Nührenbörger 2016). Beim Umgang mit Grö- Indirektes Indirektes Vorerfahrungen Direktes Vergleichen mit Vergleichen mit Umwandeln von Rechnen mit sammeln Vergleichen selbstgewählten standardisierten Maßeinheiten Größen Maßeinheiten Maßeinheiten Abb. 2 Stufenmodell zum Bestimmen von Längen, Flächen- und Rauminhalten (Enenkiel 2022) K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 75 ßen werden Zahlen zu Maßzahlen (Peter-Koop und Nührenbörger 2016). Neben der Maßzahl muss jedoch auch zwingend die Maßeinheit berücksichtigt werden. Schü- lerinnen und Schüler orientieren sich beim Ordnen von Größen oftmals nur an der Maßzahl (Hiebert 1981), was zu falschen Ergebnissen führt, wenn die Maßeinheiten nicht identisch sind. So können Größen mit der gleichen Maßeinheit, wie Zahlen, einfach addiert und subtrahiert werden. Größen mit verschiedenen Maßeinheiten aus dem gleichen Größenbereich müssen zunächst umgewandelt werden. Die Addi- tion und Subtraktion von Größen verschiedener Größenbereiche ist hingegen nicht möglich. Bei der Multiplikation und Division von Größen verändert sich der Größen- bereich und ist darüber hinaus nur bei „verträglichen“ Maßeinheiten gültig (Frenzel und Grund 1991a). Entsprechend können Größen nur miteinander multipliziert oder dividiert werden, wenn das resultierende Ergebnis einen realen Größenbereich re- präsentiert wie beispielsweise die Berechnung des Flächeninhalts eines Rechtecks durch die Multiplikation der Kantenlängen. Für die Umrechnung von Maßeinheiten benötigen Schülerinnen und Schüler Kenntnisse über die entsprechenden Umwand- lungszahlen sowie die Fähigkeit, mit Dezimalbrüchen rechnen zu können. Neben den arithmetischen Fähigkeiten benötigen Lernende aber auch Kenntnisse über geo- metrische Figuren und die entsprechenden Größenbereiche. Fehlt das Verständnis von geometrischen Figuren (z. B. Rechteck) oder von Maßbegriffen (z. B. Flächen- inhalt) haben Lernende Schwierigkeiten, entsprechende Aufgaben adäquat zu lösen (Lafrentz und Eichler 2004). Auf der anderen Seite fördern aktive und umfang- reiche Handlungen, wie umfassende Messerfahrungen an realen Objekten auch die Entwicklung eines Begriffsverständnisses zu Maß- und Figurenbegriffen sowie die Ausbildung von entsprechenden Größenvorstellungen (Kuntze 2018; Weigand 2018; Peter-Koop und Nührenbörger 2016). Die beschriebenen Aspekte verdeutlichen, dass das Bestimmen von Längen, Flä- chen- und Rauminhalten ein zentrales Thema im Mathematikunterricht ist. Bisherige Studien weisen jedoch auf erhebliche Defizite von Schülerinnen und Schüler beim Umgang mit Größen hin (z. B. Frenzel und Grund 1991b; Lafrentz und Eichler 2004; Neubert und Thies 2012). So haben sie oftmals Schwierigkeiten beim Operieren mit Maßeinheiten, machen Fehler beim Umrechnen, haben Probleme beim Aufstellen von Formeln und können darüber hinaus Ergebnisse nicht interpretieren oder reflek- tieren, da ihnen entsprechende Größenvorstellungen fehlen. Vor dem Hintergrund, dass Schülerinnen und Schüler beim Bestimmen von Längen, Flächen- und Raum- inhalten erhebliche Schwierigkeiten haben (können) und die Thematik nicht nur für den Mathematikunterricht in allen Klassenstufen, sondern auch für den Alltag von Bedeutung ist, erscheint es wichtig, dass Lehrkräfte ihre Schülerinnen und Schüler bestmöglich dabei unterstützen (können). 3 Forschungsfrage Einer adäquaten Unterstützung gehen diagnostische Prozesse seitens der Lehrkraft voraus. Wie bereits in Abschn. 2.1.1 beschrieben, weisen aktuelle Studien darauf hin, dass Lehramtsstudierende oftmals Schwierigkeiten haben, lernrelevante Merk- male wahrzunehmen und ihre Beobachtungen zu interpretieren und zu erklären. K 76 P. Enenkiel et al. Aus diesem Grund stellt sich die Frage, wie Studierende bereits im Studium für die Diagnose von Schülerarbeitsprozessen sensibilisiert und beim Aufbau dazu benötig- ter Fähigkeiten unterstützt werden können. Bisherige Studien zeigen, dass Videos ein geeignetes Medium darstellen, um handlungsrelevante Fähigkeiten zu fördern (Krammer et al. 2016; van Es und Sherin 2010). Die Analyse von Videos findet in den meisten Fällen in Rahmen von Seminaren statt, in denen Studierende und Dozierende in einen direkten Austausch treten. In Veranstaltungen die von mehr als 200 Studierenden besucht werden, wie der Vorlesung Fachdidaktische Grundlagen für Studierende aller Lehrämter mit Mathematik als Unterrichtsfach, in der die vor- liegende Studie verortet ist, ist eine gemeinsame Diskussion, in der alle Studierenden aktiviert werden, nicht möglich. Vor diesem Hintergrund setzen wir eine videoba- sierte Lernumgebung ein, die begleitend zu Großveranstaltungen genutzt werden kann. Wie zuvor dargestellt, ist die Bedeutung des mathematischen Inhalts Längen, Flä- chen- und Rauminhalte nicht von der Hand zu weisen. Durch die wiederkehrende Thematisierung über die Schullaufbahn hinweg, stellt es sowohl für die Lehramtsstu- dierenden der Primarstufe als auch für die Lehramtsstudierenden der Sekundarstufe I und II ein relevantes Themenfeld dar. Da angenommen wird, dass die Diagnose unter anderem von dem Diagnosegegenstand abhängt, wird die Lernumgebung inhaltlich auf das Thema „Bestimmung von Längen, Flächen- und Rauminhalten“ abgestimmt. Unter Berücksichtigung des von Leuders et al. (2018) adaptierten Kompetenzmodells wird angenommen, dass mit Videos eine Entwicklung der diagnostischen Fähigkei- ten angeregt werden kann. Vor diesem Hintergrund, lässt sich die folgende Forschungsfrage ableiten: Lassen sich diagnostische Fähigkeiten von Studierenden hinsichtlich der Bestimmung von Längen, Flächen- und Rauminhalten durch Schülerinnen und Schüler mithilfe der videobasierten Lernumgebung ViviAn fördern? Um diese Forschungsfrage zu beantworten und damit die Wirksamkeit der Lern- umgebung zu überprüfen, müssen die diagnostischen Fähigkeiten der Studierenden erfasst werden. In Anlehnung an Herppich et al. (2017) treffen wir die Annahme, dass die diagnostische Performanz in repräsentativen Situationen Rückschlüsse auf die Ausprägung diagnostischer Fähigkeiten erlaubt. Um eine mögliche Entwicklung der diagnostischen Fähigkeiten in dem beschriebenen Inhaltsbereich abbilden zu können, wurden zwei Testvignetten entwickelt, die im Vor- und Nachtest einge- setzt wurden. Die dabei genutzten elementaren Schritte der Operationalisierung und Quantifizierung der vorliegenden (diagnostischen) Fähigkeiten werden im Rahmen der Darstellung der Diagnoseaufträge vorgestellt. 4 Methode 4.1 Die videobasierte Lernumgebung ViviAn Aufgrund der hohen Komplexität des Konstrukts Diagnostische Fähigkeiten, die nicht zuletzt auf den Einfluss situativer Faktoren zurückzuführen ist, stellt die Ent- wicklung eines validen Förder- und Testinstrumentes eine große Herausforderung K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 77 dar. Die Analyse von Unterrichtsvideos, in denen Lernprozesse von Schülerinnen und Schülern bewertet werden, ist eine Möglichkeit, die sich im Rahmen von Groß- veranstaltungen nutzen lässt und zeitökonomisch ist. Damit Videos zum Lernerfolg von Studierenden beitragen, müssen sie in eine geeignete Lernumgebung eingebet- tet sein (Seago 2004; Blomberg et al. 2013). Zudem bringt eine Lernumgebung den Vorteil mit sich, dass Studierende Videos ohne explizite Anweisung von Dozieren- den analysieren können. In der von uns entwickelten Lernumgebung ViviAn stehen den Studierenden neben einer Videosequenz weitere Informationen zur Verfügung. Diese stammen aus dem Mathematik-Labor „Mathe ist mehr“, einem Schülerlabor der Universität Koblenz-Landau am Campus Landau. 4.1.1 Videosequenzen aus dem Mathematik-Labor „Mathe ist mehr“ als Basis von ViviAn Das Mathematik-Labor bietet verschiedene Lernumgebungen für Schülerinnen und Schüler an, in denen jeweils ein mathematischer Inhalt, wie das Bestimmen von Längen, Flächen- und Rauminhalten, mithilfe von gegenständlichen Materialien und Simulationen erarbeitet wird. Das Mathematik-Labor wird in der Regel von ganzen Schulklassen besucht, wobei jeweils vier Schülerinnen und Schüler sich die Inhalte als Gruppe gemeinsam erarbeiten. Durch die Gruppenarbeit sollen Diskussionen angeregt und kooperatives Lernen geschult werden. Für Forschungszwecke wird eine Gruppe von Lernenden in einem separaten Raum aus der Vogelperspektive gefilmt. Dies ermöglicht es, sowohl die gesamte Lerngruppe als auch einzelne Lernende zu fokussieren (Bartel und Roth 2017). Zudem bietet ein Laptop die Möglichkeit die Arbeit am Bildschirm, wie beispielsweise die Verwendung von Simulationen aufzunehmen. Mit dem gewählten Fokus auf den Schülerinnen und Schülern selbst, bieten die Videos den Studierenden die Möglichkeit, Lernprozesse von Schülerinnen und Schülern zu diagnostizieren, indem lernrelevante Merkmale wahrgenommen und verarbeitet werden. Da eine Analyse von mehrstündigen Videos, aufgrund der Fülle an Informatio- nen die Studierenden kognitiv stark beanspruchen würde, müssen die Videos vorab modifiziert werden (vgl. von Aufschnaiter et al. 2017). Durch die Modifikation können lernrelevante Aspekte durch Kürzungen oder Ergänzungen hervorgehoben werden, wodurch die Komplexität der Videos stark reduziert wird. Entsprechend wurden im ersten Schritt bereits vorhandene Videoaufnahmen gesichtet. Relevante Szenen, in denen die Schülerinnen und Schüler beim Bestimmen von Größen Stra- tegien anwandten oder Schwierigkeiten erkennen ließen, wurden geschnitten. Aus 15 Kurzvideos wurden anschließend acht Sequenzen ausgewählt, in denen eine gro- ße Bandbreite von Strategien sichtbar sowie Fähigkeiten und Schwierigkeiten der Schülerinnen und Schülern zu identifizieren waren. Darüber hinaus wurde darauf geachtet, dass die Wahrnehmung der Handlungen sowie Diskussionen der Schüle- rinnen und Schülern nicht durch eingeschränkte Ton- und Bildqualität beeinträchtigt werden. Da die Studierenden die videografierten Schülerinnen und Schüler nicht kennen, ist die Zuordnung der Verbalisierungen erschwert. Daher wurden die videografierten Schülerinnen und Schüler mit gelben Markern versehen (vgl. Abb. 3). Über die K 78 P. Enenkiel et al. Abb. 3 Oberfläche von ViviAn jeweilige Sprechdauer erscheint in den Videosequenzen über den entsprechenden Lernenden ein Rechteck mit „S1“, „S2“, „S3“ oder „S4“ . Für eine einheitliche Ge- staltung werden die Benennungen auch an verschiedenen Stellen der Lernumgebung wieder aufgegriffen. So beinhalten beispielsweise auch die Diagnoseaufträge für die Studierenden diese Benennungen der Schülerinnen und Schüler. Die Videovignette stellt das Zentrum der Oberfläche von ViviAn dar. Durch Betätigen entsprechen- der Buttons, die um die im Zentrum stehende Videovignette angeordnet sind (vgl. Abb. 3), können die Studierenden weitere Informationen nach Bedarf abrufen .So informiert der Button oberhalb des Videos über das Thema und die Lernziele der Mathematik-Labor-Station. Die weiteren Buttons sind in die beiden Perspektiven Schüler- und Metaebene untergliedert. Mit den Buttons der Schülerebene können Das „S“ steht für Schülerin bzw. Schüler. Weitere Informationen zum Aufbau der Lernumgebung sind bei Bartel und Roth (2017) sowie unter vivian.uni-landau.de zu finden. K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 79 Materialien der Station abgerufen werden, mit denen die Lernenden während des Lernprozesses arbeiteten oder welche sie produziert haben. So können mit dem But- ton Schülerprodukte die schriftlichen Arbeitsergebnisse aller Lernenden der Videose- quenz abgerufen werden. Die Buttons der Metaebene bieten weitere Informationen, über die eine Lehrkraft im Klassenraum verfügt. Neben Hintergrundinformationen zu den abgebildeten Schülerinnen und Schülern, wie etwa Klassenstufe und Schulart, können sich Studierende über die zeitliche Einordnung der Sequenz im Lernprozess informieren. Dies ermöglicht es ihnen unter anderem, zu sehen, welche Lernziele durch die in der Videovignette bearbeitete Aufgabe erreicht werden soll. Auf die- se Weise soll eine möglichst unterrichtsnahe Lernumgebung für die Studierenden geschaffen werden (vgl. Roth 2020). 4.1.2 Erstellung der Diagnoseaufträge Damit Videos lernförderlich sein können, müssen Studierende sich aktiv mit diesen auseinandersetzen (Seago 2004). Eine Möglichkeit zur Anregung dieser aktiven Auseinandersetzung stellt das Arbeiten mit auf die Videosequenzen abgestimmten Aufgaben dar. Durch das Betätigen des Buttons Diagnoseauftrag öffnet sich in der Lernumgebung ViviAn ein Fenster, in dem die Aufgaben dargestellt sind und die Antworten direkt eingegeben werden können (vgl. Abb. 3). Die Antworten der Studierenden auf die Diagnoseaufträge werden gespeichert und können jederzeit zu Forschungszwecken abgerufen werden. Die Diagnoseaufträge, die für die Videovignetten erstellt wurden, basieren auf den Komponenten des Diagnoseprozesses von Beretz et al. (2017) und von Aufschnaiter et al. (2018) (vgl. Abschn. 2.1.2). Durch die detaillierte Darstellung der einzel- nen Diagnoseschritte, eignen sich diese für die Strukturierung diagnostischer Tä- tigkeiten, was besonders für eine Förderung diagnostischer Fähigkeiten ertragreich sein kann. Der Diagnoseprozess ist jedoch iterativ. Das Ableiten von Konsequen- zen bzw. das Bilden von Fördermaßnahmen stellt in der Regel den Ausgangspunkt für eine erneute Diagnostik dar. Da die Videovignetten in dieser Studie jedoch in- haltlich abgeschlossen sind, endet in diesem Setting der Diagnoseprozess mit dem Ableiten von Konsequenzen. Darüber hinaus wird in Anlehnung an Beretz et al. (2017) angenommen, dass das Bilden von adäquaten Fördermaßnahmen zwar eng mit einer (informellen) Diagnostik verknüpft ist, aber wegen des dafür zusätzlich benötigten Handlungswissens eine davon abzugrenzende Kompetenz darstellt (vgl. Abschn. 2.1). Um die diagnostischen Fähigkeiten hinsichtlich der Bestimmung von Längen, Flächen- und Rauminhalten adäquat zu erfassen und zu fördern, scheint eine Trennung der Kompetenzen zwingend notwendig. Der erste Schritt Datenerhebung/ Datensichtung entfällt in diesem Setting ebenfalls, da die Videovignetten bereits auf relevante Lernprozesse hinsichtlich der Bestimmung von Längen, Flächen- und Rauminhalten modifiziert wurden. Der Diagnoseprozess beschränkt sich in dieser Studie somit auf die in Abb. 4 dargestellten Komponenten. Diese eignen sich auch für die Konstruktion der Diagnoseaufträge, sofern geeig- nete Operatoren verwendet werden (vgl. Beretz et al. 2017). Durch die Operatoren sollen die Studierenden strukturiert durch das Diagnostizieren geleitet werden. Stu- dierende können zwar durch freie Textfelder ihre Antwort offen formulieren; ih- K 80 P. Enenkiel et al. (Förder)-relevante Konsequenzen für Beobachtungen Mögliche Ursachen Beobachtungen eine Förderung differenziert deuten ergründen beschreiben ableiten Abb. 4 Relevante Komponenten des Diagnoseprozesses nach Beretz et al. (2017) und von Aufschnaiter et al. (2018) re Aufmerksamkeit wird jedoch durch entsprechende Aufgabenformulierungen auf spezifische Aspekte der Videosequenz gerichtet. Die Diagnoseaufträge für die Kom- ponenten werden im Folgenden dargestellt. Förderrelevante Beobachtungen beschreiben In einem ersten Schritt sollen Stu- dierende ihre Beobachtungen beschreiben. Das offene Antwortformat ermöglicht, dass die Studierenden ihre Wahrnehmung eigenständig zusammenfassen können. Der Diagnoseauftrag „Beschreiben Sie aus mathematikdidaktischer Perspektive die Situation, die in der Videovignette zu sehen ist.“ soll die Wahrnehmung der Stu- dierenden auf Aspekte der Videosequenz lenken, die aus mathematikdidaktischer Perspektive relevant sind. Die Beschreibung der relevanten Beobachtungen stellt eine Zusammenstellung der entsprechenden Wahrnehmungen dar und dient somit als Ausgangspunkt zur Beantwortung der weiteren Diagnoseaufträge. Aus diesem Grund ist dieser Diagnoseauftrag der erste Arbeitsauftrag in jeder Videovignette. Als besonders relevant erscheint dabei die deutungsfreie bzw. neutrale Beschreibung der Situation, in der lediglich relevante Informationen aus der Videovignette gesammelt werden. Beobachtungen differenziert deuten Im nächsten Schritt sollen die Informatio- nen, die aus den Beobachtungen gezogen wurden, differenziert verarbeitet werden. Die Diagnoseaufträge beziehen sich entweder auf einzelne Schülerinnen und Schüler oder auf die gesamte Gruppe und fokussieren die Fähigkeiten oder Schwierigkeiten, die die Schülerinnen und Schüler in der Videosequenz zeigen. Da die Deutungen daher von der jeweiligen Videosequenz abhängig sind, variieren die Diagnoseauf- träge mit der jeweiligen Vignette. Exemplarische Diagnoseaufträge lauten: „Wel- che Vergleichs-, Mess- und Berechnungsstrategien wendet S1 an, um Aufgabe 1.2 zu lösen? Begründen Sie Ihre Aussage.“ oder „Welche Schwierigkeiten treten bei der Bearbeitung der Aufgabe auf? Begründen Sie Ihre Aussage.“ Die Diagnoseaufträ- ge haben geschlossene oder offene Antwortformate. Die Studierenden werden bei geschlossenen Aufgaben (Multiple-Choice- oder Single-Choice-Aufgaben) jedoch immer aufgefordert ihre Auswahl anhand ihrer Beobachtungen aus der Videose- quenz in einem Freitextfeld zu begründen (vgl. Abb. 3). Mögliche Ursachen ergründen Für die entsprechenden Deutungen gilt es im nächsten Schritt mögliche Ursachen zu finden. Unter Einbezug des fachlichen und fachdidaktischen Vorwissens sollen die Studierenden beispielsweise Ursachen für einen Schülerfehler, der in der Videovignette beobachtet werden konnte, angeben: „Die Schülerinnen und Schüler haben offenbar Schwierigkeiten die Aufgabe adäquat zu lösen. Welche Ursachen könnten diesen Schülerschwierigkeiten zugrunde liegen?“ K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 81 Die möglichen Ursachen ergeben sich oftmals aus den Aussagen und Handlun- gen der Schülerinnen und Schüler, die in der jeweiligen Videovignette abgebildet sind. So kann den Schülerinnen und Schülern die Erkenntnis fehlen, dass sich die Rauminhaltsformel aus dem gedanklichen Aufeinanderstapeln der Schichten aus Einheitswürfeln ergibt .V D h  A/, was schließlich in der Videosequenz dazu führt, dass die Rauminhaltsformel für ein Quadermodell fehlerhaft erstellt wird. Alterna- tiv kann den Schülerinnen und Schülern jedoch auch das Begriffsverständnis für Rauminhalt oder Quader fehlen. Durch Einbezug der Zusatzinformationen können auch mögliche Ursachen ausgeschlossen werden, wenn beispielsweise in dem Sta- tionsteil vorher die Eigenschaften eines Quadermodells bereits erarbeitet wurden. Das Aufgabenformat in dieser Komponente ist offen und muss mit einem Freitext beantwortet werden. Konsequenzen für die Förderung ableiten Aus den Beobachtungen, Deutungen und Ergründungen möglicher Ursachen sollen die Studierenden im letzten Schritt entsprechende Konsequenzen für eine Förderung ableiten. Dabei sollen die Stu- dierenden mittels Multiple-Choice-Aufgabe zum einen entscheiden, ob sie als be- treuende Lehrperson während der Situation eingegriffen hätten und zum anderen, ob sie nach der Situation intervenieren würden. Die Studierenden werden bei ih- rer Auswahl aufgefordert ihre Antwort zu begründen. Falls die Studierenden sich für eine Intervention entscheiden, öffnet sich ein weiterer Diagnoseauftrag, in dem die Studierenden beschreiben können, wie sie ihre Intervention gestalten würden. Die Aufforderung der Beschreibung einer möglichen Intervention soll eine mög- lichst authentische Unterrichtssituation darstellen und eine künstliche Trennung von Diagnose und Handlung unterbinden. Die formulierten Fördermaßnahmen der Stu- dierenden wurden im Rahmen der Studie nicht ausgewertet, da angenommen wird, dass das aktive Intervenieren eine andere Kompetenz darstellt. Die Begründung zu dieser Annahme wird in Abschn. 2.1.1 beschrieben. 4.1.3 Erstellung der Musterlösung Bei Großveranstaltungen, die von mehr als 200 Studierenden besucht werden, kann den Studierenden aus organisatorischen Gründen keine persönliche und individuelle Rückmeldung zu ihren Bearbeitungen gegeben werden. Um Studierende jedoch bei ihren Videoanalysen zu unterstützen, scheint eine Form von Rückmeldung zielfüh- rend (von Aufschnaiter et al. 2017). Da bisherige Studien zeigen, dass auch die Darbietung einer richtigen Lösung zu einem Lerneffekt beitragen kann (z. B. Ban- gert-Drowns et al. 1991), wurde für jede Videovignette eine Musterlösung erstellt. Die Musterlösungen basieren auf einem Expertenrating, das vorab mit wissenschaft- lichen Mitarbeiterinnen und Mitarbeitern, Professorinnen und Professoren aus der Mathematikdidaktik sowie Mathematiklehrkräften durchgeführt wurden. Die Ex- perten waren bereits Raterinnen und Rater von Videos in anderen Projekten und verfügen daher über weitereichende Erfahrungen mit Videoanalysen. Vor dem Ex- pertenrating wurde sichergestellt, dass entsprechende diagnostische und fachliche Voraussetzungen gegeben waren. So wurde einerseits die Komponenten des Dia- gnoseprozesses von Beretz et al. (2017) und von Aufschnaiter et al. (2018) erläutert K 82 P. Enenkiel et al. Expertinnen & Bearbeitung Erstellung der Überprüfung der Experten Musterlösungen Musterlösung der Vignetten Vignette 1 & Vignette 7 & Experte1 Vignette 2 Vignette 8 Vignette 3 & Vignette 1 & Experte 2 Vignette 2 Vignette 4 Vignette 5 & Vignette 3 & Experte 3 Vignette 4 Vignette 6 … … … Vignette 7 & Vignette 5 & Experte 8 Vignette 6 Vignette 8 Abb. 5 Expertenrating zur Erstellung von Musterlösungen sowie die Strategien zum Bestimmen von Längen, Flächen- und Rauminhalten und die damit verbundenen möglichen Schülerschwierigkeiten diskutiert. Das Experten- rating erfolgte in mehreren Schritten (vgl. Abb. 5): 1. Die Diagnoseaufträge für jede Videovignette wurden von zwei Expertinnen bzw. Experten beantwortet. Eine Expertin bzw. ein Experte beantwortete dabei die Dia- gnoseaufträge für je zwei Videovignetten. 2. Die Antworten der Expertinnen und Experten wurden anschließend gesammelt, zusammengefasst und inhaltlich miteinander verglichen. Antworten von Exper- tinnen und Experten, die sich inhaltlich unterschieden, wurden farblich kenntlich gemacht. 3. Aus den Expertenantworten wurde nachfolgend für jede Videovignette eine Mus- terlösung erstellt. Die Antworten der Experten auf Single-Choice- oder Multiple- Choice-Aufgaben wurden mit einem Kreuz kenntlich gemacht. Die Freitextant- worten wurden strukturiert zusammengestellt, indem beispielsweise unterschied- liche inhaltliche Aspekte durch Stichpunkte getrennt dargestellt wurden. Um die Verarbeitung und Reflexion der Musterlösung zu ermöglichen, wurde auf einfache und prägnante Formulierungen geachtet. 4. In einem gemeinsamen Workshop wurden anschließend die Musterlösungen von denselben Expertinnen und Experten begutachtet. Dabei bewerteten die Exper- tinnen und Experten die Musterlösungen von zwei anderen Vignetten. So sollte gewährleistet werden, dass die Vignetten von einer großen Bandbreite von Exper- tinnen und Experten begutachtet wurden. In einem anschließenden Plenum wur- den Meinungsverschiedenheiten und unterschiedliche Antworten gemeinsam dis- kutiert. Konnte kein Konsens gefunden werden, wurden beide Lösungen in die Musterlösung mit aufgenommen und jeweils begründet. Die Musterlösungen auf Basis des Expertenratings wurden im nächsten Schritt in die videobasierte Lernumgebung ViviAn eingebettet, so dass diese den Studierenden K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 83 nach der Bearbeitung der Diagnoseaufträge angezeigt wurde. Aus einer Metaanalyse von Bangert-Drowns et al. (1991) geht hervor, dass Feedback lernwirksamer ist, wenn es vor der Bearbeitung eines Arbeitsauftrages nicht eingesehen werden kann. Wenn Lernende das Feedback einsehen können, bevor sie sich mit der Aufgabe aktiv auseinandergesetzt haben, wird es demnach nur wenig zur Reflexion der eigenen Antwort beitragen können (Bangert-Drowns et al. 1991). Um diesen Effekt, von Kulhavy (1977)als presearch availability bezeichnet, zu verhindern, wurden das Online-Umfrage-Tool in ViviAn so programmiert, dass Studierende erst auf die Musterlösung zugreifen konnten, nachdem sie die entsprechenden Diagnoseaufträge beantwortet hatten. Um eine Reflexion der eigenen Antworten mit den Musterlö- Rückmeldung Vergleichen Sie nun Ihre gegebenen Antworten zu den Diagnoseaufträgen mit den Antworten der Expertinnen und Experten. 1) Beschreiben Sie aus mathematikdidaktischer Perspektive die Situation, die in der Videovignette zu sehen ist. Sie haben folgende Antwort gegeben: Die SuS messen mithilfe des Maßbandes die Kantenlänge der Fliese aus und berechnen damit den Flächeninhalt. Anschließend versuchen sie den Flächeninhalt in eine andere Einheit umzurechnen. Damit haben sie offensichtlich Probleme. Die zuständige Lehrkraft kommt im weiteren Verlauf des Lernprozesses in den Raum und versucht den SuS zu helfen. Experten haben folgende Antwort gegeben: � S4 misst mithilfe eines Maßbandes die Länge und die Breite der Fliese und gibt seine Ergebnisse an seine Gruppenmitglieder weiter. � Die SuS sollen den Flächeninhalt einer Fliese bestimmen. Abb. 6 Musterlösungen in ViviAn K 84 P. Enenkiel et al. sungen zu ermöglichen, bekamen die Studierenden zusätzlich zur Musterlösung den entsprechenden Diagnoseauftrag und ihre eigene Antwort angezeigt (vgl. Abb. 6). 4.2 Rahmeninformationen 4.2.1 Stichprobe Um zu prüfen, ob die Arbeit mit ViviAn Mathematiklehramtsstudierende unterstüt- zen kann, ihre diagnostischen Fähigkeiten im Bereich Bestimmung von Längen, Flä- chen- und Rauminhalten zu entwickeln, wurde im Wintersemester 2017/2018 eine Interventionsstudie mit einem Vor- und Nachtest durchgeführt. Da das Bestimmen von Längen, Flächen- und Rauminhalten sowohl in der Primarstufe als auch im Sin- ne des Spiralprinzips in weiterführenden Schulen erarbeitet und vertieft wird, fand die Interventionsstudie im Rahmen der Großveranstaltung Fachdidaktische Grund- lagen statt, einer Bachelorveranstaltung, die von Mathematiklehramtsstudierenden aller Schularten besucht wird. In allen Schularten spielen entsprechende Vergleichs-, Mess- und Berechnungsstrategien eine durchgängige Rolle. Aufgrund der hohen Relevanz des Themengebiets für Lehramtsstudierende der Grund- und Förderschu- le sowie auch für Lehramtsstudierende für Realschule plus und Gymnasium (vgl. Abschn. 2.2) ergibt sich für diese didaktische Großveranstaltung eine gute inhaltliche Passung für die Arbeit mit ViviAn hinsichtlich des gewählten Diagnosegegenstands. Die Vorlesung Fachdidaktische Grundlagen ist eine Einführungsveranstaltung in die Didaktik der Mathematik und wird daher in der Regel von Mathematiklehramts- studierenden des ersten und zweiten Fachsemesters besucht. Die Inhalte der Ver- anstaltung beziehen sich auf querschnittliche Fragen zur Mathematikdidaktik (Roth 2020), wobei allgemeine Aspekte des Mathematikunterrichts sowie auch fachdi- daktische und fachmethodische Grundprinzipien thematisiert werden. Weiter hatten Studierende aus der Veranstaltung Didaktik der Geometrie die Möglichkeit mit Vi- viAn zu arbeiten. Die Vorlesung Didaktik der Geometrie ist eine Veranstaltung für Mathematiklehramtsstudierende der Sekundarstufe I, in der Themen der Geometrie fachdidaktisch behandelt werden, wie beispielsweise Möglichkeiten zur Aufberei- tung entsprechender Themen für den Geometrieunterricht. Da die Videovignetten zu spezifischen Themen des Geometrieunterrichts passen, wurde die Bearbeitung der Videovignetten zur Theorie-Praxis-Verknüpfung auch in dieser Veranstaltung etabliert. Die Experimentalgruppe bestand aus 103 Studierenden , 83 Studierende aus der Veranstaltung Fachdidaktische Grundlagen und 20 Studierende aus der Veranstal- tung Didaktik der Geometrie. Die 103 Studierenden setzten sich aus 76 Studierenden der Grund- und Förderschule sowie 27 Studierenden des Lehramts für Realschule plus und Gymnasium zusammen. Da der Nachtest identisch zum Vortest war, er- schien es wichtig, mögliche Testeffekte zu kontrollieren. Dazu wurde im darauf- folgenden Semester eine Kontrollgruppe erhoben. Da die Didaktik der Geometrie nur jedes zweite Semester gehalten wird, stammte die Kontrollgruppe ausschließlich Am Vortest nahmen zunächst 119 Studierende teil, wovon jedoch 16 die Studie vor der Bearbeitung des Nachtests abgebrochen haben und entsprechend bei der Datenauswertung nicht berücksichtigt wurden. K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 85 aus der Veranstaltung Fachdidaktische Grundlagen. Sie bestand aus 81 Mathema- tiklehramtsstudierenden (73 Grund- und Förderschullehramt, acht Realschule plus bzw. Gymnasiallehramt). 4.2.2 Studiendesign Die Interventionsstudie dauerte insgesamt zehn Wochen. Um einen Theorie-Praxis- Bezug zu gewährleisten, wurde der Beginn der Arbeit mit ViviAn thematisch pas- send auf die entsprechenden Veranstaltungen abgestimmt. Ein theoretischer Input im Rahmen einer Vorlesung sollte die Studierenden vorab für die Analyse der Video- vignetten in ViviAn sensibilisieren. Der theoretische Input umfasste unter anderem fachdidaktische Aspekte bei der Bestimmung von Längen, Flächen- und Raumin- halten, in denen auch typische Schülerschwierigkeiten thematisiert wurden. Darüber hinaus wurde auch der Prozess des Diagnostizierens von Beretz et al. (2017) und von Aufschnaiter et al. (2018) (vgl. Abschn. 2.1.2) behandelt, der den Studierenden hinsichtlich der Anforderungen der Komponenten erläutert wurde. Am Ende der Vorlesung wurde den Studierenden die videobasierte Lernumgebung ViviAn vor- gestellt, in der auf Grundlage einer Beispielsvignette die Funktionen von ViviAn sowie die Komponenten des Diagnoseprozesses erläutert wurden. Für die Studieren- den, die an der Vorlesung nicht teilnehmen konnten und dennoch mit ViviAn arbeiten wollten, wurde ein Einführungsvideo erstellt und online zur Verfügung gestellt. Da- rüber hinaus wurde dort auch ein Dokument für die Studierenden hinterlegt, das die fachdidaktischen Aspekte für die Bestimmung von Längen, Flächen- und Raumin- halten beinhaltete und ein Vorlesungsvideo zum entsprechenden Teil der Vorlesung zur Verfügung gestellt. Nach dem theoretischen Input bearbeiteten die Studieren- den einen Vortest, der aus zwei Testvignetten bestand (vgl. Abschn. 4.3). Um eine authentische Unterrichtssituation abzubilden, konnten die Videosequenzen der Test- vignetten nur einmal angeschaut, nicht pausiert und nicht vor- oder zurückgespult werden. Da die beiden Testvignetten auch als Nachtest fungierten, erhielten die Studierenden nach der Bearbeitung keine Musterlösung. Anschließend bearbeiteten die Studierenden jede Woche eine von insgesamt fünf Trainingsvignetten .Umden Studierenden die Möglichkeit zu geben, ihre Antworten auf Basis eines Abgleichs mit der Musterlösung zu reflektieren, konnten die Videosequenzen der Trainings- vignetten im Gegensatz zu den Testvignetten mehrmals angeschaut, pausiert sowie vor- und zurückgespult werden. Nach der Bearbeitung von fünf Trainingsvignetten nahmen die Studierenden am Nachtest teil. 4.3 Testinstrument Das Testinstrument, das im Vor- und Nachtest eingesetzt wurde, bestand aus zwei Videovignetten. Bei beiden Videovignetten wurde darauf geachtet, dass die Diagno- sen möglichst eindeutig waren und möglichst wenige Störfaktoren die Qualität des Videos beeinflussen. Die Videosequenz der ersten Testvignette zeigt eine Gruppen- In der vorlesungsfreien Zeit von drei Wochen mussten die Studierenden nur eine Trainingsvignette be- arbeiten. K 86 P. Enenkiel et al. arbeit von vier Schülerinnen und Schülern der sechsten Klassenstufe bei der Erar- beitung der Formel für den Oberflächeninhalt eines Quadermodells. Als Materialien standen den Schülerinnen und Schülern ein durchsichtiges Quadermodell, Einheits- quadrate, Lineal sowie ein Folienstift zur Verfügung, mit dem die Schülerinnen und Schüler gegebenenfalls auf dem Quadermodell zeichnen konnten. Die Schülerinnen und Schüler wenden in der Videosequenz verschiedene Strategien an, wodurch eine intensive Diskussion zwischen den Gruppenmitgliedern entsteht. Die Videosequenz der zweiten Testvignette zeigt vier Schülerinnen und Schüler der Klassenstufen 3 und 4 bei einem Flächeninhaltsvergleich von selbst konstruierten ebenen Figuren. Da Flächeninhalte der ebenen Figuren auf verschiedene Art und Weisen verglichen werden können (beispielsweise durch einen direkten Vergleich der ebenen Figuren oder durch das Messen der Flächeninhalte mit einer Maßeinheit, vgl. Abschn. 2.2) ist diese Videosequenz von verschiedenen Lösungsstrategien geprägt. Darüber hinaus thematisieren die Schülerinnen und Schüler auch das Umwandeln von Maßeinheiten. Die Diagnoseaufträge für die Videovignetten wurden nach den Komponenten des in Abschn. 2.1.2 dargestellten Modells des Diagnoseprozesses erstellt. Da die Video- sequenzen der Testvignetten nur einmal angeschaut, nicht pausiert und auch nicht vor- und zurückgespult werden konnten, wurde den Studierenden in ViviAn die Möglichkeit gegeben, die Diagnoseaufträge vorab durchzulesen. Dies sollte die Stu- dierenden unterstützen, die Wahrnehmung auf relevante Aspekte der Videosequenz zu legen. 4.4 Testvalidierung Das Testinstrument zur Erfassung der diagnostischen Fähigkeiten im Vor- und Nach- test wurde im ersten Schritt validiert. Dazu wurden die Antworten der Studierenden der Experimental- und Kontrollgruppe aus dem Nachtest auf Basis einer qualitativen Inhaltsanalyse kodiert und anschließend mithilfe eines Rasch-Partial-Credit-Modells auf interne Validität geprüft. 4.4.1 Qualitative Inhaltsanalyse Um die offenen Antworten der Studierenden zu quantifizieren, wurde auf die struk- turierende Inhaltsanalyse nach Skalenpunkten nach Mayring (2015) zurückgegriffen. Diese Form der Inhaltsanalyse ermöglicht es, die schriftlichen Antworten der teil- nehmenden Studierenden systematisch, regel- sowie theoriegeleitet zu analysieren, sodass Rückschlüsse auf deren Antworten gezogen werden können (Mayring 2015). Auf Basis des Expertenratings wurde deduktiv ein Kategoriensystem erstellt, das zur Bewertung der Studierendenantworten herangezogen wurde (Enenkiel 2022). Das Kategoriensystem wurde anschließend auf die ersten 30 Studierendenantworten angewendet sowie mit Beschreibungen, Kodierregeln, Ankerbespielen und teilwei- se mit Gegenbeispielen ergänzt. Erlaubte das Kategoriensystem keine eindeutige K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 87 Tab. 1 Exemplarisches Kategoriensystem für den Diagnoseauftrag der Komponente „Mögliche Ursachen ergründen“ Code Beschreibung Ankerbeispiel Kodierregel V1 U1 F1 Aussagen, die wiedergeben, „Die Schüler waren so Wenn die Aussage des Stu- dass die SuS so sehr mit dem auf die Berechnung der dierenden sich inhaltlich Prozess des Bestimmens einen Seite des Quaders mit der Beschreibung zu des Flächeninhalts der einen fixiert, sodass sie alle V1 U1 F1 deckt, wird eine 1 Teilfläche beschäftigt waren, anderen Seiten unbe- kodiert, andernfalls eine 0 dass sie vergessen haben, die absichtigt ausgelassen Flächeninhalte der anderen haben.“ Teilflächen zu bestimmen V1 U2 F1 Aussagen, die wiedergeben, „Das Problem ist das Wenn die Aussage des Stu- dass die SuS den Begriff Begriffsverständnis, sie dierenden sich inhaltlich „Oberfläche“ nicht ver- kennen den Unterschied mit der Beschreibung zu standen haben bzw. den zwischen den Maßbe- V1 U2 F1 deckt, wird eine 1 Unterschied zwischen „Flä- griffen Flächeninhalt und kodiert, andernfalls eine 0 che“ und „Oberfläche“ nicht Oberflächeninhalt nicht.“ kennen V1 U3 F1 Aussagen, die wiedergeben, „Sie haben die Aufga- Wenn die Aussage des Stu- dass die SuS die Aufgabe benstellung vielleicht nur dierenden sich inhaltlich nicht richtig verstanden bzw. überflogen bzw. nicht mit der Beschreibung zu nicht richtig gelesen haben konkret verstanden.“ V1 U3 F1 deckt, wird eine 1 kodiert, andernfalls eine 0 Zuordnung, wurden Kategorien zusammengeführt oder induktiv ergänzt (Enenkiel 2022). Ein Beispiel hierfür kann Tab. 1 entnommen werden. Das darin dargestellte Ka- tegoriensystem enthält die Kategorien zur Kodierung der Studierendenantworten für den Diagnoseauftrag „Die Schüler in der gezeigten Videosequenz geben als Ergebnis den Flächeninhalt von nur einer Fläche an. Welche Ursachen könnten diesem Feh- ler zugrunde liegen?“ und kann der Komponente „Mögliche Ursachen ergründen“ zugeordnet werden. Der Diagnoseauftrag stammt aus Testvignette 1 und beinhaltet mögliche Ursachen dafür, dass die Lernenden in der Videosequenz als Ergebnis nur den Flächeninhalt einer Teilfläche des Quadermodells angeben und nicht, wie in der Aufgabenstellung gefordert, den Oberflächeninhalt des Quadermodells bestimmen. Eine Mehrfachkodierung war möglich, wenn Studierende mehrere Ursachen dafür nannten, dass die Schülerinnen und Schüler in der Videosequenz den Flächeninhalt von nur einer Teilfläche des Quadermodells bestimmen. Mit dem Kategoriensystem wurden die offenen Antworten der Studierenden von zwei unabhängigen Raterinnen kodiert. Zur Überprüfung der Übereinstim- mung wurde das Cohens Kappa berechnet. Die mittlere Interraterreliabilität von M D 0,72.SD D 0,19/ weist auf eine insgesamt gute Übereinstimmung der Raterinnen hin (Kuckartz 2016). Anschließend wurde ein gemeinsames Konsensge- spräch durchgeführt, in dem Passagen, die von den Raterinnen zunächst unterschied- lich kodiert wurden, auf Basis von Diskussionen und Vergleichen mit weiteren Stu- Diese Vorgehensweise hat große Übereinstimmung mit der von Blömeke et al. (2014), die für die Ko- dierung von offenen Antworten zur Erfassung situationsspezifischer Fähigkeiten deduktiv entwickelte Ka- tegorien durch induktive Kriterien ergänzen. K 88 P. Enenkiel et al. dierendenantworten eindeutig einer Kodierung zugeordnet wurden. Die Daten der Konsenskodierung dienten als Basis für sich anschließende quantitative Analysen. Eine anschließende inhaltliche Analyse der Kategorien führte dazu, dass Kategorien entfernt oder zu Subkategorien zusammengefasst wurden, insofern dies inhaltlich sinnvoll erschien (Enenkiel 2022). Diese überarbeiteten Kategorien, im Folgenden als „Items“ bezeichnet, wurden anschließend zunächst mithilfe der Item-Response- Theorie (IRT) auf ihre Passung überprüft. 4.4.2 Mehrdimensionales Rasch-Partial-Credit-Modell Die Prüfung der Konstruktvalidität mittels IRT wird von vielen Autoren empfohlen (z. B. Blömeke et al. 2015;Wu et al. 2016). Diese hat bei der Auswertung von Test- daten gegenüber der Klassischen Testtheorie einige konzeptuelle und praktische Vor- teile, die beispielsweise bei Hartig und Goldhammer (2010) kurz zusammengefasst sind. Die Faktoren- und Itemanalyse basierte auf den Daten des Nachtests, da hier im Vergleich zum Vortest weniger Items aufgrund von Bodeneffekten ausgeschlos- sen werden mussten. Im ersten Schritt wurde eine deskriptive Analyse der 68 Items durchgeführt, die aufgrund von Bodeneffekten .M < 0,05/ und geringen Varianzen .Var < 0,05/ zum Ausschluss von elf Items führte. Da noch keine empirischen Evidenzen für die Dimensionalität der in Abschn. 2.1 beschriebenen diagnostischen Fähigkeiten vorliegen, wurden verschiedene Modelle gegeneinander getestet. Dabei wurden die Items per Einfachstrukturen (Between-Item-Mehrdimensionalität, Har- tig und Höhler 2010) den jeweiligen Faktoren zugeordnet. Auf eine Modellierung mit einer komplexen Ladungsstruktur (Within-Item-Mehrdimensionalität, Hartig und Höhler 2010) wurde verzichtet, da keine theoretisch fundierten Vorannahmen über die Gewichtung möglicher Teilfähigkeiten und deren Interaktionen zugrunde lagen (vgl. Hartig und Höhler 2010). Anschließend wurden relative Modellvergleiche auf Basis der korrigierten Informationskriterien AICc (Akaike information criteria) und SABIC (Bayesian information criteria) durchgeführt (Burnham und Anderson 2004; Sclove 1987). Die Modellvergleiche (vgl. Tab. 3 im Anhang) sowie die Korrelatio- nen zwischen den Faktoren (vgl. Tab. 4 im Anhang) suggerieren die Extraktion eines dreidimensionalen Modells, das zwischen den Komponenten Beschreiben, Deuten und Ursachenfinden/Konsequenzen ableiten unterscheidet. Dieses Vorgehen wird ausführlich in Enenkiel (2022) beschrieben. Der relative Vergleich zweier oder mehrerer Modelle kann mithilfe informationstheoretischer Maße durchgeführt werden (Eid et al. 2010). Die absoluten Werte dieser Maße geben keinen Aufschluss über die Modellpassungen. Stattdessen geben die Differenzen der absoluten Zahlen der zu vergleichenden Mo- delle Aufschluss darüber, welches der aufgestellten Modelle besser zu den Daten passt. So passt sich das Modell mit dem kleinsten Werten am besten an die Daten an, wobei eine Differenz von mehr als zehn als starkes Indiz für die beste Passung gedeutet werden kann (Rost 2004). Burnham und Anderson (2004) empfehlen für kleine Stichproben die Verwendung eines korrigierten AIC (AICc), der bei großen Stichpro- ben gegen den AIC konvergiert. Sclove (1987) schlägt analog die Verwendung des Sample Size Adjusted BIC (SABIC) für kleine Stichproben vor. Aufgrund der eher geringen Stichprobe der vorliegenden Un- tersuchung, wird bei Modellvergleichen zur Validierung auf die Verwendung des AICc und des SABIC zurückgegriffen. K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 89 Im Anschluss wurden die Items hinsichtlich ihrer Schwierigkeiten, Trennschär- fen , lokal stochastischen Abhängigkeiten sowie ihren Item-Fit-Werten analysiert. Items, die eine hohe lokale stochastische Abhängigkeit aufzeigten, wurden zu ei- nem Partial-Credit-Item zusammengeführt, wenn dies auch inhaltlich sinnvoll er- schien (Enenkiel 2022). Für die Überprüfung der geordneten Antwortwortkatego- rien der Partial-Credit-Items wurden die mittleren Fähigkeitswerte und die relati- ven Häufigkeiten der einzelnen Kategorien herangezogen (Adams et al. 2012;Wu et al. 2016). Die Itemanalyse führte aufgrund mangelhafter Item-Kennwerte und inhaltlichen Gründen zum Ausschluss von 13 Items. Für das Rasch-Partial-Credit- Modell ergab sich nach der Selektion eine mittlere Itemtrennschärfe (Bühner 2011) von M D 0,40.SD D 0,14/ bei einer durchschnittlichen Itemschwierig- TS r .pb/ keit von M D 1,37.SD D 0,88/. Die Infit- und Outfit-Werte lagen im Mittel bei M D 1,00 .SD D 0,10/ und M D 0,97.SD D 0,21/, was auf eine gu- Infit Infit Outfit Outfit te Passung der theoretischen und empirisch ermittelten Werte hindeutet (Adams und Khoo 1996). Die mittlere Residualkorrelation von M D0,019.S D D 0,112/ Q3 Q3 deutet insgesamt auf eine lokale stochastische Unabhängigkeit der Items hin (vgl. Christensen et al. 2017). Die ähnlich zu Cronbachs Alpha zu interpretierenden EAP- Reliabilitäten der drei Dimensionen sind vor dem Hintergrund der schwierigen Ope- rationalisierung des Konstrukts im moderaten Bereich (Beschreiben:EAP D 0,80, Deuten:EAP D 0,83, Ursachenfinden/Konsequenzen ableiten: EAP D 0,68, D U=K vgl. Bortz und Döring 2006). Die ansteigenden Trennschärfen und mittlere Fähig- keiten der Partial-Credit-Items deuten auf geordnete Antwortkategorien hin (Enen- kiel 2022). Der Standardized-Root-Mean-Residual von SRMR D 0,079 weist auf einen guten Modellfit hin (vgl. Bühner 2011). Um die Ergebnisse der Validierung des Nachtests zu überprüfen, wurde das Partial-Credit-Modell anhand der Vor- testdaten überprüft. Auch hier deuteten die Informationskriterien AICc und SA- BIC auf die Extraktion des dreidimensionalen Modells hin, dass zwischen den Komponenten Beschreiben, Deuten und Ursachenfinden/Konsequenzen ableiten un- terscheidet. Die mittleren Infit- und Outfit-Werte der Items von M D 1,00 Infit .SD D 0,11/ und M D 0,92 .SD D 0,24/ weisen auf eine Passung Infit Outfit Outfit der theoretischen und empirischen Werte hin. Die durchschnittliche Itemtrennschär- fe von M D 0,35 .SD D 0,13/ im Vortest bei einer mittleren Itemschwierigkeit TS TS von M D 1,84.SD D 0,90/ liegt im moderaten Bereich. Die Residualkorrelation betrug im Vortest im Mittel M D0,014.S D D 0,112) und deutet auf eine Q3 Q3 lokal stochastische Unabhängigkeit hin. Der Modellfit von SRMR D 0,085 weist insgesamt auf eine gute Passung des Modells hin (Bühner 2011). Die EAP-Reliabili- täten (EAP D 0,637 in der Dimension Beschreiben,EAP D 0,746 in der Dimen- B D sion Deuten und EAP D 0,504 in der Dimension Ursachenfinden/Konsequenzen U=K ableiten) sind geringer als die des Nachtests. Die Trennschärfe der Items wurde über die jeweilige punktbiseriale Korrelation bestimmt. K 90 P. Enenkiel et al. 5 Ergebnisse Für die Analyse der Lerneffekte bietet es sich an, basierend auf den Analysen der IRT, mit dem Summenscore zu rechnen, da es sich bei einem Partial-Credit-Modell um eine suffiziente Statistik handelt (Rost 2004). Das bedeutet, dass jeder Person lediglich ein Summenscore zugewiesen wird, der die Eigenschaftsausprägung der Person ausreichend gut beschreibt. Tab. 2 stellt die Mittelwerte und Standardabwei- chungen im Vor- und Nachtest der Experimentalgruppe (EG) und der Kontrollgruppe (KG) dar. Der maximal zu erreichende Summenscore beträgt für die Komponente Beschreiben 12 Punkte, für die Komponente Deuten 17 Punkte und für die Kompo- nente Ursachenfinden/Konsequenzen ableiten 14 Punkte. Da die Erhebung der Kontrollgruppe in einem anderen Semester stattfand, die Veranstaltung Fachdidaktische Grundlagen sowie auch der theoretische Input von einem anderen Dozierenden gehalten wurde und die Experimental- und Kontroll- gruppe folglich nicht randomisiert werden konnten, wurde auf eine gemeinsame Auswertung der beiden Gruppen, etwa in Form einer gemischten ANOVA, ver- zichtet. Zudem erfordern die nicht normalverteilten Daten der Kontrollgruppe ei- ne separate Auswertung der Daten. Aus diesen Gründen wurde zur Überprüfung, ob die Arbeit mit der Lernumgebung ViviAn in der Experimentalgruppe zu einer Entwicklung in den diagnostischen Fähigkeiten beiträgt, ein verbundener T-Test herangezogen. Die Normalverteilung der Differenzwerte des Vor- und Nachtests als Voraussetzung für den verbundenen T-Tests wurde sowohl mit dem Shapiro- Wilk-Test als auch grafisch mit Q-Q-Plots überprüft (Holling und Gediga 2015). Die Normalverteilung ist für die Differenzen in der Komponente Beschreiben mit W D 0,98 und p D 0,182 sowie in der Komponente Deuten mit W D 0,99 B D und p D 0,425 gegeben. Die Teststatistik des Shapiro-Wilk-Tests für die Kompo- nente Ursachenfinden/Konsequenzen ableiten deutet jedoch mit W D 0,96 und U =K p D 0,004 auf eine Abweichung von einer Normalverteilung hin. Eine zusätzliche grafische Überprüfung durch einen Q-Q-Plot suggeriert jedoch eine Normalvertei- lung in den Differenzwerten. Da der T-Test bei einer Stichprobe von N> 30 als robust gilt und der Q-Q-Plot auf Normalverteilung hindeutet, kann die Abweichung bei N D 103 als unproblematisch aufgefasst werden. EG Die Ergebnisse des T-Tests für verbundene Stichproben zeigen, dass die Experi- mentalgruppe ihre diagnostischen Fähigkeiten in allen drei Komponenten signifikant mit großen Effekten steigern konnte (vgl. Abb. 7): t .102/ D8,81, p< 0,001, Tab. 2 Mittelwerte und Standardabweichungen der Studierenden im Vor- und Nachtest Mittelwert (Standardabweichung) EG (N D 103) KG (N D 81) Vortest Beschreiben 1,92 (2,13) 1,25 (1,75) Nachtest Beschreiben 4,28 (2,59) 1,17 (1,86) Vortest Deuten 3,98 (2,56) 3,99 (2,61) Nachtest Deuten 6,17 (2,90) 4,37 (3,37) Vortest Ursachenfinden/Konsequenzen ableiten 2,70 (1,75) 2,12 (1,6) Nachtest Ursachenfinden/Konsequenzen ableiten 4,34 (2,23) 1,86 (1,35) EG Experimentalgruppe, KG Kontrollgruppe K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 91 Beschreiben Deuten Ursachenfinden/ Konsequenzen ableiten 12 17 14 11 9 6 7 6 5 5 4 0 0 0 Vortest Nachtest Vortest Nachtest Vortest Nachtest EG KG EG KG EG KG Abb. 7 Entwicklung der diagnostischen Fähigkeiten der Studierenden in der Experimentalgruppe und der Kontrollgruppe dargestellt durch den Summenscore in der jeweiligen Dimension d D 0,87; t .102/ D9,06, p< 0,001, d D 0,892; t .102/ D7,91, D U=K p< 0,001, d D 0,72. In der Kontrollgruppe war die Voraussetzung der Normalverteilung in den Kom- ponenten Beschreiben und Ursachenfinden/Konsequenzen ableiten nicht gegeben. Sowohl der Shapiro-Wilk-Test mit W D 0,87, p< 0,001 und W D 0,96, B U =K p D 0,019 als auch die Q-Q-Plots lassen eine Abweichung von einer Normalver- teilung vermuten. In der Komponente Deuten hingegen konnte mit W D 0,98, p D 0,137 von einer Normalverteilung ausgegangen werden. Trotz einer Stichpro- bengröße von N D 81 wurde, aufgrund der grafischen Analyse, die auf eine KG Verletzung der Normalverteilung hindeutet, in den Komponenten Beschreiben und Ursachenfinden/Konsequenzen ableiten, der nicht parametrische Wilcoxon-Test an- gewendet. Obwohl sich die Studierenden vom Vor- zum Nachtest in der Dimension Be- schreiben und Ursachenfinden/Konsequenzen ableiten etwas verschlechterten sowie in der Dimension Deuten verbesserten, zeigen die Ergebnisse, dass diese Unterschie- de nicht signifikant sind: V D 562,00;p D 0,987; t .80/ D1,23, p D 0,223 B D und V D 738,50, p D 0,184. Dies lässt vermuten, dass die reine Bearbei- U=K tung des Vor- und Nachtests keinen Einfluss auf die diagnostischen Fähigkeiten der Studierenden hat. 6 Diskussion In der vorliegenden Studie wurde untersucht, ob die videobasierte Lernumgebung ViviAn dazu beitragen kann, Studierende beim Diagnostizieren von Fähigkeiten und Schwierigkeiten hinsichtlich der Bestimmung von Längen, Flächen- und Raumin- halten zu unterstützen. Dafür wurden Videovignetten erstellt, die Schülerinnen und Schüler bei der Bearbeitung von Aufgaben zur Bestimmung von Flächen- und Raum- inhalten zeigen. Entsprechende Diagnoseaufträge sollten die Studierenden durch die Analyse leiten und für den Diagnoseprozess sensibilisieren. Um die Wirksamkeit der Lernumgebung zu überprüfen, wurde eine Interventionsstudie mit einem Vor- und einem Nachtest durchgeführt. Studierende arbeiteten über mehrere Wochen hinweg K 92 P. Enenkiel et al. mit der videobasierten Lernumgebung und analysierten mehrere Videovignetten. Um die Studierenden bei der Analyse zu unterstützen, erhielten sie nach den Videoanaly- sen Musterlösungen auf Basis eines Expertenratings. Eine Kontrollgruppe, die in der Interventionsphase nicht mit ViviAn arbeitete, sollte mögliche Testeffekte aufgrund der Übereinstimmung von Vor- und Nachtest kontrollieren. Das Testinstrument, das jeweils eingesetzt wurde, wurde mithilfe eines mehrdimensionalen Rasch-Partial- Credit-Modells auf Basis der Daten des Nachtests validiert. Die Dimensionsana- lyse suggeriert die Extraktion eines dreidimensionalen Modells, das zwischen den Komponenten Beschreiben, Deuten und Ursachenfinden/Konsequenzen ableiten dif- ferenziert. Dass das Finden von Ursachen und das Ableiten möglicher Konsequenzen einen Faktor abbilden, lässt sich dadurch begründen, dass besonders die möglichen Ursachen wertvolle Anhaltspunkte für eine mögliche Förderung geben (vgl. von Aufschnaiter et al. 2018). Die Itemkennwerte deuten insgesamt auf eine gute Pas- sung des Modells hin. Um das extrahierte Modell zusätzlich zu stützen, wurde dieses auch mithilfe der Daten des Vortests überprüft. Die EAP-Reliabilitäten fie- len geringer aus als mit den Daten des Nachtests. Dies kann unter anderem darauf zurückgeführt werden, dass die Studierenden im Vortest insgesamt weniger Punk- te erzielten, was sich wiederum negativ auf die Reliabilität des Testes auswirken kann. Nichtsdestotrotz weisen die statistischen Kennwerte auch beim Vortest auf die Passung des beschriebenen dreidimensionalen Modells hin. Die Ergebnisse der Lerneffektanalyse zeigen, dass sich die Mathematiklehramtsstudierenden, die mit der videobasierten Lernumgebung ViviAn gearbeitet haben, in allen Dimensionen signifikant mit einem großen Effekt verbessern. In der Kontrollgruppe konnte hin- gegen kein Lerneffekt verzeichnet werden. Auffallend ist jedoch, dass die Studierenden – auch im zweiten Messzeitpunkt – über niedrige Summenscores in allen drei Teilfähigkeitsbereichen verfügen (vgl. Abb. 7). Die Studierenden erreichten im Durchschnitt weniger als die Hälfte der zu erreichenden Punkte. Für die vorliegende Studie können mehrere Begründungen herangezogen werden. Zum einen kann der niedrige Summenscore auf die offenen Diagnoseaufträge zurückgeführt werden. So erfordert die Formulierung von freien Antworten neben diagnostischen Fähigkeiten, sowohl eine gewisse Motivation, als auch die Fähigkeit, Antworten nachvollziehbar formulieren zu können. Dies stellen Fähigkeiten dar, die im Rahmen dieser Studie nicht kontrolliert werden konnten. Zum anderen ist der maximale Summenscore auch hoch, da dieser auf zusammen- getragenen Antworten von Mathematikdidaktikerinnen und Mathematikdidaktikern basiert (vgl. Abb. 5). Diese wiederum verfügen teilweise über langjährige Erfahrung im zugrundeliegenden Bereich und hatten zudem – im Gegensatz zu den Proban- dinnen und Probanden der vorliegenden Studie – die Möglichkeit, sich die Videos mehrmals anzuschauen. Darüber hinaus wurde das Kategoriensystem, das sich durch das Expertenrating ergab, induktiv ergänzt. Dies erschien notwendig, da die Ant- worten der Studierenden teilweise nicht zu den deduktiv entwickelten Kategorien zugeordnet werden konnten, jedoch trotzdem sinnvolle Beantwortungen der Diagno- seaufträge waren. Unter Berücksichtigung aller potenziellen sinnvollen Antworten ergibt sich insgesamt ein hoher maximaler Summenscore in den drei Dimensio- nen, welcher isoliert betrachtet nur begrenzt aussagekräftig ist. Dies erscheint mit Blick auf das Ziel der vorliegenden Studie unproblematisch und vielmehr sinnvoll, K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 93 da die Förderung der diagnostischen Fähigkeiten von Mathematiklehramtsstudieren- den klar im Vordergrund steht. Durch die vielen Aspekte, die in den Testvignetten erkannt werden konnten, konnte der Zuwachs der diagnostischen Fähigkeiten abge- bildet werden. Hätte eine möglichst genaue Bewertung der diagnostischen Fähig- keiten Studierenden im Vordergrund gestanden, hätte eine andere Vorgehensweise herangezogen werden müssen. Die Diagnoseaufträge wurden in Diskussionsrunden von Expertinnen und Ex- perten, die hinsichtlich diagnostischer Fähigkeiten forschen, analysiert, wodurch die Inhaltsvalidität gegeben sein sollte. Jedoch müsste in weiteren Studien die Konstrukt- validität des hier eingesetzten Testinstrumentes mittels Kriteriumsvalidität überprüft werden (Döring und Bortz 2016), indem beispielsweise das Fachwissen, das fach- didaktische Wissen oder weitere Prädiktoren als Kriterium in Regressionsanalysen miteinbezogen werden, um mögliche Zusammenhänge darzustellen. So wird ange- nommen, dass das fachliche und fachdidaktische Wissen zur Vorhersage diagnosti- scher Fähigkeiten beitragen kann (vgl. Blömeke et al. 2014). Da angenommen wird, dass die diagnostische Fähigkeit von der diagnostischen Situation abhängt, müssten die Kriteriumsvariablen auf die diagnostische Situation abgestimmt werden. Ein weiterer zu diskutierender Aspekt betrifft die Formulierung des ersten Dia- gnoseauftrags jeder Videovignette, welcher eine Beschreibung der dargestellten Si- tuation aus mathematikdidaktischer Perspektive fordert. Einige Antworten aus dem Vortest (z. B.: „S4 spielt mit der Schere“) legen offen, dass die Studierenden Aspek- te beschreiben, die keinen fachdidaktischen Bezug aufweisen und somit keine dia- gnoserelevanten Beobachtungen darstellen. Im Nachtest bildeten solche Antworten hingegen nur noch die Ausnahme. Dies kann darauf zurückgeführt werden, dass bei den Musterlösungen der Trainingsvignetten darauf geachtet wurde, ausschließlich mathematikdidaktisch relevante Aspekte aufzunehmen. Es ist an dieser Stelle zu überlegen, ob der Diagnoseauftrag noch stärker fokussiert werden sollte, indem der Diagnosegegenstand explizit benannt wird. Dies hätte den Vorteil, dass den Studie- renden von Anfang an der Fokus transparent wäre. Gegen eine solche Fokussierung spricht, dass der Blick der Studierenden dann bereits stark eingeschränkt wäre und sie den Schritt der Fokussierung auf diagnoserelevante Aspekte nicht selbstständig gehen könnten. Hinsichtlich des Einbezugs der anschließenden didaktischen Interventionen in das Konstrukt der diagnostischen Fähigkeiten besteht bisher große Uneinigkeit. Es liegt nahe, dass in Situationen im Unterrichtsalltag, die tendenziell nicht planbar sind, wie etwa Interaktionen zwischen Lernenden und Lehrkraft, die diagnostische Per- formanz lediglich über das beobachtbare Verhalten erfahrbar gemacht werden kann. Um eine realistische Unterrichtssituation abzubilden, beinhalteten die Arbeitsauf- träge in den Videoanalysen auch die Nennung möglicher Fördermaßnahmen. Wir nehmen jedoch an, dass die anschließenden Interventionen von vielerlei, insbesonde- re nicht kognitiven, Dispositionen der Urteilenden abhängen, sodass eine Aussage über deren Angemessenheit nur schwer möglich erscheint. Zudem erscheint eine solche Aussage schwierig, da mögliche Interventionen nicht isoliert von den voran- gegangenen Diagnosen betrachtet werden können und sie somit auch eine Aussage über die Passung von Diagnose und Intervention beinhalten müsste. Aufgrund der K 94 P. Enenkiel et al. genannten Aspekte wurden die von den Studierenden beschriebenen pädagogischen Handlungen im Rahmen der Studie nicht ausgewertet. Die Ergebnisse der Studie müssen vor dem Hintergrund der Zusammensetzung der beiden Gruppen betrachtet werden. Die Experimentalgruppe setzte sich neben der überwiegenden Anzahl der Studierenden aus der Vorlesung Fachdidaktische Grundlagen auch aus Studierenden der Vorlesung Didaktik der Geometrie zusam- men. Die Studierenden der Kontrollgruppe stammten aus organisatorischen Grün- den hingegen ausschließlich aus der Vorlesung Fachdidaktische Grundlagen.Dieser unterschiedlichen Zusammensetzung wurde mit einer separaten statistischen Aus- wertung der beiden Gruppen mittels eines verbundenen T-Tests Rechnung getragen. Der Einfluss der Subgruppe der Teilnehmenden aus der Vorlesung Didaktik der Geo- metrie lässt sich jedoch aufgrund ihrer geringen Größe von 20 Studierenden nicht eruieren. Die Ergebnisse zum Lernzuwachs stimmen mit den Ergebnissen bisheriger Studi- en überein, die zeigen konnten, dass Videoanalysen die Wahrnehmung und Interpre- tation relevanter Unterrichtsaspekte von Studierenden positiv beeinflussen können (Krammer et al. 2016; Sunder et al. 2016). Aus den Ergebnissen lässt sich somit ableiten, dass die Arbeit mit ViviAn einen positiven Einfluss auf die Fähigkeiten der Studierenden hat. Worauf der große Lerneffekt zurückzuführen ist, kann aus den Ergebnissen nicht entnommen werden. So stellt sich die Frage, ob die Unter- stützungsmaßnahmen in Form der Musterlösungen den Lerneffekt erklären können. Bei der Erstellung der Musterlösungen wurde bewusst auf einfache Formulierun- gen, prägnante Sätze und eine strukturierte Darstellung geachtet, weshalb es durch- aus plausibel erscheint, dass die Musterlösungen für die Erklärung des Lerneffekts maßgeblich sein könnten. Dennoch hätte für eine statistische Absicherung dieser Annahme eine weitere Kontrollgruppe herangezogen werden müssen, deren Pro- banden im Anschluss an die Bearbeitung der Videovignetten keine Musterlösungen erhalten hätten. Da ViviAn auch in der Modulabschlussprüfung der Veranstaltung „Fachdidaktische Grundlagen“ integriert ist, die am Campus Landau als E-Klausur stattfindet, schien dies aus ethischen Gründen jedoch nicht vertretbar. Inwiefern die Arbeit mit der videobasierten Lernumgebung dazu beitragen kann, Studierende auf die Anforderungen im Unterrichtsalltag im Schuldienst vorzuberei- ten, konnte bisher noch nicht geklärt werden. Um eine solche Aussage zu treffen, könnte etwa im Rahmen einer experimentellen Studie die Performanz der Studie- renden in realen, aber vergleichbaren Unterrichtssituationen erfasst werden. Dazu müssten die Studierenden dieselben Schülerinnen und Schüler zum selben Entwick- lungsstand unterrichten, was jedoch in der Realität nicht umsetzbar ist. Die videobasierte Lernumgebung ViviAn wird am Campus Landau bisher im Rah- men von Großveranstaltungen eingesetzt, in denen die Studierenden online, parallel zur Veranstaltung, Videovignetten bearbeiten. Aufgrund der großen Studierenden- zahl ist es bisher nicht möglich, den Studierenden persönliche Rückmeldungen zu Der Fragestellung, ob pädagogische Interventionen angemessen durchgeführt wurden und inwiefern diese im Zusammenhang mit diagnostischen Fähigkeiten stehen, geht Walz (2020) in seiner Arbeit nach. Im Sommersemester 2018, in dem die Kontrollgruppe erhoben wurde, war ViviAn nicht Teil der Mo- dulabschlussprüfung. K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 95 ihren Videoanalysen zu geben. Die Studierenden erhalten zwar ausführliche Mus- terlösungen, jedoch sind diese, aufgrund organisatorischer und technischer Gege- benheiten, nicht individuell auf die jeweiligen Antworten angepasst. Dies wirft die Frage auf, ob die curriculare Struktur des Lehramtsstudiums, wie es momentan an- geboten wird, nicht grundlegend verändert werden sollte. So können beispielsweise fach- und themenspezifische Seminare die Möglichkeit bieten, gemeinsam Videos zu analysieren und über adäquate Diagnosen zu diskutieren. Ziel der vorliegenden Studie war es, die diagnostischen Fähigkeiten von Mathe- matiklehramtsstudierenden zu entwickeln bzw. zu fördern. Wie oben bereits dis- kutiert, konnte ein Lernzuwachs auf Basis der vorliegenden Daten nachgewiesen werden. Einschränkend muss an dieser Stelle erwähnt werden, dass keine Aussage über die Nachhaltigkeit der Arbeit mit ViviAn getätigt werden kann, da kein Fol- low-Up-Test durchgeführt wurde. Da die Arbeit mit ViviAn mit den Inhalten der entsprechenden Veranstaltungen verknüpft ist, kann jedoch angenommen werden, dass die Videoanalysen eine enge Theorie-Praxis-Verknüpfung ermöglichen. 7 Anhang Tab. 3 Modellvergleiche anhand den Informationskriterien Modell AICc AICc saBIC saBIC 1. 3-dimensional (B× D × U / K) 12.909 – 12.786 – 2. 1-dimensional (B / D / U / K) 13.105 +196 13.002 +216 3. 4-dimensional (B× D × U × K) 12.931 +22 12.790 +4 4. 2-dimensional (B / D / U × K) 13.086 +177 12.976 +190 5. 2-dimensional (B× D / U / K) 13.246 +337 13.136 +350 6. 3-dimensional (B / D × U × K) 13.034 +125 12.911 +125 B Beschreiben, D Deuten, U Ursachenfinden, K Konsequenzen ableiten, × steht für die Trennung der jewei- ligen Dimensionen, / steht für die Zusammenführung der jeweiligen Dimensionen, AICc second-order bias correction Akaike Information Criteria, SABIC Sample Size Adjusted Bayes Information Criteria,  steht für die Differenz der Informationskriterien des jeweiligen Modells und des, anhand der Informationskrite- rien am besten passenden Modells (3-dimensional B× D × U / K) K 96 P. Enenkiel et al. Tab. 4 Korrelationen zwischen den Faktoren Latente Korrelationen Modell Faktoren (1) (2) (3) (4) 1. 3-dimensional (B× D × U / K) (1) 1,000 – – – (2) 0,694 1,000 – – (3) 0,867 0,799 1,000 – 2. 1-dimensional (B / D / U / K) (1) 1,000 – – – 3. 4-dimensional (B× D × U × K) (1) 1,000 – – – (2) 0,663 1,000 – – (3) 0,724 0,863 1,000 – (4) 0,882 0,648 0,881 1,000 4. 2-dimensional (B / D / U × K) (1) 1,000 – – – (2) 0,92 1,000 – – 5. 2-dimensional (B× D / U / K) (1) 1,000 – – – (2) 0,693 1,000 – – 6. 3-dimensional (B / D × U × K) (1) 1,000 – – – (2) 0,892 1,000 – – (3) 0,845 0,948 1,000 – B Beschreiben, D Deuten, U Ursachen finden, K Konsequenzen ableiten, × steht für die Trennung der jeweiligen Faktoren, / steht für die Zusammenführung der jeweiligen Faktoren Funding Open Access funding enabled and organized by Projekt DEAL. Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Li- zenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ord- nungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden. Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betref- fende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen. Weitere Details zur Lizenz entnehmen Sie bitte der Lizenzinformation auf http://creativecommons.org/ licenses/by/4.0/deed.de. Literatur Adams, R. J., & Khoo, S.-T. (1996). Quest. The interactive test analysis system. Victoria: ACER Press. Adams, R. J., Wu, M. L., & Wilson, M. (2012). The Rasch rating model and the disordered threshold controversy. Educational and Psychological Measurement, 72(4), 547–573. Bangert-Drowns, R. L., Kulik, C.-L. C., Kulik, J. A., & Morgan, M. (1991). The instructional effect of feedback in test-like events. Review of Educational Research, 61(2), 213–238. Bartel, M.-E., & Roth, J. (2017). Diagnostische Kompetenz von Lehramtsstudierenden fördern. Das Vi- deotool ViviAn. In J. Leuders, T. Leuders, S. Prediger & S. Ruwisch (Hrsg.), Mit Heterogenität im Mathematikunterricht umgehen lernen. Konzepte und Perspektiven für eine zentrale Anforderung an die Lehrerbildung (S. 43–52). Wiesbaden: Springer. K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 97 Behrmann, L., & Glogger-Frey, I. (2017). Produkt- und Prozessindikatoren diagnostischer Kompetenz. In A. Südkamp & A.-K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften. Theoretische und methodische Weiterentwicklungen (S. 42–45). Münster: Waxmann. Beretz, A.-K., Lengnink, K., & Von Aufschnaiter, C. (2017). Diagnostische Kompetenz gezielt fördern – Videoeinsatz im Lehramtsstudium Mathematik und Physik. In C. Selter, S. Hußmann, C. Hößle, C. Knipping, K. Lengnink & J. Michaelis (Hrsg.), Diagnose und Förderung heterogener Lerngrup- pen. Theorien, Konzepte und Beispiele aus der MINT-Lehrerbildung (S. 149–168). Münster: Wax- mann. Berliner, D. C. (1986). In pursuit of the expert pedagogue. Educational Researcher, 15(7), 5–13. Berliner, D. C. (2001). Learning about and learning from expert teachers. International Journal of Educa- tional Research, 35, 463–482. Blomberg, G., Renkl, A., Garmoran Sherin, M., Borko, H., & Seidel, T. (2013). Five research-based heuri- stics for using video in pre-service teacher education. Journal of Educational Research, 5(1), 90–114. Blömeke, S., Gustafsson, J.-E., & Shavelson, R. J. (2015). Beyond dichotomies. Zeitschrift für Psychologie, 223(1), 3–13. Blömeke, S., König, J., Busse, A., Stuhl, U., Benthien, J., Döhrmann, M., & Kaiser, G. (2014). Von der Lehrerausbildung in den Beruf – Fachbezogenes Wissen als Voraussetzung für Wahrnehmung, Inter- pretation und Handeln im Unterricht. Zeitschrift für Erziehungswissenschaften, 17(3), 509–542. Böhmer, I., Gräsel, C., Krolak-Schwerdt, S., Hörstermann, T., & Glock, S. (2017). Teachers’ school tracking decision. In D. Leutner, J. Fleischer, J. Grünkorn & E. Klieme (Hrsg.), Competence as- sessment in education. Research, models and instruments (S. 131–148). Heidelberg: Springer. Bortz, J., & Döring, N. (2006). Forschungsmethoden und Evaluation für Human- und Sozialwissenschaftler (5. Aufl.). Heidelberg: Springer. Bühner, M. (2011). Einführung in die Test- und Fragebogenkonstruktion (3. Aufl.). München: Pearson Studium. Burnham, K. P., & Anderson, D. R. (2004). Multimodel inference: understanding AIC and BIC in model selection. Sociological Methods & Research, 33(2), 261–304. Christensen, K. B., Makransky, G., & Horton, M. (2017). Critical values for yen’s Q3: identification of local dependence in the Rasch model using residual correlations. Applied Psychological Measurement, 41(3), 178–194. Döring, N., & Bortz, J. (2016). Forschungsmethoden und Evaluation in den Sozial- und Humanwissen- schaften (5. Aufl.). Berlin: Springer. Eid, M., Gollwitzer, M., & Schmitt, M. (2010). Statistik und Forschungsmethoden. Lehrbuch. Weinheim: Beltz. Enenkiel, P. (2022). Diagnostische Fähigkeiten mit Videovignetten und Feedback fördern. Gruppenar- beitsprozesse zur Bestimmung von Längen, Flächen- und Rauminhalten. Wiesbaden: Springer Spek- trum. Enenkiel, P., & Roth, J. (2018). Diagnostische Fähigkeiten von Lehramtsstudierenden mithilfe von Video- vignetten fördern – Der Einfluss von Feedback. In Fachgruppe Didaktik der Mathematik der Uni- versität Paderborn (Hrsg.), Beiträge zum Mathematikunterricht 2018 (S. 513–516). Münster: WTM- Verlag. Frenzel, L., & Grund, K.-H. (1991a). Umgang mit Größen. Mathematik Lehren, 45, 10–14. Frenzel, L., & Grund, K.-H. (1991b). Wie tief ist der Brunnen? Einige Gedanken zum Anwenden von Mathematik. Mathematik Lehren, 45, 4–8. Gruber, H. (2001). Expertise. In D. H. Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie (S. 164– 169). Weinheim: Beltz. Hartig, J., & Goldhammer, F. (2010). Modelle der Item-Response-Theorie. In S. Maschke & L. Stecher (Hrsg.), Methoden der empirischen erziehungswissenschaftlichen Forschung. Enzyklopädie Erzie- hungswissenschaft Online (EEO) (S. 1–36). Weinheim: Juventa. Hartig, J., & Höhler, J. (2010). Modellierung von Kompetenzen mit mehrdimensionalen IRT-Modellen. Zeitschrift für Pädagogik, 56, 189–198. Heitzmann, N., Seidel, T., Poitz, A., Hetmanek, A., Wecker, C., Fischer, M., Ufer, S., Schmidmaier, R., Neuhaus, B., Siebeck, M., Stürmer, K., Obersteiner, A., Reiss, K., Girwidz, R., & Fischer, F. (2019). Facilitating diagnostic competences in simulations: A conceptual framework and a research agenda for medical and teacher education. Frontline Learning Research, 7(4), 1–24. Herppich, S., Praetorius, A.-K., Hetmanek, A., Glogger-Frey, I., Ufer, S., Leutner, D., Behrmann, L., Böh- mer, I., Böhmer, M., Förster, N., Kaiser, J., Karing, C., Karst, K., Klug, J., Ohle, A., & Südkamp, A. (2017). Ein Arbeitsmodell für die empirische Erforschung der diagnostischen Kompetenz von Lehrkräften. In A. Südkamp & A.-K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften. K 98 P. Enenkiel et al. Theoretische und methodische Weiterentwicklungen. Pädagogische Psychologie und Entwicklungs- psychologie, (Bd. 94, S. 75–94). Münster: Waxmann. Hetmanek, A., & van Gog, T. (2017). Förderung von diagnostischer Kompetenz: Potenziale von Ansät- zen aus der medizinischen Ausbildung. In A. Südkamp & A.-K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften (S. 209–216). Münster: Waxmann. Hiebert, J. (1981). Units of measure: results and implications from national assessment. The Arithmetik Teacher, 28(6), 38–43. Holling, H., & Gediga, G. (2015). Statistik – Testverfahren. Göttingen: Hogrefe. Horstkemper, M. (2006). Diagnostizieren und Fördern. Pädagogische Diagnostik als wichtige Vorausset- zung für individuellen Lernerfolg. Friedrich Jahresheft. (S. 4–7). Kaiser, J., Praetorius, A.-K., Südkamp, A., & Ufer, S. (2017). Die enge Verwobenheit von diagnostischem und pädagogischem Handeln als Herausforderung bei der Erfassung diagnostischer Kompetenz. In A. Südkamp & A.-K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften. Theoretische und methodische Weiterentwicklungen (S. 114–123). Münster: Waxmann. Karst, K., Klug, J., & Ufer, S. (2017). Strukturierung diagnostischer Situationen im inner- und außerun- terrichtlichen Handeln von Lehrkräften. In A. Südkamp & A.-K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften (S. 102–123). Münster: Waxmann. Krammer, K., & Reusser, K. (2005). Unterrichtsvideos als Medium der Aus- und Weiterbildung von Lehr- personen. Beiträge zur Lehrerinnen- und Lehrerbildung, 23(1), 35–50. Krammer, K., Hugener, I., Biaggi, S., Frommelt, M., Fürrer Auf der Maur, G., & Stürmer, K. (2016). Videos in der Ausbildung von Lehrkräften: Förderung der professionellen Unterrichtswahrnehmung durch die Analyse von eigenen bzw. fremden Videos. Unterrichtswissenschaft, 44(4), 357–372. Krauthausen, G. (2018). Einführung in die Mathematikdidaktik – Grundschule. Berlin: Springer. Kuckartz, U. (2016). Qualitative Inhaltsanalyse. Methoden, Praxis, Computerunterstützung (3. Aufl.). Weinheim: Beltz Juventa. Kulhavy, R. W. (1977). Feedback in written instruction. Review of Educational Research, 47(2), 211–232. Kuntze, S. (2018). Flächeninhalt und Volumen. In H.-G. Weigand, A. Filler, R. Hölzl, S. Kuntze, M. Lud- wig & J. Roth, et al. (Hrsg.), Didaktik der Geometrie für die Sekundarstufe I (2. Aufl. S. 149–178). Berlin, Heidelberg: Springer Spektrum. Lafrentz, H., & Eichler, K. P. (2004). Vorerfahrungen von Schulanfängern zum Vergleichen und Messen von Längen und Flächen. Grundschulunterricht, 7(8), 42–47. Leuders, T., Dörfler, T., Leuders, J., & Philipp, K. (2018). Diagnostic competence of mathematic teachers: unpacking a complex construct. In T. Leuders, K. Philipp & J. Leuders (Hrsg.), Diagnostic com- petence of mathematics teachers. Unpacking a complex construct in teacher education and teacher practice (S. 3–32). Cham: Springer. Loibl, K., Leuders, T., & Doerfler, T. (2020). A framework for explaining teachers’ diagnostic judgements by cognitive modeling (DiacoM). Teaching and Teacher Education, 91, 103059. Mayring, P. (2015). Qualitative Inhaltsanalyse. Grundlagen und Techniken (12. Aufl.). Weinheim: Beltz. Ministerium für Bildung, Wissenschaft, Jugend und Kultur Rheinland-Pfalz (2007). Rahmenlehrplan Ma- thematik (Klassenstufen 5–9/10). Mainz: Ministerium für Bildung, Wissenschaft, Jugend und Kultur Rheinland-Pfalz. Ministerium für Bildung, Wissenschaft, Jugend und Kultur Rheinland-Pfalz (2015). Lehrplan Mathematik Grund- und Leistungsfach in der gymnasialen Oberstufe (Mainzer Studienstufe). Mainz: Ministerium für Bildung, Wissenschaft, Jugend und Kultur Rheinland-Pfalz. Neubert, B., & Thies, S. (2012). Zur Entwicklung des Flächeninhaltsbegriffs. Mathematik Lehren, 172, 15–19. Peter-Koop, A. (2001). Authentische Zugänge zum Umgang mit Größen. Die Grundschulzeitschrift, 141(15), 6–11. Peter-Koop, A., & Nührenbörger, M. (2016). Größen und Messen. In G. Walther, M. Van den Heuvel- Panhuizen, D. Granzer & O. Köller (Hrsg.), Bildungsstandards für die Grundschule: Mathematik konkret (S. 89–117). Berlin: Cornelsen. Radatz, H., & Schipper, W. (2007). Handbuch für den Mathematikunterricht an Grundschulen. Hannover: Schroedel. Rehm, M., & Bölsterli, K. (2014). Entwicklung von Unterrichtsvignetten. In D. Krüger, I. Parchmann & H. Schecker (Hrsg.), Methoden in der naturwissenschaftsdidaktischen Forschung (S. 213–226). Heidelberg: Springer. Rost, J. (2004). Lehrbuch Testtheorie – Testkonstruktion (2. Aufl.). Bern: Huber. K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 99 Roth, J. (2020). Theorie-Praxis-Verzahnung durch Lehr-Lern-Labore – das Landauer Konzept der mathe- matikdidaktischen Lehrpersonenbildung. In B. Priemer & J. Roth (Hrsg.), Lehr-Lern-Labore. Kon- zepte und deren Wirksamkeit in der MINT-Lehrpersonenbildung (S. 59–84). Berlin: Springer. Ruwisch, S. (2003). Gute Aufgaben für die Arbeit mit Größen – Erkundungen zum Größenverständnis von Grundschulkindern als Ausgangbasis. In S. Ruwisch & A. Peter-Koop (Hrsg.), Gute Aufgaben im Ma- thematikunterricht der Grundschule (S. 211–227). Offenburg; Mildenberger. Didaktik des Sachrech- nens in der Grundschule/Marianne Franke. Zentralblatt für Didaktik der Mathematik, 35(5), 41–43. Sabers, D. S., Cushing, K. S., & Berliner, D. C. (1991). Differences among teachers in a task characteri- zed by simultaneity, multidimensionality, and immediacy. American Educational Research Journal, 28(1), 63–88. Schmidt, R. (2014). Flächenvergleich durch Stempeln. Praxis der Mathematik in der Schule, 55, 11–14. Schrader, F.-W. (2011). Lehrer als Diagnostiker. In E. Terhart (Hrsg.), Handbuch der Forschung zum Leh- rerberuf (S. 683–698). Münster: Waxmann. Sclove, S. L. (1987). Application of model-selection criteria to some problems in multivariate analysis. Psychometrika, 52(3), 333–343. Seago, N. (2004). Using video as an object of inquiry mathematics teaching and learning. In J. E. Brophy (Hrsg.), Using video in teacher education: Advances in research on teaching (S. 259–285). Amster- dam: Elsevier. Seidel, T., & Prenzel, M. (2007). Wie Lehrpersonen Unterricht wahrnehmen und einschätzen – Erfassung pädagogisch-psychologischer Kompetenzen mit Videosequenzen. In M. Prenzel, I. Gogolin & H.- H. Krüger (Hrsg.), Kompetenzdiagnostik (S. 201–216). Wiesbaden: Verlag für Sozialwissenschaften. Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutsch- land (2004). Beschlüsse der Kultusministerkonferenz. Bildungsstandards im Fach Mathematik für den Mittleren Schulabschluss. Beschluss vom 4.12.2003. München: Wolters Kluwer. https://www. kmk.org/fileadmin/veroeffentlichungen_beschluesse/2003/2003_12_04-Bildungsstandards-Mathe- Mittleren-SA.pdf. Zugegriffen: 19. Dez. 2020. Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (2012). Bildungsstandards im Fach Mathematik für die Allgemeine Hochschulreife. Beschluss vom 18.10.2012. Köln: Wolters Kluwer. https://www.kmk.org/fileadmin/veroeffentlichungen_ beschluesse/2012/2012_10_18-Bildungsstandards-Mathe-Abi.pdf. Zugegriffen: 19. Dez. 2020. Star, J. R., & Strickland, S. K. (2008). Learning to observe: using video to improve preservice mathematics teachers’ ability to notice. Journal of Mathematics Teacher Education, 11(2), 107–125. Sunder, C., Todorova, M., & Möller, K. (2016). Kann die professionelle Unterrichtswahrnehmung von Sachunterrichtsstudierenden trainiert werden? Konzeption und Erprobung einer Intervention mit Vi- deos aus dem naturwissenschaftlichen Grundschulunterricht. Zeitschrift für Didaktik der Naturwis- senschaften, 22(1), 1–12. Syring, M., Bohl, T., Kleinknecht, M., Kuntze, S., Rehm, M., & Schneider, J. (2015). Videos oder Texte in der Lehrerbildung? Effekte unterschiedlicher Medien auf die kognitive Belastung und die mo- tivational-emotionalen Prozesse beim Lernen mit Fällen. Zeitschrift für Erziehungswissenschaften, 18(4), 667–685. Van Es, E. A., & Sherin, M. G. (2010). The influence of video clubs on teachers’ thinking and practice. Journal of Mathematics Teacher Education, 13(2), 155–176. Von Aufschnaiter, C., Münster, C., & Beretz, A.-K. (2018). Zielgerichtet und differenziert diagnostizieren. MNU Journal, 71(6), 382–387. Von Aufschnaiter, C., Selter, C., & Michaelis, J. (2017). Nutzung von Vignetten zur Entwicklung von Dia- gnose- und Förderkompetenzen – Konzeptionelle Überlegungen und Beispiele aus der MINT-Leh- rerbildung. In C. Selter, S. Hußmann, C. Hößle, C. Knipping & K. Lengnink (Hrsg.), Diagnose und Förderung heterogener lerngruppen. Theorien, Konzepte und Beispiele aus der MINT-Lehrerbildung (S. 85–105). Münster: Waxmann. Wahl, D. (2002). Mit Training vom trägen Wissen zum kompetenten Handeln? Zeitschrift für Pädagogik, 48(2), 227–241. Walz, M. (2020). Das Interventionsverhalten von Studierenden mit divergierender prozessdiagnostischer Fähigkeit „Deuten“. Universität Koblenz-Landau, Campus Landau. https://kola.opus.hbz-nrw.de/ frontdoor/index/index/docId/2132. Zugegriffen: 21. Febr. 2022. Weigand, H.-G. (2018). Begriffslernen und Begriffslehren. In H.-G. Weigand, A. Filler, R. Hölzl, S. Kunt- ze, M. Ludwig & J. Roth, et al. (Hrsg.), Didaktik der Geometrie für die Sekundarstufe I (2. Aufl. S. 85–106). Berlin, Heidelberg: Springer Spektrum. Wu, M., Tam, H. P., & Jen, T.-H. (2016). Educational measurement for applied researchers. Theory into practice. Singapur: Springer. http://www.deepdyve.com/assets/images/DeepDyve-Logo-lg.png Journal für Mathematik-Didaktik Springer Journals

Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern

Loading next page...
 
/lp/springer-journals/diagnostische-f-higkeiten-mit-der-videobasierten-lernumgebung-vivian-f-xywpu347HO

References (76)

Publisher
Springer Journals
Copyright
Copyright © The Author(s) 2022
ISSN
0173-5322
eISSN
1869-2699
DOI
10.1007/s13138-022-00204-y
Publisher site
See Article on Publisher Site

Abstract

J Math Didakt (2022) 43:67–99 https://doi.org/10.1007/s13138-022-00204-y ORIGINALARBEIT/ORIGINAL ARTICLE Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern Patrizia Enenkiel · Marie-Elene Bartel · Moritz Walz · Jürgen Roth Eingegangen: 21. Dezember 2020 / Angenommen: 1. März 2022 / Online publiziert: 15. März 2022 © Der/die Autor(en) 2022 Zusammenfassung Ziel des vorliegenden Forschungsprojekts ist es, zu untersu- chen, ob diagnostische Fähigkeiten von Mathematiklehramtsstudierenden mit der vi- deobasierten Lernumgebung ViviAn (https://vivian.uni-landau.de) gefördert werden können. Für die Entwicklung von ViviAn wurden kurze Videovignetten aus video- grafierten Gruppenarbeiten im Mathematik-Labor „Mathe ist mehr“ zugeschnitten und mit entsprechenden Kontextinformationen in der dazu entwickelten Lernumge- bung ViviAn implementiert. Die Videovignetten zeigen Schülerinnen und Schüler der Klassenstufen 5, 6 und 11 bei der Bearbeitung von Aufgaben zur Bestimmung von Längen, Flächen- und Rauminhalten geometrischer Figuren. Entsprechend um- fasst der Diagnosegegenstand die Fähigkeiten, die die Schülerinnen und Schüler bei der Bearbeitung der Aufgaben zeigen und die Schwierigkeiten, die sie beim Lö- sen dieser Aufgaben haben. Ausgehend vom Diagnosegegenstand und dem Ziel der Förderung der Schülerinnen und Schüler leiten inhaltlich abgestimmte Diagnose- aufträge die Studierenden durch die Videoanalysen. Die diagnostischen Fähigkeiten wurden hierbei durch die Teilkomponenten Beschreiben, Deuten, Ursachen finden und Konsequenzen ableiten operationalisiert. Um den Studierenden die Möglichkeit zu geben, mit Hilfe der Lernumgebung ihre diagnostischen Fähigkeiten zu entwi- ckeln, können sie ihre Antworten mit Musterlösungen zu den Diagnoseaufträgen vergleichen. Zur Prüfung der Wirksamkeit der videobasierten Lernumgebung wurde eine quasi-experimentelle Studie mit einer Kontrollgruppe durchgeführt. Die Er- gebnisse zeigen, dass die Arbeit mit der videobasierten Lernumgebung zu einer signifikanten Lernentwicklung der Mathematiklehramtsstudierenden hinsichtlich ih- rer diagnostischen Fähigkeiten in diesem mathematikdidaktischen Bereich beiträgt. Bei der Kontrollgruppe hingegen konnte kein Lerneffekt verzeichnet werden. Wir Patrizia Enenkiel () · Marie-Elene Bartel · Moritz Walz · Jürgen Roth Campus Landau, Universität Koblenz-Landau, Fortstraße 7, 76829 Landau, Deutschland E-Mail: enenkiel@uni-landau.de K 68 P. Enenkiel et al. schließen daraus, dass die Arbeit mit ViviAn Studierende dabei unterstützen kann, diagnostische Fähigkeiten zu entwickeln. Schlüsselwörter Förderung diagnostischer Fähigkeiten · Videobasierte Lernumgebung · Quasi-experimentelle Studie · Mathematiklehramtsstudierende Promoting Diagnostic Skills with the Video-Based Learning Environment ViviAn Abstract The aim of the present research project is to investigate whether diagnos- tic skills of pre-service mathematics teachers can be enhanced by using the video- based learning environment ViviAn (https://vivian.uni-landau.de). For this purpose, short video vignettes which show different groups of students working in the math- ematics lab “math is more” were recorded. The video vignettes show students of class 5, 6 und 11 working on different tasks. To solve the tasks the students have to determine lengths, areas and spatial volume of geometric figures. Those video vignettes were cut and implemented with appropriate contextual information in the learning environment ViviAn (https://vivian.uni-landau.de). The pre-service teachers are supposed to diagnose how the students solve the tasks and which difficulties they have in doing so. Content-based diagnostic assignments guide the pre-service teach- ers through the video analyses. The diagnostic skills were operationalized through the subcomponents of describing, interpreting, finding causes and deriving conse- quences. The pre-service teachers can compare their answers to expert solutions. Thus, the development of their diagnostic skills should be supported. To test the effectiveness of the video-based learning environment a quasi-experimental study with a control group was conducted. The results show that working with the video- based learning environment contributes to a significant learning development of the pre-service teachers in terms of their diagnostic skills. In contrast, no learning effect was measured for the control group. We conclude that working with the video-based learning environment ViviAn can support students by developing their diagnostic skills. Keywords Promotion of diagnostic skills · Video-based learning environment · Quasi-experimental study · Pre-service teachers 1 Einleitung Die Anforderungen, die eine Lehrkraft im Schulalltag bewältigen muss, sind viel- fältig. Insbesondere in Unterrichtsprozessen, die von Interaktionen geprägt sind, müssen Lehrkräfte, oftmals unter großem Handlungsdruck, lernrelevante Merkmale von Schülerinnen und Schülern wahrnehmen und interpretieren, um anschließend den Lehr-Lernprozess adäquat gestalten zu können. Diese Fähigkeiten können un- ter dem Begriff diagnostische Fähigkeiten gefasst werden (Leuders et al. 2018). Es wird angenommen, dass solche handlungsrelevanten Fähigkeiten erst durch um- fangreiche Praxiserfahrungen entwickelt werden (Berliner 1986; Gruber 2001). Vor K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 69 dem Hintergrund, dass das erworbene Wissen von Lehramtsstudierenden oftmals nur unzureichend in praktischen Phasen umgesetzt wird (Wahl 2002), sind praxis- nahe Möglichkeiten zur Förderung dieser Fähigkeiten sehr bedeutsam. Diese sind in der Realität der universitären Lehrerbildung sowohl bei didaktischen Großveran- staltungen als auch bei inhaltsspezifischen Seminaren jedoch nur bedingt gegeben. Aus diesem Grund kommt der Analyse von videografierten Unterrichtsprozessen als Ergänzung zum theoretischen Input eine große Bedeutung zu. Videos haben den Vorteil, authentische Unterrichtsprozesse abzubilden und dennoch die Komplexität des Unterrichtsalltags zu reduzieren, wodurch handlungssteuernde Prozesse bewusst erarbeitet werden können (Wahl 2002). In bisherigen Studien wurden Videos insbe- sondere im Rahmen von Seminaren (etwa Sunder et al. 2016) eingesetzt. Um Videos mit den beschriebenen Potenzialen auch in Großveranstaltungen zu nutzen, haben wir die videobasierte Lernumgebung ViviAn „Videovignetten zur Analyse von Un- terrichtsprozessen“ (vgl. https://vivian.uni-landau.de) entwickelt. Hier sind neben einem kurzen Videoausschnitt weitere Hintergrundinformationen implementiert, die die Studierenden vor, während und nach der Betrachtung des Videos im Rahmen der eigenständigen Auseinandersetzung mit den Unterrichtsprozessen nutzen können (vgl. Abschn. 4.1). Ziel des vorliegenden Forschungsvorhabens ist es, zu untersu- chen, ob diagnostische Fähigkeiten von Studierenden mithilfe der videobasierten Lernumgebung ViviAn gefördert werden können. 2 Theoretische Grundlagen 2.1 Diagnostische Fähigkeiten Für eine gezielte, individuelle Förderung von Schülerinnen und Schülern erscheinen adäquate Diagnosen seitens der Lehrenden nicht nur notwendig, sondern vielmehr essenziell (Horstkemper 2006; Leuders et al. 2018). In diesem Abschnitt werden zunächst die dazu erforderlichen diagnostischen Fähigkeiten als zentrale Kompo- nente diagnostischer Kompetenz dargestellt und im Kontinuum-Modell nach Blö- meke et al. (2015) verortet. Da Lehramtsstudierende kaum Möglichkeiten haben diese bedeutenden Fähigkeiten in der Unterrichtspraxis zu entwickeln, werden in der Hochschule vermehrt Videos eingesetzt. Deren vielfältiges Potenzial ist ebenfalls in diesem Abschnitt dargestellt. Um dieses Potenzial zu nutzen, ist eine strukturierte Analyse der Videos vonnöten. Diese kann durch fokussierende Aufgaben, die sich auf unterrichtsrelevante Aspekte beziehen, realisiert werden. Die Aufgaben wurden in Anlehnung an ein Modell für einen Diagnoseprozess von Beretz et al. (2017) entwickelt, das abschließend vorgestellt wird. 2.1.1 Begriffsklärung Die anfallenden Diagnoseaufgaben einer Lehrkraft sind vielfältig. Sowohl bei der Erstellung von Zeugnisnoten oder Schullaufbahnempfehlungen als auch bei der Pla- nung und Durchführung des Unterrichts müssen Lehrkräfte diagnostische Leistungen erbringen (Schrader 2011). Die Gesamtheit der Fähigkeiten, die für die Bewältigung K 70 P. Enenkiel et al. der Diagnoseaufgaben notwendig sind, bezeichnet Schrader (2011)als Diagnos- tische Kompetenz. Die Untersuchung dieses Konstrukts wurde in Deutschland in den vergangenen Jahrzehnten, insbesondere infolge des schlechten Abschneidens Deutschlands in internationalen Vergleichsstudien, deutlich intensiviert. Vor diesem Hintergrund gibt es eine Reihe von Ansätzen zur Konzeptualisierung des Konstrukts der diagnostischen Kompetenz. Einer dieser Ansätze führt über den allgemeinen Kompetenzbegriff und kann durch das Kompetenzmodell von Blömeke et al. (2015) beschrieben werden. Bei der Modellierung werden zwei in der Forschung existierende kontroverse Perspek- tiven auf den Kompetenzbegriff berücksichtigt. Die erste Perspektive betont die Bedeutsamkeit des erfolgreichen Handelns in spezifischen Situationen. Die zwei- te Perspektive stammt aus der Bildungsforschung und legt ihren Schwerpunkt auf die kognitiven, motivationalen und affektiven Voraussetzungen, die einem Verhalten zugrunde liegen (Blömeke et al. 2015). Eine Möglichkeit zur Überwindung dieser Dichotomien besteht in der Berücksichtigung beider Perspektiven. Das Kompetenz- modell ist demnach als eine Art Kontinuum zu verstehen, wobei die kognitiven und affektiv-motivationalen Dispositionen und die Performanz durch situationsspezifi- sche Fähigkeiten mediiert werden (Blömeke et al. 2015). Dieses Kompetenzmodell wurde von Leuders et al. (2018) auf die diagnostische Kompetenz übertragen (vgl. Abb. 1) und gliedert sich in die Kompetenzfacetten dia- gnostische Dispositionen, diagnostische Fähigkeiten und diagnostische Performanz. Die diagnostischen Dispositionen umfassen die personenbezogenen Voraussetzun- gen, die es einer Lehrkraft ermöglichen, in diagnostischen Situationen adäquat zu handeln. Diagnostische Fähigkeiten können als kognitive Prozesse beschrieben wer- den, die sich in dem Modell von Leuders et al. (2018) bzw. von Blömeke et al. (2015) aus dem Wahrnehmen, Interpretieren und Entscheiden zusammensetzen. Die diag- nostischen Fähigkeiten basieren auf der einen Seite auf den diagnostischen Disposi- tionen und münden auf der anderen Seite in die diagnostische Performanz, welche das beobachtbare Verhalten in diagnostischen Situationen darstellt. Bei der Betrachtung diagnostischer Kompetenz schreiben viele Autorinnen und Autoren den diagnostischen Fähigkeiten eine hohe Relevanz zu. „Werden einzelne oder mehrere [...] Teilschritte nicht adäquat vollzogen, ist von mehr oder weniger starken Verzerrungen im Urteil auszugehen“ (Behrmann und Glogger-Frey 2017, S. 137). Welche kognitiven Prozesse dabei genau durchlaufen werden, hängt in ho- hem Maß von der diagnostischen Situation ab, in der sich eine Lehrkraft befindet, und lässt keine allgemeingültige Konzeptualisierung zu (Herppich et al. 2017;Het- manek und van Gog 2017; Karst et al. 2017; Loibl et al. 2020). So wird eine Lehrkraft Abb. 1 Diagnostische Kompe- tenz als Kontinuum (Leuders Diagnossche Diagnossche Diagnossche et al. 2018) Disposionen Fähigkeiten Performanz Wissen Wahrnehmen Überzeugungen Beobachtbares Interpreeren Movaon Verhalten Entscheiden Emoonen K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 71 den diagnostischen Prozess bei einer Übergangsempfehlung, aufgrund der verbind- lichen und weitreichenden Konsequenzen ihrer Empfehlung, sehr strukturiert durch- laufen und dabei auf viele Informationen zurückgreifen, um dann letztendlich eine Übergangsempfehlung auszusprechen. Hingegen werden Lehrkräfte in alltäglichen Unterrichtssituationen, aufgrund des großen Handlungsdrucks, den kognitiven Pro- zess weniger strukturiert und vermutlich eher heuristisch durchlaufen, um etwa den Unterricht kurzfristig an den Lernstand der Schülerinnen und Schüler anzupassen . Studien zeigen, dass Lehrkräfte zwischen mehreren Informationen abwägen und tendenziell eine hohe Anstrengungsbereitschaft bei der Verarbeitung von Informa- tionen zeigen, wenn mit dem Urteil eine hohe Konsequenz einhergeht, wie beispiels- weise eine Schullaufbahnempfehlung (Böhmer et al. 2017). Die Autoren schluss- folgern daraus, dass Lehrkräfte, abhängig von der jeweiligen diagnostischen Situa- tion, zwischen heuristischer und strukturierter Informationsverarbeitung wechseln. Bisherige Forschungsergebnisse führen zur Annahme, dass sich erfahrene und un- erfahrene Lehrkräfte hinsichtlich der Wahrnehmung und Verarbeitung von Informa- tionen unterscheiden (Berliner 2001). So zeigt eine Studie von Star und Strickland (2008), dass Mathematiklehramtsstudierende bei der Analyse von Unterrichtsvideos lediglich unspezifische Aussagen zu der videografierten Unterrichtssituation machen konnten und hinsichtlich des mathematischen Themas nur wenige Fragen richtig beantworteten. Die Ergebnisse können von weiteren Autoren gestützt werden. So zeigen die Ergebnisse einer Studie von Seidel und Prenzel (2007), dass Lehrkräfte mit Berufserfahrung besser in der Lage sind, Unterrichtsaspekte zu bewerten und zu interpretieren, als Lehramtsstudierende. Sabers et al. (1991) kommen zu ähnli- chen Schlussfolgerungen. So nehmen unerfahrene Lehrkräfte häufiger Wertungen vor und sind weniger in der Lage, Ursachen für das Verhalten der Schülerinnen und Schüler zu identifizieren, als erfahrene Lehrkräfte. Die Ergebnisse werden häu- fig damit begründet, dass Lehramtsstudierende noch nicht in der Lage sind, auf ihr fachliches und fachdidaktisches Wissen zurückzugreifen und dieses in praxis- nahen Unterrichtssituationen anzuwenden. Die Ergebnisse stützen die Annahme, dass Studierende bereits im Lehramtsstudium die Möglichkeit erhalten sollten, ihr erworbenes Wissen anzuwenden, um so der Theorie-Praxis-Kluft im Studium entge- genzuwirken. So beschreiben Sabers et al. (1991): „Because the performance of the advanced beginners was not equal to the experts in a number of domains, perhaps policymakers need to rethink the content and structure of typical teacher education programs. Perhaps we need to structure experiences for preservice and practicing teachers that will facilitate the development of expertise.“ (S. 85). Ob die pädagogischen Handlungen, wie sie im Modell von Leuders et al. (2018) als diagnostische Per- formanz aufgeführt sind, noch Teil der diagnostischen Kompetenz sind, wird kontrovers diskutiert. Kaiser et al. (2017) beschreiben, dass die Verknüpfung von diagnostischen und pädagogischen Handlungen von der jeweiligen Situation abhängt. So lässt sich bei einer Übergangsempfehlung die Diagnose von der pä- dagogischen Handlung trennen. In einer diagnostischen Situation im Unterricht muss eine Lehrkraft un- mittelbar reagieren, weshalb die Diagnose in den meisten Fällen direkt in eine pädagogische Handlung mündet. K 72 P. Enenkiel et al. 2.1.2 Analyse von Unterrichtsvideos Eine Möglichkeit zur Überwindung der beschriebenen Theorie-Praxis-Kluft bietet die Analyse von Unterrichtsvideos. So können die im Lehramtsstudium vermittelten theoretischen Grundlagen illustriert werden. Videos bilden durch visuelle, auditi- ve und nonverbale Informationen authentische Unterrichtssituationen ab (Krammer und Reusser 2005). Sie können jedoch aufgrund der Parallelität der Handlungen und Aussagen Studierende kognitiv stark beanspruchen, was durch bisherige Stu- dien belegt werden konnte (z. B. Syring et al. 2015). Um Studierende kognitiv zu entlasten, bietet sich der Einsatz von Videovignetten an, die kurze Unterrichtssze- nen darstellen (Rehm und Bölsterli 2014). Dadurch beschränkt sich die Analyse auf kurze Unterrichtssequenzen, wodurch der Fokus auf inhaltlich relevante Aspekte ge- legt werden kann. Zudem bieten Videos den Vorteil, dass sie ohne Handlungsdruck mehrmals analysiert werden können, wodurch die Komplexität, die in realen Unter- richtssituationen auftritt, reduziert wird (Heitzmann et al. 2019). Um das Potenzial von Videoanalysen für das Lehramtsstudium ausschöpfen zu können, bedarf es der Gestaltung geeigneter Lernumgebungen (Krammer und Reusser 2005), die mehre- re Aspekte berücksichtigt sollten. Der wohl wichtigste Aspekt ist die Festlegung des Lernziels, das mit der Videoanalyse erreicht werden soll (Blomberg et al. 2013). Vor dem Hintergrund der Zielperspektive werden dann entsprechende Videos erstellt und Aufgaben zur Analyse entwickelt (von Aufschnaiter et al. 2017). Soll beispiels- weise das Handeln von Lehrkräften und die resultierenden Auswirkungen auf den Lernprozess der Schülerinnen und Schüler analysiert werden, eignen sich Videovi- gnetten, in denen Interaktionen von Lehrkräften und Lernenden zu beobachten sind. Steht hingegen die Analyse von Lernprozessen von Schülerinnen und Schüler im Vordergrund, eignen sich Videovignetten, die Lernende bei Aufgabenbearbeitungen zeigen (von Aufschnaiter et al. 2017). Zur Reflexion der eigenen Wahrnehmung und des eigenen Handelns bietet sich in der Weiterbildung von Lehrkräften die Analyse von Videos des eigenen Unterrichts an. Da Studierende jedoch nur selten die Möglichkeit haben, eigenständigen Unterricht durchzuführen, der videografiert werden kann, werden im Lehramtsstudium häufig fremde Videos analysiert. Durch die Analyse von solchen kann eine kritische Distanzhaltung eingenommen werden, da die videografierten Schülerinnen und Schüler und gegebenenfalls die videogra- fierte Lehrkraft den Studierenden unbekannt sind. Jedoch fehlen den Studierenden dadurch auch entsprechende Kontextinformationen, wodurch die Analyse erschwert wird (Blomberg et al. 2013). Um dieser Problematik entgegenzuwirken, sollten den Studierenden neben der Videovignette weitere Informationen bereitgestellt werden, über die auch die betreuende Lehrperson in der Regel verfügt (Blomberg et al. 2013). Bisherige Studien weisen darauf hin, dass die Analyse von Videovignetten für die Wahrnehmung und Verarbeitung relevanter Unterrichtsaspekte ertragreich sein kann (z. B. Krammer et al. 2016; Sunder et al. 2016). Die Ergebnisse einer Studie im Pre-Post-Design von Sunder et al. (2016) lassen jedoch darauf schließen, dass eine Förderung durch Videoanalysen nicht nur fachabhängig, sondern auch themenab- hängig ist. Die Studierenden in der Studie konnten sich nämlich nur bei der Analyse von solchen Videovignetten verbessern, die das Thema der Videovignetten in der Intervention abbildeten. Dies lässt darauf schließen, dass diagnostische Leistungen K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 73 in hohem Maß vom Diagnosegegenstand abhängen. Im Rahmen dieser Studie wurde das Erarbeiten von Längen, Flächen- und Rauminhalten durch Schülerinnen und Schülern als Diagnosegegenstand gewählt (vgl. Abschn. 2.2). Um die Studierenden im Zuge der Analyse der Unterrichtsvideos bei der Fokus- sierung auf den gewählten Diagnosegegenstand zu unterstützen, muss dieser sich in den konzipierten Aufgaben wiederfinden. Zudem müssen die Aufgaben zu einer aktiven Auseinandersetzung mit den in den Videovignetten dargestellten relevanten Unterrichtsaspekten anregen und somit Facetten abbilden, die einen Diagnoseprozess anregen. Um Studierende beim Aufbau diagnostischer Fähigkeiten zu unterstützen, haben Beretz et al. (2017) und von Aufschnaiter et al. (2018) ein Modell für einen Diagnoseprozess entwickelt, der folgende Schritte beinhaltet: (1) Daten erheben/ sichten, (2) Beobachtungen beschreiben, (3) Beobachtungen deuten, (4) Ursachen ergründen und (5) Konsequenzen ableiten. Im ersten Schritt wird auf geeignete Da- ten zurückgegriffen, die vor dem Hintergrund einer diagnostischen Fragestellung selbst erhoben oder aus vorhandenen Quellen extrahiert wurden. Welche Daten er- fasst werden sollen, hängt vom intendierten Ziel der Diagnostik ab. Im zweiten Schritt werden die anhand der Daten getätigten relevanten Beobachtungen beschrie- ben. Dieser Schritt dient primär der Zusammenstellung relevanter Informationen, die aus den Beobachtungen gewonnen werden können. Anhand dieser Beschrei- bungen können dann lernrelevante Beobachtungen differenziert gedeutet werden. Das kann z. B. die Analyse von Fähigkeiten, Fertigkeiten sowie Schwierigkeiten der Schülerinnen und Schüler beinhalten. In der Regel wird dazu fachdidaktisches Wissen genutzt, indem etwa auf das Wissen über typische Fehlvorstellungen von Schülerinnen und Schüler zurückgegriffen wird. Für die getätigten Deutungen wird im nächsten Schritt nach Erklärungen und Ursachen gesucht. Beretz et al. (2017) schreiben diesem Schritt eine hohe Relevanz zu, da er „[...] zu einer intensiveren Auseinandersetzung mit dem Denken und Handeln der Schülerinnen und Schüler und einer positiven Einstellung gegenüber den Lernenden führen [...]“ kann (S. 151). Die möglichen Ursachen geben auch wertvolle Anhaltspunkte für die anschließende Ableitung von Konsequenzen, da eine Interventionsmaßnahme maßgeblich davon abhängt, welche Ursache den Aussagen und Handlungen der Lernenden zugrun- de liegt. Die resultierenden Konsequenzen beinhalten Hinweise, wie die Lernenden im weiteren Lernprozess unterstützt werden können und bilden den Ausgangspunkt für die Gestaltung adäquater Fördermaßnahmen. Von Aufschnaiter et al. (2018) fassen die Gestaltung der Fördermaßnahme, wie andere Autorinnen und Autoren (vgl. Abschn. 2.1.1) jedoch nicht mehr unter die Diagnostik. Wie bereits dargestellt, bedarf die Analyse von Unterrichtsvideos einem eindeutigen Diagnosegegenstand, welcher im Folgenden erläutert wird. 2.2 Bestimmung von Längen, Flächen- und Rauminhalten Das Bestimmen von Längen, Flächen- und Rauminhalten ist ein wichtiges Themen- gebiet in der Mathematik und wird im Sinne des Spiralprinzips über die Jahrgangs- stufen hinweg mehrfach aufgegriffen und erweitert sowie vertieft. Durch den di- rekten Alltagsbezug, beispielsweise das Messen von Körpergrößen, besitzen bereits Schulanfänger Kenntnisse über Größenbereiche und Maßeinheiten (z. B. Lafrentz K 74 P. Enenkiel et al. und Eichler 2004;Ruwisch 2003). In der Primarstufe machen Schülerinnen und Schüler erste Erfahrungen mit dem Vergleichen und Messen von Längen, Flä- chen- und Rauminhalten (Ministerium für Bildung, Wissenschaft, Jugend und Kultur Rheinland-Pfalz 2015). In der Sekundarstufe I werden dann entsprechende Formeln hergeleitet, um Längen sowie Flächen- und Rauminhalte von geometrischen Figu- ren zu berechnen. In diesem Zusammenhang wird erstmals das Umrechnen von Maßeinheiten behandelt (Ministerium für Bildung, Wissenschaft, Jugend und Kul- tur Rheinland-Pfalz 2007; Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland 2004). In der Sekundarstufe II wer- den die Vorerfahrungen schließlich aufgegriffen, um die Integralrechnung durch die Approximation der Ober- und Untersumme einzuführen (Ministerium für Bildung, Wissenschaft, Jugend und Kultur Rheinland-Pfalz 2015; Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland 2012). Für die Erarbeitung von Größen bzw. Größenbereichen im Unterricht wird häu- fig auf didaktische Stufenmodelle verwiesen, in denen das Rechnen mit Größen in mehreren Schritten erarbeitet wird (z. B. Radatz und Schipper 2007). Über die Vorer- fahrungen der Schülerinnen und Schüler werden Repräsentanten erst direkt und an- schließend indirekt über selbstgewählte und standardisierte Maßeinheiten verglichen (vgl. Abb. 2). Darauf folgt das Umwandeln der Maßeinheiten des entsprechenden Größenbereichs, bis schließlich die Größen miteinander verrechnet werden. Solche Stufenmodelle stehen häufig in der Kritik, da eine sukzessive Abfolge nicht immer sinnvoll und oftmals auch nur bedingt möglich ist (Krauthausen 2018). So erscheint etwa das indirekte Vergleichen mit selbstgewählten Maßeinheiten oft künstlich, da Schülerinnen und Schüler bereits Vorerfahrungen zu standardisier- ten Maßeinheiten besitzen (Peter-Koop 2001). Darüber hinaus kann es in einigen Situationen durchaus sinnvoll sein, Vergleiche von Repräsentanten durchzuführen, auch wenn Lernende bereits mit standardisierten Maßeinheiten messen können. Je- de Vorgehensweise führt zu einem eigenen Erkenntnisgewinn und trägt zu einem umfassenden Verständnis des jeweiligen Größenbereiches bei (Schmidt 2014). Es erscheint daher weitaus zielführender, dass Lernende selbst erkennen, in welchem Kontext welche Vorgehensweise sinnvoll anzuwenden ist und welche Maßeinheiten genutzt werden sollten. Vor diesem Hintergrund wurden die Vorgehensweisen beim Bestimmen von Län- gen, Flächen- und Rauminhalten im Sinne von Strategien kategorisiert und die- se Strategien beschrieben (Enenkiel und Roth 2018). Neben dem Vergleichen und Messen wird in der Kategorisierung auch das Berechnen von Größen aufgeführt, so dass Vorgehensweisen zur Bestimmung von Längen, Flächen- und Rauminhalten in ihrer ganzen Breite abgedeckt werden. Diese Vorgehensweisen erfordern zum Teil arithmetische Fähigkeiten sowie Kenntnisse über geometrische Figuren, weshalb das Themengebiet auch in der Schnittmenge der Arithmetik und der Geometrie einge- ordnet werden kann (Peter-Koop und Nührenbörger 2016). Beim Umgang mit Grö- Indirektes Indirektes Vorerfahrungen Direktes Vergleichen mit Vergleichen mit Umwandeln von Rechnen mit sammeln Vergleichen selbstgewählten standardisierten Maßeinheiten Größen Maßeinheiten Maßeinheiten Abb. 2 Stufenmodell zum Bestimmen von Längen, Flächen- und Rauminhalten (Enenkiel 2022) K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 75 ßen werden Zahlen zu Maßzahlen (Peter-Koop und Nührenbörger 2016). Neben der Maßzahl muss jedoch auch zwingend die Maßeinheit berücksichtigt werden. Schü- lerinnen und Schüler orientieren sich beim Ordnen von Größen oftmals nur an der Maßzahl (Hiebert 1981), was zu falschen Ergebnissen führt, wenn die Maßeinheiten nicht identisch sind. So können Größen mit der gleichen Maßeinheit, wie Zahlen, einfach addiert und subtrahiert werden. Größen mit verschiedenen Maßeinheiten aus dem gleichen Größenbereich müssen zunächst umgewandelt werden. Die Addi- tion und Subtraktion von Größen verschiedener Größenbereiche ist hingegen nicht möglich. Bei der Multiplikation und Division von Größen verändert sich der Größen- bereich und ist darüber hinaus nur bei „verträglichen“ Maßeinheiten gültig (Frenzel und Grund 1991a). Entsprechend können Größen nur miteinander multipliziert oder dividiert werden, wenn das resultierende Ergebnis einen realen Größenbereich re- präsentiert wie beispielsweise die Berechnung des Flächeninhalts eines Rechtecks durch die Multiplikation der Kantenlängen. Für die Umrechnung von Maßeinheiten benötigen Schülerinnen und Schüler Kenntnisse über die entsprechenden Umwand- lungszahlen sowie die Fähigkeit, mit Dezimalbrüchen rechnen zu können. Neben den arithmetischen Fähigkeiten benötigen Lernende aber auch Kenntnisse über geo- metrische Figuren und die entsprechenden Größenbereiche. Fehlt das Verständnis von geometrischen Figuren (z. B. Rechteck) oder von Maßbegriffen (z. B. Flächen- inhalt) haben Lernende Schwierigkeiten, entsprechende Aufgaben adäquat zu lösen (Lafrentz und Eichler 2004). Auf der anderen Seite fördern aktive und umfang- reiche Handlungen, wie umfassende Messerfahrungen an realen Objekten auch die Entwicklung eines Begriffsverständnisses zu Maß- und Figurenbegriffen sowie die Ausbildung von entsprechenden Größenvorstellungen (Kuntze 2018; Weigand 2018; Peter-Koop und Nührenbörger 2016). Die beschriebenen Aspekte verdeutlichen, dass das Bestimmen von Längen, Flä- chen- und Rauminhalten ein zentrales Thema im Mathematikunterricht ist. Bisherige Studien weisen jedoch auf erhebliche Defizite von Schülerinnen und Schüler beim Umgang mit Größen hin (z. B. Frenzel und Grund 1991b; Lafrentz und Eichler 2004; Neubert und Thies 2012). So haben sie oftmals Schwierigkeiten beim Operieren mit Maßeinheiten, machen Fehler beim Umrechnen, haben Probleme beim Aufstellen von Formeln und können darüber hinaus Ergebnisse nicht interpretieren oder reflek- tieren, da ihnen entsprechende Größenvorstellungen fehlen. Vor dem Hintergrund, dass Schülerinnen und Schüler beim Bestimmen von Längen, Flächen- und Raum- inhalten erhebliche Schwierigkeiten haben (können) und die Thematik nicht nur für den Mathematikunterricht in allen Klassenstufen, sondern auch für den Alltag von Bedeutung ist, erscheint es wichtig, dass Lehrkräfte ihre Schülerinnen und Schüler bestmöglich dabei unterstützen (können). 3 Forschungsfrage Einer adäquaten Unterstützung gehen diagnostische Prozesse seitens der Lehrkraft voraus. Wie bereits in Abschn. 2.1.1 beschrieben, weisen aktuelle Studien darauf hin, dass Lehramtsstudierende oftmals Schwierigkeiten haben, lernrelevante Merk- male wahrzunehmen und ihre Beobachtungen zu interpretieren und zu erklären. K 76 P. Enenkiel et al. Aus diesem Grund stellt sich die Frage, wie Studierende bereits im Studium für die Diagnose von Schülerarbeitsprozessen sensibilisiert und beim Aufbau dazu benötig- ter Fähigkeiten unterstützt werden können. Bisherige Studien zeigen, dass Videos ein geeignetes Medium darstellen, um handlungsrelevante Fähigkeiten zu fördern (Krammer et al. 2016; van Es und Sherin 2010). Die Analyse von Videos findet in den meisten Fällen in Rahmen von Seminaren statt, in denen Studierende und Dozierende in einen direkten Austausch treten. In Veranstaltungen die von mehr als 200 Studierenden besucht werden, wie der Vorlesung Fachdidaktische Grundlagen für Studierende aller Lehrämter mit Mathematik als Unterrichtsfach, in der die vor- liegende Studie verortet ist, ist eine gemeinsame Diskussion, in der alle Studierenden aktiviert werden, nicht möglich. Vor diesem Hintergrund setzen wir eine videoba- sierte Lernumgebung ein, die begleitend zu Großveranstaltungen genutzt werden kann. Wie zuvor dargestellt, ist die Bedeutung des mathematischen Inhalts Längen, Flä- chen- und Rauminhalte nicht von der Hand zu weisen. Durch die wiederkehrende Thematisierung über die Schullaufbahn hinweg, stellt es sowohl für die Lehramtsstu- dierenden der Primarstufe als auch für die Lehramtsstudierenden der Sekundarstufe I und II ein relevantes Themenfeld dar. Da angenommen wird, dass die Diagnose unter anderem von dem Diagnosegegenstand abhängt, wird die Lernumgebung inhaltlich auf das Thema „Bestimmung von Längen, Flächen- und Rauminhalten“ abgestimmt. Unter Berücksichtigung des von Leuders et al. (2018) adaptierten Kompetenzmodells wird angenommen, dass mit Videos eine Entwicklung der diagnostischen Fähigkei- ten angeregt werden kann. Vor diesem Hintergrund, lässt sich die folgende Forschungsfrage ableiten: Lassen sich diagnostische Fähigkeiten von Studierenden hinsichtlich der Bestimmung von Längen, Flächen- und Rauminhalten durch Schülerinnen und Schüler mithilfe der videobasierten Lernumgebung ViviAn fördern? Um diese Forschungsfrage zu beantworten und damit die Wirksamkeit der Lern- umgebung zu überprüfen, müssen die diagnostischen Fähigkeiten der Studierenden erfasst werden. In Anlehnung an Herppich et al. (2017) treffen wir die Annahme, dass die diagnostische Performanz in repräsentativen Situationen Rückschlüsse auf die Ausprägung diagnostischer Fähigkeiten erlaubt. Um eine mögliche Entwicklung der diagnostischen Fähigkeiten in dem beschriebenen Inhaltsbereich abbilden zu können, wurden zwei Testvignetten entwickelt, die im Vor- und Nachtest einge- setzt wurden. Die dabei genutzten elementaren Schritte der Operationalisierung und Quantifizierung der vorliegenden (diagnostischen) Fähigkeiten werden im Rahmen der Darstellung der Diagnoseaufträge vorgestellt. 4 Methode 4.1 Die videobasierte Lernumgebung ViviAn Aufgrund der hohen Komplexität des Konstrukts Diagnostische Fähigkeiten, die nicht zuletzt auf den Einfluss situativer Faktoren zurückzuführen ist, stellt die Ent- wicklung eines validen Förder- und Testinstrumentes eine große Herausforderung K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 77 dar. Die Analyse von Unterrichtsvideos, in denen Lernprozesse von Schülerinnen und Schülern bewertet werden, ist eine Möglichkeit, die sich im Rahmen von Groß- veranstaltungen nutzen lässt und zeitökonomisch ist. Damit Videos zum Lernerfolg von Studierenden beitragen, müssen sie in eine geeignete Lernumgebung eingebet- tet sein (Seago 2004; Blomberg et al. 2013). Zudem bringt eine Lernumgebung den Vorteil mit sich, dass Studierende Videos ohne explizite Anweisung von Dozieren- den analysieren können. In der von uns entwickelten Lernumgebung ViviAn stehen den Studierenden neben einer Videosequenz weitere Informationen zur Verfügung. Diese stammen aus dem Mathematik-Labor „Mathe ist mehr“, einem Schülerlabor der Universität Koblenz-Landau am Campus Landau. 4.1.1 Videosequenzen aus dem Mathematik-Labor „Mathe ist mehr“ als Basis von ViviAn Das Mathematik-Labor bietet verschiedene Lernumgebungen für Schülerinnen und Schüler an, in denen jeweils ein mathematischer Inhalt, wie das Bestimmen von Längen, Flächen- und Rauminhalten, mithilfe von gegenständlichen Materialien und Simulationen erarbeitet wird. Das Mathematik-Labor wird in der Regel von ganzen Schulklassen besucht, wobei jeweils vier Schülerinnen und Schüler sich die Inhalte als Gruppe gemeinsam erarbeiten. Durch die Gruppenarbeit sollen Diskussionen angeregt und kooperatives Lernen geschult werden. Für Forschungszwecke wird eine Gruppe von Lernenden in einem separaten Raum aus der Vogelperspektive gefilmt. Dies ermöglicht es, sowohl die gesamte Lerngruppe als auch einzelne Lernende zu fokussieren (Bartel und Roth 2017). Zudem bietet ein Laptop die Möglichkeit die Arbeit am Bildschirm, wie beispielsweise die Verwendung von Simulationen aufzunehmen. Mit dem gewählten Fokus auf den Schülerinnen und Schülern selbst, bieten die Videos den Studierenden die Möglichkeit, Lernprozesse von Schülerinnen und Schülern zu diagnostizieren, indem lernrelevante Merkmale wahrgenommen und verarbeitet werden. Da eine Analyse von mehrstündigen Videos, aufgrund der Fülle an Informatio- nen die Studierenden kognitiv stark beanspruchen würde, müssen die Videos vorab modifiziert werden (vgl. von Aufschnaiter et al. 2017). Durch die Modifikation können lernrelevante Aspekte durch Kürzungen oder Ergänzungen hervorgehoben werden, wodurch die Komplexität der Videos stark reduziert wird. Entsprechend wurden im ersten Schritt bereits vorhandene Videoaufnahmen gesichtet. Relevante Szenen, in denen die Schülerinnen und Schüler beim Bestimmen von Größen Stra- tegien anwandten oder Schwierigkeiten erkennen ließen, wurden geschnitten. Aus 15 Kurzvideos wurden anschließend acht Sequenzen ausgewählt, in denen eine gro- ße Bandbreite von Strategien sichtbar sowie Fähigkeiten und Schwierigkeiten der Schülerinnen und Schülern zu identifizieren waren. Darüber hinaus wurde darauf geachtet, dass die Wahrnehmung der Handlungen sowie Diskussionen der Schüle- rinnen und Schülern nicht durch eingeschränkte Ton- und Bildqualität beeinträchtigt werden. Da die Studierenden die videografierten Schülerinnen und Schüler nicht kennen, ist die Zuordnung der Verbalisierungen erschwert. Daher wurden die videografierten Schülerinnen und Schüler mit gelben Markern versehen (vgl. Abb. 3). Über die K 78 P. Enenkiel et al. Abb. 3 Oberfläche von ViviAn jeweilige Sprechdauer erscheint in den Videosequenzen über den entsprechenden Lernenden ein Rechteck mit „S1“, „S2“, „S3“ oder „S4“ . Für eine einheitliche Ge- staltung werden die Benennungen auch an verschiedenen Stellen der Lernumgebung wieder aufgegriffen. So beinhalten beispielsweise auch die Diagnoseaufträge für die Studierenden diese Benennungen der Schülerinnen und Schüler. Die Videovignette stellt das Zentrum der Oberfläche von ViviAn dar. Durch Betätigen entsprechen- der Buttons, die um die im Zentrum stehende Videovignette angeordnet sind (vgl. Abb. 3), können die Studierenden weitere Informationen nach Bedarf abrufen .So informiert der Button oberhalb des Videos über das Thema und die Lernziele der Mathematik-Labor-Station. Die weiteren Buttons sind in die beiden Perspektiven Schüler- und Metaebene untergliedert. Mit den Buttons der Schülerebene können Das „S“ steht für Schülerin bzw. Schüler. Weitere Informationen zum Aufbau der Lernumgebung sind bei Bartel und Roth (2017) sowie unter vivian.uni-landau.de zu finden. K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 79 Materialien der Station abgerufen werden, mit denen die Lernenden während des Lernprozesses arbeiteten oder welche sie produziert haben. So können mit dem But- ton Schülerprodukte die schriftlichen Arbeitsergebnisse aller Lernenden der Videose- quenz abgerufen werden. Die Buttons der Metaebene bieten weitere Informationen, über die eine Lehrkraft im Klassenraum verfügt. Neben Hintergrundinformationen zu den abgebildeten Schülerinnen und Schülern, wie etwa Klassenstufe und Schulart, können sich Studierende über die zeitliche Einordnung der Sequenz im Lernprozess informieren. Dies ermöglicht es ihnen unter anderem, zu sehen, welche Lernziele durch die in der Videovignette bearbeitete Aufgabe erreicht werden soll. Auf die- se Weise soll eine möglichst unterrichtsnahe Lernumgebung für die Studierenden geschaffen werden (vgl. Roth 2020). 4.1.2 Erstellung der Diagnoseaufträge Damit Videos lernförderlich sein können, müssen Studierende sich aktiv mit diesen auseinandersetzen (Seago 2004). Eine Möglichkeit zur Anregung dieser aktiven Auseinandersetzung stellt das Arbeiten mit auf die Videosequenzen abgestimmten Aufgaben dar. Durch das Betätigen des Buttons Diagnoseauftrag öffnet sich in der Lernumgebung ViviAn ein Fenster, in dem die Aufgaben dargestellt sind und die Antworten direkt eingegeben werden können (vgl. Abb. 3). Die Antworten der Studierenden auf die Diagnoseaufträge werden gespeichert und können jederzeit zu Forschungszwecken abgerufen werden. Die Diagnoseaufträge, die für die Videovignetten erstellt wurden, basieren auf den Komponenten des Diagnoseprozesses von Beretz et al. (2017) und von Aufschnaiter et al. (2018) (vgl. Abschn. 2.1.2). Durch die detaillierte Darstellung der einzel- nen Diagnoseschritte, eignen sich diese für die Strukturierung diagnostischer Tä- tigkeiten, was besonders für eine Förderung diagnostischer Fähigkeiten ertragreich sein kann. Der Diagnoseprozess ist jedoch iterativ. Das Ableiten von Konsequen- zen bzw. das Bilden von Fördermaßnahmen stellt in der Regel den Ausgangspunkt für eine erneute Diagnostik dar. Da die Videovignetten in dieser Studie jedoch in- haltlich abgeschlossen sind, endet in diesem Setting der Diagnoseprozess mit dem Ableiten von Konsequenzen. Darüber hinaus wird in Anlehnung an Beretz et al. (2017) angenommen, dass das Bilden von adäquaten Fördermaßnahmen zwar eng mit einer (informellen) Diagnostik verknüpft ist, aber wegen des dafür zusätzlich benötigten Handlungswissens eine davon abzugrenzende Kompetenz darstellt (vgl. Abschn. 2.1). Um die diagnostischen Fähigkeiten hinsichtlich der Bestimmung von Längen, Flächen- und Rauminhalten adäquat zu erfassen und zu fördern, scheint eine Trennung der Kompetenzen zwingend notwendig. Der erste Schritt Datenerhebung/ Datensichtung entfällt in diesem Setting ebenfalls, da die Videovignetten bereits auf relevante Lernprozesse hinsichtlich der Bestimmung von Längen, Flächen- und Rauminhalten modifiziert wurden. Der Diagnoseprozess beschränkt sich in dieser Studie somit auf die in Abb. 4 dargestellten Komponenten. Diese eignen sich auch für die Konstruktion der Diagnoseaufträge, sofern geeig- nete Operatoren verwendet werden (vgl. Beretz et al. 2017). Durch die Operatoren sollen die Studierenden strukturiert durch das Diagnostizieren geleitet werden. Stu- dierende können zwar durch freie Textfelder ihre Antwort offen formulieren; ih- K 80 P. Enenkiel et al. (Förder)-relevante Konsequenzen für Beobachtungen Mögliche Ursachen Beobachtungen eine Förderung differenziert deuten ergründen beschreiben ableiten Abb. 4 Relevante Komponenten des Diagnoseprozesses nach Beretz et al. (2017) und von Aufschnaiter et al. (2018) re Aufmerksamkeit wird jedoch durch entsprechende Aufgabenformulierungen auf spezifische Aspekte der Videosequenz gerichtet. Die Diagnoseaufträge für die Kom- ponenten werden im Folgenden dargestellt. Förderrelevante Beobachtungen beschreiben In einem ersten Schritt sollen Stu- dierende ihre Beobachtungen beschreiben. Das offene Antwortformat ermöglicht, dass die Studierenden ihre Wahrnehmung eigenständig zusammenfassen können. Der Diagnoseauftrag „Beschreiben Sie aus mathematikdidaktischer Perspektive die Situation, die in der Videovignette zu sehen ist.“ soll die Wahrnehmung der Stu- dierenden auf Aspekte der Videosequenz lenken, die aus mathematikdidaktischer Perspektive relevant sind. Die Beschreibung der relevanten Beobachtungen stellt eine Zusammenstellung der entsprechenden Wahrnehmungen dar und dient somit als Ausgangspunkt zur Beantwortung der weiteren Diagnoseaufträge. Aus diesem Grund ist dieser Diagnoseauftrag der erste Arbeitsauftrag in jeder Videovignette. Als besonders relevant erscheint dabei die deutungsfreie bzw. neutrale Beschreibung der Situation, in der lediglich relevante Informationen aus der Videovignette gesammelt werden. Beobachtungen differenziert deuten Im nächsten Schritt sollen die Informatio- nen, die aus den Beobachtungen gezogen wurden, differenziert verarbeitet werden. Die Diagnoseaufträge beziehen sich entweder auf einzelne Schülerinnen und Schüler oder auf die gesamte Gruppe und fokussieren die Fähigkeiten oder Schwierigkeiten, die die Schülerinnen und Schüler in der Videosequenz zeigen. Da die Deutungen daher von der jeweiligen Videosequenz abhängig sind, variieren die Diagnoseauf- träge mit der jeweiligen Vignette. Exemplarische Diagnoseaufträge lauten: „Wel- che Vergleichs-, Mess- und Berechnungsstrategien wendet S1 an, um Aufgabe 1.2 zu lösen? Begründen Sie Ihre Aussage.“ oder „Welche Schwierigkeiten treten bei der Bearbeitung der Aufgabe auf? Begründen Sie Ihre Aussage.“ Die Diagnoseaufträ- ge haben geschlossene oder offene Antwortformate. Die Studierenden werden bei geschlossenen Aufgaben (Multiple-Choice- oder Single-Choice-Aufgaben) jedoch immer aufgefordert ihre Auswahl anhand ihrer Beobachtungen aus der Videose- quenz in einem Freitextfeld zu begründen (vgl. Abb. 3). Mögliche Ursachen ergründen Für die entsprechenden Deutungen gilt es im nächsten Schritt mögliche Ursachen zu finden. Unter Einbezug des fachlichen und fachdidaktischen Vorwissens sollen die Studierenden beispielsweise Ursachen für einen Schülerfehler, der in der Videovignette beobachtet werden konnte, angeben: „Die Schülerinnen und Schüler haben offenbar Schwierigkeiten die Aufgabe adäquat zu lösen. Welche Ursachen könnten diesen Schülerschwierigkeiten zugrunde liegen?“ K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 81 Die möglichen Ursachen ergeben sich oftmals aus den Aussagen und Handlun- gen der Schülerinnen und Schüler, die in der jeweiligen Videovignette abgebildet sind. So kann den Schülerinnen und Schülern die Erkenntnis fehlen, dass sich die Rauminhaltsformel aus dem gedanklichen Aufeinanderstapeln der Schichten aus Einheitswürfeln ergibt .V D h  A/, was schließlich in der Videosequenz dazu führt, dass die Rauminhaltsformel für ein Quadermodell fehlerhaft erstellt wird. Alterna- tiv kann den Schülerinnen und Schülern jedoch auch das Begriffsverständnis für Rauminhalt oder Quader fehlen. Durch Einbezug der Zusatzinformationen können auch mögliche Ursachen ausgeschlossen werden, wenn beispielsweise in dem Sta- tionsteil vorher die Eigenschaften eines Quadermodells bereits erarbeitet wurden. Das Aufgabenformat in dieser Komponente ist offen und muss mit einem Freitext beantwortet werden. Konsequenzen für die Förderung ableiten Aus den Beobachtungen, Deutungen und Ergründungen möglicher Ursachen sollen die Studierenden im letzten Schritt entsprechende Konsequenzen für eine Förderung ableiten. Dabei sollen die Stu- dierenden mittels Multiple-Choice-Aufgabe zum einen entscheiden, ob sie als be- treuende Lehrperson während der Situation eingegriffen hätten und zum anderen, ob sie nach der Situation intervenieren würden. Die Studierenden werden bei ih- rer Auswahl aufgefordert ihre Antwort zu begründen. Falls die Studierenden sich für eine Intervention entscheiden, öffnet sich ein weiterer Diagnoseauftrag, in dem die Studierenden beschreiben können, wie sie ihre Intervention gestalten würden. Die Aufforderung der Beschreibung einer möglichen Intervention soll eine mög- lichst authentische Unterrichtssituation darstellen und eine künstliche Trennung von Diagnose und Handlung unterbinden. Die formulierten Fördermaßnahmen der Stu- dierenden wurden im Rahmen der Studie nicht ausgewertet, da angenommen wird, dass das aktive Intervenieren eine andere Kompetenz darstellt. Die Begründung zu dieser Annahme wird in Abschn. 2.1.1 beschrieben. 4.1.3 Erstellung der Musterlösung Bei Großveranstaltungen, die von mehr als 200 Studierenden besucht werden, kann den Studierenden aus organisatorischen Gründen keine persönliche und individuelle Rückmeldung zu ihren Bearbeitungen gegeben werden. Um Studierende jedoch bei ihren Videoanalysen zu unterstützen, scheint eine Form von Rückmeldung zielfüh- rend (von Aufschnaiter et al. 2017). Da bisherige Studien zeigen, dass auch die Darbietung einer richtigen Lösung zu einem Lerneffekt beitragen kann (z. B. Ban- gert-Drowns et al. 1991), wurde für jede Videovignette eine Musterlösung erstellt. Die Musterlösungen basieren auf einem Expertenrating, das vorab mit wissenschaft- lichen Mitarbeiterinnen und Mitarbeitern, Professorinnen und Professoren aus der Mathematikdidaktik sowie Mathematiklehrkräften durchgeführt wurden. Die Ex- perten waren bereits Raterinnen und Rater von Videos in anderen Projekten und verfügen daher über weitereichende Erfahrungen mit Videoanalysen. Vor dem Ex- pertenrating wurde sichergestellt, dass entsprechende diagnostische und fachliche Voraussetzungen gegeben waren. So wurde einerseits die Komponenten des Dia- gnoseprozesses von Beretz et al. (2017) und von Aufschnaiter et al. (2018) erläutert K 82 P. Enenkiel et al. Expertinnen & Bearbeitung Erstellung der Überprüfung der Experten Musterlösungen Musterlösung der Vignetten Vignette 1 & Vignette 7 & Experte1 Vignette 2 Vignette 8 Vignette 3 & Vignette 1 & Experte 2 Vignette 2 Vignette 4 Vignette 5 & Vignette 3 & Experte 3 Vignette 4 Vignette 6 … … … Vignette 7 & Vignette 5 & Experte 8 Vignette 6 Vignette 8 Abb. 5 Expertenrating zur Erstellung von Musterlösungen sowie die Strategien zum Bestimmen von Längen, Flächen- und Rauminhalten und die damit verbundenen möglichen Schülerschwierigkeiten diskutiert. Das Experten- rating erfolgte in mehreren Schritten (vgl. Abb. 5): 1. Die Diagnoseaufträge für jede Videovignette wurden von zwei Expertinnen bzw. Experten beantwortet. Eine Expertin bzw. ein Experte beantwortete dabei die Dia- gnoseaufträge für je zwei Videovignetten. 2. Die Antworten der Expertinnen und Experten wurden anschließend gesammelt, zusammengefasst und inhaltlich miteinander verglichen. Antworten von Exper- tinnen und Experten, die sich inhaltlich unterschieden, wurden farblich kenntlich gemacht. 3. Aus den Expertenantworten wurde nachfolgend für jede Videovignette eine Mus- terlösung erstellt. Die Antworten der Experten auf Single-Choice- oder Multiple- Choice-Aufgaben wurden mit einem Kreuz kenntlich gemacht. Die Freitextant- worten wurden strukturiert zusammengestellt, indem beispielsweise unterschied- liche inhaltliche Aspekte durch Stichpunkte getrennt dargestellt wurden. Um die Verarbeitung und Reflexion der Musterlösung zu ermöglichen, wurde auf einfache und prägnante Formulierungen geachtet. 4. In einem gemeinsamen Workshop wurden anschließend die Musterlösungen von denselben Expertinnen und Experten begutachtet. Dabei bewerteten die Exper- tinnen und Experten die Musterlösungen von zwei anderen Vignetten. So sollte gewährleistet werden, dass die Vignetten von einer großen Bandbreite von Exper- tinnen und Experten begutachtet wurden. In einem anschließenden Plenum wur- den Meinungsverschiedenheiten und unterschiedliche Antworten gemeinsam dis- kutiert. Konnte kein Konsens gefunden werden, wurden beide Lösungen in die Musterlösung mit aufgenommen und jeweils begründet. Die Musterlösungen auf Basis des Expertenratings wurden im nächsten Schritt in die videobasierte Lernumgebung ViviAn eingebettet, so dass diese den Studierenden K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 83 nach der Bearbeitung der Diagnoseaufträge angezeigt wurde. Aus einer Metaanalyse von Bangert-Drowns et al. (1991) geht hervor, dass Feedback lernwirksamer ist, wenn es vor der Bearbeitung eines Arbeitsauftrages nicht eingesehen werden kann. Wenn Lernende das Feedback einsehen können, bevor sie sich mit der Aufgabe aktiv auseinandergesetzt haben, wird es demnach nur wenig zur Reflexion der eigenen Antwort beitragen können (Bangert-Drowns et al. 1991). Um diesen Effekt, von Kulhavy (1977)als presearch availability bezeichnet, zu verhindern, wurden das Online-Umfrage-Tool in ViviAn so programmiert, dass Studierende erst auf die Musterlösung zugreifen konnten, nachdem sie die entsprechenden Diagnoseaufträge beantwortet hatten. Um eine Reflexion der eigenen Antworten mit den Musterlö- Rückmeldung Vergleichen Sie nun Ihre gegebenen Antworten zu den Diagnoseaufträgen mit den Antworten der Expertinnen und Experten. 1) Beschreiben Sie aus mathematikdidaktischer Perspektive die Situation, die in der Videovignette zu sehen ist. Sie haben folgende Antwort gegeben: Die SuS messen mithilfe des Maßbandes die Kantenlänge der Fliese aus und berechnen damit den Flächeninhalt. Anschließend versuchen sie den Flächeninhalt in eine andere Einheit umzurechnen. Damit haben sie offensichtlich Probleme. Die zuständige Lehrkraft kommt im weiteren Verlauf des Lernprozesses in den Raum und versucht den SuS zu helfen. Experten haben folgende Antwort gegeben: � S4 misst mithilfe eines Maßbandes die Länge und die Breite der Fliese und gibt seine Ergebnisse an seine Gruppenmitglieder weiter. � Die SuS sollen den Flächeninhalt einer Fliese bestimmen. Abb. 6 Musterlösungen in ViviAn K 84 P. Enenkiel et al. sungen zu ermöglichen, bekamen die Studierenden zusätzlich zur Musterlösung den entsprechenden Diagnoseauftrag und ihre eigene Antwort angezeigt (vgl. Abb. 6). 4.2 Rahmeninformationen 4.2.1 Stichprobe Um zu prüfen, ob die Arbeit mit ViviAn Mathematiklehramtsstudierende unterstüt- zen kann, ihre diagnostischen Fähigkeiten im Bereich Bestimmung von Längen, Flä- chen- und Rauminhalten zu entwickeln, wurde im Wintersemester 2017/2018 eine Interventionsstudie mit einem Vor- und Nachtest durchgeführt. Da das Bestimmen von Längen, Flächen- und Rauminhalten sowohl in der Primarstufe als auch im Sin- ne des Spiralprinzips in weiterführenden Schulen erarbeitet und vertieft wird, fand die Interventionsstudie im Rahmen der Großveranstaltung Fachdidaktische Grund- lagen statt, einer Bachelorveranstaltung, die von Mathematiklehramtsstudierenden aller Schularten besucht wird. In allen Schularten spielen entsprechende Vergleichs-, Mess- und Berechnungsstrategien eine durchgängige Rolle. Aufgrund der hohen Relevanz des Themengebiets für Lehramtsstudierende der Grund- und Förderschu- le sowie auch für Lehramtsstudierende für Realschule plus und Gymnasium (vgl. Abschn. 2.2) ergibt sich für diese didaktische Großveranstaltung eine gute inhaltliche Passung für die Arbeit mit ViviAn hinsichtlich des gewählten Diagnosegegenstands. Die Vorlesung Fachdidaktische Grundlagen ist eine Einführungsveranstaltung in die Didaktik der Mathematik und wird daher in der Regel von Mathematiklehramts- studierenden des ersten und zweiten Fachsemesters besucht. Die Inhalte der Ver- anstaltung beziehen sich auf querschnittliche Fragen zur Mathematikdidaktik (Roth 2020), wobei allgemeine Aspekte des Mathematikunterrichts sowie auch fachdi- daktische und fachmethodische Grundprinzipien thematisiert werden. Weiter hatten Studierende aus der Veranstaltung Didaktik der Geometrie die Möglichkeit mit Vi- viAn zu arbeiten. Die Vorlesung Didaktik der Geometrie ist eine Veranstaltung für Mathematiklehramtsstudierende der Sekundarstufe I, in der Themen der Geometrie fachdidaktisch behandelt werden, wie beispielsweise Möglichkeiten zur Aufberei- tung entsprechender Themen für den Geometrieunterricht. Da die Videovignetten zu spezifischen Themen des Geometrieunterrichts passen, wurde die Bearbeitung der Videovignetten zur Theorie-Praxis-Verknüpfung auch in dieser Veranstaltung etabliert. Die Experimentalgruppe bestand aus 103 Studierenden , 83 Studierende aus der Veranstaltung Fachdidaktische Grundlagen und 20 Studierende aus der Veranstal- tung Didaktik der Geometrie. Die 103 Studierenden setzten sich aus 76 Studierenden der Grund- und Förderschule sowie 27 Studierenden des Lehramts für Realschule plus und Gymnasium zusammen. Da der Nachtest identisch zum Vortest war, er- schien es wichtig, mögliche Testeffekte zu kontrollieren. Dazu wurde im darauf- folgenden Semester eine Kontrollgruppe erhoben. Da die Didaktik der Geometrie nur jedes zweite Semester gehalten wird, stammte die Kontrollgruppe ausschließlich Am Vortest nahmen zunächst 119 Studierende teil, wovon jedoch 16 die Studie vor der Bearbeitung des Nachtests abgebrochen haben und entsprechend bei der Datenauswertung nicht berücksichtigt wurden. K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 85 aus der Veranstaltung Fachdidaktische Grundlagen. Sie bestand aus 81 Mathema- tiklehramtsstudierenden (73 Grund- und Förderschullehramt, acht Realschule plus bzw. Gymnasiallehramt). 4.2.2 Studiendesign Die Interventionsstudie dauerte insgesamt zehn Wochen. Um einen Theorie-Praxis- Bezug zu gewährleisten, wurde der Beginn der Arbeit mit ViviAn thematisch pas- send auf die entsprechenden Veranstaltungen abgestimmt. Ein theoretischer Input im Rahmen einer Vorlesung sollte die Studierenden vorab für die Analyse der Video- vignetten in ViviAn sensibilisieren. Der theoretische Input umfasste unter anderem fachdidaktische Aspekte bei der Bestimmung von Längen, Flächen- und Raumin- halten, in denen auch typische Schülerschwierigkeiten thematisiert wurden. Darüber hinaus wurde auch der Prozess des Diagnostizierens von Beretz et al. (2017) und von Aufschnaiter et al. (2018) (vgl. Abschn. 2.1.2) behandelt, der den Studierenden hinsichtlich der Anforderungen der Komponenten erläutert wurde. Am Ende der Vorlesung wurde den Studierenden die videobasierte Lernumgebung ViviAn vor- gestellt, in der auf Grundlage einer Beispielsvignette die Funktionen von ViviAn sowie die Komponenten des Diagnoseprozesses erläutert wurden. Für die Studieren- den, die an der Vorlesung nicht teilnehmen konnten und dennoch mit ViviAn arbeiten wollten, wurde ein Einführungsvideo erstellt und online zur Verfügung gestellt. Da- rüber hinaus wurde dort auch ein Dokument für die Studierenden hinterlegt, das die fachdidaktischen Aspekte für die Bestimmung von Längen, Flächen- und Raumin- halten beinhaltete und ein Vorlesungsvideo zum entsprechenden Teil der Vorlesung zur Verfügung gestellt. Nach dem theoretischen Input bearbeiteten die Studieren- den einen Vortest, der aus zwei Testvignetten bestand (vgl. Abschn. 4.3). Um eine authentische Unterrichtssituation abzubilden, konnten die Videosequenzen der Test- vignetten nur einmal angeschaut, nicht pausiert und nicht vor- oder zurückgespult werden. Da die beiden Testvignetten auch als Nachtest fungierten, erhielten die Studierenden nach der Bearbeitung keine Musterlösung. Anschließend bearbeiteten die Studierenden jede Woche eine von insgesamt fünf Trainingsvignetten .Umden Studierenden die Möglichkeit zu geben, ihre Antworten auf Basis eines Abgleichs mit der Musterlösung zu reflektieren, konnten die Videosequenzen der Trainings- vignetten im Gegensatz zu den Testvignetten mehrmals angeschaut, pausiert sowie vor- und zurückgespult werden. Nach der Bearbeitung von fünf Trainingsvignetten nahmen die Studierenden am Nachtest teil. 4.3 Testinstrument Das Testinstrument, das im Vor- und Nachtest eingesetzt wurde, bestand aus zwei Videovignetten. Bei beiden Videovignetten wurde darauf geachtet, dass die Diagno- sen möglichst eindeutig waren und möglichst wenige Störfaktoren die Qualität des Videos beeinflussen. Die Videosequenz der ersten Testvignette zeigt eine Gruppen- In der vorlesungsfreien Zeit von drei Wochen mussten die Studierenden nur eine Trainingsvignette be- arbeiten. K 86 P. Enenkiel et al. arbeit von vier Schülerinnen und Schülern der sechsten Klassenstufe bei der Erar- beitung der Formel für den Oberflächeninhalt eines Quadermodells. Als Materialien standen den Schülerinnen und Schülern ein durchsichtiges Quadermodell, Einheits- quadrate, Lineal sowie ein Folienstift zur Verfügung, mit dem die Schülerinnen und Schüler gegebenenfalls auf dem Quadermodell zeichnen konnten. Die Schülerinnen und Schüler wenden in der Videosequenz verschiedene Strategien an, wodurch eine intensive Diskussion zwischen den Gruppenmitgliedern entsteht. Die Videosequenz der zweiten Testvignette zeigt vier Schülerinnen und Schüler der Klassenstufen 3 und 4 bei einem Flächeninhaltsvergleich von selbst konstruierten ebenen Figuren. Da Flächeninhalte der ebenen Figuren auf verschiedene Art und Weisen verglichen werden können (beispielsweise durch einen direkten Vergleich der ebenen Figuren oder durch das Messen der Flächeninhalte mit einer Maßeinheit, vgl. Abschn. 2.2) ist diese Videosequenz von verschiedenen Lösungsstrategien geprägt. Darüber hinaus thematisieren die Schülerinnen und Schüler auch das Umwandeln von Maßeinheiten. Die Diagnoseaufträge für die Videovignetten wurden nach den Komponenten des in Abschn. 2.1.2 dargestellten Modells des Diagnoseprozesses erstellt. Da die Video- sequenzen der Testvignetten nur einmal angeschaut, nicht pausiert und auch nicht vor- und zurückgespult werden konnten, wurde den Studierenden in ViviAn die Möglichkeit gegeben, die Diagnoseaufträge vorab durchzulesen. Dies sollte die Stu- dierenden unterstützen, die Wahrnehmung auf relevante Aspekte der Videosequenz zu legen. 4.4 Testvalidierung Das Testinstrument zur Erfassung der diagnostischen Fähigkeiten im Vor- und Nach- test wurde im ersten Schritt validiert. Dazu wurden die Antworten der Studierenden der Experimental- und Kontrollgruppe aus dem Nachtest auf Basis einer qualitativen Inhaltsanalyse kodiert und anschließend mithilfe eines Rasch-Partial-Credit-Modells auf interne Validität geprüft. 4.4.1 Qualitative Inhaltsanalyse Um die offenen Antworten der Studierenden zu quantifizieren, wurde auf die struk- turierende Inhaltsanalyse nach Skalenpunkten nach Mayring (2015) zurückgegriffen. Diese Form der Inhaltsanalyse ermöglicht es, die schriftlichen Antworten der teil- nehmenden Studierenden systematisch, regel- sowie theoriegeleitet zu analysieren, sodass Rückschlüsse auf deren Antworten gezogen werden können (Mayring 2015). Auf Basis des Expertenratings wurde deduktiv ein Kategoriensystem erstellt, das zur Bewertung der Studierendenantworten herangezogen wurde (Enenkiel 2022). Das Kategoriensystem wurde anschließend auf die ersten 30 Studierendenantworten angewendet sowie mit Beschreibungen, Kodierregeln, Ankerbespielen und teilwei- se mit Gegenbeispielen ergänzt. Erlaubte das Kategoriensystem keine eindeutige K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 87 Tab. 1 Exemplarisches Kategoriensystem für den Diagnoseauftrag der Komponente „Mögliche Ursachen ergründen“ Code Beschreibung Ankerbeispiel Kodierregel V1 U1 F1 Aussagen, die wiedergeben, „Die Schüler waren so Wenn die Aussage des Stu- dass die SuS so sehr mit dem auf die Berechnung der dierenden sich inhaltlich Prozess des Bestimmens einen Seite des Quaders mit der Beschreibung zu des Flächeninhalts der einen fixiert, sodass sie alle V1 U1 F1 deckt, wird eine 1 Teilfläche beschäftigt waren, anderen Seiten unbe- kodiert, andernfalls eine 0 dass sie vergessen haben, die absichtigt ausgelassen Flächeninhalte der anderen haben.“ Teilflächen zu bestimmen V1 U2 F1 Aussagen, die wiedergeben, „Das Problem ist das Wenn die Aussage des Stu- dass die SuS den Begriff Begriffsverständnis, sie dierenden sich inhaltlich „Oberfläche“ nicht ver- kennen den Unterschied mit der Beschreibung zu standen haben bzw. den zwischen den Maßbe- V1 U2 F1 deckt, wird eine 1 Unterschied zwischen „Flä- griffen Flächeninhalt und kodiert, andernfalls eine 0 che“ und „Oberfläche“ nicht Oberflächeninhalt nicht.“ kennen V1 U3 F1 Aussagen, die wiedergeben, „Sie haben die Aufga- Wenn die Aussage des Stu- dass die SuS die Aufgabe benstellung vielleicht nur dierenden sich inhaltlich nicht richtig verstanden bzw. überflogen bzw. nicht mit der Beschreibung zu nicht richtig gelesen haben konkret verstanden.“ V1 U3 F1 deckt, wird eine 1 kodiert, andernfalls eine 0 Zuordnung, wurden Kategorien zusammengeführt oder induktiv ergänzt (Enenkiel 2022). Ein Beispiel hierfür kann Tab. 1 entnommen werden. Das darin dargestellte Ka- tegoriensystem enthält die Kategorien zur Kodierung der Studierendenantworten für den Diagnoseauftrag „Die Schüler in der gezeigten Videosequenz geben als Ergebnis den Flächeninhalt von nur einer Fläche an. Welche Ursachen könnten diesem Feh- ler zugrunde liegen?“ und kann der Komponente „Mögliche Ursachen ergründen“ zugeordnet werden. Der Diagnoseauftrag stammt aus Testvignette 1 und beinhaltet mögliche Ursachen dafür, dass die Lernenden in der Videosequenz als Ergebnis nur den Flächeninhalt einer Teilfläche des Quadermodells angeben und nicht, wie in der Aufgabenstellung gefordert, den Oberflächeninhalt des Quadermodells bestimmen. Eine Mehrfachkodierung war möglich, wenn Studierende mehrere Ursachen dafür nannten, dass die Schülerinnen und Schüler in der Videosequenz den Flächeninhalt von nur einer Teilfläche des Quadermodells bestimmen. Mit dem Kategoriensystem wurden die offenen Antworten der Studierenden von zwei unabhängigen Raterinnen kodiert. Zur Überprüfung der Übereinstim- mung wurde das Cohens Kappa berechnet. Die mittlere Interraterreliabilität von M D 0,72.SD D 0,19/ weist auf eine insgesamt gute Übereinstimmung der Raterinnen hin (Kuckartz 2016). Anschließend wurde ein gemeinsames Konsensge- spräch durchgeführt, in dem Passagen, die von den Raterinnen zunächst unterschied- lich kodiert wurden, auf Basis von Diskussionen und Vergleichen mit weiteren Stu- Diese Vorgehensweise hat große Übereinstimmung mit der von Blömeke et al. (2014), die für die Ko- dierung von offenen Antworten zur Erfassung situationsspezifischer Fähigkeiten deduktiv entwickelte Ka- tegorien durch induktive Kriterien ergänzen. K 88 P. Enenkiel et al. dierendenantworten eindeutig einer Kodierung zugeordnet wurden. Die Daten der Konsenskodierung dienten als Basis für sich anschließende quantitative Analysen. Eine anschließende inhaltliche Analyse der Kategorien führte dazu, dass Kategorien entfernt oder zu Subkategorien zusammengefasst wurden, insofern dies inhaltlich sinnvoll erschien (Enenkiel 2022). Diese überarbeiteten Kategorien, im Folgenden als „Items“ bezeichnet, wurden anschließend zunächst mithilfe der Item-Response- Theorie (IRT) auf ihre Passung überprüft. 4.4.2 Mehrdimensionales Rasch-Partial-Credit-Modell Die Prüfung der Konstruktvalidität mittels IRT wird von vielen Autoren empfohlen (z. B. Blömeke et al. 2015;Wu et al. 2016). Diese hat bei der Auswertung von Test- daten gegenüber der Klassischen Testtheorie einige konzeptuelle und praktische Vor- teile, die beispielsweise bei Hartig und Goldhammer (2010) kurz zusammengefasst sind. Die Faktoren- und Itemanalyse basierte auf den Daten des Nachtests, da hier im Vergleich zum Vortest weniger Items aufgrund von Bodeneffekten ausgeschlos- sen werden mussten. Im ersten Schritt wurde eine deskriptive Analyse der 68 Items durchgeführt, die aufgrund von Bodeneffekten .M < 0,05/ und geringen Varianzen .Var < 0,05/ zum Ausschluss von elf Items führte. Da noch keine empirischen Evidenzen für die Dimensionalität der in Abschn. 2.1 beschriebenen diagnostischen Fähigkeiten vorliegen, wurden verschiedene Modelle gegeneinander getestet. Dabei wurden die Items per Einfachstrukturen (Between-Item-Mehrdimensionalität, Har- tig und Höhler 2010) den jeweiligen Faktoren zugeordnet. Auf eine Modellierung mit einer komplexen Ladungsstruktur (Within-Item-Mehrdimensionalität, Hartig und Höhler 2010) wurde verzichtet, da keine theoretisch fundierten Vorannahmen über die Gewichtung möglicher Teilfähigkeiten und deren Interaktionen zugrunde lagen (vgl. Hartig und Höhler 2010). Anschließend wurden relative Modellvergleiche auf Basis der korrigierten Informationskriterien AICc (Akaike information criteria) und SABIC (Bayesian information criteria) durchgeführt (Burnham und Anderson 2004; Sclove 1987). Die Modellvergleiche (vgl. Tab. 3 im Anhang) sowie die Korrelatio- nen zwischen den Faktoren (vgl. Tab. 4 im Anhang) suggerieren die Extraktion eines dreidimensionalen Modells, das zwischen den Komponenten Beschreiben, Deuten und Ursachenfinden/Konsequenzen ableiten unterscheidet. Dieses Vorgehen wird ausführlich in Enenkiel (2022) beschrieben. Der relative Vergleich zweier oder mehrerer Modelle kann mithilfe informationstheoretischer Maße durchgeführt werden (Eid et al. 2010). Die absoluten Werte dieser Maße geben keinen Aufschluss über die Modellpassungen. Stattdessen geben die Differenzen der absoluten Zahlen der zu vergleichenden Mo- delle Aufschluss darüber, welches der aufgestellten Modelle besser zu den Daten passt. So passt sich das Modell mit dem kleinsten Werten am besten an die Daten an, wobei eine Differenz von mehr als zehn als starkes Indiz für die beste Passung gedeutet werden kann (Rost 2004). Burnham und Anderson (2004) empfehlen für kleine Stichproben die Verwendung eines korrigierten AIC (AICc), der bei großen Stichpro- ben gegen den AIC konvergiert. Sclove (1987) schlägt analog die Verwendung des Sample Size Adjusted BIC (SABIC) für kleine Stichproben vor. Aufgrund der eher geringen Stichprobe der vorliegenden Un- tersuchung, wird bei Modellvergleichen zur Validierung auf die Verwendung des AICc und des SABIC zurückgegriffen. K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 89 Im Anschluss wurden die Items hinsichtlich ihrer Schwierigkeiten, Trennschär- fen , lokal stochastischen Abhängigkeiten sowie ihren Item-Fit-Werten analysiert. Items, die eine hohe lokale stochastische Abhängigkeit aufzeigten, wurden zu ei- nem Partial-Credit-Item zusammengeführt, wenn dies auch inhaltlich sinnvoll er- schien (Enenkiel 2022). Für die Überprüfung der geordneten Antwortwortkatego- rien der Partial-Credit-Items wurden die mittleren Fähigkeitswerte und die relati- ven Häufigkeiten der einzelnen Kategorien herangezogen (Adams et al. 2012;Wu et al. 2016). Die Itemanalyse führte aufgrund mangelhafter Item-Kennwerte und inhaltlichen Gründen zum Ausschluss von 13 Items. Für das Rasch-Partial-Credit- Modell ergab sich nach der Selektion eine mittlere Itemtrennschärfe (Bühner 2011) von M D 0,40.SD D 0,14/ bei einer durchschnittlichen Itemschwierig- TS r .pb/ keit von M D 1,37.SD D 0,88/. Die Infit- und Outfit-Werte lagen im Mittel bei M D 1,00 .SD D 0,10/ und M D 0,97.SD D 0,21/, was auf eine gu- Infit Infit Outfit Outfit te Passung der theoretischen und empirisch ermittelten Werte hindeutet (Adams und Khoo 1996). Die mittlere Residualkorrelation von M D0,019.S D D 0,112/ Q3 Q3 deutet insgesamt auf eine lokale stochastische Unabhängigkeit der Items hin (vgl. Christensen et al. 2017). Die ähnlich zu Cronbachs Alpha zu interpretierenden EAP- Reliabilitäten der drei Dimensionen sind vor dem Hintergrund der schwierigen Ope- rationalisierung des Konstrukts im moderaten Bereich (Beschreiben:EAP D 0,80, Deuten:EAP D 0,83, Ursachenfinden/Konsequenzen ableiten: EAP D 0,68, D U=K vgl. Bortz und Döring 2006). Die ansteigenden Trennschärfen und mittlere Fähig- keiten der Partial-Credit-Items deuten auf geordnete Antwortkategorien hin (Enen- kiel 2022). Der Standardized-Root-Mean-Residual von SRMR D 0,079 weist auf einen guten Modellfit hin (vgl. Bühner 2011). Um die Ergebnisse der Validierung des Nachtests zu überprüfen, wurde das Partial-Credit-Modell anhand der Vor- testdaten überprüft. Auch hier deuteten die Informationskriterien AICc und SA- BIC auf die Extraktion des dreidimensionalen Modells hin, dass zwischen den Komponenten Beschreiben, Deuten und Ursachenfinden/Konsequenzen ableiten un- terscheidet. Die mittleren Infit- und Outfit-Werte der Items von M D 1,00 Infit .SD D 0,11/ und M D 0,92 .SD D 0,24/ weisen auf eine Passung Infit Outfit Outfit der theoretischen und empirischen Werte hin. Die durchschnittliche Itemtrennschär- fe von M D 0,35 .SD D 0,13/ im Vortest bei einer mittleren Itemschwierigkeit TS TS von M D 1,84.SD D 0,90/ liegt im moderaten Bereich. Die Residualkorrelation betrug im Vortest im Mittel M D0,014.S D D 0,112) und deutet auf eine Q3 Q3 lokal stochastische Unabhängigkeit hin. Der Modellfit von SRMR D 0,085 weist insgesamt auf eine gute Passung des Modells hin (Bühner 2011). Die EAP-Reliabili- täten (EAP D 0,637 in der Dimension Beschreiben,EAP D 0,746 in der Dimen- B D sion Deuten und EAP D 0,504 in der Dimension Ursachenfinden/Konsequenzen U=K ableiten) sind geringer als die des Nachtests. Die Trennschärfe der Items wurde über die jeweilige punktbiseriale Korrelation bestimmt. K 90 P. Enenkiel et al. 5 Ergebnisse Für die Analyse der Lerneffekte bietet es sich an, basierend auf den Analysen der IRT, mit dem Summenscore zu rechnen, da es sich bei einem Partial-Credit-Modell um eine suffiziente Statistik handelt (Rost 2004). Das bedeutet, dass jeder Person lediglich ein Summenscore zugewiesen wird, der die Eigenschaftsausprägung der Person ausreichend gut beschreibt. Tab. 2 stellt die Mittelwerte und Standardabwei- chungen im Vor- und Nachtest der Experimentalgruppe (EG) und der Kontrollgruppe (KG) dar. Der maximal zu erreichende Summenscore beträgt für die Komponente Beschreiben 12 Punkte, für die Komponente Deuten 17 Punkte und für die Kompo- nente Ursachenfinden/Konsequenzen ableiten 14 Punkte. Da die Erhebung der Kontrollgruppe in einem anderen Semester stattfand, die Veranstaltung Fachdidaktische Grundlagen sowie auch der theoretische Input von einem anderen Dozierenden gehalten wurde und die Experimental- und Kontroll- gruppe folglich nicht randomisiert werden konnten, wurde auf eine gemeinsame Auswertung der beiden Gruppen, etwa in Form einer gemischten ANOVA, ver- zichtet. Zudem erfordern die nicht normalverteilten Daten der Kontrollgruppe ei- ne separate Auswertung der Daten. Aus diesen Gründen wurde zur Überprüfung, ob die Arbeit mit der Lernumgebung ViviAn in der Experimentalgruppe zu einer Entwicklung in den diagnostischen Fähigkeiten beiträgt, ein verbundener T-Test herangezogen. Die Normalverteilung der Differenzwerte des Vor- und Nachtests als Voraussetzung für den verbundenen T-Tests wurde sowohl mit dem Shapiro- Wilk-Test als auch grafisch mit Q-Q-Plots überprüft (Holling und Gediga 2015). Die Normalverteilung ist für die Differenzen in der Komponente Beschreiben mit W D 0,98 und p D 0,182 sowie in der Komponente Deuten mit W D 0,99 B D und p D 0,425 gegeben. Die Teststatistik des Shapiro-Wilk-Tests für die Kompo- nente Ursachenfinden/Konsequenzen ableiten deutet jedoch mit W D 0,96 und U =K p D 0,004 auf eine Abweichung von einer Normalverteilung hin. Eine zusätzliche grafische Überprüfung durch einen Q-Q-Plot suggeriert jedoch eine Normalvertei- lung in den Differenzwerten. Da der T-Test bei einer Stichprobe von N> 30 als robust gilt und der Q-Q-Plot auf Normalverteilung hindeutet, kann die Abweichung bei N D 103 als unproblematisch aufgefasst werden. EG Die Ergebnisse des T-Tests für verbundene Stichproben zeigen, dass die Experi- mentalgruppe ihre diagnostischen Fähigkeiten in allen drei Komponenten signifikant mit großen Effekten steigern konnte (vgl. Abb. 7): t .102/ D8,81, p< 0,001, Tab. 2 Mittelwerte und Standardabweichungen der Studierenden im Vor- und Nachtest Mittelwert (Standardabweichung) EG (N D 103) KG (N D 81) Vortest Beschreiben 1,92 (2,13) 1,25 (1,75) Nachtest Beschreiben 4,28 (2,59) 1,17 (1,86) Vortest Deuten 3,98 (2,56) 3,99 (2,61) Nachtest Deuten 6,17 (2,90) 4,37 (3,37) Vortest Ursachenfinden/Konsequenzen ableiten 2,70 (1,75) 2,12 (1,6) Nachtest Ursachenfinden/Konsequenzen ableiten 4,34 (2,23) 1,86 (1,35) EG Experimentalgruppe, KG Kontrollgruppe K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 91 Beschreiben Deuten Ursachenfinden/ Konsequenzen ableiten 12 17 14 11 9 6 7 6 5 5 4 0 0 0 Vortest Nachtest Vortest Nachtest Vortest Nachtest EG KG EG KG EG KG Abb. 7 Entwicklung der diagnostischen Fähigkeiten der Studierenden in der Experimentalgruppe und der Kontrollgruppe dargestellt durch den Summenscore in der jeweiligen Dimension d D 0,87; t .102/ D9,06, p< 0,001, d D 0,892; t .102/ D7,91, D U=K p< 0,001, d D 0,72. In der Kontrollgruppe war die Voraussetzung der Normalverteilung in den Kom- ponenten Beschreiben und Ursachenfinden/Konsequenzen ableiten nicht gegeben. Sowohl der Shapiro-Wilk-Test mit W D 0,87, p< 0,001 und W D 0,96, B U =K p D 0,019 als auch die Q-Q-Plots lassen eine Abweichung von einer Normalver- teilung vermuten. In der Komponente Deuten hingegen konnte mit W D 0,98, p D 0,137 von einer Normalverteilung ausgegangen werden. Trotz einer Stichpro- bengröße von N D 81 wurde, aufgrund der grafischen Analyse, die auf eine KG Verletzung der Normalverteilung hindeutet, in den Komponenten Beschreiben und Ursachenfinden/Konsequenzen ableiten, der nicht parametrische Wilcoxon-Test an- gewendet. Obwohl sich die Studierenden vom Vor- zum Nachtest in der Dimension Be- schreiben und Ursachenfinden/Konsequenzen ableiten etwas verschlechterten sowie in der Dimension Deuten verbesserten, zeigen die Ergebnisse, dass diese Unterschie- de nicht signifikant sind: V D 562,00;p D 0,987; t .80/ D1,23, p D 0,223 B D und V D 738,50, p D 0,184. Dies lässt vermuten, dass die reine Bearbei- U=K tung des Vor- und Nachtests keinen Einfluss auf die diagnostischen Fähigkeiten der Studierenden hat. 6 Diskussion In der vorliegenden Studie wurde untersucht, ob die videobasierte Lernumgebung ViviAn dazu beitragen kann, Studierende beim Diagnostizieren von Fähigkeiten und Schwierigkeiten hinsichtlich der Bestimmung von Längen, Flächen- und Raumin- halten zu unterstützen. Dafür wurden Videovignetten erstellt, die Schülerinnen und Schüler bei der Bearbeitung von Aufgaben zur Bestimmung von Flächen- und Raum- inhalten zeigen. Entsprechende Diagnoseaufträge sollten die Studierenden durch die Analyse leiten und für den Diagnoseprozess sensibilisieren. Um die Wirksamkeit der Lernumgebung zu überprüfen, wurde eine Interventionsstudie mit einem Vor- und einem Nachtest durchgeführt. Studierende arbeiteten über mehrere Wochen hinweg K 92 P. Enenkiel et al. mit der videobasierten Lernumgebung und analysierten mehrere Videovignetten. Um die Studierenden bei der Analyse zu unterstützen, erhielten sie nach den Videoanaly- sen Musterlösungen auf Basis eines Expertenratings. Eine Kontrollgruppe, die in der Interventionsphase nicht mit ViviAn arbeitete, sollte mögliche Testeffekte aufgrund der Übereinstimmung von Vor- und Nachtest kontrollieren. Das Testinstrument, das jeweils eingesetzt wurde, wurde mithilfe eines mehrdimensionalen Rasch-Partial- Credit-Modells auf Basis der Daten des Nachtests validiert. Die Dimensionsana- lyse suggeriert die Extraktion eines dreidimensionalen Modells, das zwischen den Komponenten Beschreiben, Deuten und Ursachenfinden/Konsequenzen ableiten dif- ferenziert. Dass das Finden von Ursachen und das Ableiten möglicher Konsequenzen einen Faktor abbilden, lässt sich dadurch begründen, dass besonders die möglichen Ursachen wertvolle Anhaltspunkte für eine mögliche Förderung geben (vgl. von Aufschnaiter et al. 2018). Die Itemkennwerte deuten insgesamt auf eine gute Pas- sung des Modells hin. Um das extrahierte Modell zusätzlich zu stützen, wurde dieses auch mithilfe der Daten des Vortests überprüft. Die EAP-Reliabilitäten fie- len geringer aus als mit den Daten des Nachtests. Dies kann unter anderem darauf zurückgeführt werden, dass die Studierenden im Vortest insgesamt weniger Punk- te erzielten, was sich wiederum negativ auf die Reliabilität des Testes auswirken kann. Nichtsdestotrotz weisen die statistischen Kennwerte auch beim Vortest auf die Passung des beschriebenen dreidimensionalen Modells hin. Die Ergebnisse der Lerneffektanalyse zeigen, dass sich die Mathematiklehramtsstudierenden, die mit der videobasierten Lernumgebung ViviAn gearbeitet haben, in allen Dimensionen signifikant mit einem großen Effekt verbessern. In der Kontrollgruppe konnte hin- gegen kein Lerneffekt verzeichnet werden. Auffallend ist jedoch, dass die Studierenden – auch im zweiten Messzeitpunkt – über niedrige Summenscores in allen drei Teilfähigkeitsbereichen verfügen (vgl. Abb. 7). Die Studierenden erreichten im Durchschnitt weniger als die Hälfte der zu erreichenden Punkte. Für die vorliegende Studie können mehrere Begründungen herangezogen werden. Zum einen kann der niedrige Summenscore auf die offenen Diagnoseaufträge zurückgeführt werden. So erfordert die Formulierung von freien Antworten neben diagnostischen Fähigkeiten, sowohl eine gewisse Motivation, als auch die Fähigkeit, Antworten nachvollziehbar formulieren zu können. Dies stellen Fähigkeiten dar, die im Rahmen dieser Studie nicht kontrolliert werden konnten. Zum anderen ist der maximale Summenscore auch hoch, da dieser auf zusammen- getragenen Antworten von Mathematikdidaktikerinnen und Mathematikdidaktikern basiert (vgl. Abb. 5). Diese wiederum verfügen teilweise über langjährige Erfahrung im zugrundeliegenden Bereich und hatten zudem – im Gegensatz zu den Proban- dinnen und Probanden der vorliegenden Studie – die Möglichkeit, sich die Videos mehrmals anzuschauen. Darüber hinaus wurde das Kategoriensystem, das sich durch das Expertenrating ergab, induktiv ergänzt. Dies erschien notwendig, da die Ant- worten der Studierenden teilweise nicht zu den deduktiv entwickelten Kategorien zugeordnet werden konnten, jedoch trotzdem sinnvolle Beantwortungen der Diagno- seaufträge waren. Unter Berücksichtigung aller potenziellen sinnvollen Antworten ergibt sich insgesamt ein hoher maximaler Summenscore in den drei Dimensio- nen, welcher isoliert betrachtet nur begrenzt aussagekräftig ist. Dies erscheint mit Blick auf das Ziel der vorliegenden Studie unproblematisch und vielmehr sinnvoll, K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 93 da die Förderung der diagnostischen Fähigkeiten von Mathematiklehramtsstudieren- den klar im Vordergrund steht. Durch die vielen Aspekte, die in den Testvignetten erkannt werden konnten, konnte der Zuwachs der diagnostischen Fähigkeiten abge- bildet werden. Hätte eine möglichst genaue Bewertung der diagnostischen Fähig- keiten Studierenden im Vordergrund gestanden, hätte eine andere Vorgehensweise herangezogen werden müssen. Die Diagnoseaufträge wurden in Diskussionsrunden von Expertinnen und Ex- perten, die hinsichtlich diagnostischer Fähigkeiten forschen, analysiert, wodurch die Inhaltsvalidität gegeben sein sollte. Jedoch müsste in weiteren Studien die Konstrukt- validität des hier eingesetzten Testinstrumentes mittels Kriteriumsvalidität überprüft werden (Döring und Bortz 2016), indem beispielsweise das Fachwissen, das fach- didaktische Wissen oder weitere Prädiktoren als Kriterium in Regressionsanalysen miteinbezogen werden, um mögliche Zusammenhänge darzustellen. So wird ange- nommen, dass das fachliche und fachdidaktische Wissen zur Vorhersage diagnosti- scher Fähigkeiten beitragen kann (vgl. Blömeke et al. 2014). Da angenommen wird, dass die diagnostische Fähigkeit von der diagnostischen Situation abhängt, müssten die Kriteriumsvariablen auf die diagnostische Situation abgestimmt werden. Ein weiterer zu diskutierender Aspekt betrifft die Formulierung des ersten Dia- gnoseauftrags jeder Videovignette, welcher eine Beschreibung der dargestellten Si- tuation aus mathematikdidaktischer Perspektive fordert. Einige Antworten aus dem Vortest (z. B.: „S4 spielt mit der Schere“) legen offen, dass die Studierenden Aspek- te beschreiben, die keinen fachdidaktischen Bezug aufweisen und somit keine dia- gnoserelevanten Beobachtungen darstellen. Im Nachtest bildeten solche Antworten hingegen nur noch die Ausnahme. Dies kann darauf zurückgeführt werden, dass bei den Musterlösungen der Trainingsvignetten darauf geachtet wurde, ausschließlich mathematikdidaktisch relevante Aspekte aufzunehmen. Es ist an dieser Stelle zu überlegen, ob der Diagnoseauftrag noch stärker fokussiert werden sollte, indem der Diagnosegegenstand explizit benannt wird. Dies hätte den Vorteil, dass den Studie- renden von Anfang an der Fokus transparent wäre. Gegen eine solche Fokussierung spricht, dass der Blick der Studierenden dann bereits stark eingeschränkt wäre und sie den Schritt der Fokussierung auf diagnoserelevante Aspekte nicht selbstständig gehen könnten. Hinsichtlich des Einbezugs der anschließenden didaktischen Interventionen in das Konstrukt der diagnostischen Fähigkeiten besteht bisher große Uneinigkeit. Es liegt nahe, dass in Situationen im Unterrichtsalltag, die tendenziell nicht planbar sind, wie etwa Interaktionen zwischen Lernenden und Lehrkraft, die diagnostische Per- formanz lediglich über das beobachtbare Verhalten erfahrbar gemacht werden kann. Um eine realistische Unterrichtssituation abzubilden, beinhalteten die Arbeitsauf- träge in den Videoanalysen auch die Nennung möglicher Fördermaßnahmen. Wir nehmen jedoch an, dass die anschließenden Interventionen von vielerlei, insbesonde- re nicht kognitiven, Dispositionen der Urteilenden abhängen, sodass eine Aussage über deren Angemessenheit nur schwer möglich erscheint. Zudem erscheint eine solche Aussage schwierig, da mögliche Interventionen nicht isoliert von den voran- gegangenen Diagnosen betrachtet werden können und sie somit auch eine Aussage über die Passung von Diagnose und Intervention beinhalten müsste. Aufgrund der K 94 P. Enenkiel et al. genannten Aspekte wurden die von den Studierenden beschriebenen pädagogischen Handlungen im Rahmen der Studie nicht ausgewertet. Die Ergebnisse der Studie müssen vor dem Hintergrund der Zusammensetzung der beiden Gruppen betrachtet werden. Die Experimentalgruppe setzte sich neben der überwiegenden Anzahl der Studierenden aus der Vorlesung Fachdidaktische Grundlagen auch aus Studierenden der Vorlesung Didaktik der Geometrie zusam- men. Die Studierenden der Kontrollgruppe stammten aus organisatorischen Grün- den hingegen ausschließlich aus der Vorlesung Fachdidaktische Grundlagen.Dieser unterschiedlichen Zusammensetzung wurde mit einer separaten statistischen Aus- wertung der beiden Gruppen mittels eines verbundenen T-Tests Rechnung getragen. Der Einfluss der Subgruppe der Teilnehmenden aus der Vorlesung Didaktik der Geo- metrie lässt sich jedoch aufgrund ihrer geringen Größe von 20 Studierenden nicht eruieren. Die Ergebnisse zum Lernzuwachs stimmen mit den Ergebnissen bisheriger Studi- en überein, die zeigen konnten, dass Videoanalysen die Wahrnehmung und Interpre- tation relevanter Unterrichtsaspekte von Studierenden positiv beeinflussen können (Krammer et al. 2016; Sunder et al. 2016). Aus den Ergebnissen lässt sich somit ableiten, dass die Arbeit mit ViviAn einen positiven Einfluss auf die Fähigkeiten der Studierenden hat. Worauf der große Lerneffekt zurückzuführen ist, kann aus den Ergebnissen nicht entnommen werden. So stellt sich die Frage, ob die Unter- stützungsmaßnahmen in Form der Musterlösungen den Lerneffekt erklären können. Bei der Erstellung der Musterlösungen wurde bewusst auf einfache Formulierun- gen, prägnante Sätze und eine strukturierte Darstellung geachtet, weshalb es durch- aus plausibel erscheint, dass die Musterlösungen für die Erklärung des Lerneffekts maßgeblich sein könnten. Dennoch hätte für eine statistische Absicherung dieser Annahme eine weitere Kontrollgruppe herangezogen werden müssen, deren Pro- banden im Anschluss an die Bearbeitung der Videovignetten keine Musterlösungen erhalten hätten. Da ViviAn auch in der Modulabschlussprüfung der Veranstaltung „Fachdidaktische Grundlagen“ integriert ist, die am Campus Landau als E-Klausur stattfindet, schien dies aus ethischen Gründen jedoch nicht vertretbar. Inwiefern die Arbeit mit der videobasierten Lernumgebung dazu beitragen kann, Studierende auf die Anforderungen im Unterrichtsalltag im Schuldienst vorzuberei- ten, konnte bisher noch nicht geklärt werden. Um eine solche Aussage zu treffen, könnte etwa im Rahmen einer experimentellen Studie die Performanz der Studie- renden in realen, aber vergleichbaren Unterrichtssituationen erfasst werden. Dazu müssten die Studierenden dieselben Schülerinnen und Schüler zum selben Entwick- lungsstand unterrichten, was jedoch in der Realität nicht umsetzbar ist. Die videobasierte Lernumgebung ViviAn wird am Campus Landau bisher im Rah- men von Großveranstaltungen eingesetzt, in denen die Studierenden online, parallel zur Veranstaltung, Videovignetten bearbeiten. Aufgrund der großen Studierenden- zahl ist es bisher nicht möglich, den Studierenden persönliche Rückmeldungen zu Der Fragestellung, ob pädagogische Interventionen angemessen durchgeführt wurden und inwiefern diese im Zusammenhang mit diagnostischen Fähigkeiten stehen, geht Walz (2020) in seiner Arbeit nach. Im Sommersemester 2018, in dem die Kontrollgruppe erhoben wurde, war ViviAn nicht Teil der Mo- dulabschlussprüfung. K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 95 ihren Videoanalysen zu geben. Die Studierenden erhalten zwar ausführliche Mus- terlösungen, jedoch sind diese, aufgrund organisatorischer und technischer Gege- benheiten, nicht individuell auf die jeweiligen Antworten angepasst. Dies wirft die Frage auf, ob die curriculare Struktur des Lehramtsstudiums, wie es momentan an- geboten wird, nicht grundlegend verändert werden sollte. So können beispielsweise fach- und themenspezifische Seminare die Möglichkeit bieten, gemeinsam Videos zu analysieren und über adäquate Diagnosen zu diskutieren. Ziel der vorliegenden Studie war es, die diagnostischen Fähigkeiten von Mathe- matiklehramtsstudierenden zu entwickeln bzw. zu fördern. Wie oben bereits dis- kutiert, konnte ein Lernzuwachs auf Basis der vorliegenden Daten nachgewiesen werden. Einschränkend muss an dieser Stelle erwähnt werden, dass keine Aussage über die Nachhaltigkeit der Arbeit mit ViviAn getätigt werden kann, da kein Fol- low-Up-Test durchgeführt wurde. Da die Arbeit mit ViviAn mit den Inhalten der entsprechenden Veranstaltungen verknüpft ist, kann jedoch angenommen werden, dass die Videoanalysen eine enge Theorie-Praxis-Verknüpfung ermöglichen. 7 Anhang Tab. 3 Modellvergleiche anhand den Informationskriterien Modell AICc AICc saBIC saBIC 1. 3-dimensional (B× D × U / K) 12.909 – 12.786 – 2. 1-dimensional (B / D / U / K) 13.105 +196 13.002 +216 3. 4-dimensional (B× D × U × K) 12.931 +22 12.790 +4 4. 2-dimensional (B / D / U × K) 13.086 +177 12.976 +190 5. 2-dimensional (B× D / U / K) 13.246 +337 13.136 +350 6. 3-dimensional (B / D × U × K) 13.034 +125 12.911 +125 B Beschreiben, D Deuten, U Ursachenfinden, K Konsequenzen ableiten, × steht für die Trennung der jewei- ligen Dimensionen, / steht für die Zusammenführung der jeweiligen Dimensionen, AICc second-order bias correction Akaike Information Criteria, SABIC Sample Size Adjusted Bayes Information Criteria,  steht für die Differenz der Informationskriterien des jeweiligen Modells und des, anhand der Informationskrite- rien am besten passenden Modells (3-dimensional B× D × U / K) K 96 P. Enenkiel et al. Tab. 4 Korrelationen zwischen den Faktoren Latente Korrelationen Modell Faktoren (1) (2) (3) (4) 1. 3-dimensional (B× D × U / K) (1) 1,000 – – – (2) 0,694 1,000 – – (3) 0,867 0,799 1,000 – 2. 1-dimensional (B / D / U / K) (1) 1,000 – – – 3. 4-dimensional (B× D × U × K) (1) 1,000 – – – (2) 0,663 1,000 – – (3) 0,724 0,863 1,000 – (4) 0,882 0,648 0,881 1,000 4. 2-dimensional (B / D / U × K) (1) 1,000 – – – (2) 0,92 1,000 – – 5. 2-dimensional (B× D / U / K) (1) 1,000 – – – (2) 0,693 1,000 – – 6. 3-dimensional (B / D × U × K) (1) 1,000 – – – (2) 0,892 1,000 – – (3) 0,845 0,948 1,000 – B Beschreiben, D Deuten, U Ursachen finden, K Konsequenzen ableiten, × steht für die Trennung der jeweiligen Faktoren, / steht für die Zusammenführung der jeweiligen Faktoren Funding Open Access funding enabled and organized by Projekt DEAL. Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Li- zenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ord- nungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden. Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betref- fende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen. Weitere Details zur Lizenz entnehmen Sie bitte der Lizenzinformation auf http://creativecommons.org/ licenses/by/4.0/deed.de. Literatur Adams, R. J., & Khoo, S.-T. (1996). Quest. The interactive test analysis system. Victoria: ACER Press. Adams, R. J., Wu, M. L., & Wilson, M. (2012). The Rasch rating model and the disordered threshold controversy. Educational and Psychological Measurement, 72(4), 547–573. Bangert-Drowns, R. L., Kulik, C.-L. C., Kulik, J. A., & Morgan, M. (1991). The instructional effect of feedback in test-like events. Review of Educational Research, 61(2), 213–238. Bartel, M.-E., & Roth, J. (2017). Diagnostische Kompetenz von Lehramtsstudierenden fördern. Das Vi- deotool ViviAn. In J. Leuders, T. Leuders, S. Prediger & S. Ruwisch (Hrsg.), Mit Heterogenität im Mathematikunterricht umgehen lernen. Konzepte und Perspektiven für eine zentrale Anforderung an die Lehrerbildung (S. 43–52). Wiesbaden: Springer. K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 97 Behrmann, L., & Glogger-Frey, I. (2017). Produkt- und Prozessindikatoren diagnostischer Kompetenz. In A. Südkamp & A.-K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften. Theoretische und methodische Weiterentwicklungen (S. 42–45). Münster: Waxmann. Beretz, A.-K., Lengnink, K., & Von Aufschnaiter, C. (2017). Diagnostische Kompetenz gezielt fördern – Videoeinsatz im Lehramtsstudium Mathematik und Physik. In C. Selter, S. Hußmann, C. Hößle, C. Knipping, K. Lengnink & J. Michaelis (Hrsg.), Diagnose und Förderung heterogener Lerngrup- pen. Theorien, Konzepte und Beispiele aus der MINT-Lehrerbildung (S. 149–168). Münster: Wax- mann. Berliner, D. C. (1986). In pursuit of the expert pedagogue. Educational Researcher, 15(7), 5–13. Berliner, D. C. (2001). Learning about and learning from expert teachers. International Journal of Educa- tional Research, 35, 463–482. Blomberg, G., Renkl, A., Garmoran Sherin, M., Borko, H., & Seidel, T. (2013). Five research-based heuri- stics for using video in pre-service teacher education. Journal of Educational Research, 5(1), 90–114. Blömeke, S., Gustafsson, J.-E., & Shavelson, R. J. (2015). Beyond dichotomies. Zeitschrift für Psychologie, 223(1), 3–13. Blömeke, S., König, J., Busse, A., Stuhl, U., Benthien, J., Döhrmann, M., & Kaiser, G. (2014). Von der Lehrerausbildung in den Beruf – Fachbezogenes Wissen als Voraussetzung für Wahrnehmung, Inter- pretation und Handeln im Unterricht. Zeitschrift für Erziehungswissenschaften, 17(3), 509–542. Böhmer, I., Gräsel, C., Krolak-Schwerdt, S., Hörstermann, T., & Glock, S. (2017). Teachers’ school tracking decision. In D. Leutner, J. Fleischer, J. Grünkorn & E. Klieme (Hrsg.), Competence as- sessment in education. Research, models and instruments (S. 131–148). Heidelberg: Springer. Bortz, J., & Döring, N. (2006). Forschungsmethoden und Evaluation für Human- und Sozialwissenschaftler (5. Aufl.). Heidelberg: Springer. Bühner, M. (2011). Einführung in die Test- und Fragebogenkonstruktion (3. Aufl.). München: Pearson Studium. Burnham, K. P., & Anderson, D. R. (2004). Multimodel inference: understanding AIC and BIC in model selection. Sociological Methods & Research, 33(2), 261–304. Christensen, K. B., Makransky, G., & Horton, M. (2017). Critical values for yen’s Q3: identification of local dependence in the Rasch model using residual correlations. Applied Psychological Measurement, 41(3), 178–194. Döring, N., & Bortz, J. (2016). Forschungsmethoden und Evaluation in den Sozial- und Humanwissen- schaften (5. Aufl.). Berlin: Springer. Eid, M., Gollwitzer, M., & Schmitt, M. (2010). Statistik und Forschungsmethoden. Lehrbuch. Weinheim: Beltz. Enenkiel, P. (2022). Diagnostische Fähigkeiten mit Videovignetten und Feedback fördern. Gruppenar- beitsprozesse zur Bestimmung von Längen, Flächen- und Rauminhalten. Wiesbaden: Springer Spek- trum. Enenkiel, P., & Roth, J. (2018). Diagnostische Fähigkeiten von Lehramtsstudierenden mithilfe von Video- vignetten fördern – Der Einfluss von Feedback. In Fachgruppe Didaktik der Mathematik der Uni- versität Paderborn (Hrsg.), Beiträge zum Mathematikunterricht 2018 (S. 513–516). Münster: WTM- Verlag. Frenzel, L., & Grund, K.-H. (1991a). Umgang mit Größen. Mathematik Lehren, 45, 10–14. Frenzel, L., & Grund, K.-H. (1991b). Wie tief ist der Brunnen? Einige Gedanken zum Anwenden von Mathematik. Mathematik Lehren, 45, 4–8. Gruber, H. (2001). Expertise. In D. H. Rost (Hrsg.), Handwörterbuch Pädagogische Psychologie (S. 164– 169). Weinheim: Beltz. Hartig, J., & Goldhammer, F. (2010). Modelle der Item-Response-Theorie. In S. Maschke & L. Stecher (Hrsg.), Methoden der empirischen erziehungswissenschaftlichen Forschung. Enzyklopädie Erzie- hungswissenschaft Online (EEO) (S. 1–36). Weinheim: Juventa. Hartig, J., & Höhler, J. (2010). Modellierung von Kompetenzen mit mehrdimensionalen IRT-Modellen. Zeitschrift für Pädagogik, 56, 189–198. Heitzmann, N., Seidel, T., Poitz, A., Hetmanek, A., Wecker, C., Fischer, M., Ufer, S., Schmidmaier, R., Neuhaus, B., Siebeck, M., Stürmer, K., Obersteiner, A., Reiss, K., Girwidz, R., & Fischer, F. (2019). Facilitating diagnostic competences in simulations: A conceptual framework and a research agenda for medical and teacher education. Frontline Learning Research, 7(4), 1–24. Herppich, S., Praetorius, A.-K., Hetmanek, A., Glogger-Frey, I., Ufer, S., Leutner, D., Behrmann, L., Böh- mer, I., Böhmer, M., Förster, N., Kaiser, J., Karing, C., Karst, K., Klug, J., Ohle, A., & Südkamp, A. (2017). Ein Arbeitsmodell für die empirische Erforschung der diagnostischen Kompetenz von Lehrkräften. In A. Südkamp & A.-K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften. K 98 P. Enenkiel et al. Theoretische und methodische Weiterentwicklungen. Pädagogische Psychologie und Entwicklungs- psychologie, (Bd. 94, S. 75–94). Münster: Waxmann. Hetmanek, A., & van Gog, T. (2017). Förderung von diagnostischer Kompetenz: Potenziale von Ansät- zen aus der medizinischen Ausbildung. In A. Südkamp & A.-K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften (S. 209–216). Münster: Waxmann. Hiebert, J. (1981). Units of measure: results and implications from national assessment. The Arithmetik Teacher, 28(6), 38–43. Holling, H., & Gediga, G. (2015). Statistik – Testverfahren. Göttingen: Hogrefe. Horstkemper, M. (2006). Diagnostizieren und Fördern. Pädagogische Diagnostik als wichtige Vorausset- zung für individuellen Lernerfolg. Friedrich Jahresheft. (S. 4–7). Kaiser, J., Praetorius, A.-K., Südkamp, A., & Ufer, S. (2017). Die enge Verwobenheit von diagnostischem und pädagogischem Handeln als Herausforderung bei der Erfassung diagnostischer Kompetenz. In A. Südkamp & A.-K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften. Theoretische und methodische Weiterentwicklungen (S. 114–123). Münster: Waxmann. Karst, K., Klug, J., & Ufer, S. (2017). Strukturierung diagnostischer Situationen im inner- und außerun- terrichtlichen Handeln von Lehrkräften. In A. Südkamp & A.-K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften (S. 102–123). Münster: Waxmann. Krammer, K., & Reusser, K. (2005). Unterrichtsvideos als Medium der Aus- und Weiterbildung von Lehr- personen. Beiträge zur Lehrerinnen- und Lehrerbildung, 23(1), 35–50. Krammer, K., Hugener, I., Biaggi, S., Frommelt, M., Fürrer Auf der Maur, G., & Stürmer, K. (2016). Videos in der Ausbildung von Lehrkräften: Förderung der professionellen Unterrichtswahrnehmung durch die Analyse von eigenen bzw. fremden Videos. Unterrichtswissenschaft, 44(4), 357–372. Krauthausen, G. (2018). Einführung in die Mathematikdidaktik – Grundschule. Berlin: Springer. Kuckartz, U. (2016). Qualitative Inhaltsanalyse. Methoden, Praxis, Computerunterstützung (3. Aufl.). Weinheim: Beltz Juventa. Kulhavy, R. W. (1977). Feedback in written instruction. Review of Educational Research, 47(2), 211–232. Kuntze, S. (2018). Flächeninhalt und Volumen. In H.-G. Weigand, A. Filler, R. Hölzl, S. Kuntze, M. Lud- wig & J. Roth, et al. (Hrsg.), Didaktik der Geometrie für die Sekundarstufe I (2. Aufl. S. 149–178). Berlin, Heidelberg: Springer Spektrum. Lafrentz, H., & Eichler, K. P. (2004). Vorerfahrungen von Schulanfängern zum Vergleichen und Messen von Längen und Flächen. Grundschulunterricht, 7(8), 42–47. Leuders, T., Dörfler, T., Leuders, J., & Philipp, K. (2018). Diagnostic competence of mathematic teachers: unpacking a complex construct. In T. Leuders, K. Philipp & J. Leuders (Hrsg.), Diagnostic com- petence of mathematics teachers. Unpacking a complex construct in teacher education and teacher practice (S. 3–32). Cham: Springer. Loibl, K., Leuders, T., & Doerfler, T. (2020). A framework for explaining teachers’ diagnostic judgements by cognitive modeling (DiacoM). Teaching and Teacher Education, 91, 103059. Mayring, P. (2015). Qualitative Inhaltsanalyse. Grundlagen und Techniken (12. Aufl.). Weinheim: Beltz. Ministerium für Bildung, Wissenschaft, Jugend und Kultur Rheinland-Pfalz (2007). Rahmenlehrplan Ma- thematik (Klassenstufen 5–9/10). Mainz: Ministerium für Bildung, Wissenschaft, Jugend und Kultur Rheinland-Pfalz. Ministerium für Bildung, Wissenschaft, Jugend und Kultur Rheinland-Pfalz (2015). Lehrplan Mathematik Grund- und Leistungsfach in der gymnasialen Oberstufe (Mainzer Studienstufe). Mainz: Ministerium für Bildung, Wissenschaft, Jugend und Kultur Rheinland-Pfalz. Neubert, B., & Thies, S. (2012). Zur Entwicklung des Flächeninhaltsbegriffs. Mathematik Lehren, 172, 15–19. Peter-Koop, A. (2001). Authentische Zugänge zum Umgang mit Größen. Die Grundschulzeitschrift, 141(15), 6–11. Peter-Koop, A., & Nührenbörger, M. (2016). Größen und Messen. In G. Walther, M. Van den Heuvel- Panhuizen, D. Granzer & O. Köller (Hrsg.), Bildungsstandards für die Grundschule: Mathematik konkret (S. 89–117). Berlin: Cornelsen. Radatz, H., & Schipper, W. (2007). Handbuch für den Mathematikunterricht an Grundschulen. Hannover: Schroedel. Rehm, M., & Bölsterli, K. (2014). Entwicklung von Unterrichtsvignetten. In D. Krüger, I. Parchmann & H. Schecker (Hrsg.), Methoden in der naturwissenschaftsdidaktischen Forschung (S. 213–226). Heidelberg: Springer. Rost, J. (2004). Lehrbuch Testtheorie – Testkonstruktion (2. Aufl.). Bern: Huber. K Diagnostische Fähigkeiten mit der videobasierten Lernumgebung ViviAn fördern 99 Roth, J. (2020). Theorie-Praxis-Verzahnung durch Lehr-Lern-Labore – das Landauer Konzept der mathe- matikdidaktischen Lehrpersonenbildung. In B. Priemer & J. Roth (Hrsg.), Lehr-Lern-Labore. Kon- zepte und deren Wirksamkeit in der MINT-Lehrpersonenbildung (S. 59–84). Berlin: Springer. Ruwisch, S. (2003). Gute Aufgaben für die Arbeit mit Größen – Erkundungen zum Größenverständnis von Grundschulkindern als Ausgangbasis. In S. Ruwisch & A. Peter-Koop (Hrsg.), Gute Aufgaben im Ma- thematikunterricht der Grundschule (S. 211–227). Offenburg; Mildenberger. Didaktik des Sachrech- nens in der Grundschule/Marianne Franke. Zentralblatt für Didaktik der Mathematik, 35(5), 41–43. Sabers, D. S., Cushing, K. S., & Berliner, D. C. (1991). Differences among teachers in a task characteri- zed by simultaneity, multidimensionality, and immediacy. American Educational Research Journal, 28(1), 63–88. Schmidt, R. (2014). Flächenvergleich durch Stempeln. Praxis der Mathematik in der Schule, 55, 11–14. Schrader, F.-W. (2011). Lehrer als Diagnostiker. In E. Terhart (Hrsg.), Handbuch der Forschung zum Leh- rerberuf (S. 683–698). Münster: Waxmann. Sclove, S. L. (1987). Application of model-selection criteria to some problems in multivariate analysis. Psychometrika, 52(3), 333–343. Seago, N. (2004). Using video as an object of inquiry mathematics teaching and learning. In J. E. Brophy (Hrsg.), Using video in teacher education: Advances in research on teaching (S. 259–285). Amster- dam: Elsevier. Seidel, T., & Prenzel, M. (2007). Wie Lehrpersonen Unterricht wahrnehmen und einschätzen – Erfassung pädagogisch-psychologischer Kompetenzen mit Videosequenzen. In M. Prenzel, I. Gogolin & H.- H. Krüger (Hrsg.), Kompetenzdiagnostik (S. 201–216). Wiesbaden: Verlag für Sozialwissenschaften. Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutsch- land (2004). Beschlüsse der Kultusministerkonferenz. Bildungsstandards im Fach Mathematik für den Mittleren Schulabschluss. Beschluss vom 4.12.2003. München: Wolters Kluwer. https://www. kmk.org/fileadmin/veroeffentlichungen_beschluesse/2003/2003_12_04-Bildungsstandards-Mathe- Mittleren-SA.pdf. Zugegriffen: 19. Dez. 2020. Sekretariat der Ständigen Konferenz der Kultusminister der Länder in der Bundesrepublik Deutschland (2012). Bildungsstandards im Fach Mathematik für die Allgemeine Hochschulreife. Beschluss vom 18.10.2012. Köln: Wolters Kluwer. https://www.kmk.org/fileadmin/veroeffentlichungen_ beschluesse/2012/2012_10_18-Bildungsstandards-Mathe-Abi.pdf. Zugegriffen: 19. Dez. 2020. Star, J. R., & Strickland, S. K. (2008). Learning to observe: using video to improve preservice mathematics teachers’ ability to notice. Journal of Mathematics Teacher Education, 11(2), 107–125. Sunder, C., Todorova, M., & Möller, K. (2016). Kann die professionelle Unterrichtswahrnehmung von Sachunterrichtsstudierenden trainiert werden? Konzeption und Erprobung einer Intervention mit Vi- deos aus dem naturwissenschaftlichen Grundschulunterricht. Zeitschrift für Didaktik der Naturwis- senschaften, 22(1), 1–12. Syring, M., Bohl, T., Kleinknecht, M., Kuntze, S., Rehm, M., & Schneider, J. (2015). Videos oder Texte in der Lehrerbildung? Effekte unterschiedlicher Medien auf die kognitive Belastung und die mo- tivational-emotionalen Prozesse beim Lernen mit Fällen. Zeitschrift für Erziehungswissenschaften, 18(4), 667–685. Van Es, E. A., & Sherin, M. G. (2010). The influence of video clubs on teachers’ thinking and practice. Journal of Mathematics Teacher Education, 13(2), 155–176. Von Aufschnaiter, C., Münster, C., & Beretz, A.-K. (2018). Zielgerichtet und differenziert diagnostizieren. MNU Journal, 71(6), 382–387. Von Aufschnaiter, C., Selter, C., & Michaelis, J. (2017). Nutzung von Vignetten zur Entwicklung von Dia- gnose- und Förderkompetenzen – Konzeptionelle Überlegungen und Beispiele aus der MINT-Leh- rerbildung. In C. Selter, S. Hußmann, C. Hößle, C. Knipping & K. Lengnink (Hrsg.), Diagnose und Förderung heterogener lerngruppen. Theorien, Konzepte und Beispiele aus der MINT-Lehrerbildung (S. 85–105). Münster: Waxmann. Wahl, D. (2002). Mit Training vom trägen Wissen zum kompetenten Handeln? Zeitschrift für Pädagogik, 48(2), 227–241. Walz, M. (2020). Das Interventionsverhalten von Studierenden mit divergierender prozessdiagnostischer Fähigkeit „Deuten“. Universität Koblenz-Landau, Campus Landau. https://kola.opus.hbz-nrw.de/ frontdoor/index/index/docId/2132. Zugegriffen: 21. Febr. 2022. Weigand, H.-G. (2018). Begriffslernen und Begriffslehren. In H.-G. Weigand, A. Filler, R. Hölzl, S. Kunt- ze, M. Ludwig & J. Roth, et al. (Hrsg.), Didaktik der Geometrie für die Sekundarstufe I (2. Aufl. S. 85–106). Berlin, Heidelberg: Springer Spektrum. Wu, M., Tam, H. P., & Jen, T.-H. (2016). Educational measurement for applied researchers. Theory into practice. Singapur: Springer.

Journal

Journal für Mathematik-DidaktikSpringer Journals

Published: Mar 1, 2022

Keywords: Förderung diagnostischer Fähigkeiten; Videobasierte Lernumgebung; Quasi-experimentelle Studie; Mathematiklehramtsstudierende; Promotion of diagnostic skills; Video-based learning environment; Quasi-experimental study; Pre-service teachers

There are no references for this article.