Get 20M+ Full-Text Papers For Less Than $1.50/day. Start a 14-Day Trial for You or Your Team.

Learn More →

Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die Primarschule– Eine Studie zum Erkennen von Stärken und Schwächen von Schülerinnen und Schülern am Beispiel von Größen

Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die Primarschule–... J Math Didakt (2022) 43:173–203 https://doi.org/10.1007/s13138-022-00202-0 ORIGINALARBEIT/ORIGINAL ARTICLE Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die Primarschule – Eine Studie zum Erkennen von Stärken und Schwächen von Schülerinnen und Schülern am Beispiel von Größen K. Philipp · I. Gobeli-Egloff Eingegangen: 28. Dezember 2020 / Angenommen: 25. Februar 2022 / Online publiziert: 4. März 2022 © Der/die Autor(en) 2022 Zusammenfassung Diagnostische Kompetenz umfasst eine Vielzahl unterschied- licher Fähigkeiten, die eine hohe Praxisrelevanz besitzen. Die Fähigkeit, Stärken und Schwächen von Schülerinnen und Schülern zu erkennen, wird insbesondere für die individuelle Förderung als fundamental betrachtet. Der diagnostische Prozess kann als Informationsverarbeitungsprozess verstanden werden, bei dem sowohl vor- handenes (fachbezogenes) Wissen als auch Informationen aus einer diagnostischen Situation aufeinander bezogen werden müssen, um Stärken und Schwächen von Schülerinnen und Schülern erkennen zu können. Ein Konzept zur Förderung dieser Teilfähigkeit diagnostischer Kompetenz am Beispiel Größen wurde im Rahmen ei- ner Interventionsstudie mit angehenden Lehrkräften für die Primarschule (N = 181) hinsichtlich seiner Wirksamkeit quantitativ untersucht. Es zeigte sich, dass das Er- kennen von Stärken und Schwächen durch die Intervention nachhaltig gefördert werden konnte. Die Art und die Nutzung von Informationen beim Diagnostizieren von Stärken und Schwächen von Schülerinnen und Schülern wurde in einer quali- tativen Analyse schriftlicher Dokumente der Studierenden untersucht. Wesentliches Ergebnis der qualitativen Herangehensweise ist ein Kategoriensystem, das über die Art der verwendeten Informationen Aufschluss gibt, und möglicherweise auf weite- re Inhaltsbereiche im Fach Mathematik übertragen werden kann. Insgesamt geben die Ergebnisse Hinweise auf den Erwerb diagnostischer Kompetenz. Schlüsselwörter Diagnosekompetenz · Größenvorstellungen · Intervention · Ausbildung von Lehrkräften Mathematics Education Subject Classification 97B50 · 97D72 K. Philipp () · I. Gobeli-Egloff Pädagogische Hochschule Nordwestschweiz, Hofackerstr. 30, 4132 Muttenz, Schweiz E-Mail: kathleen.philipp@fhnw.ch K 174 K. Philipp, I. Gobeli-Egloff Fostering Diagnostic Competence in Primary Teacher Education – a Study of Recognizing Strengths and Weaknesses of Students in the Field of “Measurement” Abstract Diagnostic competence includes many different abilities that are highly relevant for practice. The ability to recognize the strengths and weaknesses of stu- dents is seen as fundamental for individual support of students. The diagnostic process can be understood as information processing in which it is necessary to in- terlink the (subject-related) knowledge and information from a diagnostic situation to recognize the strengths and weaknesses of students. A concept to foster this facet of diagnostic competence in the field of “measurement” was investigated with quan- titative methods regarding its effectiveness in an intervention study with pre-service teachers for primary school (N = 181). The results indicate that the facilitation of the recognition of strengths and weaknesses was successful and sustainable. A quali- tative analysis based on written documents from students was derived to examine the nature and the use of information in assessing the strengths and weaknesses of students. Main result of the qualitative analyses is a category system that sheds light on the nature of used information and which can possibly be transferred to other fields in the subject of mathematics. Overall, the results provide indications for the acquirement of diagnostic competence. Keywords Diagnostic competence · Conceptions of measurement · Intervention study · Teacher education 1 Einleitung Diagnostische Kompetenz hat in der Diskussion um professionelle Kompetenzen von Lehrkräften gegenwärtig einen hohen Stellenwert. Sie gilt als Voraussetzung dafür, Unterricht an die Bedürfnisse der Lernenden anpassen zu können (Anders et al. 2010;Helmke et al. 2004; Schwarz et al. 2008). Ihr wird damit eine zen- trale Bedeutung als Komponente der Professionalität von Lehrkräften beigemessen (von Aufschnaiter et al. 2015; Baumert und Kunter 2006;Helmke 2009;Weinert 2000). Die Anpassung des Unterrichts an die Lernvoraussetzungen der Lernenden wiederum wird als Voraussetzung für deren Lernerfolg gesehen (Schrader 2013). Diagnostische Kompetenz soll dabei helfen, einerseits Schwierigkeiten, andererseits aber auch Kompetenzen bzw. Potenziale von Lernenden zu identifizieren, um sie für eine adäquate individuelle Förderung nutzen zu können (Helmke 2009; Rösike und Schnell 2017). Die Fähigkeit, sowohl Stärken als auch Schwächen von Schülerinnen und Schülern zu erkennen, wird daher als Teil diagnostischer Kompetenz und als grundlegend für die Begleitung und Unterstützung von Lernprozessen im Sinne der individuellen Förderung aufgefasst. Das Erkennen von Stärken und Schwächen wird als Fähigkeit betrachtet, die einerseits das Identifizieren von fehlerhaften bzw. richti- gen Überlegungen von Schülerinnen und Schülern beinhaltet und andererseits deren Interpretation, beispielsweise auf welche dahinterliegenden (Fehl-)Vorstellungen ih- re Überlegungen verweisen können (Philipp 2018). Die Fähigkeit wird benötigt, K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 175 um den Grad des Verständnisses von Schülerinnen und Schülern zu erfassen und bildet die Voraussetzung dafür, angepasste Fördermaßnahmen ergreifen zu können, auch wenn sich aus einer Diagnose selbst nicht direkt Maßnahmen ableiten lassen (Moser Opitz und Nührenbörger 2015;Wember 1998). Das Ziel einer solchen Diag- nostik ist die Lernförderung (assessment for learning) im Gegensatz zur summativen Bewertung einer Leistung (assessment of learning) (Black und Wiliam 2009). Der vorliegenden Studie liegt die Annahme zugrunde, dass der Aufbau fachbezo- genen Wissens und die Auseinandersetzung mit praxisnahen diagnostischen Situa- tionen den Erwerb diagnostischer Kompetenz begünstigt. Konkret wird am Beispiel Größen untersucht, (1) inwiefern sich im Rahmen der Ausbildung von Lehrkräften für die Primarschule durch eine entsprechend gestaltete Intervention die Fähigkeit des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern för- dern lässt und (2) welche Informationen die Studierenden beim Diagnostizieren von Stärken und Schwächen von Schülerinnen und Schülern nutzen. Ziel des Beitrags ist es, das Verständnis des Aufbaus diagnostischer Kompetenz im Hinblick auf die benötigte Informations- und Wissensbasis zu erweitern. 2 Theoretischer Hintergrund 2.1 Diagnostische Kompetenz im Fach Mathematik Blömeke et al. (2015) betrachten Kompetenz als Kontinuum bzw. einen Prozess und schlagen ein Modell vor, das die Transformation von Kompetenz in Performanz über situationsbezogene Fähigkeiten der Wahrnehmung, Interpretation und Entschei- dungsfindung beschreibt. Diese Fähigkeiten vermitteln zwischen dem beobachtbaren Verhalten (Performanz) und den kognitiven und affektiv-motivationalen Personenei- genschaften. Bezogen auf diagnostische Kompetenz umfassen solche Personenei- genschaften Wissen, Einstellungen sowie affektive und motivationale Aspekte. Die situationsbezogenen Fähigkeiten sind abhängig von den Personeneigenschaften und führen zu beobachtbarem Verhalten in diagnostischen Situationen, z. B. diagnosti- schen Urteilen (vgl. Abb. 1). Damit bietet das Modell einen strukturellen Rahmen, der eine breite Auffassung von diagnostischer Kompetenz und verschiedene For- schungsansätze zulässt: (1) die Untersuchung von Personeneigenschaften, die ein erfolgreiches Agieren in diagnostischen Situationen ermöglichen (2) die Untersu- chung kognitiver Prozesse, die das Zustandekommen diagnostischer Urteile erklären und (3) die Untersuchung von diagnostischen Urteilen und Tätigkeiten von Lehr- kräften in Bezug auf das Lernen von Schülerinnen und Schülern (Leuders et al. 2018). Abb. 1 Diagnostische Kom- petenz als Kontinuum. (Aus: Leuders et al. 2018,S.9) K 176 K. Philipp, I. Gobeli-Egloff Je nach Untersuchungsgegenstand kann daher das Verständnis von diagnostischer Kompetenz und ihrer Bestandteile unterschiedlich sein (Förster und Karst 2017; Leuders et al. 2018). Eine dahingehend offene Definition liefert Weinert (2000): Di- agnostische Kompetenz kann verstanden werden als ein „Bündel von Fähigkeiten, um den Kenntnisstand, die Lernfortschritte und die Leistungsprobleme der einzelnen Schüler sowie die Schwierigkeiten verschiedener Lernaufgaben im Unterricht fort- laufend beurteilen zu können, sodass das didaktische Handeln auf diagnostischen Einsichten aufgebaut werden kann“ (Weinert 2000, S. 14 f.). In dieser Definition wird deutlich, dass verschiedene diagnostische Anforderungen auch verschiedene Fähig- keiten erfordern können. Dass es sich bei diagnostischer Kompetenz um ein „Bün- del“ von Fähigkeiten anstelle einer allgemeinen (fachübergreifenden) Kompetenz handelt, wird durch empirische Befunde untermauert (Brunner et al. 2011; Spinath 2005). In Anbetracht der großen Vielfalt an diagnostischen Situationen (Ingenkamp und Lissmann 2008; Karst et al. 2017) erscheint es plausibel, dass verschiedene Fähigkeiten erforderlich sind. Die Qualität eines diagnostischen Urteils wird meist mittels dessen Urteilsakku- ratheit bestimmt (Hoge und Coladarci 1989; Südkamp et al. 2012), d. h. es wird die möglichst genaue Übereinstimmung des Urteils einer Lehrkraft mit der tatsäch- lichen Merkmalsausprägung (z. B. Lösungshäufigkeit bei einer konkreten Aufgabe) betrachtet. Dies setzt voraus, dass das interessierende Merkmal gemessen werden kann. Im schulischen Kontext sind diagnostische Urteile jedoch häufig komplex und eine Einschätzung der Urteilsakkuratheit nicht sinnvoll möglich (van Ophuysen und Behrmann 2015). Beim Erkennen von Stärken und Schwächen von Schülerinnen und Schülern ist es wichtig, dass eine Lehrkraft anhand fachbezogener Kriteri- en möglichst viele Aspekte, die zu richtigen bzw. fehlerhaften Überlegungen und Lösungen führen können, berücksichtigen kann. Dazu muss sie diese sowohl identi- fizieren als auch interpretieren können (Philipp 2018). Das bedeutet einerseits, dass die Überlegungen der Schülerinnen und Schüler als richtig oder falsch beschrieben, aber darüber hinaus auch im Hinblick auf das zugrundeliegende mathematische Verständnis gedeutet werden müssen (Jacobs et al. 2010), wobei solche Deutun- gen durch angehende Lehrkräfte häufig noch ungenau und eher allgemein sind (Pott 2019). Vor diesem Hintergrund ist davon auszugehen, dass diagnostische Kompetenz domänen-, wenn nicht gar inhaltsspezifisch ist (z. B. Lorenz und Artelt 2009). Ins- besondere mit Blick auf das Ziel der individuellen Förderung spielen fachbezogene Aspekte bei einer Diagnose und damit das fachbezogene Wissen eine Rolle (Cher- nikova et al. 2020). Bei einer solchen Diagnose muss der (individuelle) Lernprozess der Schülerinnen und Schülern selbst fokussiert werden, der eine genaue Analyse des Lernstands ermöglicht, indem beispielweise Aussagen oder schriftliche Produk- te herangezogen werden. Prediger et al. (2012) sprechen in diesem Zusammenhang von „diagnostischer Tiefenschärfe“, die unter anderem auch fachdidaktisches Wissen wie beispielweise Wissen über Grundvorstellungen oder typische Fehlvorstellungen voraussetzt. Modelle zur Konzeptualisierung diagnostischer Kompetenz im Fach Mathema- tik verdeutlichen die enge Verknüpfung von diagnostischen und (fach)didaktischen Kompetenzen, mitunter scheinen sie kaum voneinander trennbar, was insbesonde- re bei der Erfassung diagnostischer Kompetenz herausfordernd sein kann (Kaiser K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 177 et al. 2017; Ufer und Leutner 2017). Bass und Ball (2004) identifizieren in ih- rer „job analysis“, einer Tätigkeitsanalyse von Lehrkräften im Mathematikunterricht der Primarschule, Kerntätigkeiten, die auch diagnostische Tätigkeiten enthalten (z. B. Lernprozesse evaluieren). In ihrem Modell zum Professionswissen von Mathematik- lehrkräften beschreiben sie verschiedene fachwissenschaftliche und fachdidaktische Wissensfacetten, die für diese Kerntätigkeiten relevant sind (Ball et al. 2008). Im COACTIV-Modell zur professionellen Kompetenz von Lehrkräften werden diag- nostische Fähigkeiten explizit mit fachdidaktischem Wissen in Verbindung gebracht (Wissen über das mathematische Denken von Schülerinnen und Schülern sowie Wissen über mathematische Aufgaben). Daneben wird ein Bereich pädagogischen Wissens, das Wissen um Leistungsbeurteilung, als weitere Wissensfacette genannt. Bei einer Diagnose (z. B. bei der Beurteilung von lern- und leistungsrelevanten Merkmalen von Schülerinnen und Schülern) müssen diese verschiedenen Wissens- facetten integriert werden (Brunner et al. 2011). Sie dienen damit als Voraussetzung für diagnostische Tätigkeiten. Insbesondere bei der Operationalisierung fachdidak- tischer bzw. diagnostischer Kompetenz wird in den genannten Ansätzen deutlich, dass diagnostische Kompetenz fachbezogenes Wissen erfordert, etwa bei der Ana- lyse typischer Fehler von Schülerinnen und Schülern oder bei der Einschätzung des diagnostischen Potenzials von Aufgaben. Beide Modelle betonen damit die Fach- spezifität diagnostischer Kompetenz. Es handelt sich um die Wissensbasis, die zur Bewältigung (fachspezifischer) diagnostischer Anforderungen erforderlich ist. Für die Förderung der Fähigkeit des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern bedeutet das, dass das benötigte fachbezogene Wissen im Rahmen der Intervention auf- bzw. ausgebaut werden muss, damit es in diagnos- tischen Situationen aktiviert werden kann. Diese Wissensbasis ist erforderlich, um Überlegungen und Lösungsansätze von Schülerinnen und Schülern deuten zu kön- nen. Dabei müssen Informationen aus Aussagen oder Lösungen von Schülerinnen und Schülern mit fachbezogenem Wissen verknüpft werden. Welche Informationen jedoch in einem diagnostischen Prozess herangezogen werden und wie sie verarbei- tet werden, ist noch weitgehend unklar (Leuders et al. 2020). Es wird angenommen, dass im Diagnoseprozess verschiedene kognitive Prozesse ablaufen. Informationen müssen wahrgenommen und interpretiert werden, um Entscheidungen treffen zu können (z. B. über die Relevanz von Informationen und deren Gewichtung). Diese Prozesse sind abhängig von in der Person liegenden Faktoren (z. B. Wissen und Einstellungen) und zeigen sich in beobachtbarem Verhalten (Blömeke et al. 2015; Leuders et al. 2020). Im Hinblick auf die Qualität der diagnostischen Urteile ist davon auszugehen, dass eine „hohe Urteilsqualität nur möglich ist, wenn adäqua- te Verarbeitungsprozesse stattfinden, die auf qualitativ hochwertigen diagnostischen Informationen basieren“ (van Ophuysen und Behrmann 2015, S. 89). 2.2 Diagnose als Informationsverarbeitungsprozess Die Sicht auf Diagnose als Prozess steht in der Tradition der psychologischen Ur- teilsforschung (Bless et al. 2004; Hastie und Dawes 2001). Im Kern stellen sich dabei Fragen nach der Art der verarbeiteten Informationen, der Informationsbeschaffung und der Verarbeitung von Informationen bei der Bildung eines Urteils. Informa- K 178 K. Philipp, I. Gobeli-Egloff tionsverarbeitungsprozesse stehen zwischen der Aufnahme von Informationen und einem Urteil. Eine wesentliche Grundannahme besteht darin, dass Urteile durch die Interaktion zwischen neu aufgenommenen Informationen und bereits vorhandenem Wissen gebildet werden (Plessner 2011). Das bedeutet, dass beispielweise Infor- mationen über Schülerinnen und Schülern aus Arbeitsprodukten oder aus einem Gespräch mit bereits vorhandenem fachdidaktischem Wissen verknüpft werden, um zu einer Diagnose zu gelangen. Die Heuristik in einem solchen Prozess kann als Verankerung und Anpassung gedeutet werden (Tversky und Kahneman 1974). Dabei werden Informationen als Anker für eine erste Annäherung zur Lösung eines Problems genutzt. Weitere In- formationen dienen dazu, diese erste Annäherung anzupassen. Nickerson (1999) beschreibt einen solchen Prozess bei der Einschätzung des Wissens eines Laien durch eine Expertin oder einen Experten, bei dem der Ausgangspunkt das eigene Wissen darstellt. Unter Berücksichtigung unterschiedlicher Informationen wird das Modell immer weiter modifiziert: Zunächst führen „unübliche Aspekte“ des eige- nen Wissens zu einer Adaption des Modells, die Expertin oder der Experte kann die eigene Expertise berücksichtigen. Im nächsten Schritt wird Wissen über die Zuge- hörigkeit zu einer Gruppe der anderen Person bzw. bereits vorhandenes Wissen über die andere Person berücksichtigt. Mit der Verarbeitung von neu hinzukommenden Informationen (z. B. in einem Gespräch) wird die Einschätzung des Wissens der an- deren Person weiter verfeinert (Nickerson 1999). Richtet man den Blick auf die Art der verschiedenen Informationen, die im Modell von Nickerson (1999) beschrieben werden, so wird deutlich, dass sie verschiedenen Ursprungs sind. Einerseits wird auf Informationen zurückgegriffen, über die die urteilende Person bereits verfügt, und andererseits werden Informationen genutzt, die im Prozess neu hinzukommen. Im Prozess der Bildung eines Urteils werden also Informationen aus unterschied- lichen Quellen integriert. Eine Diagnose hängt damit wesentlich vom Wissen der urteilenden Person ab, aber auch von der diagnostischen Situation, die die Art der In- formationen erheblich mitbestimmt. Folgt man dem Modell von Nickerson (1999), so nimmt insbesondere das eigene Wissen einen hohen Stellenwert ein. Es dient als Anker und damit als Voraussetzung für den Diagnoseprozess. Damit bildet es die Grundlage dafür, neue Informationen zu interpretieren (Tversky und Kahneman 1974). Bezogen auf fachbezogene diagnostische Prozesse ist daher davon auszuge- hen, dass das eigene fachbezogene Wissen eine bedeutende Rolle spielt. Allerdings geht es dabei nicht nur um Inhaltswissen, sondern insbesondere um Wissen über mathematisches Denken und Lernen von Lernenden. So konnte Ostermann (2018) zeigen, dass fachdidaktisches Wissen wie etwa typische (Fehl-)Vorstellungen von Schülerinnen und Schülern bei der Schwierigkeitseinschätzung von Aufgaben eine bedeutende Rolle spielt, aber auch fachliches Wissen, das für Lehrkräfte spezifisch ist (z. B. Grundvorstellungen). Während das eigene Wissen im Nickerson-Modell damit dem mathematischen Fachwissen entspricht, wird das spezifische fachliche Wissen als „unübliche Aspekte“ des eigenen Wissens verstanden. Wissen über die Wechselwirkung von Inhalt und Lernendem (wie z. B. typische Fehler von Schülerin- nen und Schülern) wird genutzt, wenn Wissen über die Zugehörigkeit einer Gruppe (z. B. Klassenstufe) berücksichtig wird (Ostermann 2018). Das Nutzen fachbezo- genen Wissens bei der Genese eines diagnostischen Urteils konnte, ebenfalls für K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 179 das Fach Mathematik, im Rahmen einer qualitativen Studie aufgezeigt werden. Die Funktion des eigenen (fachlichen) Wissens als Grundlage (Anker) für eine Diagnose zeigte sich darin, dass die befragten Lehrkräfte eigene Lösungsansätze nutzten, um Herausforderungen einer Aufgabe zu identifizieren. Außerdem griffen die Lehrkräfte beim Analysieren von Lösungen von Schülerinnen und Schülern auf verschiedene Aspekte fachbezogenen Wissens zurück, wie etwa Grundvorstellungen, typische Fehler oder Fehlkonzepte sowie mathematische Denkweisen und Strategien von Schülerinnen und Schülern (Philipp 2018). Grundsätzlich kann Diagnose also als Prozess betrachtet werden, bei dem Infor- mationen erfasst und verarbeitet werden, um zu einer Einschätzung eines Merkmals oder zu einer Entscheidung zu gelangen (van Ophuysen und Behrmann 2015). Die Informationsbasis umfasst Informationen aus diagnostischen Situationen und aus ei- genem (fachbezogenen) Wissen. Allerdings ist bislang noch wenig darüber bekannt, wie genau diagnostische Prozesse und solche Wissensressourcen zusammenwirken. Das Modell von Nickerson (1999) liefert einen allgemeinen Ansatz, das Zusammen- spiel von diagnostischem Prozess und der Nutzung von Wissensarten zu beleuchten. Welche Informationen beim Erkennen von Stärken und Schwächen von Schülerin- nen und Schülern genutzt werden, ist Gegenstand der Untersuchung. 2.3 Erwerb diagnostischer Kompetenz Aufgrund der hohen Bedeutung für die Unterrichtsqualität, die diagnostischer Kom- petenz zugeschrieben wird, erscheint deren Förderung und Verbesserung zentral für das Lernen von Schülerinnen und Schülern (z. B. Schrader 2013). Es liegt die An- nahme zugrunde, dass sich eine höhere diagnostische Kompetenz positiv auf die Unterrichtsqualität und somit auch auf Leistungen von Schülerinnen und Schülern auswirkt, indem beispielweise Schwierigkeiten von Schülerinnen und Schülern früh- zeitig erkannt werden (Anders et al. 2010;Helmke et al. 2004;Helmke 2009). Diagnostische Kompetenz gilt als prinzipiell erlernbar, auch wenn die genauen Bedingungen des Erwerbs diagnostischer Kompetenz noch unklar sind (Herppich et al. 2017;Krauss et al. 2008). In diesem Zusammenhang stellt sich die Frage, wie diagnostische Kompetenz gefördert bzw. überhaupt erworben werden kann. Be- trachtet man Konzepte zur Förderung diagnostischer Kompetenz, so lassen sich zahlreiche Interventionsstudien finden, die die Entwicklung diagnostischer Kompe- tenz durch den Aufbau spezifischen Wissens für diagnostische Situationen anregen, beispielweise in themenspezifischen Fortbildungen für Lehrkräfte (z. B. Busch et al. 2015). Ansätze zur Förderung diagnostischer Prozesse nehmen die gezielte Samm- lung und theoriegeleitete Verarbeitung von diagnostischen Informationen in den Blick, beispielweise durch das Führen diagnostischer Interviews (Clarke et al. 2018; Wollring et al. 2013). Gemeinsam ist diesen Ansätzen die Annahme, dass sich dia- gnostische Kompetenz durch die Verknüpfung von theoretischem Wissen einerseits und reflektierter Praxiserfahrung andererseits erwerben lässt (Hascher 2008). Damit sind beispielsweise das Arbeiten an Beispielen oder tatsächliche Praxiserfahrungen im Rahmen der Ausbildung von Lehrkräften gemeint, die systematisch reflektiert werden. Solche praxisnahen Erfahrungen als „approximations of practice“ bilden insbesondere in der Ausbildung von Lehrkräften häufig Lernanlässe (Grossman und K 180 K. Philipp, I. Gobeli-Egloff McDonald 2008, S. 190). Chernikova et al. (2020) stützen diese Sichtweise in Be- zug auf diagnostische Kompetenz: Das fachbezogene Wissen von Lehrkräften spielt eine Rolle bei der Förderung diagnostischer Kompetenz, es wird gesehen als „prere- quisite for further development of skills and competences“ (Chernikova et al. 2020, S. 160), d. h. es beeinflusst die Entwicklung diagnostischer Kompetenz. Dabei sol- len Möglichkeiten zu praktischen Erfahrungen mit diesem Wissen verknüpft werden: „practice opportunities, combined with sufficient professional knowledge, can faci- litate diagnostic competences in higher education“ (Chernikova et al. 2020, S. 161). Weiterhin stellen die Autorinnen und Autoren förderliche Aspekte im Rahmen von Scaffolding heraus wie das angeleitete Arbeiten an Beispielen, Bereitstellung von „Prompts“ (Lernhinweisen), die Übernahme einer bestimmten Rolle sowie die Be- deutung von Reflexionsphasen. Daraus lässt sich für die vorliegende Studie ableiten, dass authentische diagnostische Situationen und Beispiele Praxiserfahrungen ermög- lichen, die angeleitet und mit theoretischem Wissen verknüpft sowie reflektiert wer- den müssen, um den Aufbau diagnostischer Kompetenz zu fördern. Insbesondere kann die Förderung diagnostischer Kompetenz besonders wirksam sein, wenn in- teraktionsbasierte diagnostische Situationen einbezogen werden (Chernikova et al. 2020). Mit Blick auf Informationsverarbeitungsprozesse lassen sich je nach Experti- segrad Unterschiede finden, die weitere Hinweise auf den Erwerb diagnostischer Kompetenz geben können. Kellman und Massey (2013) stellen zusammenfassend fest, dass Novizinnen und Novizen eher alle verfügbaren Informationen beachten, während Expertinnen und Experten relevante Informationen auswählen können und nicht relevante Informationen ausblenden. Außerdem verarbeiten Novizinnen und Novizen eher einzelne Aspekte nacheinander und können noch nicht größere Zu- sammenhänge oder Strukturen bilden (Kellman und Massey 2013). Begründen lassen sich solche Unterschiede auch durch das unterschiedliche Wissen, wobei es nicht nur um „mehr“ Wissen geht, sondern auch darum, dass das Wissen besser organi- siert werden kann (z. B. Bromme 2008). In Bezug auf Mathematik wird berichtet, dass angehende Lehrkräfte Schwierigkeiten damit haben, Lösungen von Schülerin- nen und Schülern zu interpretieren, wobei ihr eigenes mathematisches Wissen eine bedeutende Rolle spielt (Stahnke et al. 2016). Für die Förderung des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern könnte das bedeuten, dass die Auswahl von Informationen anhand fachbezogener Kriterien gezielt unterstützt werden muss. Bei der Entwicklung von diagnostischer Kompetenz ist von einem längerfristi- gen Lernprozess auszugehen, der eine kontinuierliche Auseinandersetzung mit dia- gnostischen Fragen erfordert. In der Ausbildung von Lehrkräften kann der Erwerb diagnostischer Kompetenz angebahnt werden, im Rahmen der Berufstätigkeit wird sie weiter ausgebaut (Buholzer und Zulliger 2013; Chernikova et al. 2020; Hascher 2008). Wichtig für die Kompetenzentwicklung ist, dass die Vielzahl an diagnosti- schen Situationen, mit denen Lehrkräfte im Alltag konfrontiert sind, und ihre Be- wältigung nicht unreflektiert bleibt. Die Förderung diagnostischer Kompetenz ist somit in allen Phasen der Ausbildung, aber auch in der Fortbildung von Lehrkräften möglich. K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 181 3 Ziele der Studie und Forschungsfragen Die hier berichtete Interventionsstudie zielt auf die Förderung diagnostischer Kom- petenz im Rahmen der Ausbildung von Lehrkräften für die Primarschule. Im Fo- kus steht eine zentrale Fähigkeit (als Teilfähigkeit diagnostischer Kompetenz) bei der Beurteilung mathematischer Kompetenzen von Schülerinnen und Schülern, das Erkennen von Stärken und Schwächen. Die Entwicklung diagnostischer Kompe- tenz soll einerseits durch die Vermittlung fachbezogenen Wissens zum Inhaltsbe- reich Größen und andererseits durch die Auseinandersetzung mit unterschiedlichen diagnostischen Situationen (Aufgabenanalyse, Analyse von Arbeitsprodukten von Schülerinnen und Schülern, Analyse von Videos und Führen eines diagnostischen Interviews) und deren systematische Reflexion angeregt werden. Damit soll auch der Breite der verschiedenen Quellen für diagnostische Informationen Rechnung getragen werden (Chernikova et al. 2020). Zunächst soll in einem quasi-experimentellen Setting geklärt werden, ob die För- derung der genannten Teilfähigkeit diagnostischer Kompetenz gelingt. Es wird davon ausgegangen, dass die Intervention die Entwicklung der Fähigkeit des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern positiv beeinflusst. Nach- dem sich in bisherigen Befunden meist kurzfristige Wirkungen aufzeigen ließen (Karing und Seidel 2017), ist auch die Frage nach der Nachhaltigkeit einer solchen Förderung von Relevanz: 1. Lässt sich die Fähigkeit des Erkennens von Stärken und Schwächen von Schü- lerinnen und Schülern durch die Vermittlung fachbezogenen Wissens und durch die Konfrontation mit verschiedenen diagnostischen Situationen prinzipiell und nachhaltig fördern? Da das vermittelte Wissen beim Erkennen von Stärken und Schwächen von Schü- lerinnen und Schülern in einem Informationsverarbeitungsprozess mit Informationen aus einer diagnostischen Situation verknüpft werden muss und es Hinweise darauf gibt, dass angehende Lehrkräfte damit Schwierigkeiten haben, soll explorativ unter- sucht werden, welche Informationen die Studierenden nutzen: 2. Auf welche Informationen beziehen sich die Studierenden bei der schriftlichen Analyse eines selbst durchgeführten diagnostischen Interviews? 3. Welche Informationen werden bei der Formulierung und Begründung von Stärken und Schwächen von Schülerinnen und Schülern miteinander verknüpft? 4 Förderung und Untersuchung diagnostischer Kompetenz 4.1 Design In einer quasi-experimentellen Studie wurde eine Intervention im Umfang von fünf Seminarsitzungen à 90 min im Rahmen regulärer Lehrveranstaltungen durchgeführt, die die Förderung fachbezogenen Wissens als Basis für das Erkennen von Stärken K 182 K. Philipp, I. Gobeli-Egloff Abb. 2 Design der Studie und Schwächen von Schülerinnen und Schülern (als Teilfähigkeit diagnostischer Kompetenz) im Bereich Größen beinhaltete (vgl. Abb. 2). Eine Kontrollgruppe nahm in der gleichen Zeit an einer Lehrveranstaltung zum Thema „Diagnose, Förderung und Beurteilung“ ohne inhaltlichen Bezug zum Thema Größen teil. Die Gruppen unterschieden sich damit hinsichtlich der Spezifität des thematisierten fachdidak- tischen Wissens, gemeinsam ist ihnen die Auseinandersetzung mit diagnostischen Fragestellungen. Ein weiteres Unterscheidungsmerkmal der beiden Gruppen war das Führen eines diagnostischen Interviews mit einer Schülerin oder einem Schü- ler der Primarstufe als Bestandteil der Intervention. Das Interview wurde von den Studierenden vor dem zweiten Messzeitpunkt geführt und ausgewertet. Zur Erfassung diagnostischer Kompetenz wurde ein Testinstrument entwickelt, das zu drei verschiedenen Messzeitpunkten eingesetzt wurde. Neben der Wirksam- keit der Intervention (Forschungsfrage 1) wurde die Verwendung von Informationen der Studierenden der Experimentalgruppe untersucht (Forschungsfragen 2 und 3), indem schriftliche Dokumente der Studierenden (Analyse des selbst durchgeführten diagnostischen Interviews) inhaltsanalytisch ausgewertet wurden. 4.2 Stichprobe Die Stichprobe (N = 181) bildeten Studierende des Studiengangs Bachelor Primarstu- fe an der Pädagogischen Hochschule Nordwestschweiz. Davon waren 142 weiblich und 39 männlich. Das durchschnittliche Alter der Studierenden betrug 24,3 Jahre (SD= 4,40). Die Lehrveranstaltungen konnten von Studierenden ab dem 3. Semester belegt werden, die bereits die Einführungsveranstaltung in die Mathematikdidak- tik erfolgreich abgeschlossen hatten. Alle Studierenden stimmten einer Teilnahme an einem Forschungsprojekt im Rahmen der regulären Lehrveranstaltung zu (oh- ne Kenntnis über die Gruppenzuteilung), indem sie sich für eine der angebotenen Lehrveranstaltungen anmeldeten. An der Intervention nahmen insgesamt 98 Studie- rende teil, in der Kontrollgruppe waren es 83 Studierende. Die Lehrveranstaltungen waren Wahl-Pflichtveranstaltungen für die Studierenden. Bei den Lehrveranstaltun- gen handelte es sich um Seminare mit maximal 30 zugelassenen Studierenden. Vier Lehrveranstaltungen waren der Experimentalgruppe zugeordnet, die von derselben Dozentin durchgeführt wurden, während die Kontrollgruppe auf vier weitere Semi- nare mit insgesamt drei verschiedenen Dozierenden verteilt war. K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 183 4.3 Intervention Aufgrund der Annahme, dass das eigene fachbezogene Wissen in diagnostischen Situationen eine bedeutende Rolle spielt und für das Erkennen von Stärken und Schwächen von Schülerinnen und Schülern grundlegende Voraussetzung ist, war fachdidaktisches Wissen wesentliches Element der Intervention. Als Inhaltsbereich wurden Größen gewählt, weil sie einen unmittelbaren Bezug zur Lebenswelt haben und als „Verbindung von arithmetischen und geometrischen Inhalten und Kompe- tenzen“ (Peter-Koop und Nührenbörger 2008, S. 89) eine bedeutende Rolle im Ma- thematikunterricht spielen. Außerdem wurde in diesem Bereich das fachdidaktische Vorwissen der Studierenden als geringer eingeschätzt als in Bezug auf arithmetische Inhalte, die im ersten Studienjahr sowohl in der Fachdidaktik als auch in der Fach- wissenschaft im Zentrum stehen, sodass (unerwünschte) Wechselwirkungen hätten entstehen können. Hinzu kommt, dass zahlreiche Studierende in der deutschsprachi- gen Schweiz bereits ab Studienbeginn als Lehrkräfte tätig sind und vorwiegend im Bereich Arithmetik Praxiserfahrungen sammeln, die zu Unterschieden im Vorwissen hätten führen können. Die Studierenden setzten sich im Rahmen der Intervention mit allen in der Primarstufe in der Schweiz vorkommenden Größenbereichen (Längen, Zeit, Geld, Gewichte, Hohlmaße und Flächeninhalte) auseinander. Es ging um den Aufbau von Größenvorstellungen, die Behandlung von Größen im Unterricht, Her- ausforderungen der verschiedenen Größenbereiche sowie typische Schwierigkeiten und Vorstellungen von Schülerinnen und Schülern. Durch die Analyse von Aussagen und Lösungen von Schülerinnen und Schülern und durch die originale Begegnung mit einer Schülerin oder einem Schüler der Primarstufe in einem diagnostischen Interview wurde die Nutzung fachbezogenen Wissens in diagnostischen Situationen angeregt. Leitende Gestaltungsprinzipien der Intervention waren die Auseinandersetzung mit Aufgabenanforderungen, dem diagnostischen Potenzial von Aufgabenstellungen und Aussagen und Lösungen von Schülerinnen und Schülern in Form von Videos oder schriftlichen Dokumenten, die ein mehrfaches Betrachten und eine vertiefte Analyse erlaubten. Ergänzend wurde das geführte (und videografierte) diagnosti- sche Interview von den Studierenden analysiert. Dazu wurde der Größenbereich Gewichte ausgewählt, da dieser insbesondere beim Aufbau von Größenvorstellun- gen große Herausforderungen für Schülerinnen und Schüler mit sich bringt: So sind Gewichte nur in einem kleinen Bereich erfahrbar, da sehr kleine Gewichte kaum noch unterscheidbar sind und Gegenstände für Kinder recht schnell zu schwer werden, was den Aufbau von Größenvorstellungen erschwert. Auch kann das unter- schiedliche Druckgefühl von Gegenständen bei der Wahrnehmung von Gewichten per Hand zu falschen Einschätzungen führen. Hinzu kommt, dass Gewichte nicht visuell wahrnehmbar sind, d. h. die Größe des Gegenstands lässt keinen Rückschluss auf sein Gewicht zu (Bräunling und Reuter 2015; Franke und Ruwisch 2010;Reu- ter 2011). Ziel des diagnostischen Interviews für die Studierenden war es, Stärken Umgangssprachlich und auch im Mathematikunterricht werden „Gewicht“ und „Masse“ gleichbedeu- tend verwendet. Auch wenn das physikalisch nicht korrekt ist, wird der Begriff „Gewicht“ auch in Anleh- nung an fachdidaktische Literatur beibehalten. K 184 K. Philipp, I. Gobeli-Egloff und Schwächen des Kindes in Bezug auf Größenvorstellungen im Bereich Gewichte zu benennen und mit Bezug auf Aussagen oder Lösungen des Kindes zu begrün- den. Dazu standen den Studierenden acht Aufgaben mit diagnostischem Potenzial zur Verfügung, die sie im Interview einsetzten. Dieses dauerte ca. 45 min und wur- de nicht im Rahmen der fünf Seminarsitzungen durchgeführt und ausgewertet. Eine schriftliche Bearbeitung (eigene Lösung) und Analyse des diagnostischen Potenzials der Aufgaben im Vorfeld diente der vertieften Auseinandersetzung mit fachbezoge- nen Kriterien zu Größenvorstellungen bei Gewichten. Die schriftliche Dokumen- tation der Studierenden bestand aus insgesamt vier Teilen: einem (vorbereitenden) Interviewleitfaden, einer Analyse der Aussagen und Lösungen des Kindes (aufga- benweise), einer Rückmeldung an die unterrichtende Lehrkraft und einer Reflexion des eigenen Verhaltens im Interview. 4.4 Instrumente Die eingesetzten Instrumente unterscheiden sich hinsichtlich der diagnostischen Si- tuation. Das eingesetzte Testinstrument zur Überprüfung der Wirksamkeit der Inter- vention enthielt schriftliche Lösungen von verschiedenen Schülerinnen und Schü- lern, die die Studierenden einschätzen sollten. Dies ermöglichte einen direkten Ver- gleich der Analysen der Studierenden pro Aufgabe hinsichtlich der genannten Stär- ken und Schwächen der Schülerinnen und Schüler und deren Interpretationen. Die Analyse der diagnostischen Interviews ermöglichte dagegen eine umfassende Beur- teilung der Kompetenzen eines einzelnen Kindes über mehrere Aufgaben hinweg. Der Fokus der Auswertung lag hier auf den Informationen, die bei der Analyse eines Gesprächs mit einer „echten“ Schülerin oder einem Schüler genutzt wurden. Bei beiden Instrumenten war das Diagnoseziel für die Studierenden dasselbe: Die Stärken und Schwächen von Schülerinnen und Schülern in Bezug auf Größenvorstel- lungen im Bereich Gewichte sollten benannt und aufgrund der jeweiligen Datenlage begründet werden. 4.4.1 Testinstrument Zur Überprüfung der Wirksamkeit der Intervention (Forschungsfrage 1) wurde ein Testinstrument entwickelt. Ziel war es, Veränderungen der Fähigkeit, Stärken und Schwächen von Schülerinnen und Schülern zu erkennen, zu erfassen. Die Studieren- den sollten anhand schriftlich vorliegender Aufgabenlösungen von Schülerinnen und Schülern der Primarstufe (4. Klasse) zu zehn Aufgaben zu Größenvorstellungen von Gewichten (1) richtige und fehlerhafte Überlegungen identifizieren sowie (2) die Lösungen der Schülerinnen und Schüler interpretieren (z. B. mögliche Ursachen nennen). Die Aufgaben waren so konzipiert, dass Teilkompetenzen für Größenvor- stellungen umfassend abgedeckt waren (Franke und Ruwisch 2010;Reuter 2011; Schipper 2009): Standardeinheiten kennen; Größen vergleichen, messen und schät- zen; Repräsentanten für Standardeinheiten kennen; Größenangaben umwandeln und deren Invarianz erkennen. Als Antwortformat wurden offene Items gewählt. Bei der Auswahl der Lösungen von Schülerinnen und Schülern für das Testinstrument wur- K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 185 de darauf geachtet, dass der Interpretationsspielraum groß war, um möglichst viele (plausible) Vermutungen zu Fehlerursachen zuzulassen. 4.4.2 Schriftliche Dokumente der Studierenden (Analysen diagnostischer Interviews) Im Rahmen der Intervention führten alle Studierenden der Experimentalgruppe ein diagnostisches Interview mit einer Schülerin oder einem Schüler der Primarstufe der Klassenstufen 3 bis 5 durch. Dazu erhielten sie ein Set von acht Aufgaben mit diagnostischem Potenzial (vgl. Emmrich 2008; Prediger et al. 2017), d. h. bei der Bearbeitung der Aufgaben sollten sowohl Vorstellungen als auch Lösungswege der Lernenden sichtbar werden, die Rückschlüsse auf deren Größenvorstellungen zu Gewichten zuließen. Die Auswertung der diagnostischen Interviews durch die Studierenden erfolgte schriftlich und beinhaltete mehrere Teile (vgl. Abschn. 4.3). Die schriftlichen Dokumente der Studierenden dienten als Datengrundlage zur Un- tersuchung der Frage nach der Verwendung von Informationen bei der Diagnose (Forschungsfragen 2 und 3). Dazu wurde ausschließlich ein Teil der schriftlichen Dokumente, die Analyse der Aussagen und Lösungen des Kindes, herangezogen. Die Verwendung von Informationen konnte so differenziert betrachtet werden: auf welche Informationen die Studierenden bei der Analyse zurückgriffen und welche sie bei der Formulierung und Begründung von Stärken und Schwächen nutzten. 4.5 Auswertung 4.5.1 Wirksamkeit der Intervention Die Fähigkeit des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern wurde bei der Auswertung den zwei Bereichen Stärken/Schwächen identi- fizieren (Wert I) und Stärken/Schwächen interpretieren (Wert II) zugeordnet: Stärken und Schwächen zu benennen wird als erster wichtiger Schritt im Diagnoseprozess aufgefasst (identifizieren). Interpretieren zu können, auf welche Teilkompetenzen von Größenvorstellungen (vgl. Abschn. 4.4.1) die Lösung der Schülerinnen und Schüler Rückschlüsse zulässt, setzt voraus, dass tieferliegende Strukturen in ihnen erkannt werden. Die Anzahl der schlüssigen Antworten der Studierenden wurden für die Auswertung herangezogen. Dahinter steckt die Überlegung, dass auf der Basis einzelner Arbeitsprodukte von Schülerinnen und Schülern keine eindeutige Diagno- se gestellt werden kann. Insofern war für die Qualität der Diagnose maßgebend, dass die Studierenden möglichst viele Stärken und Schwächen identifizieren konn- ten und dazu auch mögliche Ursachen (hypothetisch) breit benennen konnten. Jede korrekt als fehlerhaft oder richtig identifizierte Überlegung bzw. Lösung wurde mit einem Punkt bewertet. Ebenso wurde jede schlüssige interpretierende Aussage mit einem Punkt bewertet. Sinngemäß gleiche Aussagen wurden nur einfach gewertet. Anschließend wurden die Punkte summiert. Eine Maximalpunktzahl pro Aufgabe war nicht festgelegt. In Abb. 3 ist ein Beispielitem und eine Studierendenantwort sowie deren Aus- wertung dargestellt: Die oder der Studierende identifiziert die Gewichtsangabe für K 186 K. Philipp, I. Gobeli-Egloff Abb. 3 Beispielitem und Aus- wertung der Studierendenant- wort (Hervorhebungen nachträg- lich hinzugefügt) die Butter als richtig und die für die Kuh als „deutlich überschätzt“. Diese Iden- tifikationen wurden mit 2 Punkten bewertet (Wert I). Des Weiteren gibt die oder der Studierende an, dass das Kind in der Lage ist, Vergleiche anzustellen, da es den Stuhl mit der Butter vergleicht. Diese Interpretation ergab 1 Punkt (Wert II). Dass das Kind aufgeweckt sei, wurde nicht bewertet, da dies eine Aussage über einen Charakterzug des Kindes ist. Ebenso wurde die Wiederholung der Antwort der Schülerin oder des Schülers nicht gewertet, da sie keine Interpretation enthält. Insgesamt wurden hier also 3 Punkte vergeben. Die Güte des Testinstruments wurde mittels einer Itemanalyse überprüft. Dazu wurden die Werte des Posttests verwendet, um die größtmöglichen Unterschiede in den Antworten der Studierenden als Auswirkung der Intervention zu erfassen. In Tab. 1 sind Spannweite, Mittelwert und die Standardabweichung jedes Items abge- bildet sowie Itemschwierigkeit und Trennschärfe. Die Trennschärfe wurde für jedes Item der Skala berechnet. Weil Item 8 einen sehr tiefen Wert (r = 0,311) aufwies, it wurde es (nach Prüfung der inhaltlichen Validität der verbliebenen Items) elimi- niert. Die Trennschärfen der restlichen neun Items lagen zwischen r = 0,343 und it r = 0,590, was als „mittelmäßig“ eingeordnet werden kann (Döring und Bortz 2016). it Für die Bestimmung der Itemschwierigkeit wurde der Maximalwert als Durchschnitt K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 187 Tab. 1 Überprüfung der Güte der Items N Mini- Maxi- Mittel- Std. Abwei- Itemschwie- Trenn- mum mum wert chung rigkeit (%) schärfe Item 1 181 0 15 6,34 2,942 52 0,475 Item 2 181 1 18 7,70 3,064 54 0,522 Item 3 181 0 17 5,86 3,229 50 0,379 Item 4 181 1 16 6,60 2,586 56 0,554 Item 5 181 0 13 5,14 2,703 50 0,590 Item 6 181 0 12 4,42 1,773 57 0,523 Item 7 181 0 8 3,59 1,570 54 0,346 Item 8 181 1 10 4,44 1,967 53 0,311 Item 9 181 1 8 4,07 1,362 61 0,343 Item 10 181 0 6 3,66 1,312 62 0,415 der Summe der erreichten Punkte der besten 10 % der Studierenden pro Item berech- net. Die Itemschwierigkeit aller Items lag zwischen 50 und 62 % und somit in einem gewünschten Bereich (Döring und Bortz 2016). Mit dem Ausschluss von Item 8 lag das Reliabilitätsmaß der Skala, der Alpha-Koeffizient von Cronbach, bei 0,764. Die Unterschiede in der Standardabweichung der verschiedenen Items lassen sich dadurch erklären, dass bei den Aufgaben die Anzahl der oben genannten Teilkom- petenzen, zu denen eine Aussage gemacht werden konnte, variierte. 4.5.2 Verwendung von Informationen Um Forschungsfrage 2 zu beantworten, auf welche Informationen sich die Studie- renden in ihrer Analyse beziehen, wurden Kategorien entwickelt. Diese geben Auf- schluss über die Informationsbasis, auf deren Grundlage eine Diagnose zustande kommt. Die Kategorien sollten die ganze Breite an unterschiedlichen Informatio- nen widerspiegeln. Das Zusammenspiel verschiedener Kategorien sollte nachfolgend anhand der deduktiv und induktiv gebildeten Kategorien analysiert werden (For- schungsfrage 3). Als methodischer Zugang wurde eine inhaltlich-strukturierende Inhaltsanalyse (Kuckartz 2016;Mayring 2010) gewählt. Ziel dieser Vorgehenswei- se ist es, zentrale Aspekte zu identifizieren und das Datenmaterial anhand dieser Aspekte systematisch zu beschreiben. Das Verfahren ist gekennzeichnet durch in- terpretatives Vorgehen und das Merkmal der Kategoriengeleitetheit (Mayring und Fenzl 2019). Das Vorgehen im Rahmen der berichteten Studie orientiert sich am Ab- laufschema von Kuckartz (2016), da es der induktiven Entwicklung von Kategorien ein größeres Gewicht beimisst, während das Modell von Mayring (2010) stärker auf die deduktive Entwicklung von Kategorien ausgerichtet ist. Das Vorgehen wurde modifiziert und an die Bedürfnisse der Studie angepasst: 1. Die Entwicklung der Hauptkategorien erfolgte deduktiv, d. h. die Kategorien wur- den auf der Basis theoretischer Vorüberlegungen gebildet. Das beinhaltete die Un- terscheidung von Informationen, die die Studierenden zur Verfügung hatten (ver- K 188 K. Philipp, I. Gobeli-Egloff Tab. 2 Kategoriensystem zur Analyse der Informationsnutzung bei der Diagnose Haupt- Sub- Beschreibung Ankerbeispiel kategorie kategorien V: V1: Indi- Ein fachbezogenes Kriterium „Wenn sie diese jedoch schät- Verfügbare katoren für wird genannt wie Messinstru- zen muss, fällt es ihr schwer auf Information Größenvor- mente kennen, passende Maß- Stützpunktvorstellungen zurückzu- stellungen einheiten finden, passende Re- greifen“ (DIa_S1, S. 11: 1550) präsentanten finden, Gewichte vergleichen und ordnen, über Stützpunktvorstellungen ver- fügen, Beziehungen zwischen Maßeinheiten oder Invarianz von Gewichten erkennen V2: Her- Typische Schwierigkeiten wer- „Ihr war nicht klar, dass das Ge- ausforde- den genannt wie die visuelle wicht visuell nicht wahrnehmbar rungen bei Wahrnehmbarkeit von Gewich- ist und somit die Grösse keinen Gewichten ten oder das Problem geringer Ruckschluss auf das Gewicht zu- Gewichtsunterschiede sowie der lässt.“ (DIa_S1, S. 11: 1814) begrenzte Erfahrungsbereich bei Gewichten V3: Mathe- Fachbezogene Aspekte über Ma- „[...] dass oftmals im Mathema- matikunter- thematikunterricht, Lehrmittel tikunterricht das Rechnen mit richt oder Lehrpläne werden genannt Grössen fokussiert wird. Folg- lich können die Schülerinnen und Schüler schon recht früh Einheiten umrechnen, ohne jedoch genaue- re Vorstellungen zu haben, was die Masseinheiten beinhalten.“ (DId_S11, S. 8: 535) fügbare Information), und den Informationen, die sie der Interviewsituation mit der Schülerin oder dem Schüler entnahmen (neu hinzukommende Information). 2. Die schriftlichen Dokumente (Analysen diagnostischer Interviews) der Studieren- den (N = 98) wurden in einer ersten Kodierung anhand der beiden Hauptkategorien grob kodiert. 3. Für die weitere Feinanalyse (Bildung von Subkategorien) wurden insgesamt 12 Dokumente aufgrund verschiedener Kriterien ausgewählt. Es wurde darauf geachtet, dass Studierende aus allen vier Lehrveranstaltungen sowie männlichen und weiblichen Geschlechts vertreten sind. Zudem sollten alle acht Aufgaben im Interview eingesetzt worden sein. Schließlich richtete sich die Anzahl der Inter- views danach, dass im Verlauf des Kodierprozesses keine neuen Aspekte mehr hinzukamen (theoretische Sättigung). 4. Die Subkategorien wurden sowohl deduktiv als auch induktiv (am Material), ge- leitet durch die Forschungsfrage, gebildet. Dazu gehörte der Bezug zu Informa- tionen, die die Studierenden in ihrer Analyse nutzten, beispielsweise der Bezug zu fachbezogenen Kriterien zu Größenvorstellungen von Gewichten, die Bestand- teil der Intervention waren und zur deduktiven Kategorienbildung genutzt wurden (als Subkategorien zur Hauptkategorie verfügbare Informationen). In einer zwei- ten Kodierung wurde das Material anhand der Subkategorien kodiert und das Ka- tegoriensystem fortlaufend angepasst. K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 189 Tab. 2 (Fortsetzung) Haupt- Sub- Beschreibung Ankerbeispiel kategorie kategorien N:Neu N1: Richti- Eine korrekte Antwort oder „Sie schätzte die 3900g korrekt hinzukom- ge Lösung Lösung wird genannt für das Gewicht eines Neugebore- mende nen.“ (DIc_S8, S. 8: 2673) Information N2: Fehler Ein Fehler oder eine Fehlüberle- „Bei dieser Aufgabe liegt er mit gung des Kindes wird genannt seinen angegebenen Gegenständen meistens falsch.“ (DIb_S5, S. 6: 388) N3: Bei- Ein Beispiel des Kindes wird „Bei der Frage, woher er die Ge- spiel genannt wichte kenne, kamen Aussagen, wie: ,Mein Cousin, der ein Jahr alt ist, wiegt 10kg.‘“ (DIa_S3, S. 6: 895) N4: Argu- Eine Begründung des Kindes „Er antwortet: ,Also erstens ist ment wird genannt, beispielweise in einem Brötchen viel Luft und warum ein Gegenstand schwer zweitens besteht die Münze aus oder leicht ist Metall, und Metall ist schwer.‘“ (DIa_S2, S. 7: 2776) N5: Stra- Das strategische Vorgehen des „In Aufgabe zwei vergleicht sie tegisches Kindes wird beschrieben wie das die Gegenstände untereinander Vorgehen Vergleichen, Abschätzen, Raten und im Vergleich mit Stützpunkt- oder das Zuordnen von Gewicht vorstellungen und erstellt einer und Größe des Gegenstandes imaginären Rangfolge nach Ge- wicht.“ (DIb_S4, S. 8: 2111) N6: Bear- Aspekte bezüglich der Bearbei- „[...] auffällig, dass F. lange zögert beitungs- tung werden genannt wie das um einzelne Gegenstände für die verhalten Revidieren der Lösung, Nach- Standardgrössen zu bestimmen.“ fragen des Kindes, Zeigen von (DIb_S5, S. 6: 110) (Un-)Sicherheit, Reihenfolge der Bearbeitung und Bearbeitungs- dauer N7: Vor- Aspekte aus dem Vorwissen „Der Umgang mit der Küchen- wissen des Kindes werden genannt wie waage kenne er vom Kochen mit Alltagserfahrung, Messerfah- seiner Mutter, [...]“ (DIc_S7, S. 6: rung und Erfahrungen aus dem 1707) Unterricht 5. Um die Stabilität des Kodierens zu gewährleisten, wurde nach Abschluss der Ana- lyse mit einem Abstand von drei Wochen ein Teil des Materials (25 %) erneut ko- diert, um die Intrakoderübereinstimmung (κ = 0,92, nach Brennan und Prediger 1981) sicherzustellen (Rädiker und Kuckartz 2019). 6. Bezüglich der Forschungsfrage 3 wurden Zusammenhänge zwischen Kategorien untersucht. Dazu wurden Muster im Auftreten der Kategorien untersucht. Umge- setzt wurde dieser Auswertungsschritt über die Untersuchung von Beziehungen zwischen den Kategorien anhand der Überschneidungen (gemeinsames Auftreten von Kategorien) in einem Textabschnitt (Rädiker und Kuckartz 2019). Zu diesem Zweck wurde die Formulierung von Stärken und Schwächen von Schülerinnen und Schülern und deren Begründung ergänzend kodiert. K 190 K. Philipp, I. Gobeli-Egloff Bei der Entwicklung des Kategoriensystems stand die Frage, auf welche Informa- tionen die Studierenden in ihrer Analyse Bezug nehmen, im Zentrum (vgl. Tab. 2). Die Frage nach der Nutzung von Informationen, etwa bei der Formulierung von Hypothesen zu Stärken und Schwächen des interviewten Kindes, wurde anhand von Analysen der Beziehungen der Kategorien untersucht. 5 Ergebnisse 5.1 Wirksamkeit der Intervention Mithilfe des eingesetzten Testinstruments konnte die Frage geklärt werden, ob die Intervention bei der Experimentalgruppe zu einer höher ausgeprägten Fähigkeit des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern geführt hat als bei der Kontrollgruppe. Dazu wurden die Daten varianzanalytisch ausgewertet. Die Voraussetzungen dafür waren erfüllt: Die Unabhängigkeit der Messwerte war durch die Stichprobenwahl und das Design gegeben. Die Normalverteilung der ab- hängigen Variablen – dem Erkennen von Stärken und Schwächen – konnten durch den Saphiro-Wilk-Test (p > 0,05), mögliche Ausreißer durch die visuelle Überprü- fung des Boxplots und die Sphärizität mit dem Mauchly-Test (p > 0,05) überprüft werden. Die Varianzgleichheit der Residuen mit dem Levene-Test war zum zweiten und dritten Messzeitpunkt nicht erfüllt. Varianzheterogenität entsteht jedoch gemäß Bryk und Raudenbush (1988) oft durch die Einwirkung eines Treatments, in diesem Fall der Intervention, was sich in unterschiedlichen Varianzen niederschlagen kann. Die Varianzanalyse gilt bei etwa gleich großen Stichproben als robust und Bortz und Schuster (2010) empfehlen nur bei kleinen Stichproben (n < 10) und Verletzung mehrerer Voraussetzungen ein anderes Verfahren. In Tab. 3 sind die Mittelwerte sowie die Standardabweichung der erreichten Punk- te der Experimental- und Kontrollgruppe zu allen drei Messzeitpunkten dargestellt (vgl. auch Abb. 4). Ebenso ist ersichtlich, wie sich die Gruppen zu den Messzeit- punkten unterschieden. Deskriptiv lässt sich feststellen, dass die Experimentalgruppe beim zweiten Mess- zeitpunkt den höchsten Wert erzielte (M= 50,82; SD= 14,22). Dieser nahm zum drit- ten Messzeitpunkt wieder ab (M= 45,98; SD= 13,58), lag jedoch höher als zum ers- ten Messzeitpunkt. Die Kontrollgruppe hatte beim Pretest einen höheren Mittelwert als die Experimentalgruppe (M= 43,69; SD= 9,56). Der Mittelwert der Kontroll- Tab. 3 Gruppenunterschiede zu den drei Messzeitpunkten Mess- Experimentalgruppe Kontrollgruppe ANOVA zeitpunkt (n= 98) (n= 83) MSD M SD Effekt df F η Pre 40,78 8,55 43,69 9,56 Gruppe 1 6,53* 0,035 Post 50,82 14,22 42,83 9,19 Zeit 2 21,96** 0,109 Follow-up 45,98 13,58 40,07 9,98 Gruppe× Zeit 2 30,50** 0,146 *p< 0,05; **p<0,01 K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 191 Abb. 4 Mittelwerte der Experi- mental- und Kontrollgruppe gruppe nahm dann zum zweiten Messzeitpunkt (M= 42,83; SD= 9,19) sowie zum dritten Messzeitpunkt ab (M= 40,07; SD= 9,98). In einem nächsten Schritt wurden Gruppenunterschiede unter Einbezug aller drei Messzeitpunkte varianzanalytisch untersucht. Die Gruppen unterschieden sich bei einem Signifikanzniveau von p < 0,05 zu allen drei Testzeitpunkten signifi- kant (vgl. Tab. 3). Allerdings lag der Mittelwert der Kontrollgruppe zu Beginn der Intervention höher als der der Experimentalgruppe. Dies ist insofern von Be- deutung, weil damit mögliche Effekte der Intervention nicht auf bereits höhere Werte der Experimentalgruppe zu Beginn der Intervention zurückzuführen wären. Die Analyse zeigte eine statistisch signifikante Interaktion von Gruppe und Zeit (F(2, 358) = 30,50; p < 0,001). Das bedeutet, dass sich die erfasste Fähigkeit in Ab- hängigkeit von der Gruppenzugehörigkeit unterschiedlich entwickelte. Die Effekt- stärke (η = 0,146) kann als stark interpretiert werden (Cohen 1988). Aufgrund der Abnahme der Mittelwerte der Experimentalgruppe zwischen Post- und Follow-up- Test, wurde zur Beurteilung der Nachhaltigkeit der Intervention eine Varianzanalyse mit Messwiederholung mit dem ersten und dritten Messzeitpunkt durchgeführt. Es zeigte sich ein statistisch signifikanter Unterschied (F(1, 179) = 32,02; p < 0,001) mit einem starken Effekt (η = 0,152). Da zwei Werte zur Erfassung der Fähigkeit des Erkennens von Stärken und Schwächen zur Messung herangezogen wurden, ist hier zur differenzierten Beurtei- lung der Wirksamkeit der Intervention eine getrennte Betrachtung der beiden Werte sinnvoll. Mit Wert I wurde das Identifizieren von Stärken und Schwächen erfasst. Interessant ist, dass kein statistisch signifikanter Interaktionseffekt nachweisbar war (F(1,92; 342,83) = 0,03; p = 0,963). Beide Gruppen haben sowohl vor als auch nach der Intervention ähnliche Werte erreicht (vgl. Tab. 4 und Abb. 5). Mit Wert II wurde das Interpretieren von Stärken und Schwächen von Schüle- rinnen und Schülern erfasst (vgl. Tab. 5 und Abb. 6). Es zeigte sich ein statistisch signifikanter Interaktionseffekt (F(2, 358) = 40,37; p < 0,001) und ein starker Effekt (η = 0,184). K 192 K. Philipp, I. Gobeli-Egloff Tab. 4 Gruppenunterschiede beim Identifizieren von Stärken und Schwächen Mess- Experimentalgruppe Kontrollgruppe ANOVA zeitpunkt (n= 98) (n= 83) MSD M SD Effekt df F η Pre 16,70 5,48 18,59 5,45 Gruppe 1,00 7,21 0,039 Post 17,29 5,50 19,18 5,24 Zeit 1,92 2,28 0,013 Follow-up 17,40 6,41 19,46 5,88 Gruppe× Zeit 1,92 0,03 0,000 *p< 0,05; **p<0,01 Tab. 5 Gruppenunterschiede beim Interpretieren von Stärken und Schwächen Mess- Experimentalgruppe Kontrollgruppe ANOVA zeitpunkt (n= 98) (n= 83) MSD M SD Effekt df F η Pre 24,21 6,89 25,23 6,55 Gruppe 1 26,99* 0,131 Post 33,56 12,29 23,82 6,67 Zeit 2 25,99** 0,127 Follow-up 28,60 10,31 20,76 6,70 Gruppe× Zeit 2 40,37** 0,184 *p< 0,05; **p<0,01 5.2 Informationen im diagnostischen Prozess Nachdem die Förderung diagnostischer Kompetenz, bezogen auf die Teilfähigkeit des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern, hinsicht- lich ihrer Wirksamkeit betrachtet wurde, steht im Folgenden die Verwendung von Informationen im Fokus. Die Datengrundlage hierfür bildeten schriftliche Dokumen- te (Analysen diagnostischer Interviews) der Studierenden der Experimentalgruppe von selbst durchgeführten Interviews im Verlauf der Intervention. 5.2.1 Art der Informationen In einem ersten Schritt der Analyse wurde untersucht, welche Informationen die Studierenden bei ihrer Diagnose nutzten (Forschungsfrage 2). Die verfügbaren Informationen (V), auf die die Studierenden Bezug nahmen, ent- stammten fachdidaktischem Wissen zu Größenbereichen, wie verschiedene Indika- toren für Größenvorstellungen (V1) sowie typische Herausforderungen des Größen- bereichs Gewichte (V2), die Schwierigkeiten beim Aufbau von Größenvorstellungen verursachen können. Anhand der acht eingesetzten Aufgaben mit diagnostischem Potenzial konnten die Studierenden verschiedene Teilfähigkeiten von Schülerinnen und Schülern in Bezug auf den Umgang mit Gewichten einschätzen. Dazu zogen die Studierenden in ihrer Analyse verschiedene Kriterien heran. Die Studierenden schätzten ein, inwiefern bereits Kenntnisse zu Messinstrumenten vorhanden waren. Beim Schätzen von Gewichten diente den Studierenden als Kriterium, ob die Schü- lerin oder der Schüler passende Repräsentanten für Standardgrößen kannte und ob er oder sie auf Referenzgrößen (Stützpunktvorstellungen) zurückgreifen konnte. Ob Bezüge zu Kategorien aus Tab. 2 sind kursiv hervorgehoben. K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 193 Abb. 5 Gruppenunterschiede beim Identifizieren von Stärken und Schwächen Abb. 6 Gruppenunterschiede beim Interpretieren von Stärken und Schwächen die Schülerin oder der Schüler passende Maßeinheiten für Gegenstände auswählen konnte, ob diese zueinander in Beziehung (vergröbern/verfeinern) gesetzt werden konnten und die Unveränderlichkeit von Gewichten (Invarianz) erkannt wurde, wa- ren weitere Kriterien, auf die sich die Studierenden in ihrer Analyse bezogen. Au- ßerdem orientierten sich die Studierenden daran, ob das Kind Gegenstände nach Gewicht vergleichen und ordnen konnte. Es wurde sichtbar, dass die Studierenden in ihrer Analyse die fachlichen Kriteri- en zur Beurteilung von Größenvorstellungen, die in den Interviewaufgaben angelegt waren, auch tatsächlich als Informationen nutzten. In den Analysen der Studieren- den wurde aber auch deutlich, dass sie sich auf weiteres fachdidaktisches Wissen bezogen, das im Rahmen der Intervention thematisiert wurde. Dies zeigte sich bei- spielweise darin, dass sie auf Herausforderungen des Größenbereichs Gewichte (V2) Bezug nahmen. Sie nannten im Zusammenhang mit einer Tendenz von Schülerin- nen und Schülern, das Gewicht mit der Größe des Gegenstandes in Verbindung zu K 194 K. Philipp, I. Gobeli-Egloff bringen, die nicht-visuelle Wahrnehmbarkeit von Gewichten. Auch das Problem, dass geringe Gewichtsunterschiede mit der Hand kaum wahrnehmbar sind, wur- de als Information genutzt. Daneben verwendeten die Studierenden Informationen, die sich auf ihre Kenntnisse über gängigen Mathematikunterricht (V3), Lehrmittel bzw. auf den Lehrplan bezogen, beispielweise welche Repräsentanten für Gewichte typischerweise vorkommen. Die neu hinzukommenden Informationen (N) sind dadurch gekennzeichnet, dass die Studierenden sie aus der Gesprächssituation mit der Schülerin oder dem Schüler entnahmen. Hierbei bezogen sie sich sowohl auf richtige Lösungen (N1) als auch auf Fehler (N2) der Schülerinnen und Schüler sowie genannte Beispiele (N3).Diese stellten Informationen dar, die im Gespräch über die Aufgaben zunächst konkret sichtbar und damit schnell erfassbar waren. Weiterhin wurden aber auch Informa- tionen herangezogen, die von einer tiefergehenden Analyse zeugten. So wurden Argumente (N4) von Schülerinnen und Schülern berücksichtigt, die das Zustande- kommen ihrer Lösung erklärten, beispielweise, dass die Materialbeschaffenheit oder die Größe von Gegenständen bei der Einschätzung von Gewichten eine Rolle spielte oder die Kategorisierung von Gegenständen in „schwer“ und „leicht“, z. B. bei der Zuordnung von Maßeinheiten. Informationen von den Schülerinnen und Schülern bezüglich ihres Vorwissens (N7), differenzierten die Studierenden in ihrer Analyse einerseits danach, woher dieses Vorwissen stammte, z. B. aus dem Unterricht oder aus dem Alltag und spezifizierten es, wenn es sich um eine konkrete Messerfah- rung handelte. Neben der Argumentation der Schülerinnen und Schüler fokussierten die Studierenden auf Informationen zum strategischen Vorgehen (N5) der Kinder. So wurden verschiedene Strategien identifiziert, die bei der Aufgabenbearbeitung sichtbar wurden. Die Studierenden bezogen sich auf Strategien wie raten, abschät- zen (beispielweise durch das Vorstellen des Gewichts eines Gegenstandes in der Hand), systematisches Vergleichen und Ordnen von Gegenständen nach Gewicht. Neben diesen eher fachlich ausgerichteten Informationen, wurden auch Informatio- nen zu allgemeineren Merkmalen genannt, wie dem Bearbeitungsverhalten (N6). Die Studierenden nahmen hier Bezug zur Bearbeitungsdauer und zur Reihenfolge der Bearbeitung einer Aufgabe, berücksichtigten aber auch, ob das Kind Sicherheit bzw. Unsicherheit zeigte und ob es gegebenenfalls seine Lösungen selbst korrigierte. Auch das Nachfragen der Schülerinnen und Schüler wurde in diesem Zusammen- hang angeführt. Es zeigte sich insgesamt, dass die Studierenden in ihrer Analyse Bezug auf ein breites Spektrum an Informationen nahmen. Die Informationen unterschieden sich nicht nur hinsichtlich der Quellen, sondern auch in ihrer unmittelbaren Wahrnehm- barkeit. Während etwa richtige Lösungen, Fehler oder eine länger andauernde Bear- beitungsdauer prinzipiell direkt wahrgenommen werden können, erfordert beispiel- weise die Identifikation von strategischem Vorgehen oder der Bezug zu Indikatoren für Größenvorstellungen eine Wahrnehmung tiefer liegender Strukturen. 5.2.2 Nutzung von Informationen bei der Formulierung von Stärken und Schwächen Nachdem im ersten Schritt der qualitativen Auswertung der Fokus darauf lag, auf welche Informationen die Studierenden in ihrer Analyse Bezug nahmen, sollte in ei- K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 195 nem zweiten Schritt die Nutzung von Informationen genauer betrachtet werden (For- schungsfrage 3). Das Ziel dieser Analyse war es, zu beleuchten, inwiefern Informa- tionen, die grundsätzlich in den Dokumenten genannt wurden, bei der Formulierung und Begründung von Stärken und Schwächen von den Studierenden herangezogen wurden. Es zeigte sich, dass zunächst auf verfügbare Informationen (V) zurückgegriffen wurde. Dabei wurden die verschiedenen Indikatoren für Größenvorstellungen (V1) als Kriterien genutzt, um Kompetenzen der Schülerinnen und Schüler einschätzen zu können. Die fachlichen Kriterien dienten somit als Leitfaden für die Formulie- rung von Stärken und Schwächen, wurden jedoch nicht differenziert in Begründun- gen genutzt. Als Begründungen für Aussagen über Stärken und Schwächen wurden größtenteils Bezüge zu vermutetem Vorwissen (N7) der Kinder hergestellt, insbe- sondere fehlende bzw. vorhandene Alltags- und Messerfahrungen. Die typischen Herausforderungen (V2) des Größenbereichs Gewichte oder das Wissen über Ma- thematikunterricht (V3) wurden überwiegend nicht genutzt, um beispielweise mög- liche Ursachen für Schwächen zu benennen, selbst wenn sie zuvor im Rahmen von Beschreibungen bei der Analyse verwendet wurden. Es zeigte sich außerdem, dass Aussagen zu Stärken und Schwächen häufig direkt aus einem Fehler (N2) oder aus einer richtigen Lösung (N1) des Kindes abgeleitet wurden, bei denen zwar der Bezug zu fachlichen Kriterien gegeben war, jedoch keine weiteren Informationen berück- sichtigt wurden, um die Aussagen zu bestärken. Dies ließ sich ebenso feststellen, wenn Aussagen zu Stärken oder Schwächen des Kindes mit dem Bearbeitungsver- halten (N6) begründet wurden (z. B. einer langen bzw. kurzen Bearbeitungsdauer). Auch Bezüge zum strategischen Vorgehen (N5) der Kinder wurden in Begründungen für Stärken und Schwächen sichtbar, insbesondere das Ordnen von Gegenständen nach Größe. Allerdings wurde hier deutlich, dass das Benennen der Strategie nicht mit der nicht-visuellen Wahrnehmbarkeit von Gewichten (als typische Herausfor- derung (V2) der Größenbereichs Gewichte) in Verbindung gebracht wurde, wenn dies zu Fehleinschätzungen führte. Bei der Formulierung von Stärken und Schwä- chen fiel weiterhin auf, dass keine Bezüge zu Argumenten (N4) der Schülerinnen und Schüler hergestellt wurden. Auch Beispiele (N3) der Schülerinnen und Schüler wurden nicht herangezogen. Beim Bezug auf das Bearbeitungsverhalten (N6) zeigte sich, dass ausschließlich die Bearbeitungsdauer als Begründungen für eine Stärke oder Schwäche genutzt wurde, nicht jedoch beispielsweise das Revidieren einer Lö- sung oder die Reihenfolge der Bearbeitung, obwohl diese Aspekte in der Analyse genannt wurden. Die Nutzung von Informationen bei der Beurteilung von Stärken und Schwächen von Schülerinnen und Schülern kann dahingehend gedeutet werden, dass die Stu- dierenden in der Formulierung und Begründung von Stärken und Schwächen eines Kindes inhaltsspezifisches fachdidaktisches Wissen benötigen, um sie mit Informa- tionen, die in der Interviewsituation neu hinzukommen, zu fundierten Aussagen verknüpfen zu können. An vielen Stellen wurde damit die Verknüpfung von verfüg- baren Informationen (V) und neu hinzukommenden Informationen (N) explizit. Dies lässt den Schluss zu, dass die fachlichen Kriterien zur Beurteilung von Kompetenzen von Schülerinnen und Schülern die Studierenden in ihrer Diagnose unterstützen. K 196 K. Philipp, I. Gobeli-Egloff Die Ergebnisse legen nahe, dass die Studierenden mehr Informationen wahrge- nommen haben, als sie für die Formulierung von Stärken und Schwächen nutzten. Dies zeigte sich darin, dass zuvor thematisierte Informationen in den Analysen bei der Formulierung und Begründung von Stärken und Schwächen nicht mehr auf- gegriffen wurden. Daher kann davon ausgegangen werden, dass die Studierenden die Informationen bezüglich ihrer Relevanz für die Beurteilung von Stärken und Schwächen werteten. 6 Diskussion Ziel der Intervention war es, diagnostische Kompetenz im Rahmen der Ausbildung von Lehrkräften für die Primarschule zu fördern. Der Fokus lag auf einer zentralen Teilfähigkeit diagnostischer Kompetenz, der Fähigkeit des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern. Diese Fähigkeit kann als grundle- gend dafür betrachtet werden, dass auf der Grundlage (begründeter) Hypothesen bei der Beurteilung von Kompetenzen von Schülerinnen und Schülern auch individu- elle Fördermaßnahmen eingeleitet werden können (Philipp 2018). Zielsetzung der Studie war es, einerseits die Wirksamkeit der Intervention zu prüfen (Forschungs- frage 1) und andererseits die Verwendung von Informationen im diagnostischen Prozess zu untersuchen (Forschungsfragen 2 und 3), ausgehend von der Annahme, dass das inhaltsspezifische fachdidaktische Wissen, das Bestandteil der Intervention war, sichtbar wird. 6.1 Wirksamkeit der Intervention Zur Überprüfung der Wirksamkeit der Intervention wurde ein Testinstrument ein- gesetzt, das es erlaubt, die Güte diagnostischer Urteile neben dem vorherrschenden Paradigma der Urteilsgenauigkeit zu bestimmen. Dies hat den Nachteil, dass die Er- gebnisse aufgrund fehlender Korrespondenzmaße weniger gut mit Befunden anderer Studien vergleichbar sind. Von Vorteil ist jedoch, dass über die Anzahl von Aus- sagen bezüglich fachbezogener Kategorien besser Rückschlüsse auf das inhaltliche Lernen der Studierenden gezogen werden kann und damit auch über den Erwerb diagnostischer Kompetenz. Die quantitativen Analysen zeigten einen deutlichen Zuwachs der erfassten Fä- higkeit (das Erkennen von Stärken und Schwächen von Schülerinnen und Schülern) in der Experimentalgruppe über die drei Messzeitpunkte, während in der Kontroll- gruppe kein Zuwachs zu verzeichnen war. Der Unterschied konnte mittels einer Varianzanalyse auf den Haupteffekt der Intervention zurückgeführt werden, der als groß zu werten ist. Das zeigt, dass die Förderung diagnostischer Kompetenz er- folgreich und nachhaltig war. Allerdings war ein Abfall der Werte zwischen dem zweiten und dritten Messzeitpunkt zu verzeichnen, d. h. die erreichten hohen Wer- te direkt nach der Intervention blieben nicht stabil. Das könnte daran liegen, dass zwischen den beiden letzten Messzeitpunkten das Thema Größen im Rahmen der Lehrveranstaltung nicht mehr behandelt wurde und somit das weitere Übungsfeld in diesem Bereich fehlte. Es könnte auch ein Hinweis darauf sein, dass diagnostische K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 197 Tätigkeiten kontinuierlicher angeregt werden müssen, um diagnostische Kompetenz nachhaltig zu fördern. Durch die Erfassung zweier Werte, das Identifizieren sowie das Interpretieren von Stärken und Schwächen, konnte die Wirksamkeit der För- derung diagnostischer Kompetenz differenzierter betrachtet werden. Beide Gruppen erreichten im Bereich Identifizieren über alle drei Messzeitpunkte hinweg ähnliche Werte. Daraus ist zu schließen, dass das Identifizieren von fehlerhaften und richtigen Überlegungen bzw. Lösungen durch die Intervention nicht gefördert werden konnte, wenngleich höhere Werte hätten erreicht werden können. Die Wirkung der Inter- vention konnte jedoch im Bereich der Interpretation von Stärken und Schwächen nachgewiesen werden. Das bedeutet, dass die Studierenden nach der Intervention ei- ne größere Anzahl schlüssiger Interpretationen der Lösungen von Schülerinnen und Schülern, beispielweise über mögliche Ursachen für Schwierigkeiten, formulieren konnten. Dies zeigt, dass die Studierenden bei etwa gleichbleibender Anzahl von Identifikationen in der Lage waren, diese breiter zu interpretieren. Sie konnten also jeweils mehr fachbezogene Kriterien zur Beurteilung der Größenvorstellungen von Schülerinnen und Schülern heranziehen. Für eine förderorientierte Diagnostik stellt dies einen wesentlichen Schritt dar und dient als Basis für eine weiterführende, pro- zessorientierte Diagnostik, die theoriegeleitet ist (Philipp 2018; Scherer und Moser Opitz 2010). Das fachdidaktische Wissen kann als Voraussetzung für die Entwicklung dia- gnostischer Kompetenz verstanden werden, die sich als beobachtbares Verhalten in der Formulierung von Aussagen zu Stärken und Schwächen von Schülerinnen und Schülern zeigte, also als Personeneigenschaft, die die situationsbezogenen Fä- higkeiten beeinflusst (Blömeke et al. 2015). Der Einfluss des inhaltsspezifischen fachdidaktischen Wissens auf die Güte des diagnostischen Urteils lässt sich durch den Vergleich mit der Kontrollgruppe untermauern, die sich bezüglich der besuchten Lehrveranstaltung in diesem Punkt unterschied. Dies könnte ebenfalls als Hinweis darauf gedeutet werden, dass diagnostische Urteile nicht nur domänen-, sondern auch inhaltsspezifisch sein können bzw. durch solches Wissen beeinflusst werden. Steht dieses Wissen nicht zur Verfügung, so ist die Beurteilung von Kompeten- zen von Schülerinnen und Schülern auf der Basis allgemeinen fachdidaktischen und diagnostischen Wissens erschwert. Dies könnte auch daran liegen, dass die Studierenden noch am Beginn der Entwicklung diagnostischer Kompetenz stehen und inhaltsspezifische fachliche Kriterien benötigen, während erfahrenere Lehrkräfte möglicherweise flexibler mit fachdidaktischem Wissen umgehen können. Hinwei- se aus der Experten-Novizen-Forschung deuten an, dass Expertinnen und Experten im Vergleich zu Novizinnen und Novizen passende Kategorien aktivieren können (Krolak-Schwerdt et al. 2009). Möglicherweise unterstützte auch das Führen des di- agnostischen Interviews die Verarbeitung des fachdidaktischen Wissens auf andere Weise als das in der Kontrollgruppe der Fall war. Einschränkend ist zu sagen, dass aufgrund des Designs der Studie keine Aussage dazu gemacht werden kann, welches Element der Intervention (Auseinandersetzung mit diagnostischen Situationen und deren Reflexion, Aufbau fachdidaktischen Wis- sens) besonders förderlich war. Die Aussagen zur Wirksamkeit beziehen sich also auf das Gesamtkonzept der Intervention. In künftigen Studien könnte dies anhand K 198 K. Philipp, I. Gobeli-Egloff einer systematischen Variation verschiedener Elemente mit mehreren Gruppen in experimentellen Designs untersucht werden. 6.2 Verwendung von Informationen Neben der Beurteilung der Wirksamkeit der Intervention, wurde im Rahmen der berichteten Studie auch der diagnostische Prozess selbst in den Blick genommen. Die Frage danach, auf welche Informationen überhaupt in einem solchen Prozess zurückgegriffen wird und wie sie genutzt werden, waren zentrale Fragestellungen. Im Gegensatz zu dem eingesetzten Testinstrument zur Überprüfung der Wirksam- keit der Intervention lag hier der Fokus auf einer Beurteilung von Kompetenzen eines Kindes über mehrere Aufgaben hinweg. Die Informationen mussten hier also integriert werden, um zu einer Gesamteinschätzung der Größenvorstellungen des Kindes zu kommen. Zentrales Ergebnis ist ein deduktiv sowie induktiv entwickel- tes Kategoriensystem (vgl. Tab. 2), das Aufschluss über die Art der verwendeten Informationen gibt und zwischen Informationen, die bereits verfügbar sind (fach- didaktisches Wissen) und Informationen, die in einer diagnostischen Situation neu hinzukommen, unterscheidet. Eine Übertragbarkeit auf andere Inhaltsbereiche wäre bei Anpassung der inhaltsspezifischen Kategorien prinzipiell möglich. Des Weiteren zeigte sich, dass sowohl auf unmittelbar wahrnehmbare Informationen (z. B. Bear- beitungsdauer) zurückgegriffen wurde als auch auf Informationen, die nur durch die Wahrnehmung tieferliegender Strukturen erfasst werden können (z. B. strategisches Vorgehen der Schülerinnen und Schüler). Diese wurden jedoch nicht konsequent zur Begründung von Aussagen zu Stärken und Schwächen von Schülerinnen und Schülern genutzt. Von Novizinnen und Novizen wird berichtet, dass sie sich häufig an Oberflächenmerkmalen orientieren (Gruber 1994). Kellman und Massey (2013) weisen in diesem Zusammenhang darauf hin, dass Novizinnen und Novizen sowie Expertinnen und Experten durchaus dieselben Informationen berücksichtigen, sie aber erst mit zunehmender Expertise interpretieren können. Die Nutzung von Informationen im Hinblick auf das Erkennen von Stärken und Schwächen von Schülerinnen und Schülern wurde über das gemeinsame Auftreten von Kategorien bei der Formulierung von Stärken und Schwächen des interviewten Kindes betrachtet. Hier zeigte sich insbesondere die Verknüpfung von verfügbaren Informationen und neu hinzukommenden Informationen. Dies wird als ein Beleg dafür gewertet, dass einzelne Informationen nicht getrennt voneinander betrachtet wurden, sondern dass sie zu Einheiten verknüpft wurden, bei denen Informationen aus beiden Informationsquellen integriert wurden. In den schriftlichen Analysen wurde deutlich, dass die Studierenden zunächst beschreibend vorgingen. Erst in der Formulierung von Kompetenzen und Schwierigkeiten des interviewten Kindes wurden Interpretationen deutlich. Es zeigte sich, dass die Studierenden dabei nicht alle Informationen nutzten, die sie bei der Analyse nannten. Das kann dahingehend gedeutet werden, dass die Studierenden im diagnostischen Prozess Informationen gewichteten. Allerdings wurde deutlich, dass aus Fehlern oder richtigen Lösun- gen direkt Formulierungen zu Stärken und Schwächen abgeleitet wurden. Solche vorschnellen Beurteilungen, die sich an Korrektheit orientieren, werden von Novi- zinnen und Novizen berichtet (Streit et al. 2019; Reinhold 2018). Zudem bezogen K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 199 sich die Studierenden stark auf das Bearbeitungsverhalten, insbesondere auf die Bearbeitungsdauer, sodass davon ausgegangen werden kann, dass der Prozess des Gewichtens gesonderter Unterstützung bedarf und in künftigen Studien fokussiert werden könnte. Auch bei der qualitativen Analyse zeigte sich die Bedeutung des fachdidaktischen Wissens insofern, als dass die Studierenden auf das in der Intervention vermittel- te fachdidaktische Wissen zurückgriffen, um Kompetenzen von Schülerinnen und Schülern zu beurteilen. Es kann daher als Ankerfunktion (Nickerson 1999)dienen und den Analyseprozess der Studierenden leiten. So wurden Teilkompetenzen von Größenvorstellungen (vgl. Abschn. 4.4.1) als Ankerpunkte verwendet. Dass die Stu- dierenden verfügbare Informationen mit neu hinzukommenden Informationen ver- knüpften, um Aussagen über die Stärken und Schwächen des interviewten Kindes zu machen, kann als Anpassungsprozess (Nickerson 1999) betrachtet werden, bei dem die Menge an Informationen über mehrere Aufgaben hinweg verdichtet werden musste. Die Art der Informationen, die in einem solchen Anpassungsprozess ver- wendet wurden, konnten ergänzend zu den Befunden von Ostermann (2018) durch das Kategoriensystem konkretisiert werden. Einschränkend ist anzumerken, dass nicht ausgeschlossen werden kann, dass die Studierenden bestimmte Informationen in der Interviewsituation gar nicht wahrge- nommen (und damit auch nicht verschriftlicht) haben. Da die Studierenden unter- schiedliche Kinder befragten, gab es keine „Vergleichsnorm“, an der die Güte der diagnostischen Urteile gemessen werden konnte. Der Fokus der Studie lag allerdings nicht auf der Akkuratheit der Urteile, sondern darauf, ob (1) sich die Anzahl der Aussagen zu Stärken und Schwächen von Schülerinnen und Schülern erhöhen ließ und (2) welche Informationen im diagnostischen Prozess genutzt wurden. Des Wei- teren kann nicht mit Sicherheit gesagt werden, dass die Studierenden die verfügbaren Informationen tatsächlich verinnerlicht hatten, da die schriftlichen Analysen durch Hinzuziehen von Literatur entstanden sein könnten. Insofern müssen die Dokumente als Prozessdokumente im Lernprozess der Studierenden aufgefasst werden. Auch die Verallgemeinerbarkeit der qualitativen Befunde ist durch die reduzierte Stichprobe eingeschränkt. 6.3 Fazit Die Befunde der hier berichteten Interventionsstudie weisen darauf hin, dass die Ent- wicklung diagnostischer Kompetenz durch die Förderung inhaltsspezifischen fach- didaktischen Wissens bereits im Rahmen der Ausbildung angeregt werden kann, auch wenn davon auszugehen ist, dass sich diagnostische Kompetenz über einen längeren Zeitraum entwickelt (z. B. Hascher 2008). Die erfolgreiche Förderung di- agnostischer Kompetenz im Rahmen der Interventionsstudie stützt damit auch die weit verbreitete Annahme, dass diagnostische Kompetenz wie andere Kompetenzen prinzipiell erlernbar ist (Hartig und Klieme 2006; Herppich et al. 2017) und kann dies konkretisieren: Förderung ist möglich durch Aufbau des fachbezogenen Wis- sens und durch die Konfrontation mit diagnostischen Situationen. Insgesamt geben die Ergebnisse der Studie wertvolle Hinweise auf den Erwerb diagnostischer Kom- petenz und lassen darauf schließen, dass angehende Lehrkräfte nach entsprechender K 200 K. Philipp, I. Gobeli-Egloff Förderung in der Lage sind, fachbezogenes Wissen in diagnostischen Situationen zu nutzen, um Stärken und Schwächen von Schülerinnen und Schülern beurteilen kön- nen. Dabei wurde deutlich, welche Informationen die Studierenden bei der Diagnose berücksichtigen. Als Beitrag zur Förderung diagnostischer Kompetenz konnte somit ein Konzept entwickelt werden, das die Verbindung von fachbezogenem Wissen mit Informationen aus diagnostischen Situationen bei den Studierenden unterstützt. Funding Open access funding provided by FHNW University of Applied Sciences and Arts Northwestern Switzerland Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Li- zenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ord- nungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden. Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betref- fende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen. Weitere Details zur Lizenz entnehmen Sie bitte der Lizenzinformation auf http://creativecommons.org/ licenses/by/4.0/deed.de. Literatur Anders, Y., Kunter, M., Brunner, M., Krauss, S., & Baumert, J. (2010). Diagnostische Fähigkeiten von Mathematiklehrkräften und die Leistungen ihrer Schülerinnen und Schüler. Psychologie in Erziehung und Unterricht, 3, 175–193. v. Aufschnaiter, C., Cappell, J., Dübbelde, G., Ennemoser, M., Mayer, J., Stiensmeier-Pelster, J., Sträßer, R., & Wolgast, A. (2015). Diagnostische Kompetenz. Theoretische Überlegungen zu einem zentralen Konstrukt der Lehrerbildung. Zeitschrift für Pädagogik, 61, 738–758. Ball, D. L., Thames, M. H., & Phelbs, G. (2008). Content knowledge for teaching: what makes it special? Journal of Teacher Education, 59(5), 389–407. Bass, H., & Ball, D. L. (2004). A practice-based theory of mathematical knowledge for teaching: the case of mathematical reasoning. In W. Jianpan & X. Binyan (Hrsg.), Trends and challenges in mathematics education (S. 107–123). Shanghai: East China Normal University Press. Baumert, J., & Kunter, M. (2006). Stichwort: Professionelle Kompetenz von Lehrkräften. Zeitschrift für Erziehungswissenschaft, 9(4), 469–520. Black, P., & Wiliam, D. (2009). Developing the theory of formative assessment. Educational Assessment, Evaluation and Accountability, 21, 5–31. Bless, H., Fiedler, K., & Strack, F. (2004). Social cognition—How individuals construct social reality. Hove: Psychology Press. Blömeke, S., Gustafsson, J. E., & Shavelson, R. J. (2015). Beyond dichotomies: competence viewed as a continuum. Zeitschrift für Psychologie, 223(1), 3–13. Bortz, J., & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler. Berlin Heidelberg: Sprin- ger. Bräunling, K., & Reuter, D. (2015). Messen und Größen. In J. Leuders & K. Philipp (Hrsg.), Mathematik – Didaktik für die Grundschule (S. 44–57). Berlin: Cornelsen. Brennan, R. L., & Prediger, D. J. (1981). Coefficient kappa: some uses, misuses, and alternatives. Educa- tional and Psychological Measurement, 41(3), 687–699. Bromme, R. (2008). Lehrerexpertise. In W. Schneider & M. Hasselhorn (Hrsg.), Handbuch der pädagogi- schen Psychologie (S. 159–167). Stuttgart: Hogrefe. K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 201 Brunner, M., Anders, Y., Hachfeld, A., & Krauss, S. (2011). Diagnostische Fähigkeiten von Mathemati- klehrkräften. In M. Kunter, J. Baumert, W. Blum, U. Klusmann, S. Krauss & M. Neubrand (Hrsg.), Professionelle Kompetenz von Lehrkräften (S. 215–234). Münster: Waxmann. Bryk, A. S., & Raudenbush, S. W. (1988). Heterogeneity of variance in experimental studies: a challenge to conventional interpretations. Psychological Bulletin, 104(3), 396. Buholzer, A., & Zulliger, S. (2013). Die Entwicklung von diagnostischen Fähigkeiten bei Studierenden der pädagogischen Hochschulen im Laufe ihrer Ausbildung. Beiträge zur Lehrerinnen- und Lehrer- bildung, 31(2), 186–197. Busch, J., Barzel, B., & Leuders, T. (2015). Die Entwicklung eines kategorialen Kompetenzmodells zur Erfassung diagnostischer Kompetenzen von Lehrkräften im Bereich Funktionen. Journal für Mathe- matik-Didaktik, 36(2), 315–338. Chernikova, O., Heitzmann, N., Fink, M. C., Timothy, V., Seidel, T., & Fischer, F. (2020). Facilitating di- agnostic competences in higher education—a meta-analysis in medical and teacher education. Edu- cational Psychology Review, 32, 157–196. Clarke, D. M., Roche, A., & Clarke, B. (2018). Supporting Mathematics Teachers’ Diagnostic Compe- tence Through the Use of One-to-One, Task-Based Assessment Interviews. In T. Leuders, K. Philipp & J. Leuders (Hrsg.), Diagnostic Competence of Mathematics Teachers: Unpacking a Complex Con- struct in Teacher Education and Teacher Practice (Bd. 11, S. 173–192). Cham: Springer. Cohen, J. (1988). Statistical power analysis for the behavioural sciences (2. Aufl.). New York: Academic Press. Döring, N., & Bortz, J. (2016). Forschungsmethoden und Evaluation in den Sozial- und Humanwissen- schaften (5. Aufl.). Berlin Heidelberg: Springer. Emmrich, A. (2008). Ein Vortest zu Gewichtsvorstellungen. Grundschule Mathematik, 5(19), 14–19. Förster, N., & Karst, K. (2017). Modelle diagnostischer Kompetenz: Gemeinsamkeiten und Unterschiede. In A. Südkamp & A. K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften: Theoretische und methodische Weiterentwicklungen (S. 63–65). Münster: Waxmann. Franke, M., & Ruwisch, S. (2010). Didaktik des Sachrechnens in der Grundschule. Heidelberg: Spektrum. Grossman, P., & McDonald, M. (2008). Back to the future: Directions for research in teaching and teacher education. American Educational Research Journal, 45(1), 184–205. Gruber, H. (1994). Expertise: Modelle und empirische Untersuchungen. Beiträge zur psychologischen Forschung, Bd. 34. Opladen: Westdeutscher Verlag. Hartig, J., & Klieme, E. (2006). Kompetenz und Kompetenzdiagnostik. In K. Schweizer (Hrsg.), Leistung und Leistungsdiagnostik (S. 127–143). Berlin, Heidelberg: Springer. Hascher, T. (2008). Diagnostische Kompetenzen im Lehrberuf. In C. Kraler & M. Schratz (Hrsg.), Wissen erwerben, Kompetenzen entwickeln (S. 71–86). Münster: Waxmann. Hastie, R., & Dawes, R. M. (2001). Rational choice in an uncertain world: the psychology of judgment and decision making. Thousand Oaks: SAGE. Helmke, A. (2009). Unterrichtsqualität und Lehrerprofessionalität. Diagnose, Evaluation und Verbesse- rung des Unterrichts (2. Aufl.). Seelze: Klett. Helmke, A., Hosenfeld, I., & Schrader, F.-W. (2004). Vergleichsarbeiten als Instrument zur Verbesserung der Diagnosekompetenz von Lehrkräften. In R. Arnold & C. Griese (Hrsg.), Schulleitung und Schul- entwicklung (S. 119–144). Hohengehren: Schneider. Herppich, S., Praetorius, A. K., Hetmanek, A., Glogger-Frey, I., Ufer, S., Leutner, D., Behrmann, L., Böh- mer, I., Böhmer, M., Förster, N., Kaier, J., Karing, C., Karst, K., Klug, J., Ohle, A., & Südkamp, A. (2017). In A. Südkamp & A. K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften: Theoretische und methodische Weiterentwicklungen (S. 75–93). Münster: Waxmann. Hoge, R. D., & Coladarci, T. (1989). Teacher-based judgments of academic achievement: A review of literature. Review of Educational Research, 59(3), 297–313. Ingenkamp, K., & Lissmann, U. (2008). Lehrbuch der pädagogischen Diagnostik (6. Aufl.). Weinheim Basel: Beltz. Jacobs, V. R., Lamb, L. L., & Philipp, R. A. (2010). Professional noticing of children’s mathematical think- ing. Journal for research in mathematics education, 41(2), 169–202. Kaiser, J., Praetorius, A. K., Südkamp, A., & Ufer, S. (2017). Die enge Verwobenheit von diagnostischem und pädagogischem Handeln als Herausforderung bei der Erfassung diagnostischer Kompetenz. In A. Südkamp & A. K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften: Theoretische und methodische Weiterentwicklungen (S. 114–123). Münster: Waxmann. Karing, C., & Seidel, T. (2017). Ausblick zur Förderung diagnostischer Kompetenz. In A. Südkamp & A. K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften: Theoretische und methodische Weiterentwicklungen (S. 240–246). Münster: Waxmann. K 202 K. Philipp, I. Gobeli-Egloff Karst, K., Klug, J., & Ufer, S. (2017). Strukturierung diagnostischer Situationen im inner- und außerunter- richtlichen Handeln von Lehrkräften. In A. Südkamp & A. K. Praetorius (Hrsg.), Diagnostische Kom- petenz von Lehrkräften: Theoretische und methodische Weiterentwicklungen (S. 102–114). Münster: Waxmann. Kellman, P. J., & Massey, C. M. (2013). Perceptual learning, cognition, and expertise. Psychology of learn- ing and motivation, 58, 117–165. Academic Press. Krauss, S., Brunner, M., Kunter, M., Baumert, J., Blum, W., Neubrand, M., & Jordan, A. (2008). Ped- agogical content knowledge and content knowledge of secondary mathematics teachers. Journal of Educational Psychology, 100(3), 716–725. Krolak-Schwerdt, S., Böhmer, M., & Gräsel, C. (2009). Verarbeitung von schülerbezogener Information als zielgeleiteter Prozess: Der Lehrer als „flexibler Denker“. Zeitschrift für Pädagogische Psychologie, 23(34), 175–186. Kuckartz, U. (2016). Qualitative Inhaltsanalyse. Methoden, Praxis, Computerunterstützung (3. Aufl.). Weinheim Basel: Beltz. Leuders, T., Dörfler, T., Leuders, J., & Philipp, K. (2018). Diagnostic competence of mathematics teachers: unpacking a complex construct. In T. Leuders, K. Philipp & J. Leuders (Hrsg.), Diagnostic compe- tence of mathematics teachers: unpacking a complex construct in teacher education and teacher practice (Bd. 11, S. 3–31). Cham: Springer. Leuders, T., Loibl, K., & Dörfler, T. (2020). Diagnostische Urteile von Lehrkräften erklären – Ein Rahmen- modell für kognitive Modellierungen und deren experimentelle Prüfung. Unterrichtswissenschaft, 48(4), 493–502. Lorenz, C., & Artelt, C. (2009). Fachspezifität und Stabilität diagnostischer Kompetenz von Grundschul- lehrkräften in den Fächern Deutsch und Mathematik. Zeitschrift für Pädagogische Psychologie, 23(3), 211–222. Mayring, P. (2010). Qualitative Inhaltsanalyse. Grundlagen und Techniken (11. Aufl.). Weinheim, Basel: Beltz. Mayring, P., & Fenzl, T. (2019). Qualitative Inhaltsanalyse. In N. Bauer & J. Blasius (Hrsg.), Handbuch Methoden der empirischen Sozialforschung (2. Aufl. S. 633–648). Wiesbaden: Springer VS. Moser Opitz, E., & Nührenbörger, M. (2015). Diagnostik und Leistungsbeurteilung. In R. Bruder, L. He- fendehl-Hebeker, B. Schmidt-Thieme & H. G. Weigand (Hrsg.), Handbuch der Mathematikdidaktik (S. 491–512). Berlin: Springer Spektrum. Nickerson, R. S. (1999). How we know-and sometimes misjudge-what others know: imputing one’s own knowledge to others. Psychological Bulletin, 125(6), 737–759. van Ophuysen, S., & Behrmann, L. (2015). Die Qualität pädagogischer Diagnostik im Lehrerberuf-An- merkungen zum Themenheft „Diagnostische Kompetenzen von Lehrkräften und ihre Handlungsrele- vanz“. Journal for educational research online, 7(2), 82–98. Ostermann, A. (2018). Factors influencing the accuracy of diagnostic judgments. In T. Leuders, K. Phi- lipp & J. Leuders (Hrsg.), Diagnostic competence of mathematics teachers: unpacking a complex construct in teacher education and teacher practice (Bd. 11, S. 95–108). Cham: Springer. Peter-Koop, A., & Nührenbörger, M. (2008). Größen und Messen. In G. Walther, M. van den Heuvel- Panhuizen, D. Granzer & O. Köller (Hrsg.), Bildungsstandards für die Grundschule: Mathematik konkret (S. 87–115). Berlin: Cornelsen Scriptor. Philipp, K. (2018). Diagnostic competences of mathematics teachers with a view to processes and know- ledge resources. In T. Leuders, K. Philipp & J. Leuders (Hrsg.), Diagnostic competence of mathe- matics teachers: unpacking a complex construct in teacher education and teacher practice (Bd. 11, S. 109–127). Cham: Springer. Plessner, H. (2011). Urteilen. In T. Betsch, J. Funke & H. Plessner (Hrsg.), Denken – Urteilen, Entscheiden, Problemlösen. Berlin, Heidelberg: Springer. Pott, A. (2019). Diagnostische Deutungen Im Lernbereich Mathematik. Wiesbaden: Springer. Prediger, S., Selter, C., Hußmann, S., & Nührenbörger, M. (Hrsg.). (2017). Mathe sicher können. Hand- reichungen für ein Diagnose- und Förderkonzept zur Sicherung mathematischer Basiskompetenzen. Sachrechnen. Berlin: Cornelsen. Prediger, S., Tschierschky, K., Wessel, L., & Seipp, B. (2012). Professionalisierung für fach- und sprachin- tegrierte Diagnose und Förderung im Mathematikunterricht. Zeitschrift für Interkulturellen Fremd- sprachenunterricht, 17(1), 40–58. Rädiker, S., & Kuckartz, U. (2019). Analyse qualitativer Daten mit MAXQDA. Wiesbaden: Springer. Reinhold, S. (2018). Revealing and promoting pre-service teachers’ diagnostic strategies in mathematical interviews with first-graders. In T. Leuders, K. Philipp & J. Leuders (Hrsg.), Diagnostic competence K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 203 of mathematics teachers: unpacking a complex construct in teacher education and teacher practice (Bd. 11, S. 129–148). Cham: Springer. Reuter, D. (2011). Kindliche Konzepte zur Größe Gewicht und ihre Entwicklung. Theoretische Modellie- rung und zwei Einzelfallstudien mit Drittklässlern. Dissertation. Berlin: Humboldt-Universität. Rösike, K. A., & Schnell, S. (2017). Do math! – Lehrkräfte professionalisieren für das Erkennen und För- dern von Potenzialen. In J. Leuders, T. Leuders, S. Prediger & S. Ruwisch (Hrsg.), Mit Heterogenität im Mathematikunterricht umgehen lernen (S. 223–233). Wiesbaden: Springer Spektrum. Scherer, P., & Opitz, M. E. M. (2010). Fördern im Mathematikunterricht der Primarstufe. Heidelberg: Springer Spektrum. Schipper, W. (2009). Handbuch für den Mathematikunterricht an Grundschulen. Braunschweig: Schroe- del. Schrader, F.-W. (2013). Diagnostische Kompetenz von Lehrpersonen. Beiträge zur Lehrerinnen- und Leh- rerbildung, 31(2), 154–165. Schwarz, B., Wissmach, B., & Kaiser, G. (2008). “Last curves not quite correct”: diagnostic competence of future teachers with regard to modelling and graphical representations. ZDM—The International Journal on Mathematics Education, 40(5), 777–790. Spinath, B. (2005). Akkuratheit der Einschätzung von Schülermerkmalen durch Lehrer und das Konstrukt der diagnostischen Kompetenz. Zeitschrift für Pädagogische Psychologie, 19(1/2), 85–95. Stahnke, R., Schueler, S., & Roesken-Winter, B. (2016). Teachers’ perception, interpretation, and decision- making: a systematic review of empirical mathematics education research. ZDM—The International Journal on Mathematics Education, 48(1), 1–27. Streit, C., Rüede, C., Weber, C., & Graf, B. (2019). Zur Verknüpfung von Lernstandeinschätzung und Wei- terarbeit im Arithmetikunterricht: Ein kontrastiver Vergleich zur Charakterisierung diagnostischer Expertise. Journal für Mathematik-Didaktik, 40(1), 37–62. Südkamp, A., Kaiser, J., & Möller, J. (2012). Accuracy of teachers’ judgments of students’ academic achievement: a meta-analysis. Journal of Educational Psychology, 104(3), 743–762. Tversky, A., & Kahneman, D. (1974). Judgments under uncertainty. Heuristic and biases. Science, 185, 1124–1131. Ufer, S., & Leutner, D. (2017). Kompetenzen als Dispositionen-Begriffsklärungen und Herausforderungen. In A. Südkamp & A. K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften: Theoretische und methodische Weiterentwicklungen (S. 67–74). Münster: Waxmann. Weinert, F. E. (2000). Lehren und Lernen für die Zukunft – Ansprüche an das Lernen in der Schule. Päd- agogische Nachrichten Rheinland-Pfalz, 2, 1–16. Wember, F. B. (1998). Zweimal Dialektik: Diagnose und Intervention, Wissen und Intuition. Sonderpäd- agogik, 28, 106–120. Wollring, B., Peter-Koop, A., & Grüßing, M. (2013). Das ElementarMathematische BasisInterview EMBI. In M. Hasselhorn, A. Heinze, W. Schneider & U. Trautwein (Hrsg.), Diagnostik mathematischer Kompetenzen (Bd. 11, S. 81–96). Göttingen: Hogrefe. http://www.deepdyve.com/assets/images/DeepDyve-Logo-lg.png Journal für Mathematik-Didaktik Springer Journals

Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die Primarschule– Eine Studie zum Erkennen von Stärken und Schwächen von Schülerinnen und Schülern am Beispiel von Größen

Loading next page...
 
/lp/springer-journals/f-rderung-diagnostischer-kompetenz-im-rahmen-der-ausbildung-von-lehrkr-3aLNmMjtfX

References (75)

Publisher
Springer Journals
Copyright
Copyright © The Author(s) 2022
ISSN
0173-5322
eISSN
1869-2699
DOI
10.1007/s13138-022-00202-0
Publisher site
See Article on Publisher Site

Abstract

J Math Didakt (2022) 43:173–203 https://doi.org/10.1007/s13138-022-00202-0 ORIGINALARBEIT/ORIGINAL ARTICLE Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die Primarschule – Eine Studie zum Erkennen von Stärken und Schwächen von Schülerinnen und Schülern am Beispiel von Größen K. Philipp · I. Gobeli-Egloff Eingegangen: 28. Dezember 2020 / Angenommen: 25. Februar 2022 / Online publiziert: 4. März 2022 © Der/die Autor(en) 2022 Zusammenfassung Diagnostische Kompetenz umfasst eine Vielzahl unterschied- licher Fähigkeiten, die eine hohe Praxisrelevanz besitzen. Die Fähigkeit, Stärken und Schwächen von Schülerinnen und Schülern zu erkennen, wird insbesondere für die individuelle Förderung als fundamental betrachtet. Der diagnostische Prozess kann als Informationsverarbeitungsprozess verstanden werden, bei dem sowohl vor- handenes (fachbezogenes) Wissen als auch Informationen aus einer diagnostischen Situation aufeinander bezogen werden müssen, um Stärken und Schwächen von Schülerinnen und Schülern erkennen zu können. Ein Konzept zur Förderung dieser Teilfähigkeit diagnostischer Kompetenz am Beispiel Größen wurde im Rahmen ei- ner Interventionsstudie mit angehenden Lehrkräften für die Primarschule (N = 181) hinsichtlich seiner Wirksamkeit quantitativ untersucht. Es zeigte sich, dass das Er- kennen von Stärken und Schwächen durch die Intervention nachhaltig gefördert werden konnte. Die Art und die Nutzung von Informationen beim Diagnostizieren von Stärken und Schwächen von Schülerinnen und Schülern wurde in einer quali- tativen Analyse schriftlicher Dokumente der Studierenden untersucht. Wesentliches Ergebnis der qualitativen Herangehensweise ist ein Kategoriensystem, das über die Art der verwendeten Informationen Aufschluss gibt, und möglicherweise auf weite- re Inhaltsbereiche im Fach Mathematik übertragen werden kann. Insgesamt geben die Ergebnisse Hinweise auf den Erwerb diagnostischer Kompetenz. Schlüsselwörter Diagnosekompetenz · Größenvorstellungen · Intervention · Ausbildung von Lehrkräften Mathematics Education Subject Classification 97B50 · 97D72 K. Philipp () · I. Gobeli-Egloff Pädagogische Hochschule Nordwestschweiz, Hofackerstr. 30, 4132 Muttenz, Schweiz E-Mail: kathleen.philipp@fhnw.ch K 174 K. Philipp, I. Gobeli-Egloff Fostering Diagnostic Competence in Primary Teacher Education – a Study of Recognizing Strengths and Weaknesses of Students in the Field of “Measurement” Abstract Diagnostic competence includes many different abilities that are highly relevant for practice. The ability to recognize the strengths and weaknesses of stu- dents is seen as fundamental for individual support of students. The diagnostic process can be understood as information processing in which it is necessary to in- terlink the (subject-related) knowledge and information from a diagnostic situation to recognize the strengths and weaknesses of students. A concept to foster this facet of diagnostic competence in the field of “measurement” was investigated with quan- titative methods regarding its effectiveness in an intervention study with pre-service teachers for primary school (N = 181). The results indicate that the facilitation of the recognition of strengths and weaknesses was successful and sustainable. A quali- tative analysis based on written documents from students was derived to examine the nature and the use of information in assessing the strengths and weaknesses of students. Main result of the qualitative analyses is a category system that sheds light on the nature of used information and which can possibly be transferred to other fields in the subject of mathematics. Overall, the results provide indications for the acquirement of diagnostic competence. Keywords Diagnostic competence · Conceptions of measurement · Intervention study · Teacher education 1 Einleitung Diagnostische Kompetenz hat in der Diskussion um professionelle Kompetenzen von Lehrkräften gegenwärtig einen hohen Stellenwert. Sie gilt als Voraussetzung dafür, Unterricht an die Bedürfnisse der Lernenden anpassen zu können (Anders et al. 2010;Helmke et al. 2004; Schwarz et al. 2008). Ihr wird damit eine zen- trale Bedeutung als Komponente der Professionalität von Lehrkräften beigemessen (von Aufschnaiter et al. 2015; Baumert und Kunter 2006;Helmke 2009;Weinert 2000). Die Anpassung des Unterrichts an die Lernvoraussetzungen der Lernenden wiederum wird als Voraussetzung für deren Lernerfolg gesehen (Schrader 2013). Diagnostische Kompetenz soll dabei helfen, einerseits Schwierigkeiten, andererseits aber auch Kompetenzen bzw. Potenziale von Lernenden zu identifizieren, um sie für eine adäquate individuelle Förderung nutzen zu können (Helmke 2009; Rösike und Schnell 2017). Die Fähigkeit, sowohl Stärken als auch Schwächen von Schülerinnen und Schülern zu erkennen, wird daher als Teil diagnostischer Kompetenz und als grundlegend für die Begleitung und Unterstützung von Lernprozessen im Sinne der individuellen Förderung aufgefasst. Das Erkennen von Stärken und Schwächen wird als Fähigkeit betrachtet, die einerseits das Identifizieren von fehlerhaften bzw. richti- gen Überlegungen von Schülerinnen und Schülern beinhaltet und andererseits deren Interpretation, beispielsweise auf welche dahinterliegenden (Fehl-)Vorstellungen ih- re Überlegungen verweisen können (Philipp 2018). Die Fähigkeit wird benötigt, K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 175 um den Grad des Verständnisses von Schülerinnen und Schülern zu erfassen und bildet die Voraussetzung dafür, angepasste Fördermaßnahmen ergreifen zu können, auch wenn sich aus einer Diagnose selbst nicht direkt Maßnahmen ableiten lassen (Moser Opitz und Nührenbörger 2015;Wember 1998). Das Ziel einer solchen Diag- nostik ist die Lernförderung (assessment for learning) im Gegensatz zur summativen Bewertung einer Leistung (assessment of learning) (Black und Wiliam 2009). Der vorliegenden Studie liegt die Annahme zugrunde, dass der Aufbau fachbezo- genen Wissens und die Auseinandersetzung mit praxisnahen diagnostischen Situa- tionen den Erwerb diagnostischer Kompetenz begünstigt. Konkret wird am Beispiel Größen untersucht, (1) inwiefern sich im Rahmen der Ausbildung von Lehrkräften für die Primarschule durch eine entsprechend gestaltete Intervention die Fähigkeit des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern för- dern lässt und (2) welche Informationen die Studierenden beim Diagnostizieren von Stärken und Schwächen von Schülerinnen und Schülern nutzen. Ziel des Beitrags ist es, das Verständnis des Aufbaus diagnostischer Kompetenz im Hinblick auf die benötigte Informations- und Wissensbasis zu erweitern. 2 Theoretischer Hintergrund 2.1 Diagnostische Kompetenz im Fach Mathematik Blömeke et al. (2015) betrachten Kompetenz als Kontinuum bzw. einen Prozess und schlagen ein Modell vor, das die Transformation von Kompetenz in Performanz über situationsbezogene Fähigkeiten der Wahrnehmung, Interpretation und Entschei- dungsfindung beschreibt. Diese Fähigkeiten vermitteln zwischen dem beobachtbaren Verhalten (Performanz) und den kognitiven und affektiv-motivationalen Personenei- genschaften. Bezogen auf diagnostische Kompetenz umfassen solche Personenei- genschaften Wissen, Einstellungen sowie affektive und motivationale Aspekte. Die situationsbezogenen Fähigkeiten sind abhängig von den Personeneigenschaften und führen zu beobachtbarem Verhalten in diagnostischen Situationen, z. B. diagnosti- schen Urteilen (vgl. Abb. 1). Damit bietet das Modell einen strukturellen Rahmen, der eine breite Auffassung von diagnostischer Kompetenz und verschiedene For- schungsansätze zulässt: (1) die Untersuchung von Personeneigenschaften, die ein erfolgreiches Agieren in diagnostischen Situationen ermöglichen (2) die Untersu- chung kognitiver Prozesse, die das Zustandekommen diagnostischer Urteile erklären und (3) die Untersuchung von diagnostischen Urteilen und Tätigkeiten von Lehr- kräften in Bezug auf das Lernen von Schülerinnen und Schülern (Leuders et al. 2018). Abb. 1 Diagnostische Kom- petenz als Kontinuum. (Aus: Leuders et al. 2018,S.9) K 176 K. Philipp, I. Gobeli-Egloff Je nach Untersuchungsgegenstand kann daher das Verständnis von diagnostischer Kompetenz und ihrer Bestandteile unterschiedlich sein (Förster und Karst 2017; Leuders et al. 2018). Eine dahingehend offene Definition liefert Weinert (2000): Di- agnostische Kompetenz kann verstanden werden als ein „Bündel von Fähigkeiten, um den Kenntnisstand, die Lernfortschritte und die Leistungsprobleme der einzelnen Schüler sowie die Schwierigkeiten verschiedener Lernaufgaben im Unterricht fort- laufend beurteilen zu können, sodass das didaktische Handeln auf diagnostischen Einsichten aufgebaut werden kann“ (Weinert 2000, S. 14 f.). In dieser Definition wird deutlich, dass verschiedene diagnostische Anforderungen auch verschiedene Fähig- keiten erfordern können. Dass es sich bei diagnostischer Kompetenz um ein „Bün- del“ von Fähigkeiten anstelle einer allgemeinen (fachübergreifenden) Kompetenz handelt, wird durch empirische Befunde untermauert (Brunner et al. 2011; Spinath 2005). In Anbetracht der großen Vielfalt an diagnostischen Situationen (Ingenkamp und Lissmann 2008; Karst et al. 2017) erscheint es plausibel, dass verschiedene Fähigkeiten erforderlich sind. Die Qualität eines diagnostischen Urteils wird meist mittels dessen Urteilsakku- ratheit bestimmt (Hoge und Coladarci 1989; Südkamp et al. 2012), d. h. es wird die möglichst genaue Übereinstimmung des Urteils einer Lehrkraft mit der tatsäch- lichen Merkmalsausprägung (z. B. Lösungshäufigkeit bei einer konkreten Aufgabe) betrachtet. Dies setzt voraus, dass das interessierende Merkmal gemessen werden kann. Im schulischen Kontext sind diagnostische Urteile jedoch häufig komplex und eine Einschätzung der Urteilsakkuratheit nicht sinnvoll möglich (van Ophuysen und Behrmann 2015). Beim Erkennen von Stärken und Schwächen von Schülerinnen und Schülern ist es wichtig, dass eine Lehrkraft anhand fachbezogener Kriteri- en möglichst viele Aspekte, die zu richtigen bzw. fehlerhaften Überlegungen und Lösungen führen können, berücksichtigen kann. Dazu muss sie diese sowohl identi- fizieren als auch interpretieren können (Philipp 2018). Das bedeutet einerseits, dass die Überlegungen der Schülerinnen und Schüler als richtig oder falsch beschrieben, aber darüber hinaus auch im Hinblick auf das zugrundeliegende mathematische Verständnis gedeutet werden müssen (Jacobs et al. 2010), wobei solche Deutun- gen durch angehende Lehrkräfte häufig noch ungenau und eher allgemein sind (Pott 2019). Vor diesem Hintergrund ist davon auszugehen, dass diagnostische Kompetenz domänen-, wenn nicht gar inhaltsspezifisch ist (z. B. Lorenz und Artelt 2009). Ins- besondere mit Blick auf das Ziel der individuellen Förderung spielen fachbezogene Aspekte bei einer Diagnose und damit das fachbezogene Wissen eine Rolle (Cher- nikova et al. 2020). Bei einer solchen Diagnose muss der (individuelle) Lernprozess der Schülerinnen und Schülern selbst fokussiert werden, der eine genaue Analyse des Lernstands ermöglicht, indem beispielweise Aussagen oder schriftliche Produk- te herangezogen werden. Prediger et al. (2012) sprechen in diesem Zusammenhang von „diagnostischer Tiefenschärfe“, die unter anderem auch fachdidaktisches Wissen wie beispielweise Wissen über Grundvorstellungen oder typische Fehlvorstellungen voraussetzt. Modelle zur Konzeptualisierung diagnostischer Kompetenz im Fach Mathema- tik verdeutlichen die enge Verknüpfung von diagnostischen und (fach)didaktischen Kompetenzen, mitunter scheinen sie kaum voneinander trennbar, was insbesonde- re bei der Erfassung diagnostischer Kompetenz herausfordernd sein kann (Kaiser K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 177 et al. 2017; Ufer und Leutner 2017). Bass und Ball (2004) identifizieren in ih- rer „job analysis“, einer Tätigkeitsanalyse von Lehrkräften im Mathematikunterricht der Primarschule, Kerntätigkeiten, die auch diagnostische Tätigkeiten enthalten (z. B. Lernprozesse evaluieren). In ihrem Modell zum Professionswissen von Mathematik- lehrkräften beschreiben sie verschiedene fachwissenschaftliche und fachdidaktische Wissensfacetten, die für diese Kerntätigkeiten relevant sind (Ball et al. 2008). Im COACTIV-Modell zur professionellen Kompetenz von Lehrkräften werden diag- nostische Fähigkeiten explizit mit fachdidaktischem Wissen in Verbindung gebracht (Wissen über das mathematische Denken von Schülerinnen und Schülern sowie Wissen über mathematische Aufgaben). Daneben wird ein Bereich pädagogischen Wissens, das Wissen um Leistungsbeurteilung, als weitere Wissensfacette genannt. Bei einer Diagnose (z. B. bei der Beurteilung von lern- und leistungsrelevanten Merkmalen von Schülerinnen und Schülern) müssen diese verschiedenen Wissens- facetten integriert werden (Brunner et al. 2011). Sie dienen damit als Voraussetzung für diagnostische Tätigkeiten. Insbesondere bei der Operationalisierung fachdidak- tischer bzw. diagnostischer Kompetenz wird in den genannten Ansätzen deutlich, dass diagnostische Kompetenz fachbezogenes Wissen erfordert, etwa bei der Ana- lyse typischer Fehler von Schülerinnen und Schülern oder bei der Einschätzung des diagnostischen Potenzials von Aufgaben. Beide Modelle betonen damit die Fach- spezifität diagnostischer Kompetenz. Es handelt sich um die Wissensbasis, die zur Bewältigung (fachspezifischer) diagnostischer Anforderungen erforderlich ist. Für die Förderung der Fähigkeit des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern bedeutet das, dass das benötigte fachbezogene Wissen im Rahmen der Intervention auf- bzw. ausgebaut werden muss, damit es in diagnos- tischen Situationen aktiviert werden kann. Diese Wissensbasis ist erforderlich, um Überlegungen und Lösungsansätze von Schülerinnen und Schülern deuten zu kön- nen. Dabei müssen Informationen aus Aussagen oder Lösungen von Schülerinnen und Schülern mit fachbezogenem Wissen verknüpft werden. Welche Informationen jedoch in einem diagnostischen Prozess herangezogen werden und wie sie verarbei- tet werden, ist noch weitgehend unklar (Leuders et al. 2020). Es wird angenommen, dass im Diagnoseprozess verschiedene kognitive Prozesse ablaufen. Informationen müssen wahrgenommen und interpretiert werden, um Entscheidungen treffen zu können (z. B. über die Relevanz von Informationen und deren Gewichtung). Diese Prozesse sind abhängig von in der Person liegenden Faktoren (z. B. Wissen und Einstellungen) und zeigen sich in beobachtbarem Verhalten (Blömeke et al. 2015; Leuders et al. 2020). Im Hinblick auf die Qualität der diagnostischen Urteile ist davon auszugehen, dass eine „hohe Urteilsqualität nur möglich ist, wenn adäqua- te Verarbeitungsprozesse stattfinden, die auf qualitativ hochwertigen diagnostischen Informationen basieren“ (van Ophuysen und Behrmann 2015, S. 89). 2.2 Diagnose als Informationsverarbeitungsprozess Die Sicht auf Diagnose als Prozess steht in der Tradition der psychologischen Ur- teilsforschung (Bless et al. 2004; Hastie und Dawes 2001). Im Kern stellen sich dabei Fragen nach der Art der verarbeiteten Informationen, der Informationsbeschaffung und der Verarbeitung von Informationen bei der Bildung eines Urteils. Informa- K 178 K. Philipp, I. Gobeli-Egloff tionsverarbeitungsprozesse stehen zwischen der Aufnahme von Informationen und einem Urteil. Eine wesentliche Grundannahme besteht darin, dass Urteile durch die Interaktion zwischen neu aufgenommenen Informationen und bereits vorhandenem Wissen gebildet werden (Plessner 2011). Das bedeutet, dass beispielweise Infor- mationen über Schülerinnen und Schülern aus Arbeitsprodukten oder aus einem Gespräch mit bereits vorhandenem fachdidaktischem Wissen verknüpft werden, um zu einer Diagnose zu gelangen. Die Heuristik in einem solchen Prozess kann als Verankerung und Anpassung gedeutet werden (Tversky und Kahneman 1974). Dabei werden Informationen als Anker für eine erste Annäherung zur Lösung eines Problems genutzt. Weitere In- formationen dienen dazu, diese erste Annäherung anzupassen. Nickerson (1999) beschreibt einen solchen Prozess bei der Einschätzung des Wissens eines Laien durch eine Expertin oder einen Experten, bei dem der Ausgangspunkt das eigene Wissen darstellt. Unter Berücksichtigung unterschiedlicher Informationen wird das Modell immer weiter modifiziert: Zunächst führen „unübliche Aspekte“ des eige- nen Wissens zu einer Adaption des Modells, die Expertin oder der Experte kann die eigene Expertise berücksichtigen. Im nächsten Schritt wird Wissen über die Zuge- hörigkeit zu einer Gruppe der anderen Person bzw. bereits vorhandenes Wissen über die andere Person berücksichtigt. Mit der Verarbeitung von neu hinzukommenden Informationen (z. B. in einem Gespräch) wird die Einschätzung des Wissens der an- deren Person weiter verfeinert (Nickerson 1999). Richtet man den Blick auf die Art der verschiedenen Informationen, die im Modell von Nickerson (1999) beschrieben werden, so wird deutlich, dass sie verschiedenen Ursprungs sind. Einerseits wird auf Informationen zurückgegriffen, über die die urteilende Person bereits verfügt, und andererseits werden Informationen genutzt, die im Prozess neu hinzukommen. Im Prozess der Bildung eines Urteils werden also Informationen aus unterschied- lichen Quellen integriert. Eine Diagnose hängt damit wesentlich vom Wissen der urteilenden Person ab, aber auch von der diagnostischen Situation, die die Art der In- formationen erheblich mitbestimmt. Folgt man dem Modell von Nickerson (1999), so nimmt insbesondere das eigene Wissen einen hohen Stellenwert ein. Es dient als Anker und damit als Voraussetzung für den Diagnoseprozess. Damit bildet es die Grundlage dafür, neue Informationen zu interpretieren (Tversky und Kahneman 1974). Bezogen auf fachbezogene diagnostische Prozesse ist daher davon auszuge- hen, dass das eigene fachbezogene Wissen eine bedeutende Rolle spielt. Allerdings geht es dabei nicht nur um Inhaltswissen, sondern insbesondere um Wissen über mathematisches Denken und Lernen von Lernenden. So konnte Ostermann (2018) zeigen, dass fachdidaktisches Wissen wie etwa typische (Fehl-)Vorstellungen von Schülerinnen und Schülern bei der Schwierigkeitseinschätzung von Aufgaben eine bedeutende Rolle spielt, aber auch fachliches Wissen, das für Lehrkräfte spezifisch ist (z. B. Grundvorstellungen). Während das eigene Wissen im Nickerson-Modell damit dem mathematischen Fachwissen entspricht, wird das spezifische fachliche Wissen als „unübliche Aspekte“ des eigenen Wissens verstanden. Wissen über die Wechselwirkung von Inhalt und Lernendem (wie z. B. typische Fehler von Schülerin- nen und Schülern) wird genutzt, wenn Wissen über die Zugehörigkeit einer Gruppe (z. B. Klassenstufe) berücksichtig wird (Ostermann 2018). Das Nutzen fachbezo- genen Wissens bei der Genese eines diagnostischen Urteils konnte, ebenfalls für K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 179 das Fach Mathematik, im Rahmen einer qualitativen Studie aufgezeigt werden. Die Funktion des eigenen (fachlichen) Wissens als Grundlage (Anker) für eine Diagnose zeigte sich darin, dass die befragten Lehrkräfte eigene Lösungsansätze nutzten, um Herausforderungen einer Aufgabe zu identifizieren. Außerdem griffen die Lehrkräfte beim Analysieren von Lösungen von Schülerinnen und Schülern auf verschiedene Aspekte fachbezogenen Wissens zurück, wie etwa Grundvorstellungen, typische Fehler oder Fehlkonzepte sowie mathematische Denkweisen und Strategien von Schülerinnen und Schülern (Philipp 2018). Grundsätzlich kann Diagnose also als Prozess betrachtet werden, bei dem Infor- mationen erfasst und verarbeitet werden, um zu einer Einschätzung eines Merkmals oder zu einer Entscheidung zu gelangen (van Ophuysen und Behrmann 2015). Die Informationsbasis umfasst Informationen aus diagnostischen Situationen und aus ei- genem (fachbezogenen) Wissen. Allerdings ist bislang noch wenig darüber bekannt, wie genau diagnostische Prozesse und solche Wissensressourcen zusammenwirken. Das Modell von Nickerson (1999) liefert einen allgemeinen Ansatz, das Zusammen- spiel von diagnostischem Prozess und der Nutzung von Wissensarten zu beleuchten. Welche Informationen beim Erkennen von Stärken und Schwächen von Schülerin- nen und Schülern genutzt werden, ist Gegenstand der Untersuchung. 2.3 Erwerb diagnostischer Kompetenz Aufgrund der hohen Bedeutung für die Unterrichtsqualität, die diagnostischer Kom- petenz zugeschrieben wird, erscheint deren Förderung und Verbesserung zentral für das Lernen von Schülerinnen und Schülern (z. B. Schrader 2013). Es liegt die An- nahme zugrunde, dass sich eine höhere diagnostische Kompetenz positiv auf die Unterrichtsqualität und somit auch auf Leistungen von Schülerinnen und Schülern auswirkt, indem beispielweise Schwierigkeiten von Schülerinnen und Schülern früh- zeitig erkannt werden (Anders et al. 2010;Helmke et al. 2004;Helmke 2009). Diagnostische Kompetenz gilt als prinzipiell erlernbar, auch wenn die genauen Bedingungen des Erwerbs diagnostischer Kompetenz noch unklar sind (Herppich et al. 2017;Krauss et al. 2008). In diesem Zusammenhang stellt sich die Frage, wie diagnostische Kompetenz gefördert bzw. überhaupt erworben werden kann. Be- trachtet man Konzepte zur Förderung diagnostischer Kompetenz, so lassen sich zahlreiche Interventionsstudien finden, die die Entwicklung diagnostischer Kompe- tenz durch den Aufbau spezifischen Wissens für diagnostische Situationen anregen, beispielweise in themenspezifischen Fortbildungen für Lehrkräfte (z. B. Busch et al. 2015). Ansätze zur Förderung diagnostischer Prozesse nehmen die gezielte Samm- lung und theoriegeleitete Verarbeitung von diagnostischen Informationen in den Blick, beispielweise durch das Führen diagnostischer Interviews (Clarke et al. 2018; Wollring et al. 2013). Gemeinsam ist diesen Ansätzen die Annahme, dass sich dia- gnostische Kompetenz durch die Verknüpfung von theoretischem Wissen einerseits und reflektierter Praxiserfahrung andererseits erwerben lässt (Hascher 2008). Damit sind beispielsweise das Arbeiten an Beispielen oder tatsächliche Praxiserfahrungen im Rahmen der Ausbildung von Lehrkräften gemeint, die systematisch reflektiert werden. Solche praxisnahen Erfahrungen als „approximations of practice“ bilden insbesondere in der Ausbildung von Lehrkräften häufig Lernanlässe (Grossman und K 180 K. Philipp, I. Gobeli-Egloff McDonald 2008, S. 190). Chernikova et al. (2020) stützen diese Sichtweise in Be- zug auf diagnostische Kompetenz: Das fachbezogene Wissen von Lehrkräften spielt eine Rolle bei der Förderung diagnostischer Kompetenz, es wird gesehen als „prere- quisite for further development of skills and competences“ (Chernikova et al. 2020, S. 160), d. h. es beeinflusst die Entwicklung diagnostischer Kompetenz. Dabei sol- len Möglichkeiten zu praktischen Erfahrungen mit diesem Wissen verknüpft werden: „practice opportunities, combined with sufficient professional knowledge, can faci- litate diagnostic competences in higher education“ (Chernikova et al. 2020, S. 161). Weiterhin stellen die Autorinnen und Autoren förderliche Aspekte im Rahmen von Scaffolding heraus wie das angeleitete Arbeiten an Beispielen, Bereitstellung von „Prompts“ (Lernhinweisen), die Übernahme einer bestimmten Rolle sowie die Be- deutung von Reflexionsphasen. Daraus lässt sich für die vorliegende Studie ableiten, dass authentische diagnostische Situationen und Beispiele Praxiserfahrungen ermög- lichen, die angeleitet und mit theoretischem Wissen verknüpft sowie reflektiert wer- den müssen, um den Aufbau diagnostischer Kompetenz zu fördern. Insbesondere kann die Förderung diagnostischer Kompetenz besonders wirksam sein, wenn in- teraktionsbasierte diagnostische Situationen einbezogen werden (Chernikova et al. 2020). Mit Blick auf Informationsverarbeitungsprozesse lassen sich je nach Experti- segrad Unterschiede finden, die weitere Hinweise auf den Erwerb diagnostischer Kompetenz geben können. Kellman und Massey (2013) stellen zusammenfassend fest, dass Novizinnen und Novizen eher alle verfügbaren Informationen beachten, während Expertinnen und Experten relevante Informationen auswählen können und nicht relevante Informationen ausblenden. Außerdem verarbeiten Novizinnen und Novizen eher einzelne Aspekte nacheinander und können noch nicht größere Zu- sammenhänge oder Strukturen bilden (Kellman und Massey 2013). Begründen lassen sich solche Unterschiede auch durch das unterschiedliche Wissen, wobei es nicht nur um „mehr“ Wissen geht, sondern auch darum, dass das Wissen besser organi- siert werden kann (z. B. Bromme 2008). In Bezug auf Mathematik wird berichtet, dass angehende Lehrkräfte Schwierigkeiten damit haben, Lösungen von Schülerin- nen und Schülern zu interpretieren, wobei ihr eigenes mathematisches Wissen eine bedeutende Rolle spielt (Stahnke et al. 2016). Für die Förderung des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern könnte das bedeuten, dass die Auswahl von Informationen anhand fachbezogener Kriterien gezielt unterstützt werden muss. Bei der Entwicklung von diagnostischer Kompetenz ist von einem längerfristi- gen Lernprozess auszugehen, der eine kontinuierliche Auseinandersetzung mit dia- gnostischen Fragen erfordert. In der Ausbildung von Lehrkräften kann der Erwerb diagnostischer Kompetenz angebahnt werden, im Rahmen der Berufstätigkeit wird sie weiter ausgebaut (Buholzer und Zulliger 2013; Chernikova et al. 2020; Hascher 2008). Wichtig für die Kompetenzentwicklung ist, dass die Vielzahl an diagnosti- schen Situationen, mit denen Lehrkräfte im Alltag konfrontiert sind, und ihre Be- wältigung nicht unreflektiert bleibt. Die Förderung diagnostischer Kompetenz ist somit in allen Phasen der Ausbildung, aber auch in der Fortbildung von Lehrkräften möglich. K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 181 3 Ziele der Studie und Forschungsfragen Die hier berichtete Interventionsstudie zielt auf die Förderung diagnostischer Kom- petenz im Rahmen der Ausbildung von Lehrkräften für die Primarschule. Im Fo- kus steht eine zentrale Fähigkeit (als Teilfähigkeit diagnostischer Kompetenz) bei der Beurteilung mathematischer Kompetenzen von Schülerinnen und Schülern, das Erkennen von Stärken und Schwächen. Die Entwicklung diagnostischer Kompe- tenz soll einerseits durch die Vermittlung fachbezogenen Wissens zum Inhaltsbe- reich Größen und andererseits durch die Auseinandersetzung mit unterschiedlichen diagnostischen Situationen (Aufgabenanalyse, Analyse von Arbeitsprodukten von Schülerinnen und Schülern, Analyse von Videos und Führen eines diagnostischen Interviews) und deren systematische Reflexion angeregt werden. Damit soll auch der Breite der verschiedenen Quellen für diagnostische Informationen Rechnung getragen werden (Chernikova et al. 2020). Zunächst soll in einem quasi-experimentellen Setting geklärt werden, ob die För- derung der genannten Teilfähigkeit diagnostischer Kompetenz gelingt. Es wird davon ausgegangen, dass die Intervention die Entwicklung der Fähigkeit des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern positiv beeinflusst. Nach- dem sich in bisherigen Befunden meist kurzfristige Wirkungen aufzeigen ließen (Karing und Seidel 2017), ist auch die Frage nach der Nachhaltigkeit einer solchen Förderung von Relevanz: 1. Lässt sich die Fähigkeit des Erkennens von Stärken und Schwächen von Schü- lerinnen und Schülern durch die Vermittlung fachbezogenen Wissens und durch die Konfrontation mit verschiedenen diagnostischen Situationen prinzipiell und nachhaltig fördern? Da das vermittelte Wissen beim Erkennen von Stärken und Schwächen von Schü- lerinnen und Schülern in einem Informationsverarbeitungsprozess mit Informationen aus einer diagnostischen Situation verknüpft werden muss und es Hinweise darauf gibt, dass angehende Lehrkräfte damit Schwierigkeiten haben, soll explorativ unter- sucht werden, welche Informationen die Studierenden nutzen: 2. Auf welche Informationen beziehen sich die Studierenden bei der schriftlichen Analyse eines selbst durchgeführten diagnostischen Interviews? 3. Welche Informationen werden bei der Formulierung und Begründung von Stärken und Schwächen von Schülerinnen und Schülern miteinander verknüpft? 4 Förderung und Untersuchung diagnostischer Kompetenz 4.1 Design In einer quasi-experimentellen Studie wurde eine Intervention im Umfang von fünf Seminarsitzungen à 90 min im Rahmen regulärer Lehrveranstaltungen durchgeführt, die die Förderung fachbezogenen Wissens als Basis für das Erkennen von Stärken K 182 K. Philipp, I. Gobeli-Egloff Abb. 2 Design der Studie und Schwächen von Schülerinnen und Schülern (als Teilfähigkeit diagnostischer Kompetenz) im Bereich Größen beinhaltete (vgl. Abb. 2). Eine Kontrollgruppe nahm in der gleichen Zeit an einer Lehrveranstaltung zum Thema „Diagnose, Förderung und Beurteilung“ ohne inhaltlichen Bezug zum Thema Größen teil. Die Gruppen unterschieden sich damit hinsichtlich der Spezifität des thematisierten fachdidak- tischen Wissens, gemeinsam ist ihnen die Auseinandersetzung mit diagnostischen Fragestellungen. Ein weiteres Unterscheidungsmerkmal der beiden Gruppen war das Führen eines diagnostischen Interviews mit einer Schülerin oder einem Schü- ler der Primarstufe als Bestandteil der Intervention. Das Interview wurde von den Studierenden vor dem zweiten Messzeitpunkt geführt und ausgewertet. Zur Erfassung diagnostischer Kompetenz wurde ein Testinstrument entwickelt, das zu drei verschiedenen Messzeitpunkten eingesetzt wurde. Neben der Wirksam- keit der Intervention (Forschungsfrage 1) wurde die Verwendung von Informationen der Studierenden der Experimentalgruppe untersucht (Forschungsfragen 2 und 3), indem schriftliche Dokumente der Studierenden (Analyse des selbst durchgeführten diagnostischen Interviews) inhaltsanalytisch ausgewertet wurden. 4.2 Stichprobe Die Stichprobe (N = 181) bildeten Studierende des Studiengangs Bachelor Primarstu- fe an der Pädagogischen Hochschule Nordwestschweiz. Davon waren 142 weiblich und 39 männlich. Das durchschnittliche Alter der Studierenden betrug 24,3 Jahre (SD= 4,40). Die Lehrveranstaltungen konnten von Studierenden ab dem 3. Semester belegt werden, die bereits die Einführungsveranstaltung in die Mathematikdidak- tik erfolgreich abgeschlossen hatten. Alle Studierenden stimmten einer Teilnahme an einem Forschungsprojekt im Rahmen der regulären Lehrveranstaltung zu (oh- ne Kenntnis über die Gruppenzuteilung), indem sie sich für eine der angebotenen Lehrveranstaltungen anmeldeten. An der Intervention nahmen insgesamt 98 Studie- rende teil, in der Kontrollgruppe waren es 83 Studierende. Die Lehrveranstaltungen waren Wahl-Pflichtveranstaltungen für die Studierenden. Bei den Lehrveranstaltun- gen handelte es sich um Seminare mit maximal 30 zugelassenen Studierenden. Vier Lehrveranstaltungen waren der Experimentalgruppe zugeordnet, die von derselben Dozentin durchgeführt wurden, während die Kontrollgruppe auf vier weitere Semi- nare mit insgesamt drei verschiedenen Dozierenden verteilt war. K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 183 4.3 Intervention Aufgrund der Annahme, dass das eigene fachbezogene Wissen in diagnostischen Situationen eine bedeutende Rolle spielt und für das Erkennen von Stärken und Schwächen von Schülerinnen und Schülern grundlegende Voraussetzung ist, war fachdidaktisches Wissen wesentliches Element der Intervention. Als Inhaltsbereich wurden Größen gewählt, weil sie einen unmittelbaren Bezug zur Lebenswelt haben und als „Verbindung von arithmetischen und geometrischen Inhalten und Kompe- tenzen“ (Peter-Koop und Nührenbörger 2008, S. 89) eine bedeutende Rolle im Ma- thematikunterricht spielen. Außerdem wurde in diesem Bereich das fachdidaktische Vorwissen der Studierenden als geringer eingeschätzt als in Bezug auf arithmetische Inhalte, die im ersten Studienjahr sowohl in der Fachdidaktik als auch in der Fach- wissenschaft im Zentrum stehen, sodass (unerwünschte) Wechselwirkungen hätten entstehen können. Hinzu kommt, dass zahlreiche Studierende in der deutschsprachi- gen Schweiz bereits ab Studienbeginn als Lehrkräfte tätig sind und vorwiegend im Bereich Arithmetik Praxiserfahrungen sammeln, die zu Unterschieden im Vorwissen hätten führen können. Die Studierenden setzten sich im Rahmen der Intervention mit allen in der Primarstufe in der Schweiz vorkommenden Größenbereichen (Längen, Zeit, Geld, Gewichte, Hohlmaße und Flächeninhalte) auseinander. Es ging um den Aufbau von Größenvorstellungen, die Behandlung von Größen im Unterricht, Her- ausforderungen der verschiedenen Größenbereiche sowie typische Schwierigkeiten und Vorstellungen von Schülerinnen und Schülern. Durch die Analyse von Aussagen und Lösungen von Schülerinnen und Schülern und durch die originale Begegnung mit einer Schülerin oder einem Schüler der Primarstufe in einem diagnostischen Interview wurde die Nutzung fachbezogenen Wissens in diagnostischen Situationen angeregt. Leitende Gestaltungsprinzipien der Intervention waren die Auseinandersetzung mit Aufgabenanforderungen, dem diagnostischen Potenzial von Aufgabenstellungen und Aussagen und Lösungen von Schülerinnen und Schülern in Form von Videos oder schriftlichen Dokumenten, die ein mehrfaches Betrachten und eine vertiefte Analyse erlaubten. Ergänzend wurde das geführte (und videografierte) diagnosti- sche Interview von den Studierenden analysiert. Dazu wurde der Größenbereich Gewichte ausgewählt, da dieser insbesondere beim Aufbau von Größenvorstellun- gen große Herausforderungen für Schülerinnen und Schüler mit sich bringt: So sind Gewichte nur in einem kleinen Bereich erfahrbar, da sehr kleine Gewichte kaum noch unterscheidbar sind und Gegenstände für Kinder recht schnell zu schwer werden, was den Aufbau von Größenvorstellungen erschwert. Auch kann das unter- schiedliche Druckgefühl von Gegenständen bei der Wahrnehmung von Gewichten per Hand zu falschen Einschätzungen führen. Hinzu kommt, dass Gewichte nicht visuell wahrnehmbar sind, d. h. die Größe des Gegenstands lässt keinen Rückschluss auf sein Gewicht zu (Bräunling und Reuter 2015; Franke und Ruwisch 2010;Reu- ter 2011). Ziel des diagnostischen Interviews für die Studierenden war es, Stärken Umgangssprachlich und auch im Mathematikunterricht werden „Gewicht“ und „Masse“ gleichbedeu- tend verwendet. Auch wenn das physikalisch nicht korrekt ist, wird der Begriff „Gewicht“ auch in Anleh- nung an fachdidaktische Literatur beibehalten. K 184 K. Philipp, I. Gobeli-Egloff und Schwächen des Kindes in Bezug auf Größenvorstellungen im Bereich Gewichte zu benennen und mit Bezug auf Aussagen oder Lösungen des Kindes zu begrün- den. Dazu standen den Studierenden acht Aufgaben mit diagnostischem Potenzial zur Verfügung, die sie im Interview einsetzten. Dieses dauerte ca. 45 min und wur- de nicht im Rahmen der fünf Seminarsitzungen durchgeführt und ausgewertet. Eine schriftliche Bearbeitung (eigene Lösung) und Analyse des diagnostischen Potenzials der Aufgaben im Vorfeld diente der vertieften Auseinandersetzung mit fachbezoge- nen Kriterien zu Größenvorstellungen bei Gewichten. Die schriftliche Dokumen- tation der Studierenden bestand aus insgesamt vier Teilen: einem (vorbereitenden) Interviewleitfaden, einer Analyse der Aussagen und Lösungen des Kindes (aufga- benweise), einer Rückmeldung an die unterrichtende Lehrkraft und einer Reflexion des eigenen Verhaltens im Interview. 4.4 Instrumente Die eingesetzten Instrumente unterscheiden sich hinsichtlich der diagnostischen Si- tuation. Das eingesetzte Testinstrument zur Überprüfung der Wirksamkeit der Inter- vention enthielt schriftliche Lösungen von verschiedenen Schülerinnen und Schü- lern, die die Studierenden einschätzen sollten. Dies ermöglichte einen direkten Ver- gleich der Analysen der Studierenden pro Aufgabe hinsichtlich der genannten Stär- ken und Schwächen der Schülerinnen und Schüler und deren Interpretationen. Die Analyse der diagnostischen Interviews ermöglichte dagegen eine umfassende Beur- teilung der Kompetenzen eines einzelnen Kindes über mehrere Aufgaben hinweg. Der Fokus der Auswertung lag hier auf den Informationen, die bei der Analyse eines Gesprächs mit einer „echten“ Schülerin oder einem Schüler genutzt wurden. Bei beiden Instrumenten war das Diagnoseziel für die Studierenden dasselbe: Die Stärken und Schwächen von Schülerinnen und Schülern in Bezug auf Größenvorstel- lungen im Bereich Gewichte sollten benannt und aufgrund der jeweiligen Datenlage begründet werden. 4.4.1 Testinstrument Zur Überprüfung der Wirksamkeit der Intervention (Forschungsfrage 1) wurde ein Testinstrument entwickelt. Ziel war es, Veränderungen der Fähigkeit, Stärken und Schwächen von Schülerinnen und Schülern zu erkennen, zu erfassen. Die Studieren- den sollten anhand schriftlich vorliegender Aufgabenlösungen von Schülerinnen und Schülern der Primarstufe (4. Klasse) zu zehn Aufgaben zu Größenvorstellungen von Gewichten (1) richtige und fehlerhafte Überlegungen identifizieren sowie (2) die Lösungen der Schülerinnen und Schüler interpretieren (z. B. mögliche Ursachen nennen). Die Aufgaben waren so konzipiert, dass Teilkompetenzen für Größenvor- stellungen umfassend abgedeckt waren (Franke und Ruwisch 2010;Reuter 2011; Schipper 2009): Standardeinheiten kennen; Größen vergleichen, messen und schät- zen; Repräsentanten für Standardeinheiten kennen; Größenangaben umwandeln und deren Invarianz erkennen. Als Antwortformat wurden offene Items gewählt. Bei der Auswahl der Lösungen von Schülerinnen und Schülern für das Testinstrument wur- K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 185 de darauf geachtet, dass der Interpretationsspielraum groß war, um möglichst viele (plausible) Vermutungen zu Fehlerursachen zuzulassen. 4.4.2 Schriftliche Dokumente der Studierenden (Analysen diagnostischer Interviews) Im Rahmen der Intervention führten alle Studierenden der Experimentalgruppe ein diagnostisches Interview mit einer Schülerin oder einem Schüler der Primarstufe der Klassenstufen 3 bis 5 durch. Dazu erhielten sie ein Set von acht Aufgaben mit diagnostischem Potenzial (vgl. Emmrich 2008; Prediger et al. 2017), d. h. bei der Bearbeitung der Aufgaben sollten sowohl Vorstellungen als auch Lösungswege der Lernenden sichtbar werden, die Rückschlüsse auf deren Größenvorstellungen zu Gewichten zuließen. Die Auswertung der diagnostischen Interviews durch die Studierenden erfolgte schriftlich und beinhaltete mehrere Teile (vgl. Abschn. 4.3). Die schriftlichen Dokumente der Studierenden dienten als Datengrundlage zur Un- tersuchung der Frage nach der Verwendung von Informationen bei der Diagnose (Forschungsfragen 2 und 3). Dazu wurde ausschließlich ein Teil der schriftlichen Dokumente, die Analyse der Aussagen und Lösungen des Kindes, herangezogen. Die Verwendung von Informationen konnte so differenziert betrachtet werden: auf welche Informationen die Studierenden bei der Analyse zurückgriffen und welche sie bei der Formulierung und Begründung von Stärken und Schwächen nutzten. 4.5 Auswertung 4.5.1 Wirksamkeit der Intervention Die Fähigkeit des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern wurde bei der Auswertung den zwei Bereichen Stärken/Schwächen identi- fizieren (Wert I) und Stärken/Schwächen interpretieren (Wert II) zugeordnet: Stärken und Schwächen zu benennen wird als erster wichtiger Schritt im Diagnoseprozess aufgefasst (identifizieren). Interpretieren zu können, auf welche Teilkompetenzen von Größenvorstellungen (vgl. Abschn. 4.4.1) die Lösung der Schülerinnen und Schüler Rückschlüsse zulässt, setzt voraus, dass tieferliegende Strukturen in ihnen erkannt werden. Die Anzahl der schlüssigen Antworten der Studierenden wurden für die Auswertung herangezogen. Dahinter steckt die Überlegung, dass auf der Basis einzelner Arbeitsprodukte von Schülerinnen und Schülern keine eindeutige Diagno- se gestellt werden kann. Insofern war für die Qualität der Diagnose maßgebend, dass die Studierenden möglichst viele Stärken und Schwächen identifizieren konn- ten und dazu auch mögliche Ursachen (hypothetisch) breit benennen konnten. Jede korrekt als fehlerhaft oder richtig identifizierte Überlegung bzw. Lösung wurde mit einem Punkt bewertet. Ebenso wurde jede schlüssige interpretierende Aussage mit einem Punkt bewertet. Sinngemäß gleiche Aussagen wurden nur einfach gewertet. Anschließend wurden die Punkte summiert. Eine Maximalpunktzahl pro Aufgabe war nicht festgelegt. In Abb. 3 ist ein Beispielitem und eine Studierendenantwort sowie deren Aus- wertung dargestellt: Die oder der Studierende identifiziert die Gewichtsangabe für K 186 K. Philipp, I. Gobeli-Egloff Abb. 3 Beispielitem und Aus- wertung der Studierendenant- wort (Hervorhebungen nachträg- lich hinzugefügt) die Butter als richtig und die für die Kuh als „deutlich überschätzt“. Diese Iden- tifikationen wurden mit 2 Punkten bewertet (Wert I). Des Weiteren gibt die oder der Studierende an, dass das Kind in der Lage ist, Vergleiche anzustellen, da es den Stuhl mit der Butter vergleicht. Diese Interpretation ergab 1 Punkt (Wert II). Dass das Kind aufgeweckt sei, wurde nicht bewertet, da dies eine Aussage über einen Charakterzug des Kindes ist. Ebenso wurde die Wiederholung der Antwort der Schülerin oder des Schülers nicht gewertet, da sie keine Interpretation enthält. Insgesamt wurden hier also 3 Punkte vergeben. Die Güte des Testinstruments wurde mittels einer Itemanalyse überprüft. Dazu wurden die Werte des Posttests verwendet, um die größtmöglichen Unterschiede in den Antworten der Studierenden als Auswirkung der Intervention zu erfassen. In Tab. 1 sind Spannweite, Mittelwert und die Standardabweichung jedes Items abge- bildet sowie Itemschwierigkeit und Trennschärfe. Die Trennschärfe wurde für jedes Item der Skala berechnet. Weil Item 8 einen sehr tiefen Wert (r = 0,311) aufwies, it wurde es (nach Prüfung der inhaltlichen Validität der verbliebenen Items) elimi- niert. Die Trennschärfen der restlichen neun Items lagen zwischen r = 0,343 und it r = 0,590, was als „mittelmäßig“ eingeordnet werden kann (Döring und Bortz 2016). it Für die Bestimmung der Itemschwierigkeit wurde der Maximalwert als Durchschnitt K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 187 Tab. 1 Überprüfung der Güte der Items N Mini- Maxi- Mittel- Std. Abwei- Itemschwie- Trenn- mum mum wert chung rigkeit (%) schärfe Item 1 181 0 15 6,34 2,942 52 0,475 Item 2 181 1 18 7,70 3,064 54 0,522 Item 3 181 0 17 5,86 3,229 50 0,379 Item 4 181 1 16 6,60 2,586 56 0,554 Item 5 181 0 13 5,14 2,703 50 0,590 Item 6 181 0 12 4,42 1,773 57 0,523 Item 7 181 0 8 3,59 1,570 54 0,346 Item 8 181 1 10 4,44 1,967 53 0,311 Item 9 181 1 8 4,07 1,362 61 0,343 Item 10 181 0 6 3,66 1,312 62 0,415 der Summe der erreichten Punkte der besten 10 % der Studierenden pro Item berech- net. Die Itemschwierigkeit aller Items lag zwischen 50 und 62 % und somit in einem gewünschten Bereich (Döring und Bortz 2016). Mit dem Ausschluss von Item 8 lag das Reliabilitätsmaß der Skala, der Alpha-Koeffizient von Cronbach, bei 0,764. Die Unterschiede in der Standardabweichung der verschiedenen Items lassen sich dadurch erklären, dass bei den Aufgaben die Anzahl der oben genannten Teilkom- petenzen, zu denen eine Aussage gemacht werden konnte, variierte. 4.5.2 Verwendung von Informationen Um Forschungsfrage 2 zu beantworten, auf welche Informationen sich die Studie- renden in ihrer Analyse beziehen, wurden Kategorien entwickelt. Diese geben Auf- schluss über die Informationsbasis, auf deren Grundlage eine Diagnose zustande kommt. Die Kategorien sollten die ganze Breite an unterschiedlichen Informatio- nen widerspiegeln. Das Zusammenspiel verschiedener Kategorien sollte nachfolgend anhand der deduktiv und induktiv gebildeten Kategorien analysiert werden (For- schungsfrage 3). Als methodischer Zugang wurde eine inhaltlich-strukturierende Inhaltsanalyse (Kuckartz 2016;Mayring 2010) gewählt. Ziel dieser Vorgehenswei- se ist es, zentrale Aspekte zu identifizieren und das Datenmaterial anhand dieser Aspekte systematisch zu beschreiben. Das Verfahren ist gekennzeichnet durch in- terpretatives Vorgehen und das Merkmal der Kategoriengeleitetheit (Mayring und Fenzl 2019). Das Vorgehen im Rahmen der berichteten Studie orientiert sich am Ab- laufschema von Kuckartz (2016), da es der induktiven Entwicklung von Kategorien ein größeres Gewicht beimisst, während das Modell von Mayring (2010) stärker auf die deduktive Entwicklung von Kategorien ausgerichtet ist. Das Vorgehen wurde modifiziert und an die Bedürfnisse der Studie angepasst: 1. Die Entwicklung der Hauptkategorien erfolgte deduktiv, d. h. die Kategorien wur- den auf der Basis theoretischer Vorüberlegungen gebildet. Das beinhaltete die Un- terscheidung von Informationen, die die Studierenden zur Verfügung hatten (ver- K 188 K. Philipp, I. Gobeli-Egloff Tab. 2 Kategoriensystem zur Analyse der Informationsnutzung bei der Diagnose Haupt- Sub- Beschreibung Ankerbeispiel kategorie kategorien V: V1: Indi- Ein fachbezogenes Kriterium „Wenn sie diese jedoch schät- Verfügbare katoren für wird genannt wie Messinstru- zen muss, fällt es ihr schwer auf Information Größenvor- mente kennen, passende Maß- Stützpunktvorstellungen zurückzu- stellungen einheiten finden, passende Re- greifen“ (DIa_S1, S. 11: 1550) präsentanten finden, Gewichte vergleichen und ordnen, über Stützpunktvorstellungen ver- fügen, Beziehungen zwischen Maßeinheiten oder Invarianz von Gewichten erkennen V2: Her- Typische Schwierigkeiten wer- „Ihr war nicht klar, dass das Ge- ausforde- den genannt wie die visuelle wicht visuell nicht wahrnehmbar rungen bei Wahrnehmbarkeit von Gewich- ist und somit die Grösse keinen Gewichten ten oder das Problem geringer Ruckschluss auf das Gewicht zu- Gewichtsunterschiede sowie der lässt.“ (DIa_S1, S. 11: 1814) begrenzte Erfahrungsbereich bei Gewichten V3: Mathe- Fachbezogene Aspekte über Ma- „[...] dass oftmals im Mathema- matikunter- thematikunterricht, Lehrmittel tikunterricht das Rechnen mit richt oder Lehrpläne werden genannt Grössen fokussiert wird. Folg- lich können die Schülerinnen und Schüler schon recht früh Einheiten umrechnen, ohne jedoch genaue- re Vorstellungen zu haben, was die Masseinheiten beinhalten.“ (DId_S11, S. 8: 535) fügbare Information), und den Informationen, die sie der Interviewsituation mit der Schülerin oder dem Schüler entnahmen (neu hinzukommende Information). 2. Die schriftlichen Dokumente (Analysen diagnostischer Interviews) der Studieren- den (N = 98) wurden in einer ersten Kodierung anhand der beiden Hauptkategorien grob kodiert. 3. Für die weitere Feinanalyse (Bildung von Subkategorien) wurden insgesamt 12 Dokumente aufgrund verschiedener Kriterien ausgewählt. Es wurde darauf geachtet, dass Studierende aus allen vier Lehrveranstaltungen sowie männlichen und weiblichen Geschlechts vertreten sind. Zudem sollten alle acht Aufgaben im Interview eingesetzt worden sein. Schließlich richtete sich die Anzahl der Inter- views danach, dass im Verlauf des Kodierprozesses keine neuen Aspekte mehr hinzukamen (theoretische Sättigung). 4. Die Subkategorien wurden sowohl deduktiv als auch induktiv (am Material), ge- leitet durch die Forschungsfrage, gebildet. Dazu gehörte der Bezug zu Informa- tionen, die die Studierenden in ihrer Analyse nutzten, beispielsweise der Bezug zu fachbezogenen Kriterien zu Größenvorstellungen von Gewichten, die Bestand- teil der Intervention waren und zur deduktiven Kategorienbildung genutzt wurden (als Subkategorien zur Hauptkategorie verfügbare Informationen). In einer zwei- ten Kodierung wurde das Material anhand der Subkategorien kodiert und das Ka- tegoriensystem fortlaufend angepasst. K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 189 Tab. 2 (Fortsetzung) Haupt- Sub- Beschreibung Ankerbeispiel kategorie kategorien N:Neu N1: Richti- Eine korrekte Antwort oder „Sie schätzte die 3900g korrekt hinzukom- ge Lösung Lösung wird genannt für das Gewicht eines Neugebore- mende nen.“ (DIc_S8, S. 8: 2673) Information N2: Fehler Ein Fehler oder eine Fehlüberle- „Bei dieser Aufgabe liegt er mit gung des Kindes wird genannt seinen angegebenen Gegenständen meistens falsch.“ (DIb_S5, S. 6: 388) N3: Bei- Ein Beispiel des Kindes wird „Bei der Frage, woher er die Ge- spiel genannt wichte kenne, kamen Aussagen, wie: ,Mein Cousin, der ein Jahr alt ist, wiegt 10kg.‘“ (DIa_S3, S. 6: 895) N4: Argu- Eine Begründung des Kindes „Er antwortet: ,Also erstens ist ment wird genannt, beispielweise in einem Brötchen viel Luft und warum ein Gegenstand schwer zweitens besteht die Münze aus oder leicht ist Metall, und Metall ist schwer.‘“ (DIa_S2, S. 7: 2776) N5: Stra- Das strategische Vorgehen des „In Aufgabe zwei vergleicht sie tegisches Kindes wird beschrieben wie das die Gegenstände untereinander Vorgehen Vergleichen, Abschätzen, Raten und im Vergleich mit Stützpunkt- oder das Zuordnen von Gewicht vorstellungen und erstellt einer und Größe des Gegenstandes imaginären Rangfolge nach Ge- wicht.“ (DIb_S4, S. 8: 2111) N6: Bear- Aspekte bezüglich der Bearbei- „[...] auffällig, dass F. lange zögert beitungs- tung werden genannt wie das um einzelne Gegenstände für die verhalten Revidieren der Lösung, Nach- Standardgrössen zu bestimmen.“ fragen des Kindes, Zeigen von (DIb_S5, S. 6: 110) (Un-)Sicherheit, Reihenfolge der Bearbeitung und Bearbeitungs- dauer N7: Vor- Aspekte aus dem Vorwissen „Der Umgang mit der Küchen- wissen des Kindes werden genannt wie waage kenne er vom Kochen mit Alltagserfahrung, Messerfah- seiner Mutter, [...]“ (DIc_S7, S. 6: rung und Erfahrungen aus dem 1707) Unterricht 5. Um die Stabilität des Kodierens zu gewährleisten, wurde nach Abschluss der Ana- lyse mit einem Abstand von drei Wochen ein Teil des Materials (25 %) erneut ko- diert, um die Intrakoderübereinstimmung (κ = 0,92, nach Brennan und Prediger 1981) sicherzustellen (Rädiker und Kuckartz 2019). 6. Bezüglich der Forschungsfrage 3 wurden Zusammenhänge zwischen Kategorien untersucht. Dazu wurden Muster im Auftreten der Kategorien untersucht. Umge- setzt wurde dieser Auswertungsschritt über die Untersuchung von Beziehungen zwischen den Kategorien anhand der Überschneidungen (gemeinsames Auftreten von Kategorien) in einem Textabschnitt (Rädiker und Kuckartz 2019). Zu diesem Zweck wurde die Formulierung von Stärken und Schwächen von Schülerinnen und Schülern und deren Begründung ergänzend kodiert. K 190 K. Philipp, I. Gobeli-Egloff Bei der Entwicklung des Kategoriensystems stand die Frage, auf welche Informa- tionen die Studierenden in ihrer Analyse Bezug nehmen, im Zentrum (vgl. Tab. 2). Die Frage nach der Nutzung von Informationen, etwa bei der Formulierung von Hypothesen zu Stärken und Schwächen des interviewten Kindes, wurde anhand von Analysen der Beziehungen der Kategorien untersucht. 5 Ergebnisse 5.1 Wirksamkeit der Intervention Mithilfe des eingesetzten Testinstruments konnte die Frage geklärt werden, ob die Intervention bei der Experimentalgruppe zu einer höher ausgeprägten Fähigkeit des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern geführt hat als bei der Kontrollgruppe. Dazu wurden die Daten varianzanalytisch ausgewertet. Die Voraussetzungen dafür waren erfüllt: Die Unabhängigkeit der Messwerte war durch die Stichprobenwahl und das Design gegeben. Die Normalverteilung der ab- hängigen Variablen – dem Erkennen von Stärken und Schwächen – konnten durch den Saphiro-Wilk-Test (p > 0,05), mögliche Ausreißer durch die visuelle Überprü- fung des Boxplots und die Sphärizität mit dem Mauchly-Test (p > 0,05) überprüft werden. Die Varianzgleichheit der Residuen mit dem Levene-Test war zum zweiten und dritten Messzeitpunkt nicht erfüllt. Varianzheterogenität entsteht jedoch gemäß Bryk und Raudenbush (1988) oft durch die Einwirkung eines Treatments, in diesem Fall der Intervention, was sich in unterschiedlichen Varianzen niederschlagen kann. Die Varianzanalyse gilt bei etwa gleich großen Stichproben als robust und Bortz und Schuster (2010) empfehlen nur bei kleinen Stichproben (n < 10) und Verletzung mehrerer Voraussetzungen ein anderes Verfahren. In Tab. 3 sind die Mittelwerte sowie die Standardabweichung der erreichten Punk- te der Experimental- und Kontrollgruppe zu allen drei Messzeitpunkten dargestellt (vgl. auch Abb. 4). Ebenso ist ersichtlich, wie sich die Gruppen zu den Messzeit- punkten unterschieden. Deskriptiv lässt sich feststellen, dass die Experimentalgruppe beim zweiten Mess- zeitpunkt den höchsten Wert erzielte (M= 50,82; SD= 14,22). Dieser nahm zum drit- ten Messzeitpunkt wieder ab (M= 45,98; SD= 13,58), lag jedoch höher als zum ers- ten Messzeitpunkt. Die Kontrollgruppe hatte beim Pretest einen höheren Mittelwert als die Experimentalgruppe (M= 43,69; SD= 9,56). Der Mittelwert der Kontroll- Tab. 3 Gruppenunterschiede zu den drei Messzeitpunkten Mess- Experimentalgruppe Kontrollgruppe ANOVA zeitpunkt (n= 98) (n= 83) MSD M SD Effekt df F η Pre 40,78 8,55 43,69 9,56 Gruppe 1 6,53* 0,035 Post 50,82 14,22 42,83 9,19 Zeit 2 21,96** 0,109 Follow-up 45,98 13,58 40,07 9,98 Gruppe× Zeit 2 30,50** 0,146 *p< 0,05; **p<0,01 K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 191 Abb. 4 Mittelwerte der Experi- mental- und Kontrollgruppe gruppe nahm dann zum zweiten Messzeitpunkt (M= 42,83; SD= 9,19) sowie zum dritten Messzeitpunkt ab (M= 40,07; SD= 9,98). In einem nächsten Schritt wurden Gruppenunterschiede unter Einbezug aller drei Messzeitpunkte varianzanalytisch untersucht. Die Gruppen unterschieden sich bei einem Signifikanzniveau von p < 0,05 zu allen drei Testzeitpunkten signifi- kant (vgl. Tab. 3). Allerdings lag der Mittelwert der Kontrollgruppe zu Beginn der Intervention höher als der der Experimentalgruppe. Dies ist insofern von Be- deutung, weil damit mögliche Effekte der Intervention nicht auf bereits höhere Werte der Experimentalgruppe zu Beginn der Intervention zurückzuführen wären. Die Analyse zeigte eine statistisch signifikante Interaktion von Gruppe und Zeit (F(2, 358) = 30,50; p < 0,001). Das bedeutet, dass sich die erfasste Fähigkeit in Ab- hängigkeit von der Gruppenzugehörigkeit unterschiedlich entwickelte. Die Effekt- stärke (η = 0,146) kann als stark interpretiert werden (Cohen 1988). Aufgrund der Abnahme der Mittelwerte der Experimentalgruppe zwischen Post- und Follow-up- Test, wurde zur Beurteilung der Nachhaltigkeit der Intervention eine Varianzanalyse mit Messwiederholung mit dem ersten und dritten Messzeitpunkt durchgeführt. Es zeigte sich ein statistisch signifikanter Unterschied (F(1, 179) = 32,02; p < 0,001) mit einem starken Effekt (η = 0,152). Da zwei Werte zur Erfassung der Fähigkeit des Erkennens von Stärken und Schwächen zur Messung herangezogen wurden, ist hier zur differenzierten Beurtei- lung der Wirksamkeit der Intervention eine getrennte Betrachtung der beiden Werte sinnvoll. Mit Wert I wurde das Identifizieren von Stärken und Schwächen erfasst. Interessant ist, dass kein statistisch signifikanter Interaktionseffekt nachweisbar war (F(1,92; 342,83) = 0,03; p = 0,963). Beide Gruppen haben sowohl vor als auch nach der Intervention ähnliche Werte erreicht (vgl. Tab. 4 und Abb. 5). Mit Wert II wurde das Interpretieren von Stärken und Schwächen von Schüle- rinnen und Schülern erfasst (vgl. Tab. 5 und Abb. 6). Es zeigte sich ein statistisch signifikanter Interaktionseffekt (F(2, 358) = 40,37; p < 0,001) und ein starker Effekt (η = 0,184). K 192 K. Philipp, I. Gobeli-Egloff Tab. 4 Gruppenunterschiede beim Identifizieren von Stärken und Schwächen Mess- Experimentalgruppe Kontrollgruppe ANOVA zeitpunkt (n= 98) (n= 83) MSD M SD Effekt df F η Pre 16,70 5,48 18,59 5,45 Gruppe 1,00 7,21 0,039 Post 17,29 5,50 19,18 5,24 Zeit 1,92 2,28 0,013 Follow-up 17,40 6,41 19,46 5,88 Gruppe× Zeit 1,92 0,03 0,000 *p< 0,05; **p<0,01 Tab. 5 Gruppenunterschiede beim Interpretieren von Stärken und Schwächen Mess- Experimentalgruppe Kontrollgruppe ANOVA zeitpunkt (n= 98) (n= 83) MSD M SD Effekt df F η Pre 24,21 6,89 25,23 6,55 Gruppe 1 26,99* 0,131 Post 33,56 12,29 23,82 6,67 Zeit 2 25,99** 0,127 Follow-up 28,60 10,31 20,76 6,70 Gruppe× Zeit 2 40,37** 0,184 *p< 0,05; **p<0,01 5.2 Informationen im diagnostischen Prozess Nachdem die Förderung diagnostischer Kompetenz, bezogen auf die Teilfähigkeit des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern, hinsicht- lich ihrer Wirksamkeit betrachtet wurde, steht im Folgenden die Verwendung von Informationen im Fokus. Die Datengrundlage hierfür bildeten schriftliche Dokumen- te (Analysen diagnostischer Interviews) der Studierenden der Experimentalgruppe von selbst durchgeführten Interviews im Verlauf der Intervention. 5.2.1 Art der Informationen In einem ersten Schritt der Analyse wurde untersucht, welche Informationen die Studierenden bei ihrer Diagnose nutzten (Forschungsfrage 2). Die verfügbaren Informationen (V), auf die die Studierenden Bezug nahmen, ent- stammten fachdidaktischem Wissen zu Größenbereichen, wie verschiedene Indika- toren für Größenvorstellungen (V1) sowie typische Herausforderungen des Größen- bereichs Gewichte (V2), die Schwierigkeiten beim Aufbau von Größenvorstellungen verursachen können. Anhand der acht eingesetzten Aufgaben mit diagnostischem Potenzial konnten die Studierenden verschiedene Teilfähigkeiten von Schülerinnen und Schülern in Bezug auf den Umgang mit Gewichten einschätzen. Dazu zogen die Studierenden in ihrer Analyse verschiedene Kriterien heran. Die Studierenden schätzten ein, inwiefern bereits Kenntnisse zu Messinstrumenten vorhanden waren. Beim Schätzen von Gewichten diente den Studierenden als Kriterium, ob die Schü- lerin oder der Schüler passende Repräsentanten für Standardgrößen kannte und ob er oder sie auf Referenzgrößen (Stützpunktvorstellungen) zurückgreifen konnte. Ob Bezüge zu Kategorien aus Tab. 2 sind kursiv hervorgehoben. K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 193 Abb. 5 Gruppenunterschiede beim Identifizieren von Stärken und Schwächen Abb. 6 Gruppenunterschiede beim Interpretieren von Stärken und Schwächen die Schülerin oder der Schüler passende Maßeinheiten für Gegenstände auswählen konnte, ob diese zueinander in Beziehung (vergröbern/verfeinern) gesetzt werden konnten und die Unveränderlichkeit von Gewichten (Invarianz) erkannt wurde, wa- ren weitere Kriterien, auf die sich die Studierenden in ihrer Analyse bezogen. Au- ßerdem orientierten sich die Studierenden daran, ob das Kind Gegenstände nach Gewicht vergleichen und ordnen konnte. Es wurde sichtbar, dass die Studierenden in ihrer Analyse die fachlichen Kriteri- en zur Beurteilung von Größenvorstellungen, die in den Interviewaufgaben angelegt waren, auch tatsächlich als Informationen nutzten. In den Analysen der Studieren- den wurde aber auch deutlich, dass sie sich auf weiteres fachdidaktisches Wissen bezogen, das im Rahmen der Intervention thematisiert wurde. Dies zeigte sich bei- spielweise darin, dass sie auf Herausforderungen des Größenbereichs Gewichte (V2) Bezug nahmen. Sie nannten im Zusammenhang mit einer Tendenz von Schülerin- nen und Schülern, das Gewicht mit der Größe des Gegenstandes in Verbindung zu K 194 K. Philipp, I. Gobeli-Egloff bringen, die nicht-visuelle Wahrnehmbarkeit von Gewichten. Auch das Problem, dass geringe Gewichtsunterschiede mit der Hand kaum wahrnehmbar sind, wur- de als Information genutzt. Daneben verwendeten die Studierenden Informationen, die sich auf ihre Kenntnisse über gängigen Mathematikunterricht (V3), Lehrmittel bzw. auf den Lehrplan bezogen, beispielweise welche Repräsentanten für Gewichte typischerweise vorkommen. Die neu hinzukommenden Informationen (N) sind dadurch gekennzeichnet, dass die Studierenden sie aus der Gesprächssituation mit der Schülerin oder dem Schüler entnahmen. Hierbei bezogen sie sich sowohl auf richtige Lösungen (N1) als auch auf Fehler (N2) der Schülerinnen und Schüler sowie genannte Beispiele (N3).Diese stellten Informationen dar, die im Gespräch über die Aufgaben zunächst konkret sichtbar und damit schnell erfassbar waren. Weiterhin wurden aber auch Informa- tionen herangezogen, die von einer tiefergehenden Analyse zeugten. So wurden Argumente (N4) von Schülerinnen und Schülern berücksichtigt, die das Zustande- kommen ihrer Lösung erklärten, beispielweise, dass die Materialbeschaffenheit oder die Größe von Gegenständen bei der Einschätzung von Gewichten eine Rolle spielte oder die Kategorisierung von Gegenständen in „schwer“ und „leicht“, z. B. bei der Zuordnung von Maßeinheiten. Informationen von den Schülerinnen und Schülern bezüglich ihres Vorwissens (N7), differenzierten die Studierenden in ihrer Analyse einerseits danach, woher dieses Vorwissen stammte, z. B. aus dem Unterricht oder aus dem Alltag und spezifizierten es, wenn es sich um eine konkrete Messerfah- rung handelte. Neben der Argumentation der Schülerinnen und Schüler fokussierten die Studierenden auf Informationen zum strategischen Vorgehen (N5) der Kinder. So wurden verschiedene Strategien identifiziert, die bei der Aufgabenbearbeitung sichtbar wurden. Die Studierenden bezogen sich auf Strategien wie raten, abschät- zen (beispielweise durch das Vorstellen des Gewichts eines Gegenstandes in der Hand), systematisches Vergleichen und Ordnen von Gegenständen nach Gewicht. Neben diesen eher fachlich ausgerichteten Informationen, wurden auch Informatio- nen zu allgemeineren Merkmalen genannt, wie dem Bearbeitungsverhalten (N6). Die Studierenden nahmen hier Bezug zur Bearbeitungsdauer und zur Reihenfolge der Bearbeitung einer Aufgabe, berücksichtigten aber auch, ob das Kind Sicherheit bzw. Unsicherheit zeigte und ob es gegebenenfalls seine Lösungen selbst korrigierte. Auch das Nachfragen der Schülerinnen und Schüler wurde in diesem Zusammen- hang angeführt. Es zeigte sich insgesamt, dass die Studierenden in ihrer Analyse Bezug auf ein breites Spektrum an Informationen nahmen. Die Informationen unterschieden sich nicht nur hinsichtlich der Quellen, sondern auch in ihrer unmittelbaren Wahrnehm- barkeit. Während etwa richtige Lösungen, Fehler oder eine länger andauernde Bear- beitungsdauer prinzipiell direkt wahrgenommen werden können, erfordert beispiel- weise die Identifikation von strategischem Vorgehen oder der Bezug zu Indikatoren für Größenvorstellungen eine Wahrnehmung tiefer liegender Strukturen. 5.2.2 Nutzung von Informationen bei der Formulierung von Stärken und Schwächen Nachdem im ersten Schritt der qualitativen Auswertung der Fokus darauf lag, auf welche Informationen die Studierenden in ihrer Analyse Bezug nahmen, sollte in ei- K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 195 nem zweiten Schritt die Nutzung von Informationen genauer betrachtet werden (For- schungsfrage 3). Das Ziel dieser Analyse war es, zu beleuchten, inwiefern Informa- tionen, die grundsätzlich in den Dokumenten genannt wurden, bei der Formulierung und Begründung von Stärken und Schwächen von den Studierenden herangezogen wurden. Es zeigte sich, dass zunächst auf verfügbare Informationen (V) zurückgegriffen wurde. Dabei wurden die verschiedenen Indikatoren für Größenvorstellungen (V1) als Kriterien genutzt, um Kompetenzen der Schülerinnen und Schüler einschätzen zu können. Die fachlichen Kriterien dienten somit als Leitfaden für die Formulie- rung von Stärken und Schwächen, wurden jedoch nicht differenziert in Begründun- gen genutzt. Als Begründungen für Aussagen über Stärken und Schwächen wurden größtenteils Bezüge zu vermutetem Vorwissen (N7) der Kinder hergestellt, insbe- sondere fehlende bzw. vorhandene Alltags- und Messerfahrungen. Die typischen Herausforderungen (V2) des Größenbereichs Gewichte oder das Wissen über Ma- thematikunterricht (V3) wurden überwiegend nicht genutzt, um beispielweise mög- liche Ursachen für Schwächen zu benennen, selbst wenn sie zuvor im Rahmen von Beschreibungen bei der Analyse verwendet wurden. Es zeigte sich außerdem, dass Aussagen zu Stärken und Schwächen häufig direkt aus einem Fehler (N2) oder aus einer richtigen Lösung (N1) des Kindes abgeleitet wurden, bei denen zwar der Bezug zu fachlichen Kriterien gegeben war, jedoch keine weiteren Informationen berück- sichtigt wurden, um die Aussagen zu bestärken. Dies ließ sich ebenso feststellen, wenn Aussagen zu Stärken oder Schwächen des Kindes mit dem Bearbeitungsver- halten (N6) begründet wurden (z. B. einer langen bzw. kurzen Bearbeitungsdauer). Auch Bezüge zum strategischen Vorgehen (N5) der Kinder wurden in Begründungen für Stärken und Schwächen sichtbar, insbesondere das Ordnen von Gegenständen nach Größe. Allerdings wurde hier deutlich, dass das Benennen der Strategie nicht mit der nicht-visuellen Wahrnehmbarkeit von Gewichten (als typische Herausfor- derung (V2) der Größenbereichs Gewichte) in Verbindung gebracht wurde, wenn dies zu Fehleinschätzungen führte. Bei der Formulierung von Stärken und Schwä- chen fiel weiterhin auf, dass keine Bezüge zu Argumenten (N4) der Schülerinnen und Schüler hergestellt wurden. Auch Beispiele (N3) der Schülerinnen und Schüler wurden nicht herangezogen. Beim Bezug auf das Bearbeitungsverhalten (N6) zeigte sich, dass ausschließlich die Bearbeitungsdauer als Begründungen für eine Stärke oder Schwäche genutzt wurde, nicht jedoch beispielsweise das Revidieren einer Lö- sung oder die Reihenfolge der Bearbeitung, obwohl diese Aspekte in der Analyse genannt wurden. Die Nutzung von Informationen bei der Beurteilung von Stärken und Schwächen von Schülerinnen und Schülern kann dahingehend gedeutet werden, dass die Stu- dierenden in der Formulierung und Begründung von Stärken und Schwächen eines Kindes inhaltsspezifisches fachdidaktisches Wissen benötigen, um sie mit Informa- tionen, die in der Interviewsituation neu hinzukommen, zu fundierten Aussagen verknüpfen zu können. An vielen Stellen wurde damit die Verknüpfung von verfüg- baren Informationen (V) und neu hinzukommenden Informationen (N) explizit. Dies lässt den Schluss zu, dass die fachlichen Kriterien zur Beurteilung von Kompetenzen von Schülerinnen und Schülern die Studierenden in ihrer Diagnose unterstützen. K 196 K. Philipp, I. Gobeli-Egloff Die Ergebnisse legen nahe, dass die Studierenden mehr Informationen wahrge- nommen haben, als sie für die Formulierung von Stärken und Schwächen nutzten. Dies zeigte sich darin, dass zuvor thematisierte Informationen in den Analysen bei der Formulierung und Begründung von Stärken und Schwächen nicht mehr auf- gegriffen wurden. Daher kann davon ausgegangen werden, dass die Studierenden die Informationen bezüglich ihrer Relevanz für die Beurteilung von Stärken und Schwächen werteten. 6 Diskussion Ziel der Intervention war es, diagnostische Kompetenz im Rahmen der Ausbildung von Lehrkräften für die Primarschule zu fördern. Der Fokus lag auf einer zentralen Teilfähigkeit diagnostischer Kompetenz, der Fähigkeit des Erkennens von Stärken und Schwächen von Schülerinnen und Schülern. Diese Fähigkeit kann als grundle- gend dafür betrachtet werden, dass auf der Grundlage (begründeter) Hypothesen bei der Beurteilung von Kompetenzen von Schülerinnen und Schülern auch individu- elle Fördermaßnahmen eingeleitet werden können (Philipp 2018). Zielsetzung der Studie war es, einerseits die Wirksamkeit der Intervention zu prüfen (Forschungs- frage 1) und andererseits die Verwendung von Informationen im diagnostischen Prozess zu untersuchen (Forschungsfragen 2 und 3), ausgehend von der Annahme, dass das inhaltsspezifische fachdidaktische Wissen, das Bestandteil der Intervention war, sichtbar wird. 6.1 Wirksamkeit der Intervention Zur Überprüfung der Wirksamkeit der Intervention wurde ein Testinstrument ein- gesetzt, das es erlaubt, die Güte diagnostischer Urteile neben dem vorherrschenden Paradigma der Urteilsgenauigkeit zu bestimmen. Dies hat den Nachteil, dass die Er- gebnisse aufgrund fehlender Korrespondenzmaße weniger gut mit Befunden anderer Studien vergleichbar sind. Von Vorteil ist jedoch, dass über die Anzahl von Aus- sagen bezüglich fachbezogener Kategorien besser Rückschlüsse auf das inhaltliche Lernen der Studierenden gezogen werden kann und damit auch über den Erwerb diagnostischer Kompetenz. Die quantitativen Analysen zeigten einen deutlichen Zuwachs der erfassten Fä- higkeit (das Erkennen von Stärken und Schwächen von Schülerinnen und Schülern) in der Experimentalgruppe über die drei Messzeitpunkte, während in der Kontroll- gruppe kein Zuwachs zu verzeichnen war. Der Unterschied konnte mittels einer Varianzanalyse auf den Haupteffekt der Intervention zurückgeführt werden, der als groß zu werten ist. Das zeigt, dass die Förderung diagnostischer Kompetenz er- folgreich und nachhaltig war. Allerdings war ein Abfall der Werte zwischen dem zweiten und dritten Messzeitpunkt zu verzeichnen, d. h. die erreichten hohen Wer- te direkt nach der Intervention blieben nicht stabil. Das könnte daran liegen, dass zwischen den beiden letzten Messzeitpunkten das Thema Größen im Rahmen der Lehrveranstaltung nicht mehr behandelt wurde und somit das weitere Übungsfeld in diesem Bereich fehlte. Es könnte auch ein Hinweis darauf sein, dass diagnostische K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 197 Tätigkeiten kontinuierlicher angeregt werden müssen, um diagnostische Kompetenz nachhaltig zu fördern. Durch die Erfassung zweier Werte, das Identifizieren sowie das Interpretieren von Stärken und Schwächen, konnte die Wirksamkeit der För- derung diagnostischer Kompetenz differenzierter betrachtet werden. Beide Gruppen erreichten im Bereich Identifizieren über alle drei Messzeitpunkte hinweg ähnliche Werte. Daraus ist zu schließen, dass das Identifizieren von fehlerhaften und richtigen Überlegungen bzw. Lösungen durch die Intervention nicht gefördert werden konnte, wenngleich höhere Werte hätten erreicht werden können. Die Wirkung der Inter- vention konnte jedoch im Bereich der Interpretation von Stärken und Schwächen nachgewiesen werden. Das bedeutet, dass die Studierenden nach der Intervention ei- ne größere Anzahl schlüssiger Interpretationen der Lösungen von Schülerinnen und Schülern, beispielweise über mögliche Ursachen für Schwierigkeiten, formulieren konnten. Dies zeigt, dass die Studierenden bei etwa gleichbleibender Anzahl von Identifikationen in der Lage waren, diese breiter zu interpretieren. Sie konnten also jeweils mehr fachbezogene Kriterien zur Beurteilung der Größenvorstellungen von Schülerinnen und Schülern heranziehen. Für eine förderorientierte Diagnostik stellt dies einen wesentlichen Schritt dar und dient als Basis für eine weiterführende, pro- zessorientierte Diagnostik, die theoriegeleitet ist (Philipp 2018; Scherer und Moser Opitz 2010). Das fachdidaktische Wissen kann als Voraussetzung für die Entwicklung dia- gnostischer Kompetenz verstanden werden, die sich als beobachtbares Verhalten in der Formulierung von Aussagen zu Stärken und Schwächen von Schülerinnen und Schülern zeigte, also als Personeneigenschaft, die die situationsbezogenen Fä- higkeiten beeinflusst (Blömeke et al. 2015). Der Einfluss des inhaltsspezifischen fachdidaktischen Wissens auf die Güte des diagnostischen Urteils lässt sich durch den Vergleich mit der Kontrollgruppe untermauern, die sich bezüglich der besuchten Lehrveranstaltung in diesem Punkt unterschied. Dies könnte ebenfalls als Hinweis darauf gedeutet werden, dass diagnostische Urteile nicht nur domänen-, sondern auch inhaltsspezifisch sein können bzw. durch solches Wissen beeinflusst werden. Steht dieses Wissen nicht zur Verfügung, so ist die Beurteilung von Kompeten- zen von Schülerinnen und Schülern auf der Basis allgemeinen fachdidaktischen und diagnostischen Wissens erschwert. Dies könnte auch daran liegen, dass die Studierenden noch am Beginn der Entwicklung diagnostischer Kompetenz stehen und inhaltsspezifische fachliche Kriterien benötigen, während erfahrenere Lehrkräfte möglicherweise flexibler mit fachdidaktischem Wissen umgehen können. Hinwei- se aus der Experten-Novizen-Forschung deuten an, dass Expertinnen und Experten im Vergleich zu Novizinnen und Novizen passende Kategorien aktivieren können (Krolak-Schwerdt et al. 2009). Möglicherweise unterstützte auch das Führen des di- agnostischen Interviews die Verarbeitung des fachdidaktischen Wissens auf andere Weise als das in der Kontrollgruppe der Fall war. Einschränkend ist zu sagen, dass aufgrund des Designs der Studie keine Aussage dazu gemacht werden kann, welches Element der Intervention (Auseinandersetzung mit diagnostischen Situationen und deren Reflexion, Aufbau fachdidaktischen Wis- sens) besonders förderlich war. Die Aussagen zur Wirksamkeit beziehen sich also auf das Gesamtkonzept der Intervention. In künftigen Studien könnte dies anhand K 198 K. Philipp, I. Gobeli-Egloff einer systematischen Variation verschiedener Elemente mit mehreren Gruppen in experimentellen Designs untersucht werden. 6.2 Verwendung von Informationen Neben der Beurteilung der Wirksamkeit der Intervention, wurde im Rahmen der berichteten Studie auch der diagnostische Prozess selbst in den Blick genommen. Die Frage danach, auf welche Informationen überhaupt in einem solchen Prozess zurückgegriffen wird und wie sie genutzt werden, waren zentrale Fragestellungen. Im Gegensatz zu dem eingesetzten Testinstrument zur Überprüfung der Wirksam- keit der Intervention lag hier der Fokus auf einer Beurteilung von Kompetenzen eines Kindes über mehrere Aufgaben hinweg. Die Informationen mussten hier also integriert werden, um zu einer Gesamteinschätzung der Größenvorstellungen des Kindes zu kommen. Zentrales Ergebnis ist ein deduktiv sowie induktiv entwickel- tes Kategoriensystem (vgl. Tab. 2), das Aufschluss über die Art der verwendeten Informationen gibt und zwischen Informationen, die bereits verfügbar sind (fach- didaktisches Wissen) und Informationen, die in einer diagnostischen Situation neu hinzukommen, unterscheidet. Eine Übertragbarkeit auf andere Inhaltsbereiche wäre bei Anpassung der inhaltsspezifischen Kategorien prinzipiell möglich. Des Weiteren zeigte sich, dass sowohl auf unmittelbar wahrnehmbare Informationen (z. B. Bear- beitungsdauer) zurückgegriffen wurde als auch auf Informationen, die nur durch die Wahrnehmung tieferliegender Strukturen erfasst werden können (z. B. strategisches Vorgehen der Schülerinnen und Schüler). Diese wurden jedoch nicht konsequent zur Begründung von Aussagen zu Stärken und Schwächen von Schülerinnen und Schülern genutzt. Von Novizinnen und Novizen wird berichtet, dass sie sich häufig an Oberflächenmerkmalen orientieren (Gruber 1994). Kellman und Massey (2013) weisen in diesem Zusammenhang darauf hin, dass Novizinnen und Novizen sowie Expertinnen und Experten durchaus dieselben Informationen berücksichtigen, sie aber erst mit zunehmender Expertise interpretieren können. Die Nutzung von Informationen im Hinblick auf das Erkennen von Stärken und Schwächen von Schülerinnen und Schülern wurde über das gemeinsame Auftreten von Kategorien bei der Formulierung von Stärken und Schwächen des interviewten Kindes betrachtet. Hier zeigte sich insbesondere die Verknüpfung von verfügbaren Informationen und neu hinzukommenden Informationen. Dies wird als ein Beleg dafür gewertet, dass einzelne Informationen nicht getrennt voneinander betrachtet wurden, sondern dass sie zu Einheiten verknüpft wurden, bei denen Informationen aus beiden Informationsquellen integriert wurden. In den schriftlichen Analysen wurde deutlich, dass die Studierenden zunächst beschreibend vorgingen. Erst in der Formulierung von Kompetenzen und Schwierigkeiten des interviewten Kindes wurden Interpretationen deutlich. Es zeigte sich, dass die Studierenden dabei nicht alle Informationen nutzten, die sie bei der Analyse nannten. Das kann dahingehend gedeutet werden, dass die Studierenden im diagnostischen Prozess Informationen gewichteten. Allerdings wurde deutlich, dass aus Fehlern oder richtigen Lösun- gen direkt Formulierungen zu Stärken und Schwächen abgeleitet wurden. Solche vorschnellen Beurteilungen, die sich an Korrektheit orientieren, werden von Novi- zinnen und Novizen berichtet (Streit et al. 2019; Reinhold 2018). Zudem bezogen K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 199 sich die Studierenden stark auf das Bearbeitungsverhalten, insbesondere auf die Bearbeitungsdauer, sodass davon ausgegangen werden kann, dass der Prozess des Gewichtens gesonderter Unterstützung bedarf und in künftigen Studien fokussiert werden könnte. Auch bei der qualitativen Analyse zeigte sich die Bedeutung des fachdidaktischen Wissens insofern, als dass die Studierenden auf das in der Intervention vermittel- te fachdidaktische Wissen zurückgriffen, um Kompetenzen von Schülerinnen und Schülern zu beurteilen. Es kann daher als Ankerfunktion (Nickerson 1999)dienen und den Analyseprozess der Studierenden leiten. So wurden Teilkompetenzen von Größenvorstellungen (vgl. Abschn. 4.4.1) als Ankerpunkte verwendet. Dass die Stu- dierenden verfügbare Informationen mit neu hinzukommenden Informationen ver- knüpften, um Aussagen über die Stärken und Schwächen des interviewten Kindes zu machen, kann als Anpassungsprozess (Nickerson 1999) betrachtet werden, bei dem die Menge an Informationen über mehrere Aufgaben hinweg verdichtet werden musste. Die Art der Informationen, die in einem solchen Anpassungsprozess ver- wendet wurden, konnten ergänzend zu den Befunden von Ostermann (2018) durch das Kategoriensystem konkretisiert werden. Einschränkend ist anzumerken, dass nicht ausgeschlossen werden kann, dass die Studierenden bestimmte Informationen in der Interviewsituation gar nicht wahrge- nommen (und damit auch nicht verschriftlicht) haben. Da die Studierenden unter- schiedliche Kinder befragten, gab es keine „Vergleichsnorm“, an der die Güte der diagnostischen Urteile gemessen werden konnte. Der Fokus der Studie lag allerdings nicht auf der Akkuratheit der Urteile, sondern darauf, ob (1) sich die Anzahl der Aussagen zu Stärken und Schwächen von Schülerinnen und Schülern erhöhen ließ und (2) welche Informationen im diagnostischen Prozess genutzt wurden. Des Wei- teren kann nicht mit Sicherheit gesagt werden, dass die Studierenden die verfügbaren Informationen tatsächlich verinnerlicht hatten, da die schriftlichen Analysen durch Hinzuziehen von Literatur entstanden sein könnten. Insofern müssen die Dokumente als Prozessdokumente im Lernprozess der Studierenden aufgefasst werden. Auch die Verallgemeinerbarkeit der qualitativen Befunde ist durch die reduzierte Stichprobe eingeschränkt. 6.3 Fazit Die Befunde der hier berichteten Interventionsstudie weisen darauf hin, dass die Ent- wicklung diagnostischer Kompetenz durch die Förderung inhaltsspezifischen fach- didaktischen Wissens bereits im Rahmen der Ausbildung angeregt werden kann, auch wenn davon auszugehen ist, dass sich diagnostische Kompetenz über einen längeren Zeitraum entwickelt (z. B. Hascher 2008). Die erfolgreiche Förderung di- agnostischer Kompetenz im Rahmen der Interventionsstudie stützt damit auch die weit verbreitete Annahme, dass diagnostische Kompetenz wie andere Kompetenzen prinzipiell erlernbar ist (Hartig und Klieme 2006; Herppich et al. 2017) und kann dies konkretisieren: Förderung ist möglich durch Aufbau des fachbezogenen Wis- sens und durch die Konfrontation mit diagnostischen Situationen. Insgesamt geben die Ergebnisse der Studie wertvolle Hinweise auf den Erwerb diagnostischer Kom- petenz und lassen darauf schließen, dass angehende Lehrkräfte nach entsprechender K 200 K. Philipp, I. Gobeli-Egloff Förderung in der Lage sind, fachbezogenes Wissen in diagnostischen Situationen zu nutzen, um Stärken und Schwächen von Schülerinnen und Schülern beurteilen kön- nen. Dabei wurde deutlich, welche Informationen die Studierenden bei der Diagnose berücksichtigen. Als Beitrag zur Förderung diagnostischer Kompetenz konnte somit ein Konzept entwickelt werden, das die Verbindung von fachbezogenem Wissen mit Informationen aus diagnostischen Situationen bei den Studierenden unterstützt. Funding Open access funding provided by FHNW University of Applied Sciences and Arts Northwestern Switzerland Open Access Dieser Artikel wird unter der Creative Commons Namensnennung 4.0 International Li- zenz veröffentlicht, welche die Nutzung, Vervielfältigung, Bearbeitung, Verbreitung und Wiedergabe in jeglichem Medium und Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle ord- nungsgemäß nennen, einen Link zur Creative Commons Lizenz beifügen und angeben, ob Änderungen vorgenommen wurden. Die in diesem Artikel enthaltenen Bilder und sonstiges Drittmaterial unterliegen ebenfalls der genannten Creative Commons Lizenz, sofern sich aus der Abbildungslegende nichts anderes ergibt. Sofern das betref- fende Material nicht unter der genannten Creative Commons Lizenz steht und die betreffende Handlung nicht nach gesetzlichen Vorschriften erlaubt ist, ist für die oben aufgeführten Weiterverwendungen des Materials die Einwilligung des jeweiligen Rechteinhabers einzuholen. Weitere Details zur Lizenz entnehmen Sie bitte der Lizenzinformation auf http://creativecommons.org/ licenses/by/4.0/deed.de. Literatur Anders, Y., Kunter, M., Brunner, M., Krauss, S., & Baumert, J. (2010). Diagnostische Fähigkeiten von Mathematiklehrkräften und die Leistungen ihrer Schülerinnen und Schüler. Psychologie in Erziehung und Unterricht, 3, 175–193. v. Aufschnaiter, C., Cappell, J., Dübbelde, G., Ennemoser, M., Mayer, J., Stiensmeier-Pelster, J., Sträßer, R., & Wolgast, A. (2015). Diagnostische Kompetenz. Theoretische Überlegungen zu einem zentralen Konstrukt der Lehrerbildung. Zeitschrift für Pädagogik, 61, 738–758. Ball, D. L., Thames, M. H., & Phelbs, G. (2008). Content knowledge for teaching: what makes it special? Journal of Teacher Education, 59(5), 389–407. Bass, H., & Ball, D. L. (2004). A practice-based theory of mathematical knowledge for teaching: the case of mathematical reasoning. In W. Jianpan & X. Binyan (Hrsg.), Trends and challenges in mathematics education (S. 107–123). Shanghai: East China Normal University Press. Baumert, J., & Kunter, M. (2006). Stichwort: Professionelle Kompetenz von Lehrkräften. Zeitschrift für Erziehungswissenschaft, 9(4), 469–520. Black, P., & Wiliam, D. (2009). Developing the theory of formative assessment. Educational Assessment, Evaluation and Accountability, 21, 5–31. Bless, H., Fiedler, K., & Strack, F. (2004). Social cognition—How individuals construct social reality. Hove: Psychology Press. Blömeke, S., Gustafsson, J. E., & Shavelson, R. J. (2015). Beyond dichotomies: competence viewed as a continuum. Zeitschrift für Psychologie, 223(1), 3–13. Bortz, J., & Schuster, C. (2010). Statistik für Human- und Sozialwissenschaftler. Berlin Heidelberg: Sprin- ger. Bräunling, K., & Reuter, D. (2015). Messen und Größen. In J. Leuders & K. Philipp (Hrsg.), Mathematik – Didaktik für die Grundschule (S. 44–57). Berlin: Cornelsen. Brennan, R. L., & Prediger, D. J. (1981). Coefficient kappa: some uses, misuses, and alternatives. Educa- tional and Psychological Measurement, 41(3), 687–699. Bromme, R. (2008). Lehrerexpertise. In W. Schneider & M. Hasselhorn (Hrsg.), Handbuch der pädagogi- schen Psychologie (S. 159–167). Stuttgart: Hogrefe. K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 201 Brunner, M., Anders, Y., Hachfeld, A., & Krauss, S. (2011). Diagnostische Fähigkeiten von Mathemati- klehrkräften. In M. Kunter, J. Baumert, W. Blum, U. Klusmann, S. Krauss & M. Neubrand (Hrsg.), Professionelle Kompetenz von Lehrkräften (S. 215–234). Münster: Waxmann. Bryk, A. S., & Raudenbush, S. W. (1988). Heterogeneity of variance in experimental studies: a challenge to conventional interpretations. Psychological Bulletin, 104(3), 396. Buholzer, A., & Zulliger, S. (2013). Die Entwicklung von diagnostischen Fähigkeiten bei Studierenden der pädagogischen Hochschulen im Laufe ihrer Ausbildung. Beiträge zur Lehrerinnen- und Lehrer- bildung, 31(2), 186–197. Busch, J., Barzel, B., & Leuders, T. (2015). Die Entwicklung eines kategorialen Kompetenzmodells zur Erfassung diagnostischer Kompetenzen von Lehrkräften im Bereich Funktionen. Journal für Mathe- matik-Didaktik, 36(2), 315–338. Chernikova, O., Heitzmann, N., Fink, M. C., Timothy, V., Seidel, T., & Fischer, F. (2020). Facilitating di- agnostic competences in higher education—a meta-analysis in medical and teacher education. Edu- cational Psychology Review, 32, 157–196. Clarke, D. M., Roche, A., & Clarke, B. (2018). Supporting Mathematics Teachers’ Diagnostic Compe- tence Through the Use of One-to-One, Task-Based Assessment Interviews. In T. Leuders, K. Philipp & J. Leuders (Hrsg.), Diagnostic Competence of Mathematics Teachers: Unpacking a Complex Con- struct in Teacher Education and Teacher Practice (Bd. 11, S. 173–192). Cham: Springer. Cohen, J. (1988). Statistical power analysis for the behavioural sciences (2. Aufl.). New York: Academic Press. Döring, N., & Bortz, J. (2016). Forschungsmethoden und Evaluation in den Sozial- und Humanwissen- schaften (5. Aufl.). Berlin Heidelberg: Springer. Emmrich, A. (2008). Ein Vortest zu Gewichtsvorstellungen. Grundschule Mathematik, 5(19), 14–19. Förster, N., & Karst, K. (2017). Modelle diagnostischer Kompetenz: Gemeinsamkeiten und Unterschiede. In A. Südkamp & A. K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften: Theoretische und methodische Weiterentwicklungen (S. 63–65). Münster: Waxmann. Franke, M., & Ruwisch, S. (2010). Didaktik des Sachrechnens in der Grundschule. Heidelberg: Spektrum. Grossman, P., & McDonald, M. (2008). Back to the future: Directions for research in teaching and teacher education. American Educational Research Journal, 45(1), 184–205. Gruber, H. (1994). Expertise: Modelle und empirische Untersuchungen. Beiträge zur psychologischen Forschung, Bd. 34. Opladen: Westdeutscher Verlag. Hartig, J., & Klieme, E. (2006). Kompetenz und Kompetenzdiagnostik. In K. Schweizer (Hrsg.), Leistung und Leistungsdiagnostik (S. 127–143). Berlin, Heidelberg: Springer. Hascher, T. (2008). Diagnostische Kompetenzen im Lehrberuf. In C. Kraler & M. Schratz (Hrsg.), Wissen erwerben, Kompetenzen entwickeln (S. 71–86). Münster: Waxmann. Hastie, R., & Dawes, R. M. (2001). Rational choice in an uncertain world: the psychology of judgment and decision making. Thousand Oaks: SAGE. Helmke, A. (2009). Unterrichtsqualität und Lehrerprofessionalität. Diagnose, Evaluation und Verbesse- rung des Unterrichts (2. Aufl.). Seelze: Klett. Helmke, A., Hosenfeld, I., & Schrader, F.-W. (2004). Vergleichsarbeiten als Instrument zur Verbesserung der Diagnosekompetenz von Lehrkräften. In R. Arnold & C. Griese (Hrsg.), Schulleitung und Schul- entwicklung (S. 119–144). Hohengehren: Schneider. Herppich, S., Praetorius, A. K., Hetmanek, A., Glogger-Frey, I., Ufer, S., Leutner, D., Behrmann, L., Böh- mer, I., Böhmer, M., Förster, N., Kaier, J., Karing, C., Karst, K., Klug, J., Ohle, A., & Südkamp, A. (2017). In A. Südkamp & A. K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften: Theoretische und methodische Weiterentwicklungen (S. 75–93). Münster: Waxmann. Hoge, R. D., & Coladarci, T. (1989). Teacher-based judgments of academic achievement: A review of literature. Review of Educational Research, 59(3), 297–313. Ingenkamp, K., & Lissmann, U. (2008). Lehrbuch der pädagogischen Diagnostik (6. Aufl.). Weinheim Basel: Beltz. Jacobs, V. R., Lamb, L. L., & Philipp, R. A. (2010). Professional noticing of children’s mathematical think- ing. Journal for research in mathematics education, 41(2), 169–202. Kaiser, J., Praetorius, A. K., Südkamp, A., & Ufer, S. (2017). Die enge Verwobenheit von diagnostischem und pädagogischem Handeln als Herausforderung bei der Erfassung diagnostischer Kompetenz. In A. Südkamp & A. K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften: Theoretische und methodische Weiterentwicklungen (S. 114–123). Münster: Waxmann. Karing, C., & Seidel, T. (2017). Ausblick zur Förderung diagnostischer Kompetenz. In A. Südkamp & A. K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften: Theoretische und methodische Weiterentwicklungen (S. 240–246). Münster: Waxmann. K 202 K. Philipp, I. Gobeli-Egloff Karst, K., Klug, J., & Ufer, S. (2017). Strukturierung diagnostischer Situationen im inner- und außerunter- richtlichen Handeln von Lehrkräften. In A. Südkamp & A. K. Praetorius (Hrsg.), Diagnostische Kom- petenz von Lehrkräften: Theoretische und methodische Weiterentwicklungen (S. 102–114). Münster: Waxmann. Kellman, P. J., & Massey, C. M. (2013). Perceptual learning, cognition, and expertise. Psychology of learn- ing and motivation, 58, 117–165. Academic Press. Krauss, S., Brunner, M., Kunter, M., Baumert, J., Blum, W., Neubrand, M., & Jordan, A. (2008). Ped- agogical content knowledge and content knowledge of secondary mathematics teachers. Journal of Educational Psychology, 100(3), 716–725. Krolak-Schwerdt, S., Böhmer, M., & Gräsel, C. (2009). Verarbeitung von schülerbezogener Information als zielgeleiteter Prozess: Der Lehrer als „flexibler Denker“. Zeitschrift für Pädagogische Psychologie, 23(34), 175–186. Kuckartz, U. (2016). Qualitative Inhaltsanalyse. Methoden, Praxis, Computerunterstützung (3. Aufl.). Weinheim Basel: Beltz. Leuders, T., Dörfler, T., Leuders, J., & Philipp, K. (2018). Diagnostic competence of mathematics teachers: unpacking a complex construct. In T. Leuders, K. Philipp & J. Leuders (Hrsg.), Diagnostic compe- tence of mathematics teachers: unpacking a complex construct in teacher education and teacher practice (Bd. 11, S. 3–31). Cham: Springer. Leuders, T., Loibl, K., & Dörfler, T. (2020). Diagnostische Urteile von Lehrkräften erklären – Ein Rahmen- modell für kognitive Modellierungen und deren experimentelle Prüfung. Unterrichtswissenschaft, 48(4), 493–502. Lorenz, C., & Artelt, C. (2009). Fachspezifität und Stabilität diagnostischer Kompetenz von Grundschul- lehrkräften in den Fächern Deutsch und Mathematik. Zeitschrift für Pädagogische Psychologie, 23(3), 211–222. Mayring, P. (2010). Qualitative Inhaltsanalyse. Grundlagen und Techniken (11. Aufl.). Weinheim, Basel: Beltz. Mayring, P., & Fenzl, T. (2019). Qualitative Inhaltsanalyse. In N. Bauer & J. Blasius (Hrsg.), Handbuch Methoden der empirischen Sozialforschung (2. Aufl. S. 633–648). Wiesbaden: Springer VS. Moser Opitz, E., & Nührenbörger, M. (2015). Diagnostik und Leistungsbeurteilung. In R. Bruder, L. He- fendehl-Hebeker, B. Schmidt-Thieme & H. G. Weigand (Hrsg.), Handbuch der Mathematikdidaktik (S. 491–512). Berlin: Springer Spektrum. Nickerson, R. S. (1999). How we know-and sometimes misjudge-what others know: imputing one’s own knowledge to others. Psychological Bulletin, 125(6), 737–759. van Ophuysen, S., & Behrmann, L. (2015). Die Qualität pädagogischer Diagnostik im Lehrerberuf-An- merkungen zum Themenheft „Diagnostische Kompetenzen von Lehrkräften und ihre Handlungsrele- vanz“. Journal for educational research online, 7(2), 82–98. Ostermann, A. (2018). Factors influencing the accuracy of diagnostic judgments. In T. Leuders, K. Phi- lipp & J. Leuders (Hrsg.), Diagnostic competence of mathematics teachers: unpacking a complex construct in teacher education and teacher practice (Bd. 11, S. 95–108). Cham: Springer. Peter-Koop, A., & Nührenbörger, M. (2008). Größen und Messen. In G. Walther, M. van den Heuvel- Panhuizen, D. Granzer & O. Köller (Hrsg.), Bildungsstandards für die Grundschule: Mathematik konkret (S. 87–115). Berlin: Cornelsen Scriptor. Philipp, K. (2018). Diagnostic competences of mathematics teachers with a view to processes and know- ledge resources. In T. Leuders, K. Philipp & J. Leuders (Hrsg.), Diagnostic competence of mathe- matics teachers: unpacking a complex construct in teacher education and teacher practice (Bd. 11, S. 109–127). Cham: Springer. Plessner, H. (2011). Urteilen. In T. Betsch, J. Funke & H. Plessner (Hrsg.), Denken – Urteilen, Entscheiden, Problemlösen. Berlin, Heidelberg: Springer. Pott, A. (2019). Diagnostische Deutungen Im Lernbereich Mathematik. Wiesbaden: Springer. Prediger, S., Selter, C., Hußmann, S., & Nührenbörger, M. (Hrsg.). (2017). Mathe sicher können. Hand- reichungen für ein Diagnose- und Förderkonzept zur Sicherung mathematischer Basiskompetenzen. Sachrechnen. Berlin: Cornelsen. Prediger, S., Tschierschky, K., Wessel, L., & Seipp, B. (2012). Professionalisierung für fach- und sprachin- tegrierte Diagnose und Förderung im Mathematikunterricht. Zeitschrift für Interkulturellen Fremd- sprachenunterricht, 17(1), 40–58. Rädiker, S., & Kuckartz, U. (2019). Analyse qualitativer Daten mit MAXQDA. Wiesbaden: Springer. Reinhold, S. (2018). Revealing and promoting pre-service teachers’ diagnostic strategies in mathematical interviews with first-graders. In T. Leuders, K. Philipp & J. Leuders (Hrsg.), Diagnostic competence K Förderung diagnostischer Kompetenz im Rahmen der Ausbildung von Lehrkräften für die... 203 of mathematics teachers: unpacking a complex construct in teacher education and teacher practice (Bd. 11, S. 129–148). Cham: Springer. Reuter, D. (2011). Kindliche Konzepte zur Größe Gewicht und ihre Entwicklung. Theoretische Modellie- rung und zwei Einzelfallstudien mit Drittklässlern. Dissertation. Berlin: Humboldt-Universität. Rösike, K. A., & Schnell, S. (2017). Do math! – Lehrkräfte professionalisieren für das Erkennen und För- dern von Potenzialen. In J. Leuders, T. Leuders, S. Prediger & S. Ruwisch (Hrsg.), Mit Heterogenität im Mathematikunterricht umgehen lernen (S. 223–233). Wiesbaden: Springer Spektrum. Scherer, P., & Opitz, M. E. M. (2010). Fördern im Mathematikunterricht der Primarstufe. Heidelberg: Springer Spektrum. Schipper, W. (2009). Handbuch für den Mathematikunterricht an Grundschulen. Braunschweig: Schroe- del. Schrader, F.-W. (2013). Diagnostische Kompetenz von Lehrpersonen. Beiträge zur Lehrerinnen- und Leh- rerbildung, 31(2), 154–165. Schwarz, B., Wissmach, B., & Kaiser, G. (2008). “Last curves not quite correct”: diagnostic competence of future teachers with regard to modelling and graphical representations. ZDM—The International Journal on Mathematics Education, 40(5), 777–790. Spinath, B. (2005). Akkuratheit der Einschätzung von Schülermerkmalen durch Lehrer und das Konstrukt der diagnostischen Kompetenz. Zeitschrift für Pädagogische Psychologie, 19(1/2), 85–95. Stahnke, R., Schueler, S., & Roesken-Winter, B. (2016). Teachers’ perception, interpretation, and decision- making: a systematic review of empirical mathematics education research. ZDM—The International Journal on Mathematics Education, 48(1), 1–27. Streit, C., Rüede, C., Weber, C., & Graf, B. (2019). Zur Verknüpfung von Lernstandeinschätzung und Wei- terarbeit im Arithmetikunterricht: Ein kontrastiver Vergleich zur Charakterisierung diagnostischer Expertise. Journal für Mathematik-Didaktik, 40(1), 37–62. Südkamp, A., Kaiser, J., & Möller, J. (2012). Accuracy of teachers’ judgments of students’ academic achievement: a meta-analysis. Journal of Educational Psychology, 104(3), 743–762. Tversky, A., & Kahneman, D. (1974). Judgments under uncertainty. Heuristic and biases. Science, 185, 1124–1131. Ufer, S., & Leutner, D. (2017). Kompetenzen als Dispositionen-Begriffsklärungen und Herausforderungen. In A. Südkamp & A. K. Praetorius (Hrsg.), Diagnostische Kompetenz von Lehrkräften: Theoretische und methodische Weiterentwicklungen (S. 67–74). Münster: Waxmann. Weinert, F. E. (2000). Lehren und Lernen für die Zukunft – Ansprüche an das Lernen in der Schule. Päd- agogische Nachrichten Rheinland-Pfalz, 2, 1–16. Wember, F. B. (1998). Zweimal Dialektik: Diagnose und Intervention, Wissen und Intuition. Sonderpäd- agogik, 28, 106–120. Wollring, B., Peter-Koop, A., & Grüßing, M. (2013). Das ElementarMathematische BasisInterview EMBI. In M. Hasselhorn, A. Heinze, W. Schneider & U. Trautwein (Hrsg.), Diagnostik mathematischer Kompetenzen (Bd. 11, S. 81–96). Göttingen: Hogrefe.

Journal

Journal für Mathematik-DidaktikSpringer Journals

Published: Mar 1, 2022

Keywords: Diagnosekompetenz; Größenvorstellungen; Intervention; Ausbildung von Lehrkräften; Diagnostic competence; Conceptions of measurement; Intervention study; Teacher education; 97B50; 97D72

There are no references for this article.