Na początek roku szkolnego polecamy wywiad, który z prof. Bolesławem Niemierko przeprowadził Rafał Zalcman. Rozmowa oscyluje wokół kwestii związanych z ocenianiem szkolnym. Wywiad pierwotnie ukazał się w wydaniu nr 7-8/2018 czasopisma „Edukacja i Dialog”, którego hasło przewodnie brzmi „Oceny – egzaminy – rankingi”.
„Uczenie się ma dla nas wartość dzięki swoim wynikom” – konkluduje Pan w podsumowaniu klasycznej już dziś pozycji pt. Ocenianie szkolne bez tajemnic. Zważywszy na doniosłość oceny szkolnej, która jest nie tylko istotnym regulatorem działania pedagogicznego, ale także, a może przede wszystkim informacją właśnie o wyniku uczenia się, w pierwszym odruchu jako niemożliwy jawi się należyty proces kształcenia bez jej udziału. Tymczasem nie od dziś natknąć się można na jakże chwytliwą, szczególnie z punktu widzenia rodzica, dewizę – „Szkoła bez ocen”.
Na początek zajmijmy się objaśnieniem zaimka użytego w podsumowaniu mojej książki sprzed 16 lat. To „dla nas”, jako adresatów informacji o wyniku uczenia się, mieści w sobie hierarchię odbiorców tej informacji. Pierwszym z nich jest sam uczeń uzyskujący dany wynik, drugi krąg stanowią jego opiekunowie: nauczyciele i rodzice, a trzeci – władze szkoły, autorzy podstaw programowych, działacze oświatowi i politycy.
Ta kolejność ma zasadnicze znaczenie. Gdy potraktujemy ocenianie, w tym zwłaszcza egzaminy zewnętrzne, jako sferę działalności organizatorów edukacji, a nie jako dziedzinę osiągnięć określonego ucznia, grozi nam zepchnięcie właściwego autora wyniku do roli małego trybika w machinie. W tej pozycji niełatwo o własne cele uczniów i o twórczość niezbędną dla ich rozwoju.
Psychologowie odróżniają motywację zewnętrzną uczenia się od wewnętrznej. Ta pierwsza, będąca skutkiem presji otoczenia – nauczycieli, rodziców, znajomych i obcych – jest dążeniem do przetrwania przy ograniczonym wysiłku. „Prawdziwe życie”, przepełnione radością istnienia, rozwoju i odkryć, może toczyć się poza lekcją, poza szkołą i podczas wakacji. Siłą jednostki jest motywacja wewnętrzna, modyfikowana jedynie przez oczekiwania społeczne. Jak twierdzą psychologowie, nie może być ona traktowana jako pochodna motywacji zewnętrznej. Jest pierwotna wobec wszelkich oddziaływań otoczenia, co staram się udowodnić we fragmencie A przytoczonym w niniejszym numerze czasopisma z książki Jak pomagać (a nie szkodzić) uczniom ocenianiem szkolnym.
Przejdźmy teraz od motywów do zachowań ucznia, a dokładniej – do jego zachowań celowych, czyli do czynności. Teoria czynności, rozwinięta przez psychologa Tadeusza Tomaszewskiego, przyznaje wyobrażeniom wyniku rolę jego głównego regulatora. Każdy wynik czynności, na przykład zrozumienie przeczytanego tekstu lub samodzielne rozwiązanie zadania matematycznego, ma znaczenie motywacyjne. Uczeń może odetchnąć z ulgą, że spełnił wymagania, lub ucieszyć się, że coś potrafi. Akcent pada więc albo na instytucję organizującą edukację, albo na jednostkę, której edukacja służy. Instytucja wprowadza motywację zewnętrzną uczenia się, a uczeń kieruje się przede wszystkim motywacją wewnętrzną.
A jaka jest funkcja stopni szkolnych w tym układzie sił sprawczych uczenia się w szkole? Bez informacji o wyniku czynność nie ulega poprawie lub postęp jest znikomy, co udowodnił kontynuator Tomaszewskiego, Wiesław Łukaszewski, w swych analizach przebiegu uczenia się. Informacja ma wiązać wynik z jakością jej wykonywania i wskazywać możliwości jej podniesienia. To przesądza o potrzebie oceniania szkolnego, ale też o zwodniczości stopni.
Stopnie szkolne są symbolicznym, „stenograficznym” zapisem ocen szkolnych w umownej skali. Są wygodne do zestawień, ale trudne do komunikacji. Rodzicom może się wydawać, że mówią im to, co jest ważne, ale częściej się nimi martwią niż cieszą. Łatwo więc ulegają fikcji, jaką jest „szkoła bez ocen”, co znaczy w istocie, że dzieci nie przynoszą z niej żadnych stopni.Trzeba dobrze odróżnić ocenę szkolną od stopnia. Ocena jest pełną informacją o wyniku uczenia się, wartościowaniem jego skuteczności, a stopień ujmuje tylko porównawczy aspekt oceny, jej stosunek do ustanowionej normy. Wyobraźmy sobie, że rodzice tak pytają ucznia wracającego ze szkoły: Czego się dziś nauczyłeś? Co ci się w toku lekcji udało? Będą mieć lepszą ocenę jego postępów w nauce niż dowiadując się tylko o stopniach. Koncentrując się na rozwoju, sięgną głębiej w rozmowach wychowawczych.
Pokusa opisywania potrzeb wyższego rzędu za pomocą metod statystycznych, choć intuicyjnie wydaje się chybiona, towarzyszy człowiekowi niemal od zarania. Mniej więcej od wtedy też toczy się spór pomiędzy jej zwolennikami i antagonistami. Na polu edukacji wśród tych ostatnich prym wiodą przeciwnicy jej parametryzacji. Podnoszą oni, iż kształcenie jest procesem jakościowym, wszak taki, a nie ilościowy – z czym trudno polemizować – charakter ma przyrost kompetencji. Pana odpowiedź na tę krytykę, jak rozumiem, stanowią taksonomie celów kształcenia…
Statystyka jest dobrodziejstwem i klęską komunikacji pedagogicznej. Jej logika jest urzekająca, skłaniająca do zastosowań, ale znajomość podstaw nieczęsto jej towarzyszy.
Pierwszym problemem jest jakościowe znaczenie wskaźników liczbowych dotyczących poziomu osiągnięć. Dość łatwo na przykład sporządzić listę słów, które uczeń powinien znać po roku nauki języka obcego i oszacować proporcję ich znajomości wykazaną przez ucznia w pisemnym teście słownikowym. Dużo trudniej zmierzyć poprawność wymowy tych słów, a najtrudniej – wyrażanie za ich pomocą własnych myśli w dialogu z cudzoziemcem. Powierzchowna fascynacja statystyką przejawia się ignorowaniem problemów trafności wskaźników, pogłębiona natomiast bierze je odważnie na warsztat, rozpoczynając od celów kształcenia. Po co uczymy młodzież języka obcego?
Wyzwania dla pomiaru dydaktycznego nie kończą się na doborze wskaźników umiejętności uczniów i budowaniu odpowiednich sytuacji sprawdzania. Kluczowe jest wprowadzenie normy akceptacji wyniku uczenia się. Zaliczenie osiągnięć – jako całości lub na określony stopień szkolny – wymaga decyzji o liczbie prawidłowo rozwiązanych zadań. Ta decyzja może być bardzo ryzykowna, czego przykładem jest 30 procent punktów jako reprezentacja całości oczekiwanych osiągnięć przedmiotowych maturzysty.
Pokusa „parametryzacji” systemu informacji o funkcjonowaniu edukacji jest dla władz oświatowych bardzo silna. Na całym świecie, zwłaszcza w krajach rozwijających się, władze lubują się w zbieraniu dowodów własnej skuteczności i w przynaglaniu podległych instytucji – a pośrednio nauczy-cieli oraz uczniów – do wysiłku. Nadto znajomość statystyki opisowej, a tym bardziej indukcji statystycznej, jest w Polsce na każdym szczeblu drabiny edukacyjnej wciąż jeszcze niezadowalająca. Laik sądzi, że liczby zapewniają ścisłość, ekspert natomiast traktuje procedury matematyczne jako niezbędną przeciwwagę myślenia życzeniowego i nie przecenia ich trafności w przewidywaniu zdarzeń.
Taksonomie celów kształcenia powstały, aby podnieść programy i testy z poziomu zapamiętywania wiadomości na poziom rozwiązywania problemów z wykorzystaniem tych wiadomości. Ta ich misja powiodła się częściowo, bo wprawdzie dzieło Beniamina Blooma zyskało miliony czytelników i setki przeróbek, w tym polską, a kontrola kategorii czynności ucznia stała się obowiązkiem dydaktyków, ale droga do idealnego kształcenia raczej się wydłużyła. Złożył się na to postęp psychologii poznawczej, akcentującej indywidualne, a nie wspólne ścieżki uczenia się, i rewolucja telekomunikacyjna uwalniająca nas wszystkich od mozolnego gromadzenia szczegółowej informacji. Pojawiły się możliwości promowania twórczości ucznia. Miejsce sztywnej taksonomii, sugerującej niezbędność pamiętania materiału lekcyjnego, zajmują zróżnicowane trajektorie przetwarzania gotowej informacji. Tak więc usilna popularyzacja taksonomii, w której miałem w Polsce swój udział, z wolna przechodzi do historii.
Sprawdzanie i ocenianie osiągnięć, ergo przyporządkowywanie ocen według określonych reguł, to przedmiot dociekań pomiaru dydaktycznego. Warunkiem niezbędnym dla jego prowadzenia jest wykorzystanie testu – narzędzia tyleż efektywnego, co, przynajmniej w obiegowej opinii, kontrowersyjnego. Za dowód złej sławy testu niech posłużą silnie już zakorzenione w języku ojczystym neologizmy o jednoznacznie negatywnym zabarwieniu, jak: „testologia” czy „testomania”.
Zmiany cywilizacyjne, pochodne rozwoju nauki, technologii i globalizacji gospodarki, wpływają nie tylko na pomiar dydaktyczny, lecz także na inne metody sprawdzania osiągnięć uczniów, a szerzej – na model edukacji. Kształcenie przestaje być realizacją starannie uporządkowanego materiału nauczania, którego opanowanie sprawdza się krok za krokiem i na koniec przez zastosowanie testów. Coraz bardziej liczy się własne zainteresowanie przedmiotem i oryginalna wiedza ucznia. Na pierwszy plan wysuwa się ocenianie wewnątrzszkolne, a testy dostarczają tylko informacji pomocniczej. Ta informacja jest potrzebna do porównań międzyszkolnych, ale stosunkowo mniej wnosi do przewidywań przyszłych sukcesów edukacyjnych i zawodowych ucznia. Potwierdzają to niezliczone badania karier młodych pokoleń oraz przekonań młodzieży, jak te, które są przedstawione we fragmencie B mojej książki.
„Zła sława” testów w zastosowaniach edukacyjnych jest pochodną ich nadużycia. Nie tyle przez masowość tych zastosowań, ile przez niefachową interpretację wyników. Psychologowie stanowczo wymagają, by ich testy administrowały osoby z psychometrycznym wykształceniem, obeznane z niepełną trafnością pomiaru i rygorami wnioskowania. Pedagodzy autoryzują egzaminy zewnętrzne bezwzględną decyzją władzy, zaś testy szerokiego użytku traktują jako egzaminy próbne.
Dyskusje o edukacyjnej „tyranii testowania” ciągną się w nieskończoność także w Stanach Zjednoczonych, jej wielkiej ojczyźnie. Tam argumentem są zwykle różnice kulturowe wśród uczniów i blokowanie twórczych sposobów myślenia. W Polsce testy osiągnięć szkolnych rozkwitły wraz z transformacją ustrojową przy stosunkowo szczupłej grupie odpowiednich specjalistów. Niektórzy dydaktycy przedmiotowi ochoczo zajęli się nowością, ale większości nauczycieli, nie mówiąc już o dziennikarzach kształtujących opinię publiczną, brakowało kwalifikacji do opiniowania testów. Zwalczanie „testologii”, czyli teorii testu, i „testomanii”, czyli oszołomienia pomiarem, pozwalało im przetrwać w tradycyjnych przekonaniach edukacyjnych.
Pokutujący stereotyp testu to zbiór prostych zadań odwołujących się do pamięci i podatnych na zgadywanie, przynoszących punktację z nabożeństwem przyjmowaną przez władzę, ale niszczącą uczniów i dręczącą rodziców udaremniających racjonalne wysiłki nauczycieli. Ten stereotyp nijak ma się do jakości narzędzi produkowanych obecnie przez Centralną Komisję Egzaminacyjną i wyspecjalizowane wydawnictwa edukacyjne. Niestety osądy krytyczne utrwalają się łatwo, zaś ich łagodzenie i usuwanie wymaga żmudnego nabywania wiedzy oraz cierpliwego zgłębiania tematów.
Krytycy absolutyzowania roli testów w edukacji pośród zarzutów, jakie formułują, wskazują m.in. na ich niewrażliwość na kompetencje przekrojowe, jak chociażby: zdolność kojarzenia faktów, wyciąganie wniosków czy w końcu krytyczne myślenie, a więc umiejętności bezsprzecznie powiązane z procesem kształcenia, ale cechujące się właśnie ponadprzedmiotowością.
Nie jest prawdą, że zadania mierzące wysokie kategorie procesów myślowych, takie jak analiza i synteza faktów, wnioskowanie oraz ocena rozwiązań, są niemożliwe do zbudowania. Faktem jest wszakże, że będzie to trudne przedsięwzięcie, a jego produkt nie zawsze nas zadowoli.
Im bardziej twórcze jest zadanie ucznia, tym trudniej o jego obiektywne punktowanie. Ci, którzy tropią odstępstwa od „twardej” wiedzy naukowej, nie będą chcieli uznać swobody myślenia ucznia. Od nauczyciela będą wymagać trzymania się podręcznika i tego samego od autorów zadań i od egzaminatorów punktujących ich wyniki.
Wyjściem poza suchą teorię naukową jest fabularyzacja treści testów, wprowadzenie opowiadań o rzeczach i ludziach, nadających sytuacji charakter przygodowy. W tym kierunku rozwinęła się inwencja ośrodków pomiaru dydaktycznego, nie bacząc na protesty pedagogicznych konserwatystów. Dlaczego pojawia się w teście coś, czego na lekcjach nie było? Dlaczego stawia się ucznia w sytuacji niepewności? W tradycyjnej szkole pytano tylko o to, co było jednoznacznie podane.
Nieuchronna stronniczość testów mierzących kluczowe umiejętności intelektualne uczniów jest skutkiem niekontrolowanych okoliczności ich uczenia się. Uczniowie mają różne doświadczenia przyrodnicze ze swego środowiska i społeczne z układów rodzinnych. Łatwiej lub trudniej jest im wczuć się w sytuacje obrane na fabularny trzon zadań. Także egzaminatorzy punktujący wyniki tych zadań mogą mieć różne koncepcje przedmiotu szkolnego, bo nie da się ich „sklonować” według zaprogramowanego wzoru.
Teza o ponadprzedmiotowości wyższych czynności umysłowych jest prawdziwa i pedagogicznie doniosła, co jednak dodatkowo komplikuje testowanie. Rozumowanie uczniów wyćwiczone na matematyce może utrudniać interpretacje faktów historycznych, a odczucia artystyczne mogą zniechęcać do nauk ścisłych. Nawet gramatyka języka ojczystego interferuje z obcojęzyczną, tym bardziej jego fonetyka. Dobrze byłoby mieć testy wrażliwe na zjawiska kulturowe, ale byłoby im daleko do obiektywizmu.
Bolesław Niemierko - profesor, pedagog i wykładowca na Uniwersytecie SWPS w Sopocie. Autorytet w dziedzinie pomiaru dydaktycznego. Założyciel i kierownik seminarium doktoranckiego pomiaru dydaktycznego, oceniania osiągnięć uczniów i diagnostyki edukacyjnej, a także Podyplomowego Studium Pomiaru Dydaktycznego i Podyplomowego Studium Ewaluacji Dydaktycznej; stypendysta Fulbrighta, IREX i Fundacji Kościuszkowskiej; laureat Nagrody Wydziału I PAN (dwukrotnie). Badacz przebiegu i wyników uczenia się młodzieży. Interesują go prawidłowości psychologiczne i pedagogiczne tego procesu oraz metody sprawdzania i oceniania osiągnięć uczniów. Jest pionierem zastosowań testów do tego celu i ostrym krytykiem nadużyć, do jakich w związku z nimi dochodzi w autorytarnych systemach kształcenia. Autor ponad 100 publikacji. Opublikował m.in.: O powodzeniu nauczyciela w pracy dydaktyczno-wychowawczej (1969), Testy osiągnięć szkolnych. Podstawowe pojęcia i techniki obliczeniowe (1975), Cele i wyniki kształcenia (1988), Pomiar sprawdzający w dydaktyce. Teoria i zastosowania (1990), Między oceną szkolną a dydaktyką. Bliżej dydaktyki (1991), Pomiar wyników kształcenia (1999), Ocenianie szkolne bez tajemnic (2002), Kształcenie szkolne. Podręcznik skutecznej dydaktyki (2007), Diagnostyka edukacyjna. Podręcznik akademicki (2009), Samoocena i test. Moje doświadczenia (2016).
* * *
Z pełną treścią rozmowy zapoznać się można sięgając po czasopismo „Edukacja i Dialog”.