În timpul școlii, elevii iau nenumărate note, dintre care unele, precum cele la examenele naționale sau la admiterea în diferite unități de învățământ, le influențează major traseul educațional și chiar profesional, scriu specialișii Centrului de Evaluare și Analize Educaționale pe blogul propriu.
Scopul notării este acela de a reflecta în mod real nivelul abilităților unui copil, dar și de a-l plasa corect, pe o scală a rezultatelor, în relație cu elevii de aceeași vârstă.
O evaluare mai obiectivă înseamnă o oportunitate imensă pentru toți cei implicați în actul învățării – elevi, părinți, profesori, dar și pentru întreaga societate. Cu ajutorul ei poți identifica corect atât punctele tari cât și punctele slabe și poți interveni la timp, atât la nivel micro, cât și la nivel macro. Când vezi că un copil are o problemă într-o anumită arie, îl poți ajută să exerseze mai mult în acel domeniu pentru a o depăși. Când o evaluare națională îți indică o problemă generalizată, este limpede că acolo trebuie să faci o schimbare în sistem.
Însă, de cele mai multe ori, nota este departe de a oferi informațiile de care au nevoie părinții și profesorii pentru a-și sprijini și orienta în cunoștință de cauză copiii pe parcursul școlar.
Evaluarea nu înseamnă doar calcularea unui punctaj al elevilor la un test.
Notele ar trebui să reflecte atingerea unor standarde de performanță. Notarea este relevantă dacă au fost folosiți itemi relevanți, capabili să ofere informație cu privire la un anumit nivel al unei abilități. Spre exemplu, dacă, prin absurd am da la examenul de Evaluare Națională de la sfârșitul clasei a opta doar adunări și scăderi cu numere până la 10, notele mari obținute de absolvenți nu ar spune nimic despre nivelul real al abilităților lor. În mod similar, dacă am da doar probleme de la olimpiada națională de matematică de clasa a VIII-a, notele obținute ar reflecta într-o foarte mică măsură realitatea pentru marea majoritate a elevilor.
Estimarea abilității elevului pe baza administrării unui test
De-a lungul timpului, experții au căutat o modalitate de a realiza o evaluare care să aibă un nivel ridicat de obiectivitate și să dea rezultate valide, indiferent de grupul de elevi căreia îi este administrată, de contextul în care este dată sau de caracteristicile celor care corectează.
Așa au ajuns la aplicarea în educație a Item Response Theory (IRT), o familie de modele statistice bazate pe date, care îți permite să măsori constructe precum atitudini și abilități pe care altfel nu ai putea să le cuantifici. În educație, IRT e folosit în evaluare pentru a-ți permite să pui pe o scală achiziții cognitive ale elevilor care nu pot fi observate în mod direct, precum abilitatea de a lucra cu numere sau abilitatea de a face raționamente științifice.
Unul dintre postulatele Item Response Theory este acela că performanţa unui examinat la un item dintr-un test este rezultatul exercitării unei abilități, relevante pentru contextul de evaluare în care este administrat testul.
Conform celuilalt postulat, relaţia între performanţa examinatului la un item şi abilitate evaluată este descrisă de o funcţie monoton crescătoare (funcţia caracteristică itemului). Această funcţie ne spune că pe măsură ce nivelul abilităţii unui candidat creşte, probabilitatea ca acel candidat să răspundă corect la un item este mai mare.
Pentru ca itemii folosiți în evaluare să ofere o cantitate mulțumitoare de informație, trebuie luați în calcul parametri precum puterea de diferențiere sau de discriminare (parametrul a în graficul de mai jos) și dificultatea (parametrul b în graficul de mai jos). În ceea ce privește dificultatea, un item de nivel mediu, de exemplu, nu va putea distinge foarte clar între elevii cu un nivel al abilităţii respective scăzut și foarte scăzut, pentru că, probabilistic, toţi aceștia vor tinde să răspundă greşit. Dar un astfel de item nu va putea face o diferențiere nici între elevii cu un nivel al abilităţii bun și foarte bun, pentru că, probabilistic, toţi vor tinde să răspundă corect. La o întrebare de nivel mediu, vor răspunde corect cu o probabilitate de peste 50% şi un elev de un nivel puțin peste medie, dar şi un elev cu un nivel ridicat al abilităţii respective.
La un item mai dificil, doar un un elev bun va avea asociată o probabilitate de a răspunde corect de cel puţin 50%. Pentru cei slabi și cei de nivel mediu, probabilitatea de a da un răspuns corect va fi sub 50%.
Un alt parametru important este valoarea informativă a unui item, adică puterea sa de a diferenția între elevii care posedă abilitatea presupusă și cei cărora le lipsește. Itemii care ajung să fie incluși într-o testare construită în paradigma IRT sunt itemi capabili să facă diferența între elevi de niveluri apropiate, pe diferite paliere de dificultate ( itemi ușori cu putere de discriminare bună fac diferențieri fine între elevii slabi; itemi medii cu putere de discriminare bună fac diferențieri fine între elevii medii; itemi dificili cu putere de discriminare bună fac diferențieri fine între elevii buni) . Un test este cu atât mai obiectiv și fidel (în raport cu distribuția reală a elevilor în populație, după abilitatea presupusă) cu cât funcțiile informative ale itemilor care alcătuiesc testul au valori mai mari.
Cum selectezi itemii potriviți
Pentru ca evaluarea să fie relevantă, în ea trebuie incluși itemi pretestați pe un eșantion de elevi relevant din punct de vedere statistic. În urma ei, vor fi selectați doar acei itemi care oferă o cantitate mare de informație pe palierul lor de dificultate. Doar aceștia vor fi, mai apoi, incluși în testul care trebuie să conțină itemi care să acopere toate palierele de dificultate.
Citește analiza integrală pe ceae.ro
Notă: Textul a fost preluat cu acordul autorului
Foto: © Syda Productions | Dreamstime.com
Dreamstime.com sprijină educaţia din România şi, în contextul pandemiei Covid-19, oferă gratuit imagini stock prin care Edupedu.ro îşi poate ilustra articolele cât mai relevant posibil.
1 comment
Exact dupa aceste criterii sunt formulati itemii din subiectele de examen !? Sau,poate, regula este valabila doar pentru itemii pe care ii construiesc profesori pt teste si teze? Nu trebuie sa folosim acelasi sistem de masurare?