lunes, 6 de julio de 2015

Ensayo... error-acierto... acierto-error...




¿Estás seguro que de pasar de cinco a cuatro opciones
 de respuesta subirán las respuestas netas en el próximo examen?


Respuesta... de lo que pueda pasar el examen que viene no doy un duro... ¿por qué?...

Porque puede no ser del mismo grado de dificultad y eso modularía las consecuencias del cambio de cinco a cuatro opciones por respuesta...

Sin embargo de lo que estoy seguro es de lo que hubiera ocurrido el pasado examen si ese cambio se hubiera dado en el mismo manteniendo el resto de variables... ¿qué hubiera pasado?...

De repartirse proporcionalmente la frecuencia de la opción menos consistente entre el resto de opciones, incluidas las no contestadas, es decir, siendo conservador porque repartir también entre las no contestadas va en contra de la hipótesis enunciada de que disminuye el riesgo de contestar... la distribución de resultados del examen en respuestas netas hubiera sido de 1,93 netas más en la media y de 1,97 netas más en la mediana.

¿Esa subida hubiera sido lineal a lo largo de la distribución?... es decir, ¿sube igual todo el mundo porque el examen será para todos igual y por tanto sus consecuencias son iguales?... 

Naranjas de la China... no, ese cambio no discriminará igual para todos...

De haberse producido el cambio el pasado MIR: 

1.- Hubiera mantenido el número de las preguntas difíciles respecto del total, es decir su número de aciertos...

2.- Hubiera disminuido el número de preguntas normales, respecto del total, es decir, su número de aciertos...

3.- Esa disminución de las normales hubiera aumentado la misma magnitud el número de las preguntas fáciles, respecto del total, es decir, su número de aciertos...

Y esas hubieran sido las tres causas del aumento de la media y la mediana de la distribución... pero también de la discriminación no igual para todos...

Ahora solo faltaría razonar que si se aciertan y fallan por igual las difíciles... disminuyen las regulares porque aumentan las fáciles... y la suma de todas ellas ha de seguir siendo igual... tiene lógica decir que las fáciles las contesten más examinados a lo largo de la distribución, más que las difíciles y más que las normales... ¿qué notas subirán más?...

Evidentemente las bajas y medias... pero a las bajas ni fu ni fa porque seguirán siendo bajas... y a las altas ni fu ni fa porque seguirán siendo altas... la "pupa" se producirá "en el medio de la distribución tirando al alza"... eso es así por la ley de los grandes números tuneada por el efecto añadido o "discriminatorio" del esfuerzo de la preparación y del entrenamiento (véase la máquina de Galton para tener una idea gráfica de la distribución sin el efecto añadido de la preparación y entrenamiento del examen)... ¿y eso que significa globalmente?...

Mejores respuestas netas y peores nº de orden en una parte de la distribución... la más sensible para los nº de orden... donde más "pupa" hace el apelotonamiento de resultados... ¿por qué?...

Porque las plazas se eligen por nº de orden, y los nº de orden van de uno en uno por lo tanto su pendiente es 1. Sin embargo el resultado del MIR se expresa en diezmilésimas para evitar al máximo los empates, y por tanto su pendiente se expresa en diezmilésimas y es prácticamente 0,0001... eso significa que 1 respuesta neta son 80-100-120 y más nº de orden, según sea el percentil de la distribución de resultados...

Si tiendes a discriminar, que es la función de este examen en particular por su naturaleza ordenatoria para elegir plaza de forma prevalente, deberías de tender a que la pendiente de los resultados del examen y del baremo, expresada en diezmilésimas, fuera de por sí lo más alta posible en diezmilésimas, es decir, lo más separada posible dentro de las diezmilésimas en las que se expresa... es decir, que sea el propio examen quien discrimine lo máximo posible y el baremo quien desempate, y no los nº de orden... ¿por qué?...

Porque los nº de orden no tienen remedio, se cambia nota en diezmilésimas por nº de orden ya que las personas eligen de uno en uno, completas y no divididas en diezmilésimas... se cambia una distancia que casi se pegan tan cercanas que están con una distancia de uno en uno... 

Esa es la cuestión, un examen que "separe o discrimine al máximo" en sí mismo para que el "sentimiento de la dificultad y de la discriminación" sea y se sienta acorde con el "sentimiento" de haber merecido la pena el esfuerzo de la preparación y del entrenamiento para conseguir el objetivo de nº de orden...

Cuando esos dos "sentimientos" confluyen, los examinados "no rebullen" porque se ha conseguido más o menos la conformidad entre los examinados... lo que llamo la "paz social" entre los examinados... a eso ha de aspirar un examen de esta naturaleza... según mi leal saber y entender...    

¿Esa subida simulada de lo que habría pasado el año pasado de darse ese cambio, podría ser "absorbida" por alguna medida el año que viene?...

Podría... si comparas con otros años, por ejemplo el pasado, bastaría que o bien subiera la penalización actual (33,33 %) que hace que compense contestar en todo caso después de reducir de cinco a cuatro las opciones de respuesta, o bien subiera la dificultad del examen de tal manera que los examinados la "sintieran"... es decir, contestaran menos por ello...

Las no contestadas no son otra cosa que ese "sentimiento", mayor en los que menos se preparan y entrenan y al revés, de ahí que si no lo "corrigen" con "algo" sigo pensando que ese cambio tiende a discriminar menos... baja la "pendiente" de la distribución... hace la campana más platicúrtica...

De todas formas, un cambio brusco de la dificultad del examen, se "llevaría por delante el resultado de la simulación y más, mucho más"... y además una distribución de resultados es como una "tubería opaca con sus diferentes pendientes, centrales y extremas" en la que se ve el exterior, su forma... pero no el interior, es decir, sabremos sus "medidas centrales e incluso extremas", pero nunca podremos saber lo que uno cualquiera de los examinados que "sube o baja por su interior" habría hecho o dejado de hacer si las circunstancias hubieran sido otras... 

Pero de todas formas de esas "medidas centrales y extremas" se puede deducir lo que ocurre "dentro de la tubería" si estudias la distribución de todos los resultados por los de algunos grupos más o menos homogéneos o subconjuntos con parecidas características, circunstancias, o variables...

Porque el intervalo extremo de la dificultad, que fue de 15 netas desde la convocatoria 2001 hasta la convocatoria 2009, se amplió hasta las 18 hace dos convocatorias... y hasta las ¡26 netas!... en la pasada...

Ese es el intervalo a día de hoy entre el examen más difícil en su mediana (convocatoria 2009 y examen 2010; 85,00 netas) y el más fácil en su mediana (convocatoria 2014 y examen 2015; 111,00 netas)...

Así pues, salvo error u omisión por mi parte, ya tenemos la primera prueba de la hipótesis...

Adenda.- En la muestra utilizada para realizar el trabajo, muestra postMIR consistente pero no aletorizada, se ha comparado la subida media que hubiera tenido de haberse dado ese cambio y manteniendo la penalización en el 33,33 % con el resultado que tuvo posteriormente en el MIR para modularla, y por el mismo procedimiento se ha modulado con la media y la mediana del MIR... de ahí ha salido el resultado expresado más arriba... donde dice... 

"el resultado de la distribución en el MIR hubiera sido 1,93 netas más en la media y 1,97 netas más en la mediana"...

No hay comentarios:

Publicar un comentario en la entrada