martes, 16 de junio de 2015

El MIR cada vez más español y más joven...

...



Cada vez la mediana de respuestas netas es más alta, ¿por qué?
porque, a pesar de que la "distancia" entre la mediana de todos los examinados
españoles y de todos los extranjeros se mantiene igual (17,67) entre el MIR 2009/2010
 y el último MIR, dentro del subconjunto de todos los españoles cada vez son más los
 recién egresados (sobresalientes, notables, y aprobados) lo que hace que la mediana
 haya pasado de 85,00 respuestas netas del MIR 2009/2010 a 111,00 netas 
en el último MIR 2014/2015 

que son ¡26,00 respuestas netas de diferencia!

Esta es la clave de lo que está pasando en el MIR,
¡suben las notas del examen y se obtiene peor nº de orden!
según se demuestra en las dos gráficas, superior e inferior.

¿La causa?


El diferente % de participación de unos y otros en la prueba,
y en el subconjunto de todos los españoles cada vez más % de recién
 egresados hasta su estabilización.

El reflejo gráfico del cambio de participación en el MIR se puede ver en la entrada: 


en valor absoluto la primera de las dos y en valor relativo la segunda.

Cuanto mayor sea el % de recién egresados españoles partícipes en el MIR,
mejor será la mediana del MIR a igualdad del resto de variables,
por tanto un MIR cada vez más español y cada vez más joven
será, a igualdad del resto de las variables, cada vez más fácil
¡pero cada vez más difícil!...

según se puede ver en la siguiente gráfica...


Evolución de la mediana de nº de orden


Adenda 1 para el examinador.- 

Si quieres templar las gaitas ya sabes lo que te toca, templar la dificultad del examen en función de la mochila de los examinados para que el "sentimiento" de discriminación, que no es igual que el "sentimiento" de dificultad, prevalezca sobre el segundo. Una cuestión de "sentimientos" que es el arte del equilibrio de los diferentes grados de dificultad del conjunto de preguntas del examen. El arte del examen MIR, del sancta sanctorum del examen MIR.

Lo llamo "sentimiento" de discriminación porque con los datos globales de respuestas netas de los examinados no hay manera de rascar más al fondo, para ello sería necesario estudiar los resultados pregunta a pregunta y ver las funciones de discriminación de cada distractor, ya que si la mido entre uno y otro de los resultados globales de cada examinado con su contiguo, la diferencia de discriminación entre resultados de un año y otro es muy parecida entre los distintos exámenes, pero esa no es la discriminación que entiendo que haya que medir.

La que entiendo que hay que medir es la referida al "sentimiento" de los examinados, y como no puedo hacerlo cualitativamente por encuesta y además no sería suficiente, me tengo que ir a medir cuantitativamente la de cada pregunta del examen en sí misma, para poder contrastar su resultado cualitativo con el resultado cuantitativo de las funciones matemáticas que lo gobiernan, y acto seguido "ver" si el "sentimiento" general de los examinados está o no justificado. Es decir, si la "calidad" de las preguntas, como instrumento de medida de lo que se quiere medir está o no dentro de un "orden" aceptable, vamos, si pasan o no la prueba del algodón. 

En resumen, una medición cuantitativa de lo cualitativo (el "sentimiento de mayor o menor poder discriminación del examen"). Esa es una de las tres patas de la TRI, las otras dos son la función de probabilidad y la función de información, de cada pregunta y del examen en su conjunto. Las tres constituyen las tres patas del examen, medidas por la "trébede" de la TRI. En definitiva, el examen del examen. 

Adenda 2 para el examinador.- 

Las dos variables que influyen en el nº de orden del MIR son la población de presentados y la dificultad del examen, real y sentida. Ambas variables pueden ir en la misma dirección y sentido y sus consecuencias por tanto se suman, pero también pueden ir en la misma dirección y sentido contrario y entonces se restan, se equilibran, se "templan"... para muestra dos botones...



El efecto, desagregado, de las dos variables en el nº de orden (I)


El efecto, desagregado, de las dos variables en el nº de orden (II)

Adenda 3 para el examinador.- 

La simulación del reparto, por baremos académicos, del aumento de recién egresados españoles que ha comenzado a producirse hasta su estabilización.


Simulación del aumento y reparto de los sobresalientes


Simulación del aumento y reparto de los notables


Simulación del aumento y reparto de los aprobados

Adenda 4 para el examinador.- 

La demostración de la correlación de baremo académico y respuestas netas de examen, a pesar del ruido de fondo... para muestra un botón... 


Cada punto un examinado

y más...  aquíaquíy aquí...

Adenda 5 para el examinador.- 

Aquí se ven muchas cosas del grado de dificultad, real y sentido, por los examinados pero no se ven tan desmenuzadas (desagregadas) sino en un todo. Para ver las causas hay que desagregar por subconjuntos que tengan visos de ser lo más parejos posibles para poder comparar.


Véase como los resultados del examen cada vez son mejores,
lo que supone que a igualdad de presentados al examen los resultados
de nº de orden, que van de uno en uno, y no en diezmilésimas como va la 
suma del resultado del examen y del resultado del baremo, sean cada vez peores. 

Corolario final para el examinador.- 

El arte del MIR sería poder mantener constante el "sentimiento" de discriminación del examen por parte de los examinados. Para ello habría que hacerlo de tal manera que la variable presentados y la variable grado de dificultad del examen se acoplaran mutuamente hasta conseguir "sentir" que a igual esfuerzo de mochila y preparación igual nº de orden y al revés. Al menos intentarlo, porque no hacerlo equivale a dejar el control del nº de orden a la aleatoriedad de las variables, y es con el nº de orden con el que se eligen las plazas y no con las respuestas netas de examen. Este es el meollo de la cuestión. 

En la conjunción de todas la variables, incluida la preparación, hay que contar con la aleatoriedad, aprender a convivir con ella, eso implica intentar mantenerla dentro de un orden, que es lo mismo que decir dentro de un intervalo de incertidumbre con los mínimos vaivenes posibles de ese "sentimiento". El "arte" del "arte" en suma, es acoplar el control del grado de dificultad del examen con la demanda medida en el número de presentados. 

Una tarea casi imposible a la que ha de aspirar todo examinador, la menor varianza posible en los resultados del criterio establecido para pasar la nota de corte, es decir, que esta se aproxime el máximo posible al percentil vigésimo séptimo de la distribución de resultados. 

En un examen de esta naturaleza, que se ha convertido no solo en una prueba normalizadora u ordenadora, sino en una prueba que tendiendo a una oferta de plazas estabilizada y una demanda principal estabilizada (recién egresados españoles, partícipes "naturales"), tiene que buscar el "arte" de conseguir que el resto de la demanda se acople, se module, mientras sea de libre concurrencia a esas premisas, consiguiendo aproximarse al anhelado continuo "teórico" grado-postgrado en equilibrio.

Ese equilibrio no viene de su natural, sino de la mano de múltiples variables que se han de otear en el horizonte, para después conjugarlas orientando sus términos en la ecuación final, para que esta de el resultado esperado.

No hay comentarios:

Publicar un comentario en la entrada