MIRentrelazados: ¿Cuántos MIRes hay dentro de un MIR?...

...

después de terminar esta entrada, encabezada con un ¡Adiós!... no me he resistido de completar el mismo con otras tres, una de ellas con referencias para los próximos MIRes... y esta otra titulada Atisbando el futuro inmediato, desde la perspectiva de los últimos catorce años, a modo de legado... y por fin esta última, que no es otra cosa que un intento más de buscar por los recovecos de la población MIR... al hilo de lo que ha pasado este año con el grado de dificultad del examen... ¿por qué?

Porque una cosa es que me retire a mis cuarteles de invierno, por las causas expuestas en diferentes entradas, y otra muy distinta que ello implique que deje lo que dice el subtítulo del blog desde su creación en enero de 2007. Mientras disponga de datos para trabajar y temas del MIR por investigar seguiré en ello... porque nunca fui para dos días...

0.- Preámbulo

Trabajos anteriores sobre el grado de dificultad del examen

¿Se puede extraer conocimiento de los datos?
Los resultados del MIR por países

Un tema por resolver

La nota de corte natural

El orden de la respuesta correcta

El efecto de las modulaciones

La dificultad del examen en cuatro estadísticos

La métrica del MIR

Estadísticos del MIR 2013/2014

Los resultados de las academias

¿Causalidad o casualidad en el MIR?

Probabilidad de nº de orden

Relación examen/baremo por países

¿Compensa repetir el MIR?

El baremo y su peso

Empates en el MIR

La función del baremo académico y su peso

Atisbando el futuro inmediato, el efecto de las modulaciones

0 bis.- Autocrítica al paso

Trabajo iniciado el día 2 de mayo de 2015 a las 20 horas, sigue en construcción y se irá subiendo conforme vaya elaborando las tablas, a la vez que he ido, y voy, reescribiendo el texto hasta su terminación… texto que pide un resumen y/o una poda de lo más reiterado...

1.- Antecedentes

Con el criterio actual de la nota de corte, la demanda voluntaria queda modulada por los que superan la misma, demanda efectiva, que son los que obtienen nº de orden y son llamados a elegir plaza. Depende del número de presentados al examen, demanda voluntaria, y del % de la afección de la nota de corte, ya que solo el que la supera se le adjudica nº de orden.

El % de afección por la nota de corte depende del grado de dificultad del examen sentido por el conjunto de los examinados en los diferentes intervalos de la distribución. Los diez primeros exámenes, el grupo fuerte (por encima del P73), el grupo medio (entre el P73 y el P27), y el grupo débil (por debajo del P27).

Este año se presentaron al examen 10.801 médicos (7.847 españoles más 2.954 extranjeros afectados y no afectados por el cupo), frente a 10.241 el año pasado (7.027+3.214 respectivamente). Eso ha significado 820 españoles más (habían egresado aproximadamente 707 más) y 260 extranjeros menos en el subconjunto de todos ellos.

El efecto del aumento de la demanda, 560 presentados más al examen respecto del año pasado, ha supuesto un aumento del +5,47 % de examinados.

La nota de corte el año pasado fue de 66,00 respuestas netas y este año ha sido de 66,33 respuestas netas, prácticamente la misma (el mismo sentimiento del grado de dificultad en los diez primeros exámenes), pero el % de afección de la misma (sentimiento del grado de dificultad en el grupo fuerte, medio y débil) ha sido mucho menor que el año pasado, el 20,80 % frente al 28,13 %.

Ello ha supuesto que 8.554 examinados (6.735 españoles + 1.819 extranjeros) obtuvieran nº de orden frente a 7.360 (5.624+1.726 respectivamente) el año anterior. En total 1.194 más examinados con nº de orden (+16,22 % de aumento con nº de orden) frente a solo 560 examinados más (+5,47 % de aumento de la demanda). Todo ello para 66 plazas menos (6.079 plazas este año frente a 6.145 plazas el año anterior).

A mi entender esa ha sido la causa, y no otra, de los errores de estimación de nº de orden, ante la sorpresa, que no quise creer de la serie de datos de las muestras de corrección recogidos en las tablas del Estado de la cuestión. No la quise creer a pesar de que la tuve delante mis narices.

Esas diferencias en la tabla del Estado de la cuestión ya marcaban las +10 netas en la media y mediana de la distribución de notas del examen, pero ¿quién podía creer una desviación de 10 netas en un solo año? No tenía conocimiento de que hubiera ocurrido nunca.

La consecuencia de esos datos fue que este año se metieron en el centro de la distribución de resultados 1.194 examinados más que el año anterior y esa fue la causa de que se echaran para atrás los nº de orden desde el principio hasta el final de forma proporcional, de menos a más.

Un apelotonamiento de los resultados en un amplio centro de la distribución, superior al apelotonamiento estándar, porque no todos los presentados al examen han sufrido y gozado por igual su "grado de dificultad". Para aquellos que han obtenido nº de orden perfecto, para aquellos que se han visto desplazados el nº de orden esperado, sorpresa y descontento.

¿Por qué el descontento?

Por que no olvidemos que las plazas se eligen por nº de orden dentro de un año determinado, y esa es la diferencia clave del MIR de un año para otro, no las respuestas netas.

Es el número de presentados, y el grado de dificultad del examen, que repartido en % de preguntas muy difíciles, difíciles, regulares, fáciles, y muy fáciles, logra realizar la discriminación que busca el MIR a lo largo de toda la distribución.

No se elige por respuestas netas comparadas un año con otro. Se elige por nº de orden dentro de un mismo año según el resultado obtenido, esa es la clave de cada MIR, el número de presentados y el grado de dificultad del examen, y de como te adaptes tu al mismo.

Esos +1.194 ha sido la causa final de que se hayan replegado casi todas las plazas ofertadas, y no precisamente las leídas en los curiosos análisis cualitativos, sean interesados o de buena voluntad, que se han escrito al contestar a preguntas realizadas por lo medios o por iniciativa propia. Dicho sea salvo mejor criterio.

Movido por esa diferencia de criterio causal respecto de otros, he diseñado este trabajo para tratar de confirmar, o no, la causa de esa menor afección de la nota de corte (el 20,80 % frente al 28,13 %) y me he realizado la siguiente pregunta.

¿Acaso se ha debido a que el examen tuviera un menor grado de dificultad específica en alguna parte de la distribución de los resultados, concretamente en los recién egresados españoles que han aumentado alrededor de 700 y que supuestamente habrían de haber obtenido mejor resultado, y acaso también ha influido una disminución de extranjeros (-260) que obtienen peores resultados en su conjunto, o por el contrario, esa supuesta menor dificultad sentida fue una estrategia del examinador para conseguir un menor % de afección de la nota de corte y con ello intentar que no quedaran plazas vacantes, o quedaran el menor número posible de ellas?

La típica respuesta anticipada sería que todo influyó. Estaría de acuerdo. Pero, ¿cuánto influyó cada una de las variables de la pregunta?, ¿podemos intentar desagregarlas o al menos atisbar cuál de ellas fue la más importante?

Para aproximarnos a esas preguntas, y tratar de obtener respuestas, planteo una hipótesis de trabajo, una recopilación previa de los datos precisos, la realización de los cálculos necesarios, y a través de lo que digan los mismos sacar las conclusiones oportunas.

2.- Introducción

El arte del examen se centra en su propia naturaleza. Es tal que siendo los examinados miles y miles de médicos, recién egresados o en ejercicio, y provenientes de diferentes universidades españolas o extranjeras por ser una prueba de libre concurrencia, es capaz de ordenarlos por sus resultados para elegir plaza de formación especializada. Ante la posibilidad de múltiples empates en el resultado del examen se le suma al resultado final un peso en el mismo de una parte del valor del baremo académico, aplicando al resultado de transformación en puntos del examen y del baremo cuatro decimales para disminuir al máximo los empates finales.

Para conseguir que el examen discrimine el máximo posible se sigue un formato tipo test con opciones múltiples de respuesta con penalización por las respuestas erróneas. Son 225 preguntas más 10 de reserva a contestar en un tiempo máximo de cinco horas. ¿Podrían ser más preguntas o incluso más ejercicios?, pueden ser más preguntas e incluso se podrían realizar dos ejercicios de examen en dos días seguidos obteniendo la media de sus resultados como resultado final para disminuir la posible aleatoriedad del mismo. No hay nada que lo impida, salvo error de interpretación de las normas por mi parte.

Las normas del formato premian las contestaciones válidas y penalizan las erróneas, entre cinco posibles. Las posibles cinco respuestas es una costumbre que no está normativizada por lo que podrían disminuirse si se demostrara que más allá de un número menor no aumenta su poder de discriminación. En suma el examen es un examen de potencia y velocidad. Requiere leer la pregunta, comprender e interpretar lo que preguntan, y elegir la respuesta válida entre cinco a una velocidad media de pregunta por minuto. (225+10 en cinco horas, de ahí lo de potencia y velocidad), y todo ello, siempre o casi siempre con incertidumbre, con menor o mayor incertidumbre para elegir la respuesta que se intuye válida.

Ese ejercicio de respuestas múltiples es el instrumento buscado para concentrar la prueba, una vez al año, en un solo día y a la misma hora, en diferentes localidades como sedes de examen.

Ese tipo de examen, por economía procesal, es el elegido para trata de medir los conocimientos médicos de los examinados en ese día y no en otro anterior o posterior, y además también, medir el sesgo latente que implica elegir con rapidez e incertidumbre la respuesta válida entre varias.

El resultado de todos, con diferencias de diezmilésimas los contigüos, se ordena y se le adjudica un nº de orden para normalizarlos, es decir, para llamarlos a elegir plaza por orden de prioridad.

Por lo tanto las notas cercanas en diezmilésimas, y que no diferencian en mucho los conocimientos de su anterior y su posterior, si que los diferencian por un nº de orden para elegir. Esas son las normas de la prueba a las que se han de adaptar los demandantes, salvo que las cambien, y es la forma de selección que el SNS en su conjunto diseñó en su día, allá por 1978 y que se han mantenido hasta la actualidad con ligeros retoques.

A partir del 2008 se estableció la posibilidad de concretar un criterio para adjudicar nº de orden a los examinados, porque durante unos años fue posible elegir plaza con nota negativa al haberse reducido la demanda. Esa nota de corte se ha estabilizado en los dos últimos años en una nota de corte del 35 % de la media aritmética de los diez mejores exámenes. Nota de corte que en un examen estándar estaría cercana al percentil 27 de la distribución, es decir, se acercaría al 27 % de afección. Como depende de la media de los diez mejores y del sentimiento del grado de dificultad del examen, el % de afección es variable y no fijo en el P27.

Así por ejemplo el año pasado fue del 28,13 % con un examen estándar en su reparto del grado de dificultad a lo largo de la distribución. Pero este año esa afección ha bajado al 20,83 %, es decir, bastante menor que el P27, prácticamente el P21, por lo que es lógico que nos preguntemos por la causa de esa menor afección.

¿Será porque se han preparado mejor los demandantes, será por el aumento de 700 recién egresados españoles que vienen pisando los talones con mejor mochila por el aumento de las exigencias al entrar en las facultades de Medicina, o acaso el grado de dificultad del examen ha sido menor que el año pasado, especialmente en una buena parte de sus preguntas que han estirado la distribución de notas al alza desde el centro de la misma disminuyendo el % de la afección de la nota de corte en su cola?

3.- Hipótesis de trabajo

En un MIR que tienda a un comportamiento estándar de grado de dificultad, la nota de corte del 35 % de la media de los diez mejores, tenderá a afectar aproximadamente al 27 % de los examinados. Que es tanto como decir, que tiende al valor del P27 de la distribución de resultados que determina el grupo débil, según la clasificación de Ebel y Truman.

Para poder hablar del grado de dificultad del examen, y poder comparar el % de afección de la nota de corte, propongo desagregar los resultados por grupos lo más homogéneos posibles si podemos hacerlo con los datos disponibles. Por ejemplo españoles y extranjeros.

Lo ideal sería desagregar a los españoles solo por recién egresados, que serían el grupo más homogéneo a estudiar, y el que más interesaría por su número y por su especificidad. Este año además muy especialmente, ya que han aumentado respecto del año pasado en 700 aproximadamente. Está previsto que aumente en 370 el próximo... y en los siguientes 230, 400 y 70. En los dos siguientes 2019 y 2020 ya desciende en 60 egresados cada uno aproximadamente.

¿Acertamos si nos preguntamos cuántos MIRes hay dentro de un MIR?

Para contestar esa primera pregunta no vale decir que tantos como presentados al examen. Para estudiar y medir tenemos que desagregar subconjuntos lo más homogéneos posibles. De ahí lo de desagregar españoles y extranjeros, y hacerlo en un conjunto tal de convocatorias que podamos sacar conclusiones. De esa forma podremos acotar comportamientos y observar los resultados de los mismos. De entrada sabemos que no son subconjuntos exactamente homogéneos entre ellos mismos, pero lo son más que el conjunto total de examinados.

Recurro a ello por que se de antemano que sus resultados son diferentes, y de esa forma consigo estudiar los resultados de todos los españoles, ya que no me es posible acotar totalmente el comportamiento de los recién egresados españoles, que es lo que busco.

No obstante, dentro del subconjunto de españoles, podemos observar en los últimos catorce años observo que cada año que pasa las pegas establecidas para recircular y reespecializarse han sido mayores, por eso y también por otras causas, el subconjunto del total de españoles se va acercando al de recién egresados. Ahora mismo los recién egresados suponen, aproximadamente, las tres cuartas partes del total de los españoles presentados.

¿Se mantendrá en ese % cuando se implante la troncalidad que viene, o por el contrario aumentará aún más en un intento de las administraciones de reconducir la reespecialización hacia la prueba específica troncal para ellos?

¿Acaso las autoridades están tratando de aproximarse al "teórico continuo grado-postgrado", no legislado como derecho, con diferentes modulaciones para que la prueba MIR general lo consiga al máximo posible que sería teóricamente 1:1?

Estas son las razones que me llevan a seguir buscando, tratar de averiguar si en los próximos años podemos pensar que la afección de la nota de corte será menor del 27 % porque van a seguir aumentando los recién egresados durante los tres años que vienen (370;230;400) aunque no tanto tal y como se ve para comenzar a estabilizarse o incluso descender ligeramente (+70;-60;-60)

Este año la afección de la nota de corte ha sido del 20,80 % y ha sido una sorpresa, sorpresa que ha supuesto confirmar 10 respuestas netas de ampliación del intervalo de incertidumbre, en sus medidas centrales, entre el examen más difícil de los últimos 14 años.

En los 11 primeros, de esos 14, el intervalo había sido de 15 respuestas netas, que se amplió en 3 en el examen siguiente hasta 18. El siguiente quedó dentro del intervalo de incertidumbre bajando algo menos de 3. Este año la sorpresa es que se ha ampliado desde el máximo de 18 respuestas netas a 28 respuestas netas, en un solo año 10 respuestas netas de diferencia.

Lo propio de un examen de esta naturaleza es que su comportamiento se mueva en un intervalo acotado que determina por un lado, la pericia del examinador, y por otro, la eficiencia de la preparación de los examinandos, determinada a su vez por la pericia y eficiencia de ellos y de sus preparadores. ¿Por qué?

Porque los conceptos médicos que se preguntan en el examen no son estáticos como en matemáticas o en física por ejemplo, lo son de una materia en permanente evolución. No hay un temario cerrado para el examen, no lo ha habido nunca desde su creación. Sí se tuvieron en cuenta, en su día, los planes de estudio de las facultades.

El hecho de que no haya temario cerrado no significa que se vaya a ciegas, antes bien hay una constatación empírica de que aproximadamente la mitad de las preguntas del examen lo son de conceptos importantes, consolidados y repetidos con anterioridad, aunque frecuentemente reelaborados en su texto y contexto por quien lo redacta. La otra mitad son preguntas de conceptos nuevos no preguntados anteriormente.

En el MIR español se puede sacar del examen, cuando terminas el mismo, no solo una copia de las tres de la plantilla de respuestas, sino que se puede sacar el cuadernillo de preguntas, por lo que la colección de preguntas puestas a lo largo de la historia del MIR ha servido y sirve para preparar los MIRes siguientes. Los expertos del país de referencia se asombraron en su día de ello, pero desde mi punto de vista esa concesión se ha convertido en un acierto.

La conclusión es que todos los implicados en el examen necesitan que el intervalo de incertidumbre, respecto del grado de dificultad en el que se moverá el examen, esté +/- acotado para saber a qué atenerse como si hubiera un temario y rentabilizar el esfuerzo y la pericia de la preparación, y por lo tanto que no se mueva bruscamente ni para arriba ni para abajo el grado de dificultad del examen, porque afectaría a la esencia del mismo, que es discriminar para ordenar con el menor apelotonamiento posible en el centro de la distribución de los resultados del examen, es decir, con los menores empates posibles, ¿por qué?

Por que a las notas finales, que se expresan en diezmilésimas para evitar los empates al máximo, se les adjudica nº de orden correlativo para elegir plaza sin empate posible en el nº de orden, a pesar de la cercanía entre notas expresadas en diezmilésimas en el centro de la distribución que casi empatan o empatan, y esta es la madre del cordero de la paz social en el MIR, conseguir que la discriminación de los resultados del examen se aproxime el máximo posible a la detección del conocimiento médico de los examinados y al sesgo latente de expresar esos conocimientos con la máxima eficacia y eficiencia.

La eficacia, cantidad de preguntas contestadas, es imprescindible para ganar, pero requiere una condición, que lo hagas con eficiencia, es decir, con el menor número posible de respuestas erróneas, porque una respuesta errónea penaliza un tercio del valor de una respuesta válida.

Lógicamente los examinados piensan que es preferible, ya que te has de preparar el examen, que no sea la suerte quien decida tu resultado, o que lo decida en el menor grado posible. De lo contrario se alteraría la paz social en el procedimiento por no compensar preparar el examen y se terminaría pidiendo que esa paz social la decidiera un sorteo.

Todos somos médicos, todos empatados en eso y se acabó la discusión, que sea la suerte en un sorteo quien decida mi destino. Por cierto, puestos a sortear, hagámoslo también con la entrada en el numerus clausus de las facultades.

Suerte por suerte con un sorteo conseguimos aumentar la eficiencia procesal al 100 % con cero costes de todo, de tiempo y de dinero. El sorteo se alimenta de la lógica de la igualdad y de la lógica de la estadística. Por eso no es raro que haya voces que lo pidan, no solo para sortear las plazas de formación de especialidad, sino también para sortear las plazas del numerus clausus, y lo hacen de forma razonada se esté o no de acuerdo con ellos. Aquí también se hacen más preguntas de por donde ha ido y puede ir la educación médica.

Me temo que ante la lógica del sorteo, no solo por aquello de igual título, automáticamente se alzarían las voces de los académicos para hacer valer el expediente académico. Una vez quitadas las academias de en medio, que son su obsesión, solo les faltaría proponer el expediente académico como elemento discriminador o diferenciador.

El asunto de que unas facultades sean más generosas en su calificaciones que otras, se arregla fácilmente dirían, proponemos una modulación, ponderación, o baremación, que rebaje los humos de los que califican más alto y suba los humos de los que califican más bajo.

Por cierto esa es la justificación cualitativa y cuantitativa de la baremación actual en base cuatro, por un lado igualar a los aprobados de todas las facultades (5-6,99), igualar todos los notables (7-8,99), todos los sobresalientes (9-10), y todas matrículas de honor adjudicadas sin examen voluntario y público entre los sobresalientes. Por otro lado premiar el salto de base numeral, que el imaginario imaginario popular distingue en letra, aprobados, notables, sobresalientes y matrículas de honor, multiplicados por uno, dos, tres y cuatro sus magnitudes, sean asignaturas o créditos.

La baremación, sea el procedimiento que sea el empleado, por definición no es otra cosa que la modulación o ponderación de las calificaciones, expedientes académicos, de distinta procedencia ante una prueba unitaria y común que valora el expediente académico en un % de peso del resultado final, y que curiosamente en el MIR, con la reducción de peso, solo sirve para desempatar, y todavía lo hará más eficazmente si su peso disminuye.

¿Por qué imagino que los académicos propondrán esa modulación, ponderación, o baremación?

Porque nadie mejor que ellos conoce, salvo el gestor de la prueba el MSSSI que dispone de los datos, que los expedientes académicos difieren según sean de unas facultades u otras en sus estadísticos, y que no necesariamente los resultados del examen de los alumnos de cada facultad justifican esa diferencia, y como al fin y al cabo ellos tuvieron arte y parte en esas calificaciones, y de lo que se trataría es de recuperar de una u otra forma el control perdido en su día en el posgrado MIR, de menor importancia entonces que el que conservaron y conservan. Conceder sin ceder con ánimo de recuperar.

El MIR, que no se propuso ser una reválida, ni una prueba de acreditación, lo ha terminado siendo desde 1995 por hacerse "necesaria" la especialización, pero desde que el MSSSI publica los resultados por facultades siguiendo el método propuesto por Ebel y Truman, la cosa parece que se ha complicado, ¿qué ha pasado?, lo previsible.

Las críticas de los que se sienten supuestamente "perjudicados" por ello, más cualitativas que cuantitativas, han llegado a aplicarle al MIR el calificativo de "sistémico" para la formación académica recibida en las facultades, en lugar de lo contrario, y se han comenzado a hacer propuestas de lo más curiosas.

Volvamos al grano, las preguntas que nacen del planteamiento, equivocado o no, serían, ¿ha tenido influencia en ello el importante aumento de recién egresados que supuestamente hacen el examen mejor por tener recientes los conocimientos, hábitos de estudio, y tiempo invertido en la prepración?, o por el contrario...

¿Se ha debido a un criterio y deseo buscado por el examinador intentando poner un examen con un menor grado de dificultad para el centro y la cola de la distribución de resultados, que lograra ese menor % de afección de la nota de corte que facilitara, de paso, un aumento de los examinados con nº de orden (+1.194) para que quedara el menor número de plazas vacantes?

Para acercarnos a la hipótesis del trabajo, y por tanto saber si existe diferencia de comportamiento entre los subconjuntos de españoles y extranjeros, me propongo estudiarlo en los últimos catorce años. ¿Por qué?, porque la participación en los mismos de españoles y extranjeros no ha sido igual ni en valor absoluto ni en valor relativo, y tampoco en el subconjunto de españoles ha sido igual el % de recién egresados que el % de repetidores, recirculantes, especialistas y otros.

Pretendo averiguar el comportamiento del subconjunto de los españoles a lo largo de esos años, sobre todo el centro y cola de la distribución de resultados del examen, por si pudiera arrojar algo de luz sobre la influencia del grado de dificultad del examen en el subconjunto de españoles.

Solo falta proponer cómo vamos a detectar el diferente grado de dificultad de un año y otro, en el total de examinados y en los subconjuntos trabajados.

La propuesta para ello será medir las diferencias del % de afección con la nota de corte del 35 % y con el P27 de la distribución de resultados de cada año.

Para ello damos por hecho que el grado de dificultad estándar será aquel en el que el % de afección de la nota de corte del 35 % se acerque más al % de afección del P27 que obviamente sería el 27 % siguiendo la propuesta de Ebel y Truman.

Si el % de afección de la nota de corte del 35 % fuera menor al 27 % el examen habría sido más fácil que el estándar, es decir habría afectado menos al centro y cola de la distribución, y al revés.

Como novedad el trabajo no solo se expresará en las medidas centrales en respuestas netas, sino en sus respuestas válidas y erróneas gráficamente, es decir, buscando las causas del resultado en la menor o mayor eficiencia de las respuestas de cada examinado, es decir, en su equilibrio, que no es otra cosa que el secreto de que haya cabeza, centro, y cola en la distribución.

4.- Metodología y resumen de los cálculos

4.1.-Cuantificaremos primero el total de presentados de cada convocatoria. Posteriormente los desagregaremos en dos subconjuntos cuantificados, todos los que figuren como españoles y todos los que figuren como extranjeros, estén o no afectados por el cupo.

4.2.- Calcularemos para el total de presentados el valor de N, media y mediana, P73 y P27, y nota de corte, además las magnitudes que determinaron el grupo fuerte (P73), medio (P73-P27), y débil (P27), y también el % de afección por la nota de corte. Para cada subconjunto, españoles y extranjeros, calcularemos el valor de n, media y mediana, afectados por la nota de corte y % de afección, y además calcularemos las magnitudes de los que estuvieron en el grupo fuerte, medio, y débil, respecto de los valores del conjunto de todos los examinados, para poderlos comparar.

En el MIR la referencia para determinar la nota de corte se toma el 35 % de la media aritmética de los diez mejores exámenes y no el P27 de la distribución de resultados que propusieron Ebel y Truman como valor que separa el grupo débil del grupo medio. En el trabajo de la "nota de corte natural" se demostró que el 35 % de nota de corte es el valor más cercano, como media de trece años, al P27 de la distribución de resultados.

Si convenimos en tomar esa referencia como el valor estándar del grado de dificultad del examen, lo que se aleje el valor de la nota de corte respecto del valor del P27 podría ser un método para determinar el grado de dificultad del examen respecto de un valor estándar o medio.

4.3.- El resultado del trabajo se expresará de forma gráfica a través de las respuestas válidas y las respuestas erróneas, y en el zócalo de la gráfica se expresarán los valores analíticos de los estadísticos referenciados en el punto 3.2.-

4.4.- En total serán 14 convocatorias las estudiadas, cada una con menor o mayor participación de españoles y extranjeros. Lo que dará lugar a 3 gráficas por convocatoria con sus datos analíticos, la de todos los examinados, la de todos los españoles examinados, y la de todos los extranjeros examinados. En total 42 tablas gráficas con sus datos analíticos.

4.5.- Si se hubieran presentado todos los recién egresados españoles (5.787) este año, los repetidores, recirculantes, y ya especialistas examinados hubieran sido aproximadamente 2.060 ya que los examinados que figuran como españoles fueron 7.847 aunque sabemos que algunos de ellos tienen doble nacionalidad y provienen de universidades extracomunitarias, amén de los españoles que salieron a estudiar fuera y se presentan al MIR, pero es todo lo que puedo hacer.

La magnitud de "recirculantes y otros" ha ido a menos desde la convocatoria 2001 en valor absoluto y relativo, lo que favorece a los recién egresados, y explicaría la voluntad de las administraciones en orientar la prueba a propiciar el máximo posible de "satisfacción del teórico continuo grado-postgrado", sin normativizarlo por su dificultad jurídico-política. Llevaría aparejado tener que cambiar el Art. 22 de la Ley 43/2003 de profesiones sanitarias. Las modulaciones dependen del Ministerio de Sanidad y ellos se las guisan y ellos se las comen. La ley referenciada, y la de Extranjería, dependen del Parlamento, del toma y daca de las negociaciones políticas y de las posibilidades jurídicas.

Ahí entiendo que está está la clave de las cosas, y ese es el juego que comenzó a partir del 2008 con otro Gobierno de signo diferente, curiosamente, adelantándose a las circunstancias futuras. Salvo mejor criterio e interpretación.

¿Qué pretendo con lo expuesto?

Ver las diferencias de comportamiento entre el conjunto de todos y los subconjuntos de españoles y extranjeros entre convocatorias. Comenzando con la convocatoria del último año, 2014, y terminando con la de 2001. Sabemos que el % de extranjeros partícipes fue pequeño en la de 2001 y que fue aumentando paulatinamente hasta un máximo en la de 2011 para comenzar a bajar a partir de entonces. Esa bajada ha estado motivada por los recortes de plazas, efecto de la crisis económica, y por la puesta en marcha de las modulaciones previstas en 2008 y 2010.

Lo que pretendo es aislar al máximo la posible causa de la desviación de las 10 respuestas netas de toda la población de examinados, en sus medidas centrales, este año respecto del anterior, y poder atisbar su causa. En definitiva, tratar de acercarnos a saber si ha sido debida fundamentalmente al grado de dificultad del examen porque haya afectado a +/- todos (españoles y extranjeros), o bien el aumento de recién egresados españoles marca una tendencia y estamos ante un cambio de paradigma, que significaría mejores mochilas de partida (mayores notas de corte a la entrada de las facultades y mayor hábito y presión de estudio adquiridos desde bachiller por el aumento de la competencia para entrar en Medicina), y mayor y mejor preparación para el MIR, tanto precalentando en sexto de carrera como en el curso intensivo de preparación.

5.- Reflexiones sobre la dificultad del examen

El grado de dificultad del examen lo determina el arte y parte de quien lo pone conforme a las normas y criterios con los que se rija. Se puede medir a priori y a posteriori, pero para poderlo estudiar de forma clásica no dispongo de los datos precisos y necesarios. He dedicado estos años a elaborar un modelo propio que acote su área de incertidumbre. Esa ha sido mi tarea.

La segunda cuestión sobre el grado de dificultad del examen es la que sienten los examinados en los diferentes intervalos de la distribución de resultados. Eso lo exploré en este trabajo, y también en este otro trabajo.

Esos trabajos y otros anteriores sostienen la hipótesis del que me propongo. La novedad del mismo es que se propone estudiarlos no desde el nº de orden, ni desde las respuestas netas, sino desde las respuestas válidas y erróneas, lo que justifica su mayor o menor eficiencia en respuestas netas por estar penalizadas las erróneas.

¿Podría haber pretendido el examinador poner el examen de tal manera que siendo la nota de corte parecida al año pasado afectara a casi 1.200 examinados menos y poder cubrir de esa forma más fácilmente las plazas con una mayor demanda (8.554 frente a 7.360 el año pasado), o la supuesta menor dificultad del examen se le ha ido de las manos, o es que los presentados eran mejores y además se ha preparado mejor?

Este debate ya se planteó en el blog en su día con otro examen, y un Anónimo escribió que conocía a quien había puesto el examen con anterioridad, y naranjas de la China… que no, que así no se pone el examen, pero no dijo más, y dio por equivocada mi sugerencia.

¿Se puede determinar a priori la dificultad del examen?

- Se puede intentar y se intenta, otra cosa es que +/- se consiga o se le vaya +/- según años...

En catorce años se les ha ido 28 respuestas netas del más difícil al más fácil, de esas 28 en el último examen han sido 10 netas, por lo que es lógico que nos preguntemos lo que nos preguntamos. De la convocatoria 2001 a la 2011, ambas inclusive, la desviación fue de 15 netas aproximadamente, en la de 2012 se fue de +3, la siguiente varió poco, y este último año que motiva el trabajo, nada más y nada menos que +10 netas aproximadamente. Aquí me hacía preguntas, y también hacía afirmaciones, no sé hasta qué puntos atrevidas o ignorantes.

Podemos dividir por convenio la dificultad del examen en cinco tipos de preguntas, muy difíciles, difíciles, regulares, fáciles, y muy fáciles. El efecto de la combinación de esos cinco tipos de preguntas, que determina previamente el examinador, y de la mochila de partida de los preparandos, de la eficiencia de su preparación, de la eficiencia de su entrenamiento, de la eficiencia de su estado emocional durante la preparación y durante el examen, y de la aleatoriedad o suerte, dependerá el resultado final del examen. Aquí lo explico de otra forma.

6.- Resultados del trabajo

MIR 2014/2015, conjunto de todos los médicos examinados

MIR 2014/2015, subconjunto de todos los médicos españoles

MIR 2014/2015, subconjunto de todos los médicos extranjeros

MIR 2013/2014, conjunto de todos los médicos examinados

MIR 2013/2014, subconjunto de todos los médicos españoles

MIR 2013/2014, subconjunto de todos los médicos extranjeros

MIR 2012/2013, conjunto de todos los médicos examinados

MIR 2012/2013, subconjunto de todos los médicos españoles

MIR 2012/2013, subconjunto de todos los médicos extranjeros

MIR 2011/2012, conjunto de todos los médicos examinados

MIR 2011/2012, subconjunto de todos los médicos españoles

MIR 2011/2012, subconjunto de todos los médicos extranjeros

MIR 2010/2011, conjunto de todos los médicos examinados

MIR 2010/2011, subconjunto de todos los médicos españoles

MIR 2010/2011, subconjunto de todos los médicos extranjeros

MIR 2009/2010, conjunto de todos los médicos examinados

MIR 2009/2010, subconjunto de todos los médicos españoles

MIR 2009/2010, subconjunto de todos los médicos extranjeros

MIR 2008/2009, conjunto de todos los médicos examinados

MIR 2008/2009, subconjunto de todos los médicos españoles

MIR 2008/2009, subconjunto de todos los médicos extranjeros

MIR 2007/2008, conjunto de todos los médicos examinados

MIR 2007/2008, subconjunto de todos los médicos españoles

MIR 2007/2008, subconjunto de todos los médicos extranjeros

MIR 2006/2007, conjunto de todos los médicos examinados

MIR 2006/2007, subconjunto de todos los médicos españoles

MIR 2006/2007, subconjunto de todos los médicos extranjeros

MIR 2005/2004, conjunto de todos los médicos examinados

MIR 2005/2004, subconjunto de todos los médicos españoles

MIR 2005/2004, subconjunto de todos los médicos extranjeros

MIR 2004/2003, conjunto de todos los médicos examinados

MIR 2004/2003, subconjunto de todos los médicos españoles

MIR 2004/2003, subconjunto de todos los médicos extranjeros

MIR 2003/2004, conjunto de todos los médicos examinados

MIR 2003/2004, subconjunto de todos los médicos españoles

MIR 2003/2004, subconjunto de todos los médicos extranjeros

MIR 2002/2003, conjunto de todos los médicos examinados

MIR 2002/2003, subconjunto de todos los médicos españoles

MIR 2002/2003, subconjunto de todos los médicos extranjeros

MIR 2001/2002, conjunto de todos los médicos examinados

MIR 2001/2002, subconjunto de todos los médicos españoles

MIR 2001/2002, subconjunto de todos los médicos extranjeros

Tabla 1.- Resumen de datos analíticos

Tabla 2.- Resumen de datos analíticos

7.- Análisis y discusión de los resultados

7.1.- Del trabajo realizado hasta el momento parece desprenderse que la decisión de desagregar ambos subconjuntos nos proporciona el conocimiento de "ver" la diferencia de resultados sin entrar en las causas cualitativas de esa diferencia.

Es decir, al menos hay dos MIRes en el mismo MIR, y desagregar sus resultados en al menos dos subconjuntos posibles, ha permitido confirmar gráficamente lo que ya sabíamos analíticamente por las medidas centrales, media y mediana, de sus resultados.

A pesar de que con las convocatorias estudiadas se puede deducir que el subconjunto de extranjeros examinados es menos homogéneo que el de españoles, que justifica su comportamiento más errático, terminaremos el estudio del subconjunto en las convocatorias que faltan para tener constancia del mismo, especialmente porque el número de examinados en las diferentes convocatorias a estudiar ha sido muy variable.

Así pues no entramos en el subconjunto de extranjeros nada más que a reflejar los datos de los resultados sin entrar en la búsqueda de las causas, realizando un trabajo meramente descriptivo.

Una vez realizada esa observación nos ceñiremos fundamentalmente al comportamiento de los españoles y dentro del mismo, por carencia de datos, aproximarnos al de recién egresados porque tienden a ser mayoría en el subconjunto conforme pasa el tiempo, según se puede comprobar de los datos desde las convocatorias 2001 a 2014 por la diferencia entre recién egresados y examinados en total. Como no sabemos si todos los recién egresados se presentan o no al MIR esa diferencia será una aproximación que nos indica la tendencia, sea voluntaria o forzosa por las medidas coercitivas para recircular y/o reespecializarse.

Así pues intentaremos explorar si hay diferencias de comportamiento entre el conjunto de todos los españoles presentados al examen y su posible causa.

Observamos que curiosamente en el subconjunto de españoles el compartimento en la cola de la distribución de resultados del mismo en todas las convocatorias estudiadas hasta el momento.

¿Qué es lo que tienen en común, o más en común, los que están en la cola de la distribución del subconjunto de españoles?

Un comportamiento curioso respecto de las preguntas no contestadas. Son muchas. ¿Porqué será?

Podemos preguntarnos del subconjunto de todos los españoles, recién egresados, repetidores, recirculantes, especialistas, y otros, ¿quienes preponderan en la cola con un comportamiento errático en el equilibrio de válidas, erróneas, y no contestadas?

No sabemos quienes son pero, ¿no indican algo esos resultados respecto de tantas preguntas dejadas sin contestar más allá del dato en sí mismo?, ¿es importante ese subgrupo y existe causa subsanable?

No es posible puntuar sin contestar, la gráfica expresa muchas preguntas sin contestar en la cola de la distribución de los españoles, además de más preguntas erróneas que válidas.

¿Quiénes del subconjunto de españoles pueden dejan sin contestar tantas preguntas?, ¿cuál es la causa real que les ha llevado a presentarse?, ¿se han preparado y entrenado tan poco como parece, o su preparación ha sido simplemente ineficiente, o son otras las causas por las que se presentan?, ¿acaso no justifica eso la nota de corte frente a los que se oponen a la misma?

No me imagino a un recién egresado con tal cantidad de preguntas sin contestar, es posible pero poco probable, y si no se va a eso al examen, ¿a qué se va?, y no son pocos.

Continuará... en otras entradas, aquí la segunda, la tercera, y por fin la cuarta.

2 comentarios:

Anónimo3/5/15, 12:49
Muy interesante Gangas, a ver como apuntan el resto de convocatorias, si se confirma el comportamiento del pasado MIR efectivamente hay al menos dos MIRes en el MIR, es interesante la hipótesis que lanzas.

Enhorabuena!
ResponderEliminar
Respuestas
Anónimo6/5/15, 18:41
Sigo leyendo, y agradeciendo, el denso analisis, las hipotesis, los antecedentes y las preguntas que esta formulando. Y es realmente apasionante el analisis abordado, aun con las carencias detectadas sobre la población estudiada.
Esperare con interes su continuación. Gracias
ResponderEliminar
Respuestas

Añadir comentario

sábado, 2 de mayo de 2015

¿Cuántos MIRes hay dentro de un MIR?...

2 comentarios: