viernes, 7 de marzo de 2014

Fiabilidad del examen MIR


6 comentarios:

  1. Anónimo8/3/14 1:12

    JM, qué representa exactamente el coeficiente de fiabilidad del examen? su capacidad de discriminación? si hay alguna entrada donde lo hayas explicado basta con que me lo digas y me pondré a buscarla.

    ResponderEliminar
    Respuestas
    1. Es una relación entre el nº de preguntas del examen, la media aritmética de las puntuaciones obtenidas por todos los examinados y la desviación típica o estándar de la media.

      Eliminar
    2. Se considera como valor aceptable un coeficiente de fiabilidad superior a 0,90 (entre 0 y 1)

      Un test no fiable no será nunca un test válido. Sin embargo conviene recordar que una fiabilidad alta puede no asociarse a una validez alta. La fiabilidad es una condición necesaria pero no suficiente para la validez.

      La validez, o el grado con el que un determinado instrumento mide lo que realmente intenta medir, es un concepto esencialmente relativo. Estrictamente hablando, la validez no se refiere al instrumento de medida en sí mismo, sino más bien al uso que se le da.

      Además de por la fiabilidad, la validez se relaciona, o puede verse influida, por otras características del examen, que a su vez se relacionan entre sí. La validez va a estar directamente relacionada con la relevancia y el poder de discriminación del examen.

      Relevancia, equilibrio, equidad y poder de discriminación:

      La relevancia, también definida como validez de contenido, hace referencia a que lo que se pregunte o evalúe en el examen corresponda con lo que se ha de evaluar o preguntar. En el caso del MIR el contenido de referencia es todo el curriculum de la licenciatura o grado de Medicina. Afinando un poco más, la relevancia se ve influida por el grado de equilibrio y equidad del examen.

      El equilibrio se refiere a la proporción de preguntas que corresponde a cada uno de los temas u objetivos docentes del curriculum, y la equidad a la correspondencia entre lo que se pregunta y lo que se ha enseñado.

      Dado el nivel macro del examen y la práctica imposibilidad de conocer o adecuarse a los contenidos docentes de cada Facultad de Medicina, la validez del contenido se intenta medir comparando la proporción de preguntas de cada bloque de materias (básico, médico, quirúrgico, pediatría y obstetricia y ginecología) y sus componentes, con el que correspondería en un plan de estudios estándar confeccionado con los planes de estudio oficiales de todas las Facultades de Medicina de España, principalmente al margen de que la prueba sea de libre concurrencia porque los títulos extranjeros han de ser previamente homologados por Educación para poder presentarse al MIR.

      Hay que señalar, sin embargo, que la variabilidad encontrada en los planes de estudio por facultades de Medicina confiere poco valor real a esta dimensión en la valoración del examen. Por otra parte, tanto la equidad como la especificidad (medida en la que los resultados obtenidos por quienes no han estudiado se asemejan a los obtenibles por puro azar), van a repercutir directamente, además de en la validez de contenido, en el poder de discriminación del examen, que se convierte necesariamente en la dimensión central y más importante a evaluar.

      Eliminar
    3. Es la segunda vez a lo largo de los años de mi dedicación al examen que alguien me hace una pregunta técnica xD

      Eliminar
    4. Anónimo8/3/14 11:32

      jaja soy casi un pionero! xD gracias por la explicación!! te hago otra pregunta técnica en el post de la métrica.

      Eliminar
  2. Anónimo11/3/14 9:48

    Me pregunto si una vez analizadas las características métricas del examen el ministerio utiliza los resultados para implementar cambios en la misma.
    Me pregunto también si estas modificaciones en la prueba ( si se hicieran) persiguen por igual " modular" y "seleccionar".

    Gracias por el fantástico trabajo realizado

    ResponderEliminar