sábado, 8 de marzo de 2014

Actualizando la métrica y los índices...


La métrica del MIR


Los índices por plaza

5 comentarios:

  1. hola JM, en la otra entrada ya me has explicado cómo se calcula la fiabilidad y para qué sirve. tengo más dudas con esta tabla, en concreto sobre el cálculo y la interpretación del índice de discriminación, la dificultad/facilidad y el riesgo.

    podrías comentarlo brevemente o enlazar algún sitio donde lo explique? gracias!

    ResponderEliminar
    Respuestas
    1. El poder de discriminación es la capacidad de distinguir entre un examinado bueno y uno malo, en función de una variable determinada, en el caso que nos ocupa la probabilidad de responder correctamente a las preguntas del test.

      Junto con el grado de dificultad, el poder de discriminación es la principal de las técnicas evaluativas a aplicar a los test de resultados basados en criterios relativos, es decir, aquellos para los que el criterio de lo que constituye un buen examen, con su correspondiente nota máxima y sus niveles de puntuación sucesivos, no está definido previamente sino que depende de la curva de distribución de resultados de todos los aspirantes que hicieron el examen.

      Por definición, un examen de resultados evaluables con criterios de relatividad, es un examen competitivo y tiene como objetivo principal el proporcionar una discriminación adecuada a los conocimientos o capacidades de los aspirantes. En consecuencia una discriminación adecuada es un elemento absolutamente crucial para la validez de este tipo de exámenes.

      Para medir el poder de discriminación del examen se calcula el índice de discriminación de cada pregunta. Este índice se calcula comparando las respuestas correctas de cada pregunta del grupo de estudiantes que ha obtenido los mejores resultados en el test (grupo fuerte), con el que ha obtenido los peores (grupo débil)

      En su día se demostró que la composición de los grupos fuerte y débil debe de hacerse con el primer 27% y el último 27% del total de los examinados, ordenados según su puntuación.

      El hecho de utilizar estos grupos, para el cálculo, está en la necesidad de conjugar dos fines deseables pero contradictorios, hacer que los grupos ean tan grandes y tan diferentes como sea posible.

      Con esta composición puede decirse que los que están incluidos el primer grupo son realmente superiores, en relación con la cualidad medida en el test, a los del grupo débil.

      El índice de discriminación es la principal dimensión que va a influir en la fiabilidad y la validez del examen. Por otra parte, el poder de discriminación se va a ver influido a su vez por los ajustes, o desajustes, que tenga el examen en cuanto a la equidad, especificidad, homogeneidad de las preguntas, heterogeneidad de los aspirantes, eficiencia como relación entre tiempo y número de preguntas, y dificultad.

      De todas esas dimensiones secundarias, la que tiene una repercusión más directa, y está sujeta a una variabilidad mayor es el índice de dificultad, eso es así dadas las características del examen y la relativa constancia y/o difícil modificación de las otras dimensiones que pueden relacionarse con el poder de discriminación.

      Eliminar
    2. Adenda.- Como no dispongo de los resultados de cada pregunta, lo he calculado haciendo una adaptación para hacerlo con los datos de que dispongo.

      En cuanto al resto de índices son creaciones directas o indirectas del editor del blog, el índice de dificultad tampoco lo he calculado por cada pregunta por carecer de ese dato, y es por otra parte una adaptación inversa al usado comúnmente por la comunidad académica, que es, según recientes críticas, un índice de facilidad y no de dificultad, el editor del blog, a la vez que adaptaba el índice de dificultad a los datos disponibles, lo modificaba para que fuera realmente de dificultad y no de facilidad, lo que llevó aparejado para ser consecuente crear uno de facilidad, que es casi el inverso del de dificultad.

      Los otros dos índices son el riesgo asumido y la eficiencia del mismo, ya que conviene no olvidar que el examen es un test de respuestas múltiples con penalización, en el que quien no contesta no gana, pero penaliza el contestar mal.

      El premio por contestar bien son tres puntos y la penalización por contestar mal menos un punto.

      Si tu contestas una sola pregunta y la contestas bien, serás muy eficiente pero tu nota será ínfima en valor absoluto que es el que cuenta, pero si contestas muchas y mal, sufrirás una fuerte penalización y además no ganarás.

      Este tipo de exámenes son pruebas de potencia en las que has de ir entrenado en conocimientos, tiempo y riesgo, las tres cosas son clave, una pregunta por minuto y siempre dudando, más o menos pero siempre dudando.

      El examen MIR no solo califica conocimientos sino otros muchos sesgos latentes de los examinados, por eso una actitud positiva a lo largo de la preparación y una referencias previas son muy importantes para superar la prueba con mayor éxito.

      Eliminar
  2. Buenos días, como siempre dando lo mejor, gracias por este resumen. Buen fin de semana.

    ResponderEliminar
  3. Otro resumen estupendo, que mide y pone las cosas (y a las personas) en su sitio, estemos contentos o no con nuestro resultado. Datos fiables y medidos, tablas y graficas en las que cada uno encuentra lo que le interesa. Y de vez en cuando, un poco de humor y poesia. Enhorabuena y gracias otra vez, Don José Maria.

    ResponderEliminar