Calificación analítica. Procedimiento de
calificación para
pruebas de ensayo en el cual se asignan diferentes
puntuaciones a aspectos de contenido y estilo de las
respuestas del examinado.
Calificación compuesta. La suma directa o
ponderada de las calificaciones en dos o más pruebas o
secciones de una
prueba.Calificación cruda. Calificación del
examinado en una prueba que no se ha convertido, se
calcula como el número
de reactivos que se responden correctamente o el número
de respuestas correctas menos cierta porción de las
respuestas incorrectas.
Calificación de eliminación. Procedimiento de
calificación
en el cual en lugar de marcar sólo la mejor respuesta
para un reactivo, el examinado indica qué opciones son
incorrectas.
Calificación derivada. Una calificación que se
obtiene al realizar algunas operaciones matemáticas
sobre una calificación cruda, como multiplicar la
calificación cruda por una constante y/o sumar una
constante a la calificación.
Calificación empírica. Sistema de calificación en
el cual las respuestas del examinado se califican de
acuerdo con una clave elaborada a partir de las
respuestas que dan las personas en ciertos grupos
criterio, como los esquizofrénicos o los médicos. Este
procedimiento de calificación se emplea con diversos
inventarios de intereses y de personalidad.
Calificación holística. Procedimiento de
calificación, como en los reactivos de ensayo, en la
cual se asigna una sola calificación en términos del
desempeño global del individuo, en lugar de asignar
puntos diferentes a características distintas de la
respuesta.
Calificación límite. Todos los solicitantes
que caen por
debajo de la calificación límite en un criterio son
rechazados,
y todos los solicitantes que obtienen una calificación
en el límite o encima de éste se aceptan. La
calificación límite depende de la validez de la prueba,
la razón de selección y otros factores.
Calificación real. La calificación hipotética
que es una medida del verdadero conocimiento que tiene
el examinado
del material de la prueba. En la teoría de los tests, la
calificación real de un examinado en una prueba es la
media de la distribución de calificaciones que
resultaría si el examinado presentara la prueba un
número infinito de veces.
Calificación z. Cualquiera de un grupo de
calificaciones derivadas calculada de la fórmula z =
(calificación cruda - media)/ desviación estándar, para
cada calificación cruda. En una distribución normal, más
de 99% de los casos cae entre Z =-3.00 y z = +3.00.
Calificaciones estándar normalizadas.
Calificaciones
obtenidas al transformar las calificaciones crudas de
tal
manera que las calificaciones transformadas se
distribuyen
normalmente con una media de O y una desviación estándar
de 1 (o alguna función lineal de esos números).
Calificaciones estándar. Grupo de
calificaciones, como las calificaciones z, las
calificaciones T o las calificaciones
estaninas que tienen una media y una desviación estándar
deseadas. Las calificaciones estándar se calculan
cambiando las calificaciones crudas a calificaciones z,
multiplicando las calificaciones z por la desviación
estándar deseada y luego sumando la media deseada de las
calificaciones transformadas al producto.
Calificaciones sumadas (método de). Técnica de
elaboración de escalas de actitud elaborada por R.
Likert.
Los calificadores verifican los valores numéricos en un
continuo con tres a siete (por lo general cinco)
categorías que corresponden al grado positivo o negativo
de cada una de un gran número de afirmaciones de actitud
relacionadas con el tema en cuestión. Se seleccionan
aproximadamente veinte afirmaciones de acuerdo con
ciertos criterios estadísticos para componer la escala
final de actitudes.
Calificaciones T. Calificaciones estándar
convertidas y
normalizadas que tienen una media de 50 y una desviación
estándar de 10. Las calificaciones Z también son
calificaciones estándar con una media de 50 y una
desviación estándar de 10, pero en contraste con las
calificaciones T no son normalizadas.
Cargas factoriales. En el análisis factorial,
las correlaciones resultantes (pesos) entre pruebas (y
otras variables) y los factores extraídos.
Centro de evaluación. Una técnica, usada
principalmente en la selección de personal ejecutivo,
para evaluar el
comportamiento y las características de personalidad de
un pequeño grupo de individuos al hacerlos realizar una
variedad de tareas en un periodo de unos cuantos días.
CI de Desviación. Coeficiente intelectual (CI)
que se obtiene al convertir las calificaciones crudas
obtenidas en una prueba de inteligencia a una
distribución de calificaciones que tiene una media de
100 y una desviación estándar fija, como 16 para la
Stanford-Binet o 15 para los tests de Wechsler.
Clasificación o ranking. El uso de las
calificaciones de una prueba para asignar a una persona
a una categoría en lugar de otra. Ordenar a un grupo de
individuos de acuerdo con su posición juzgada en cierta
característica; colocar en orden una lista de
características de un individuo de acuerdo con su
importancia.
Cociente de desarrollo (CD). Índice, que
equivale aproximadamente a la edad mental, que resume el
comportamiento de un infante según se evalúa por los
programas de desarrollo de Gesell.
Coeficiente intelectual (CI). Una calificación
derivada, usada originalmente en la calificación de la
Escala de Inteligencia de Stanford-Binet. Una razón CI
se calcula dividiendo la edad mental (EM) del examinado
entre su edad cronológica (Ee) y multiplicando el
cociente resultante por 100. Un CI de desviación se
calcula multiplicando la calificación z que corresponde
a una calificación cruda en una prueba de inteligencia
por la desviación estándar del CI de desviación y
agregando 100 al producto.
Coeficiente alfa. Coeficiente de confiabilidad
por con-
sistencia interna, apropiado para pruebas compuestas
por reactivos dicotómicos o de puntos múltiples; la
correlación esperada de una prueba con forma paralela
que contiene la misma cantidad de reactivos.
Coeficiente de confiabilidad. Un índice
numérico, entre .00 y 1.00, de la confiabilidad de un
instrumento de evaluación. Los métodos para determinar
la confiabilidad incluyen test-retest, formas paralelas
y consistencia interna.
Coeficiente de consistencia interna.
Coeficiente de confiabilidad basado en estimaciones de
la consistencia
interna de una prueba (por ejemplo, coeficiente de
división por mitades y coeficiente alfa).
Coeficiente de división por mitad. Un estimado
de confiabilidad determinado al aplicar la fórmula de
Spearman-Brown para m = 2 a la correlación entre las dos
mitades de la misma prueba, como los reactivos con
números nones y los reactivos con números pares.
Coeficiente de equivalencia. Coeficiente de
confiabilidad (correlación) obtenido al aplicar dos
formas diferentes de una prueba a la misma gente.
Coeficiente de estabilidad. Coeficiente de
confiabilidad
(correlación) obtenido al aplicar una prueba al mismo
grupo de sujetos en dos ocasiones diferentes.
Coeficiente de estabilidad y equivalencia.
Coeficiente de confiabilidad que se obtiene al aplicar
dos formas de una
prueba a un grupo de sujetos en dos ocasiones
diferentes.
Coeficiente de generalización. Coeficiente
numérico que es un indicador del grado de generalización
(es decir, confiabilidad) de la muestra a la población.
Un coeficiente de generalización toma en cuenta una o
más fuentes de error al generalizar de la muestra a la
población. Se calcula como una razón de la suma de las
varianzas de los componentes de la calificación de la
prueba bajo consideración a esta suma, más la suma
ponderada de las varianzas de error en la situación.
Comportamientos objetivo. Conductas
específicas, definidas de manera objetiva observadas y
medidas en las evaluaciones conductuales. De particular
interés son los efectos que los eventos antecedentes y
consecuentes tienen en esas conductas.
Confiabilidad. El grado en que un instrumento
de evaluación psicológica mide algo en forma
consistente. Un instrumento confiable está relativamente
libre de errores de medición, por lo que las
calificaciones obtenidas en el instrumento son cercanas
en valor numérico a las verdaderas calificaciones de los
examinados.
Confiabilidad de formas paralelas. Índice de
confiabilidad (coeficiente de equivalencia) que se
determina correlacionando las calificaciones de los
individuos en forma
paralela de una prueba con sus calificaciones.
Confiabilidad de test-retest. Método para
evaluar la confiabilidad de una prueba aplicándola al
mismo grupo de examinados en dos ocasiones diferentes y
calculando la correlación (coeficiente de estabilidad)
entre sus calificaciones en las dos ocasiones.
Confiabilidad entre calificadores. Dos
calificadores asignan una calificación numérica a una
muestra de personas. Luego se calcula la correlación
entre los dos conjuntos de números.
Confiabilidad impar-par. La correlación entre
las calificaciones totales en los reactivos con número
impar y las
calificaciones totales en los reactivos con número par
de una prueba, corregida mediante la fórmula de
confiabilidad de Spearrnan-Brown.
Confiabilidad intraclase. Índice de acuerdo
entre las calificaciones asignadas por un grupo de
calificadores ("jueces") a una característica o conducta
de una persona.
Confiabilidad por concordancia. Varios
calificadores hacen juicios numéricos de la cantidad de
una característica o conducta mostrada por una muestra
grande de gente. Luego se calcula un coeficiente de
concordancia, un índice de acuerdo entre los juicios de
los calificadores.
Consentimiento informado. Acuerdo formal que
establece una persona, o su tutor o representante legal,
con un organismo o con alguien más para permitir el uso
del nombre de la persona y/o información personal
(calificaciones de la prueba y similares) para un
propósito especificado.
Consistencia interna. El grado en el cual
todos los reactivos de una prueba miden la misma
variable o constructo. La confiabilidad de una prueba
calculada por las fórmulas Spearman-Brown, Kuder-Richardson
o alfa de Cronbach es una medida de la consistencia
interna de la prueba.
Constructo. Variable o concepto que una prueba
está diseñada para medir.
Contaminación de criterios. El efecto de
cualquier factor sobre un criterio de modo que el
criterio no es una medida válida de los logros de un
individuo. Las puntuaciones en una prueba de aptitud
pueden utilizarse para predecir las calificaciones en la
escuela, pero cuando los profesores usan las
puntuaciones de una prueba de aptitud para decidir qué
calificaciones asignar a los estudiantes, las
calificaciones no son un criterio válido para validar la
prueba de aptitud; el criterio ha sido contaminado.
Corrección para la adivinación. Fórmula que se
aplica a las puntuaciones crudas para corregir los
efectos de la adivinación aleatoria por parte de los
examinados. Una
fórmula popular de corrección para la adivinación
requiere que se reste parte del número de reactivos que
el examinado responde incorrectamente del número que
responde correctamente.
Corrección para la atenuación. Fórmula
utilizada para estimar cuál sería el coeficiente de
validez de una prueba si tanto la prueba como el
criterio fueran totalmente confiables.
Correlación. Grado de relación o asociación
entre dos variables, tales como una prueba y una medida
de criterio.
Crecimiento esperado. Cambio promedio en las
calificaciones de una prueba que ocurren a lo largo de
un periodo determinado en personas de una edad, grado u
otras características especificadas.
Criterio. Estándar o variable con la cual se
comparan las
calificaciones obtenidas en un instrumento psicométrico
o contra la cual se evalúa. La validez de una prueba u
otro procedimiento psicométrico usado para seleccionar o
clasificar a la gente es determinada por su capacidad
para predecir un criterio especificado de conducta en la
situación para la cual se seleccionan o clasifican las
personas.
Curva (característica) de respuesta a los
reactivos. Gráfica que muestra la proporción de
individuos que responden correctamente a un reactivo de
la prueba, graficado contra un criterio interno (la
calificación total en la prueba) o externo de desempeño.
Curva característica de los reactivos. Gráfica
utilizada en
el análisis de reactivos, en la cual la proporción de
examinados que pasa un reactivo específico se grafica
contra las calificaciones totales de la prueba.
Bibliografía: L.R.
Aiken. "Tests psicológicos y evaluación". Editorial
Pearson Educación.
Tests por Categorías