Las escalas se basan en ítems que corresponden a los hitos más representativos de cada franja de edad y área del desarrollo. Las variaciones en cuanto al ritmo y la forma de aparición de estos ítems pueden servir como indicador de que existe alguna dificultad en el desarrollo del menor, pero no en todos los casos.
Cuando, por ejemplo, establecemos que los bebés empiezan a sostenerse en pie por sí solos en torno a los 12 meses, nos referimos a que esta edad es un promedio. Pero, en realidad, puede haber bebés que la inicien a los 10 meses y otros a los 16, sin que esto suponga necesariamente un problema. En ocasiones podría ser interpretado como una señal de riesgo a la que atender para ver su evolución o, sencillamente, resolverse en un estadio evolutivo posterior.
El error de medición se tiene en cuenta
Habitualmente, las escalas de desarrollo que usan los profesionales han sido validadas bajo lo que se conoce como la teoría clásica de los test (TCT). Esta teoría asume que la puntuación que obtiene una persona está compuesta por su puntuación verdadera y el error de medición, estimado con un modelo lineal. Pero muchas escalas basadas en ella usan procedimientos estadísticos demasiado básicos y muestras heterogéneas, insuficientes y poco representativas.
Una alternativa más reciente es usar la teoría de respuesta al ítem (TRI), que calcula desde modelos probabilísticos el nivel de rasgo del sujeto, analizando cada ítem de forma independiente. De este modo, permite construir instrumentos de medición (test) con propiedades que no varían entre poblaciones.
En nuestro grupo de investigación hicimos una revisión sistemática para valorar las principales escalas del desarrollo multidimensionales destinadas a menores de 0 a 90 meses (7 años y medio), analizando su calidad, limitaciones y fortalezas.
Al revisar exhaustivamente las mejores bases de datos científicas, concluimos que hay escasos trabajos independientes que aporten evidencia a su validez. Además, encontramos pocas investigaciones publicadas en revistas de alto impacto internacional.
La escala Bayley III es la más traducida y validada en todo el mundo, seguramente porque tiene un significativo número de estudios independientes en relación con el resto de las existentes.
Puntos de corte por edad arbitrarios
Hay otros matices a tener en cuenta. Multitud de artículos combinan franjas de edades muy amplias y no consideran las características diferenciadoras de cada etapa del desarrollo, estableciendo puntos de corte por edad arbitrarios. El problema es mayor en menores de un año, ya que están infrarrepresentados los niños menores de 12 meses. Lo solucionan uniendo los datos de los menores de 1 a 6 meses, para conseguir un número de sujetos que sea suficiente para poder realizar la valoración estadística. Pero no hace falta ser un experto para saber que, evolutivamente hablando, un bebé de un mes no tiene nada que ver con uno de 4 meses o uno de 6 meses.
También escasean en las muestras utilizadas los menores con trastornos del desarrollo y pertenecientes a grupos étnicos minoritarios. De hecho, en general las escalas del desarrollo multidimensionales no cuentan con adaptaciones para niños y niñas con discapacidad (motora, visual, entre otras) o trastornos del desarrollo. Solo algunos grupos representativos, como las personas con trastornos del espectro autista, cuentan con estudios independientes suficientes
Necesitamos estudios transculturales para los bebés
Que escaseen los estudios de validación destinados a muestras minoritarias, como grupos étnicos, enfermedades raras o trastornos del desarrollo es una traba importante.
En esta línea, es fundamental validar las escalas en las poblaciones donde van a ser aplicadas para evitar los sesgos culturales que se dan al traducir las pruebas sin someterlas a la validez estadística. Esto es especialmente relevante en países de bajos ingresos, ya que la mayor parte de los procesos de adaptación y validación se dan en muestras norteamericanas y europeas.
Si queremos mejorar la evaluación de nuestros bebés es fundamental establecer franjas de edad cortas y acordes con las características evolutivas diferenciadoras de cada etapa e intentar incrementar el número de participantes, agrupados según características homogéneas a través de muestreos no incidentales.
Además, habría que potenciar que se realicen más estudios independientes, con muestras más amplias y heterogéneas.