Articles

Datos agregados

II Efectos dispares de Pruebas Repetidas

Los psicólogos han utilizado paradigmas de pruebas repetidas para muchos propósitos diferentes; por lo tanto, se han establecido varias tradiciones diferentes de esta investigación, a menudo con poca referencia cruzada. En esta sección describimos investigaciones de principios de este siglo en las que los investigadores probaron la memoria repetidamente y llegaron a conclusiones diametralmente opuestas sobre su funcionamiento. Curiosamente, hasta donde sabemos, nadie notó la paradoja planteada por esta investigación temprana hasta que dos de los autores actuales la plantearon en 1992 (Wheeler & Roediger, 1992).

En algunas de las investigaciones más conocidas en psicología cognitiva, Bartlett (1932) reportó sus famosos experimentos en los que hizo que estudiantes universitarios ingleses leyeran una historia de los indios americanos, «La guerra de los Fantasmas», y luego la recordaran varias veces. Por lo general, el primer intento de recuperación ocurrió aproximadamente 15 minutos después del estudio inicial, y las pruebas posteriores pueden ocurrir días, semanas o meses después. En pruebas posteriores, Bartlett encontró distorsiones dramáticas en el recuerdo de la historia, con muchas omisiones, alteraciones de significado y adiciones ocasionales. Bartlett enfatizó la naturaleza constructiva de la memoria y argumentó que sus sujetos probablemente usaron el esquema de un cuento de hadas, una forma común para estos estudiantes, para codificar y reconstruir la historia. Se restaban importancia a los elementos sobrenaturales, y la historia a menudo se hacía más consistente y racional. Por lo tanto, a partir de su técnica de reproducción repetida, Bartlett (1932) concluyó que los recuerdos a menudo se vuelven más propensos a errores durante las pruebas repetidas.

Vale la pena señalar que Bartlett (1932) no produjo datos agregados en apoyo de sus conclusiones, sino que presentó protocolos de muestra y anécdotas para reforzar sus conclusiones. Curiosamente, solo podemos citar un intento de replicación de la investigación pionera de Bartlett (1932), una publicada por Gauld y Stephenson (1967) y discutida a continuación, que trató de confirmar sus afirmaciones utilizando la técnica de reproducción repetida. «La guerra de los Fantasmas» se ha utilizado en una gran cantidad de investigaciones posteriores, pero este trabajo rara vez involucró pruebas repetidas y generalmente se llevó a cabo con fines distintos al examen de la naturaleza reconstructiva de la memoria. 1 Por la misma razón, se ha llevado a cabo mucha investigación sobre la naturaleza reconstructiva de la memoria, pero rara vez este interesante trabajo ha involucrado pruebas repetidas; es más habitual evaluar la memoria a través de una sola prueba de reconocimiento de información que podría haber sido inferida, pero que en realidad no se indica en un pasaje en prosa (p. ej., Johnson, Bransford, & Solomon, 1973) o a través de información errónea dada en una narrativa después de que los sujetos hayan presenciado algún evento (por ejemplo, Loftus, 1979, 1991).

Curiosamente, Bartlett (1932) no mencionó que sus repetidas investigaciones de pruebas entraban en conflicto con otras investigaciones que databan de al menos 20 años, también realizadas en Inglaterra. Ballard (1913) dio a los escolares pasajes de poesía para memorizarlos y luego los probó repetidamente durante intervalos de hasta una semana después. Ballard descubrió que los niños a menudo recordaban líneas de poesía en pruebas posteriores que no podían recordar en pruebas anteriores, un fenómeno que denominó reminiscencia. Las observaciones básicas de recuerdo en una prueba posterior de material que se había perdido en pruebas anteriores se confirmaron en investigaciones posteriores (por ejemplo, Brown, 1923) realizadas mucho antes de que Bartlett (1932) publicara su libro, por lo que es curioso que no lo citara al menos. Sin embargo, los hallazgos básicos de Ballard y Brown eran directamente contrarios a las observaciones y conclusiones de Bartlett; en lugar de olvidar dramáticamente y distorsionar la memoria, Ballard y Brown habían reportado mejoras reales con el tiempo en las habilidades de los sujetos para recordar sus experiencias. Para ser justos, el célebre libro de Bartlett tenía la intención de informar sobre sus nuevos experimentos, que aparentemente comenzaron en 1913 (Bartlett, 1932, p. v). Sin embargo, podría haber agregado a los factores sociales que influyen en la memoria histórica la tendencia a ignorar la evidencia publicada en desacuerdo con la concepción de uno.

Las observaciones de Ballard (1913) y Brown (1923) que indican los efectos positivos de las pruebas repetidas en el recuerdo general fueron examinadas durante algunos años antes de ser abandonadas, por un tiempo, como objeto de estudio serio. Buxton (1943) revisó la literatura y concluyó que la reminiscencia era un fenómeno efímero que no ocurría tan a menudo como aparecía. Sin embargo, Payne (1987) argumentó que Buxton (1943) llegó a su conclusión porque el fenómeno de la reminiscencia se había redefinido a lo largo de los años. La definición original de Ballard (1913) del término era de material que no se podía recuperar en una primera prueba que se recuperó en una segunda prueba (o posterior). Cuando el recuerdo total mejora entre dos pruebas, debe haber ocurrido reminiscencia; por lo tanto, Ballard a veces usó la mejora general entre pruebas como un índice de la ocurrencia de reminiscencia. Esto ahora parece un error, porque llevó a investigadores posteriores como Buxton (1943) a redefinir la reminiscencia como una mejora general en el recuerdo entre pruebas. Sin embargo, es perfectamente posible tener reminiscencia (definida como «recuperación intertest») sin tener una mejora general entre pruebas, porque el olvido entre pruebas puede compensar la reminiscencia o recuperación. Por lo tanto, cuando Buxton (1943) concluyó que el fenómeno no era confiable, se refirió a una mejora general entre pruebas, no a una reminiscencia definida como recuperación entre pruebas, que fue ampliamente obtenida. Sin embargo, su revisión generalmente se acredita con la disminución de la investigación en esta área durante varias décadas.

La investigación sobre el tema de las mejoras en la memoria a través de pruebas repetidas fue resucitada por Erdelyi y Becker (1974). Presentaron a los sujetos con imágenes o palabras concretas y los hicieron recordar en tres pruebas sucesivas, cada una de 7 min. También usaron un nuevo procedimiento, memoria forzada, en el que los sujetos básicamente se involucraron en una prueba de memoria libre, pero se vieron obligados a producir un número preestablecido de respuestas que era mayor que el número de elementos que los sujetos podían recordar. Este procedimiento se utilizó para superar el argumento de que las ganancias observadas en pruebas de recuperación posteriores deben atribuirse a criterios de recuperación relajados en estas pruebas. (Examinaremos los efectos del recuerdo forzado en la memoria en una sección posterior). Erdelyi y Becker reportaron mejoras generales en las pruebas de recuperación de imágenes, pero no de palabras. Llamaron a esta mejoría hipermnesia (lo opuesto a amnesia u olvido).2

Vale la pena señalar que prácticamente todos los experimentos que emplean recuerdo libre o forzado han reportado fuertes reminiscencias en el recuerdo de imágenes y palabras (p. ej., Erdelyi, Finkelstein, Herrell, Miller & Thomas, 1976), aunque en el caso de las palabras, la mejora entre pruebas se compensa con el olvido entre pruebas en muchos experimentos. (Sin embargo, algunos investigadores han reportado hipermnesia confiable para palabras; por ejemplo, Payne & Roediger, 1987). Actualmente existe una gran literatura sobre hipermnesia (ver Erdelyi, 1984; Payne, 1987; y Roediger & Challis, 1989 para reseñas). El punto que queremos establecer aquí, sin embargo, es simplemente que los fenómenos de reminiscencia e hipermnesia son reales y a menudo replicados. En un experimento interesante, Scrivner and Safer (1988) mostró a los sujetos una cinta de video de un robo y luego les hizo pruebas repetidas para recordar detalles críticos del evento. La recuperación mejoró constantemente en cuatro pruebas repetidas. La generalidad del fenómeno de la hipermnesia nos lleva de vuelta a la pregunta inicial de por qué dos tradiciones diferentes de investigación, ambas empleando pruebas repetidas, pueden llegar a conclusiones tan dispares con respecto a los procesos de recuperación en la memoria.

Wheeler y Roediger (1992) examinaron investigaciones anteriores y aislaron dos factores probables como posibles causas de los diferentes hallazgos y conclusiones: el tipo de material utilizado y la duración del intervalo entre pruebas. Bartlett (1932) usó pasajes en prosa en la mayoría de sus experimentos de memoria, como «La guerra de los fantasmas».»Por otro lado, gran parte de la investigación que mostró mejoras entre las pruebas utilizó listas de palabras, imágenes o materiales similares. (Payne, 1987, revisó 172 experimentos de este tipo que documentan el fenómeno, todos utilizando listas. Otro factor potencial es el intervalo entre pruebas; Bartlett (1932) utilizó intervalos bastante largos entre pruebas, a menudo días y a veces meses, mientras que los investigadores que estudian la hipermnesia generalmente interponen solo cinco minutos o menos entre pruebas.

No es obvio a partir de investigaciones previas cuál de estos factores debería ser más importante, o si ambos son críticos. Por ejemplo, Ballard (1913) obtuvo hipermnesia para pasajes de poesía, que podrían considerarse discursos conectados como la prosa. De manera similar, Roediger, Payne, Gillespie y Lean (1982) obtuvieron hipermnesia en el recuerdo de categorías (presidentes, aves, deportes), que también están en conjuntos bien estructurados. Por otro lado, algunos investigadores han obtenido hipermnesia a intervalos largos. En el experimento de Scrivner y Safer (1988) descrito anteriormente, se obtuvo hipermnesia entre pruebas en un intervalo de 48 horas. De manera similar, Erdelyi y Kleinbard (1978) obtuvieron hipermnesia para una lista de imágenes durante una semana mediante pruebas a sujetos tres veces al día con un procedimiento de recuperación forzada.

Wheeler y Roediger (1992) examinaron el intervalo de retención y el tipo de material como los posibles factores subyacentes a los resultados discrepantes previos en varios experimentos. Hicieron que los sujetos estudiaran 60 imágenes bajo una de dos condiciones antes de tomar pruebas de recuerdo forzado en las imágenes. En un caso, los sujetos escucharon una historia y los nombres de los 60 objetos representados ocurrieron en la historia. Se les dijo que aprendieran la historia y los nombres de las imágenes. Otros sujetos vieron las mismas 60 imágenes presentadas en el mismo orden, pero escucharon los nombres de las imágenes mientras se presentaban. Estas dos condiciones estaban destinadas a simular, hasta cierto punto, la diferencia entre los materiales de Bartlett (procesamiento esquemático de prosa) en la condición de imágenes + historia, por un lado, y las condiciones de aprendizaje de listas del experimento típico de hipermnesia en condiciones de imágenes + nombres, por el otro. El procedimiento de Wheeler y Roediger organiza esta comparación con el material objetivo mantenido constante entre condiciones, por lo que no es necesario hacer una comparación entre el recuerdo en prosa, por un lado, y el recuerdo de algún material completamente diferente presentado en listas, por el otro.

La otra variable principal en el experimento de Wheeler y Roediger (1992) fue el horario de los sujetos de prueba recibidos después de ver las 60 imágenes en una de las dos condiciones. Todos los sujetos recibieron un breve cuestionario en el que se les preguntaba sobre varias características del experimento, como la estimación del número de imágenes presentadas. Un tercio de los sujetos fueron despedidos en este momento y se les dijo que regresaran una semana después. (El cuestionario fue creado para dar a los sujetos en esta condición una justificación plausible para haber participado.) Otro tercio de los sujetos recibió una prueba para las fotos; se les dieron hojas numeradas del 1 al 60 y se les dijo que recordaran los nombres de tantas de las 60 imágenes que habían estudiado previamente como fuera posible, pero que debían adivinar para llenar los 60 espacios. Se permitieron siete minutos para la retirada. El último tercio de los sujetos fueron tratados de la misma manera, excepto que se les dieron tres pruebas de recuerdo forzado de 7 minutos, con pausas de 1 minuto entre las pruebas. Finalmente, todos los sujetos regresaron una semana después y luego recibieron tres pruebas consecutivas de recuerdo forzado para las 60 imágenes que se habían estudiado la semana anterior.

En resumen, los sujetos estudiaron imágenes en una lista o en el contexto de una historia, luego hicieron cero, uno o tres pruebas de recuerdo forzado en las imágenes, y luego regresaron la semana siguiente y tomaron tres pruebas más. Anticipamos que los sujetos que tomaran las tres pruebas inmediatas mostrarían hipermnesia (recuerdo mejorado sobre las pruebas), al menos en la condición en la que estudiaron imágenes y sus nombres (replicando Erdelyi & Becker, 1974, entre muchos otros). Sin embargo, esperábamos que el olvido (no la mejora) ocurriera entre pruebas con una semana de retraso entre ellas, y que este olvido pudiera ser más pronunciado en la condición imágenes + historia con su procesamiento basado en esquemas.

Los resultados básicos se muestran en la Tabla I. Los seis grupos de sujetos están etiquetados a la izquierda, con el primer número que indica el número de pruebas realizadas el día en que los sujetos estudiaron las imágenes (0, 1 o 3) y el segundo número que indica las tres pruebas realizadas una semana después (siempre 3). El recuerdo de imágenes fue mayor en las condiciones de imágenes + historia que en las condiciones de imágenes + nombres; colapsando en todas las demás condiciones, la diferencia fue de aproximadamente cuatro elementos. Sin embargo, el tipo de material es irrelevante para el punto principal aquí, así que centrémonos en el recuerdo de la imagen + historia en la parte inferior de la Tabla I para responder a cuatro preguntas de interés. Primero, ¿mejoró el recuerdo en las tres pruebas inmediatas? La respuesta es claramente sí: El recuerdo mejoró en 3.8 elementos en las pruebas, y la hipermnesia fue aún mayor en la condición de imágenes + historia que en la condición más típica de imágenes + nombres. Claramente, la hipermnesia se puede obtener en memoria después de una historia (aunque de imágenes incrustadas en la historia).

Cuadro I. Número de Imágenes Recordó como una Función de la Presentación del Contexto y de las Pruebas de Schedulea

Contexto y
grupo
Inmediata pruebas T3 – T1 Retraso de pruebas T3 – T1
1 2 3 1 2 3
Imágenes más nombres
3-3 26.6 27.2 28.4 1.8b 25.2 26.3 26.0 0.8
1–3 25.7 20.2 21.7 23.0 2.8b
0–3 16.7 17.5 17.5 0.8
Pictures plus story
3–3 32.7 35.0 36.4 3.8b 31.8 33.0 33.4 1.6b
1–3 31.8 23.3 25.0 25.6 2.3b
0–3 17.4 17.2 18.4 1.0

a Data are from Wheeler and Roediger (1992) and are reprinted by permission of the Cambridge University Press. b These conditions demonstrated reliable hypermnesia across the three tests.

La segunda pregunta de interés es si el olvido se produjo entre pruebas cuando transcurrieron una semana en lugar de pocos minutos entre ellas. De nuevo, la respuesta es sí. En el Grupo 3-3 en la condición fotos + historia, la recuperación disminuyó de 36.4 elementos retirados a 31.8 durante la semana; en el Grupo 1-3, la caída fue de 31.8 a 23.3. Las pruebas sucesivas con una semana entre pruebas producen olvido, no hipermnesia. Estos resultados muestran que es probable que el retraso entre las pruebas y no el tipo de material que produjo los resultados dispares en los experimentos de Ballard (1913) y Bartlett (1932).

Los resultados de la Tabla I también se pueden usar para abordar otros dos temas que son de cierto interés. ¿Se puede obtener hipermnesia después de un intervalo de retención de una semana si se producen intervalos cortos entre las pruebas sucesivas después del retraso de la semana? La respuesta dada de las seis condiciones en el lado derecho de la Mesa I parece ser sí. En los seis casos, los sujetos recordaron más en la tercera prueba que en la primera y un análisis de varianza solo en los datos de la prueba retrasada produjo un efecto significativo para el número de pruebas, F(2, 114) = 14.35, MSe = 5.03, p < .001. Sin embargo, el efecto no es particularmente robusto porque fue significativo en solo tres de las seis condiciones en ANOVAs individuales. Sin embargo, con toda probabilidad, la hipermnesia se puede obtener de forma fiable después de una semana de retraso.

El punto final a extraer de la Tabla I es el poder de una prueba para ayudar a recordar más tarde. Los sujetos que tomaron tres pruebas inmediatas recordaron más imágenes una semana después que los sujetos que tomaron solo una prueba, pero estos sujetos a su vez recordaron las imágenes mucho mejor que los sujetos que no tuvieron pruebas después de estudiar las imágenes inicialmente. Estos resultados se muestran gráficamente en la Fig. 1, donde el rendimiento en las tres pruebas retrasadas se ha promediado y trazado en función del número de pruebas inmediatas. Los tres grupos de sujetos en la condición de imágenes + nombres e imágenes + historia fueron tratados de manera idéntica hasta el momento de la primera prueba y luego cuando regresaron una semana después. La única diferencia entre las condiciones que podrían afectar el rendimiento en las pruebas posteriores fue el número de pruebas realizadas durante la sesión inicial. Sin embargo, como Fig. 1 muestra que el retraso en el recuerdo aumentó monótonamente con el número de pruebas previas y el efecto de mejora de las pruebas afectó el retraso en el recuerdo mucho más poderosamente en las imágenes + historia que en la condición imágenes + nombres. No tenemos una interpretación fácil de este último resultado, pero nuestro punto aquí es principalmente documentar el poderoso efecto que tiene tomar una prueba en la retención posterior. Muchos otros también han señalado este punto (por ejemplo, Glover, 1989; Izawa, 1971; Spitzer, 1939; Thompson et al., 1978).

Fig. 1. El efecto de prueba. El número de pruebas tomadas poco después de estudiar las imágenes afectó en gran medida el recuerdo una semana después.

Para volver al punto principal del experimento, Wheeler y Roediger (1992) argumentaron que su experimento resolvió el rompecabezas planteado por estudios anteriores inconsistentes de Ballard (1913) y Bartlett (1932). La respuesta es bastante sencilla: Si hay intervalos cortos entre las pruebas, generalmente se encuentra hipermnesia sobre las pruebas repetidas. Si los intervalos son largos (una semana, en nuestro experimento), entonces uno obtiene el olvido entre las pruebas. Por supuesto, este último punto debe ser cierto en el caso límite, por ejemplo, con 5 años entre pruebas, pero también ocurre con intervalos tan cortos como una semana.

Concluimos que el tipo de material jugó poco papel en las discrepancias anteriores entre los resultados, porque no encontramos interacción con otras variables entre las imágenes presentadas en una lista (la condición de imágenes + nombres) y las presentadas en un contexto de historia (la condición de imágenes + historia). Sin embargo, esta conclusión puede ser cuestionada, porque en cierto sentido utilizamos los mismos materiales, una serie de 60 imágenes, en ambas condiciones. Wheeler y Roediger (1992) llevaron a cabo otros dos experimentos para ver si los hallazgos básicos se podían obtener con materiales en prosa. ¿Se puede obtener hipermnesia con intervalos cortos entre las pruebas y se puede obtener olvido cuando el intervalo se alarga a una semana?

Los dos experimentos fueron similares, excepto por los tipos de materiales y el hecho de que uno se llevó a cabo como demostración en el aula y el otro se llevó a cabo en condiciones de laboratorio más controladas. Sin embargo, los resultados fueron muy parecidos. En el experimento en el aula, los estudiantes de un curso de psicología cognitiva en la Universidad Rice leyeron» La guerra de los fantasmas » dos veces a un ritmo cómodo y luego pasaron 5 minutos recordando a presidentes estadounidenses. Luego se les dio 8,5 minutos para recordar la historia lo mejor posible; después de este intento de recuperación libre, recordaron los Estados Unidos durante 5 minutos y luego recordaron la historia de nuevo durante 8,5 minutos más. Una semana después, a los estudiantes se les dio una prueba sorpresa y se les pidió que recordaran la historia de nuevo. El experimento de laboratorio se llevó a cabo en condiciones generalmente similares con un extracto de una historia corta de John Updike, «El silbido del niño», que sirvió como material objetivo.

Los resultados de los dos experimentos se muestran aquí en la Tabla II. Para ambos tipos de materiales, los sujetos mostraron mejoras modestas pero estadísticamente significativas entre las dos primeras pruebas. Siguiendo otros (por ejemplo, Mandler & Johnson, 1977), puntuamos los resultados en términos del número de unidades de idea (frases o ideas significativas en el pasaje) que se recordaron. La mejora entre las dos pruebas iniciales parece modesta, pero cada unidad de idea está compuesta de siete a ocho palabras, en promedio, por lo que la mejora se vería mayor si se calificara de esta manera (lo que, sin embargo, es difícil con materiales en prosa). En ambos casos, la mejora fue bastante consistente entre los sujetos (ver Wheeler & Roediger, 1992 para más detalles). Además, en ambos experimentos, la memoria disminuyó entre la segunda prueba y la tercera una semana después. Sin embargo, en ninguno de los dos casos los sujetos mostraron gran confusión e inexactitud en la prueba retrasada, lo que podría haberse esperado de los resultados de Bartlett (1932). Volveremos a este punto más tarde.

la Tabla II. Número de Idea Unidades Recordó en Dos Experimentos, El uso de Diferentes Prosa Passagesa

Material Prueba 1 Prueba 2 Retraso de prueba
«La Guerra de los Fantasmas»b 21.4 22.9 19.0
«El Niño de Silbar»c 12.1 13.2 10.7

Datos son de Wheeler y Roediger (1992) y reimpreso con el permiso de la Cambridge University Press. b 42 unidades idea. c 41 unidades idea.

Concluimos de los experimentos descritos hasta ahora que, para el material aprendido recientemente, el recuerdo mejora entre pruebas cuando los intervalos cortos los separan, pero que el olvido ocurre cuando el intervalo se aumenta a una semana. Bahrick y Hall (1993) han argumentado que esta conclusión puede ser válida solo para situaciones de memoria episódica, porque cuando los sujetos se prueban repetidamente en un conocimiento relativamente permanente (por ejemplo, de eventos públicos o rostros famosos), muestran mejoras en los largos retrasos entre las pruebas. Bahrick y Hall (1991) reportaron mejoras en un mes, al igual que Hermann, Buschke y Gall (1987). En un paradigma bastante diferente, Squire, Haist y Shimamura (1989) reportaron mejoras significativas con un año entre pruebas. Estos informes indican que la hipermnesia se puede obtener con largos intervalos entre las pruebas, pero Roediger y Wheeler (1993) señalaron que una posible interpretación de estos avances en el conocimiento entre las pruebas es que los sujetos pueden estar expuestos al material relevante de revistas, periódicos, televisión o libros durante este tiempo. (En algunos casos, como la investigación de Squire et al. , el procedimiento de prueba expuso a los sujetos a las respuestas correctas.) Es intrínsecamente difícil poner a prueba los conocimientos generales con intervalos muy espaciados y no tener oportunidades de estudio intermedias para el material. De hecho, la primera prueba puede sensibilizar a los sujetos a información relevante y llevarlos a prestar más atención si se exponen a ella más tarde (pero vea Bahrick & Hall, 1991). Sin embargo, los resultados descritos por Bahrick y Hall (1993) son interesantes y merecen un mayor estudio.

Para concluir esta sección, creemos que hemos resuelto la paradoja planteada por los resultados dispares de pruebas repetidas en memoria episódica al mostrar que el intervalo entre pruebas es la variable crítica. Para material aprendido recientemente, como imágenes o pasajes en prosa, las pruebas repetidas con intervalos cortos entre pruebas producen una mejora en el recuerdo general (hipermnesia). (Si Bartlett, 1932, hubiera utilizado intervalos cortos entre pruebas, podría haber llegado a conclusiones muy diferentes sobre la naturaleza reconstructiva de la memoria.) Cuando el intervalo entre las pruebas se extiende a una semana, el recuerdo disminuye. Sin embargo, incluso con este intervalo más largo, la mayor parte del olvido ocurrió como omisiones de material; se introdujeron pocos errores y confabulaciones, y la mayoría de estos fueron menores. Esto fue cierto en el experimento de clase con «La Guerra de los Fantasmas» y con los otros tipos de material, también. ¿Indica esta evidencia que recordar no es tan reconstructivo como Bartlett (1932), entre muchos otros, nos hace creer? Nos referiremos a este tema en la siguiente sección.