Articles

dados agregados

II efeitos díspares de testes repetidos

psicólogos têm usado repetidos paradigmas de testes para muitas finalidades diferentes; portanto, várias tradições diferentes desta pesquisa têm se estabelecido, muitas vezes com pouca referência cruzada. Nesta seção descrevemos pesquisas do início deste século em que os investigadores testaram a memória repetidamente e chegaram a conclusões diametralmente opostas sobre sua operação. Curiosamente, ao nosso conhecimento, ninguém notou o paradoxo colocado por esta pesquisa inicial até que dois dos autores atuais a levantaram em 1992 (Wheeler & Roediger, 1992).em algumas das pesquisas mais conhecidas em psicologia cognitiva, Bartlett (1932) relatou seus famosos experimentos em que ele fez com que estudantes universitários ingleses lessem uma história americana Indiana, “A Guerra dos fantasmas”, e então recordá-la várias vezes. Normalmente, a primeira tentativa de recall ocorreu cerca de 15 minutos após o estudo inicial, e testes posteriores podem ocorrer dias, semanas ou meses depois. Em testes posteriores Bartlett encontrou distorções dramáticas na memória da história, com muitas omissões, alterações de significado e adições ocasionais. Bartlett enfatizou a natureza construtiva da memória e argumentou que seus sujeitos provavelmente usaram o esquema de um conto de fadas, uma forma comum para esses estudantes, na codificação e reconstrução da história. Elementos sobrenaturais foram enfatizados, e a história foi muitas vezes feita mais consistente e racional. Portanto, a partir de sua técnica de reprodução repetida, Bartlett (1932) concluiu que as memórias muitas vezes se tornam mais propensas a erros sobre testes repetidos.

vale a pena notar que Bartlett (1932) não produziu dados agregados em apoio às suas conclusões, mas sim apresentou protocolos de amostra e anedotas para reforçar as suas conclusões. Curiosamente, podemos citar apenas uma tentativa de replicação da pesquisa pioneira de Bartlett (1932)—uma publicada por Gauld e Stephenson (1967) e discutida abaixo-que tentou confirmar suas afirmações usando a técnica de reprodução repetida. “A Guerra dos Fantasmas” tem sido usado em uma grande quantidade de pesquisas posteriores, mas este trabalho raramente envolvidos testes repetidos e era geralmente realizado para outros fins que examinar a natureza reparadora de memória. 1 da mesma forma, muita pesquisa tem sido conduzida sobre a natureza reconstrutiva da memória, mas raramente este trabalho interessante envolveu testes repetidos; é mais habitual avaliar a memória através de um único teste de reconhecimento para informações que poderiam ter sido inferidas, mas não realmente declaradas em uma passagem em prosa (e.g., Johnson, Bransford, & Solomon, 1973) ou através de desinformação dada em uma narrativa após os sujeitos terem testemunhado algum evento (por exemplo, Loftus, 1979, 1991).curiosamente, Bartlett (1932) não mencionou que sua pesquisa de testes repetidos entrou em conflito com outras pesquisas que datam de pelo menos 20 anos, também realizadas na Inglaterra. Ballard (1913) deu aos alunos passagens de poesia para memorizar e, em seguida, testá-los repetidamente para intervalos de até uma semana depois. Ballard descobriu que as crianças muitas vezes se lembravam de linhas de poesia em testes posteriores que não podiam se lembrar em testes anteriores, um fenômeno que ele chamou de reminiscência. As observações básicas de recall em um teste posterior de material que havia sido perdido em testes anteriores foram confirmadas em pesquisas posteriores (por exemplo, Brown, 1923) conduzidas muito antes de Bartlett (1932) publicar seu livro, por isso é curioso que ele não citou pelo menos. No entanto, os achados básicos de Ballard e Brown foram diretamente contrários às observações e conclusões de Bartlett.; ao invés de esquecimento dramático e distorção da memória, Ballard e Brown relataram melhorias reais ao longo do tempo nas habilidades dos sujeitos para recordar suas experiências. Para ser justo, o célebre livro de Bartlett tinha a intenção de relatar seus novos experimentos, que aparentemente começaram em 1913 (Bartlett, 1932, p. v). No entanto, ele pode ter adicionado aos fatores sociais que influenciam a memória histórica a tendência de desconsiderar as evidências publicadas em desacordo com a concepção de alguém.

As observações de Ballard (1913) e Brown (1923) indicando efeitos positivos de testes repetidos na recolha geral foram examinadas por alguns anos antes de serem abandonadas, por um tempo, como um objeto de estudo sério. Buxton (1943) revisou a literatura e concluiu que a reminiscência era um fenômeno efêmero que não ocorria tão frequentemente quanto parecia. No entanto, Payne (1987) argumentou que Buxton (1943) chegou à sua conclusão porque o fenômeno da reminiscência tinha sido redefinido ao longo dos anos. A definição original de Ballard (1913) do termo era de material que não podia ser lembrado em um primeiro teste que foi recuperado em um segundo (ou mais tarde) teste. Sempre que a recolha total melhora entre dois testes, deve ter ocorrido reminiscência; portanto, Ballard às vezes usou a melhoria geral entre os testes como um índice da ocorrência de reminiscência. Isso agora parece um erro, porque levou pesquisadores posteriores, como Buxton (1943) a redefinir a reminiscência como melhoria geral na recolha entre os testes. No entanto, é perfeitamente possível ter reminiscência (definida como “intertest recovery”) sem ter melhora global entre os testes, porque esquecer entre os testes pode compensar a reminiscência ou recuperação. Portanto, quando Buxton (1943) concluiu que o fenômeno não era confiável, ele se referiu a uma melhoria geral entre os testes, não a reminiscência definida como intertest recuperação, que foi amplamente obtida. No entanto, sua revisão é geralmente creditada com a diminuição da pesquisa nesta área por várias décadas.

a investigação sobre o tema das melhorias na recolha através de testes repetidos foi ressuscitada por Erdelyi e Becker (1974). Eles apresentaram imagens ou palavras concretas aos sujeitos e tiveram que lembrá-los em três testes sucessivos, cada um com duração de 7 minutos. Eles também usaram um novo procedimento, chamada forçada, no qual os sujeitos basicamente envolvidos em um teste de recolha livre, mas foram forçados a produzir um número pré-definido de respostas que era maior do que o número de itens que os sujeitos poderiam lembrar. Este procedimento foi utilizado para ultrapassar o argumento de que os ganhos observados em testes de recolha posteriores devem ser atribuídos a critérios de recolha menos exigentes nesses testes. (Examinamos os efeitos da recall forçada na memória em uma seção posterior). Erdelyi e Becker relataram melhorias globais nos testes em retirada de imagens, mas não de palavras. Eles rotularam esta melhoria hipermnésia (o oposto de amnésia, ou esquecimento).2

vale a pena notar que virtualmente todos os experimentos que empregam recall livre ou forçado relataram uma forte reminiscência na recall de imagens e palavras (e.g., Erdelyi, Finkelstein, Herrell, Miller & Thomas, 1976), embora no caso das palavras a melhoria entre os testes é compensada pelo intertest esquecimento em muitos experimentos. (However, some researchers have reported reliable hypermnesia for words; e.g., Payne & Roediger, 1987). Há por agora uma grande literatura sobre a hipermnésia (ver Erdelyi, 1984; Payne, 1987; e Roediger & Challis, 1989 para Comentários). O ponto que queremos estabelecer aqui, no entanto, é simplesmente que os fenômenos de reminiscência e hipermnésia são reais e muitas vezes replicados. Em um experimento interessante, Scrivner e Safer (1988) mostraram aos sujeitos uma fita de vídeo de um roubo e, em seguida, deu-lhes testes repetidos em recordar detalhes críticos do evento. Recall melhorou constantemente ao longo de quatro testes repetidos. A generalidade do fenómeno da hipermnésia leva-nos de volta à questão inicial de saber por que razão duas tradições de investigação diferentes, ambas utilizando testes repetidos, podem chegar a conclusões tão díspares em relação aos processos de recuperação na memória.Wheeler and Roediger (1992) examined past research and isolated two likely factors as potential causes of the different findings and conclusions: the type of material used and the length of the interval between tests. Bartlett (1932) used prose passages in most of his memory experiments, such as “The War of The Ghosts.”Por outro lado, grande parte da pesquisa mostrando melhorias entre testes usaram listas de palavras, imagens ou materiais similares. (Payne, 1987, Revised 172 such experiments documenting the phenomenon, all using lists. Outro fator potencial é o intervalo intertest; Bartlett (1932) usou intervalos bastante longos entre os testes, muitas vezes dias e às vezes meses, enquanto pesquisadores que estudam hipermnésia geralmente interpõem apenas cinco minutos ou menos entre os testes.

não é óbvio a partir de pesquisas anteriores qual destes fatores deve ser mais importante, ou se ambos são críticos. Por exemplo, Ballard (1913) obteve a hipermnésia para passagens de poesia, que pode ser considerado discurso conectado como prosa. Da mesma forma, Roediger, Payne, Gillespie e Lean (1982) obtiveram hipermnésia em retirada de categorias (presidentes, aves, esportes), que também estão em conjuntos bem estruturados. Por outro lado, alguns pesquisadores obtiveram hipermnésia através de longos intervalos. No experimento de Scrivner and Safer (1988) descrito acima, a hipermnésia foi obtida entre testes em um intervalo de 48 horas. Da mesma forma, Erdelyi e Kleinbard (1978) obtiveram hipermnésia para uma lista de imagens ao longo de uma semana, testando sujeitos três vezes por dia com um procedimento de recolha forçada.Wheeler and Roediger (1992) examined both retention interval and type of material as the possible factors underlying prior discrepant results in several experiments. Os sujeitos estudaram 60 fotos sob uma de duas condições antes de fazer testes de recolha forçada nas fotos. Em um caso, os sujeitos ouviram uma história e os nomes dos 60 objetos retratados ocorreram na história. Foi-lhes dito para aprenderem a história e os nomes das fotografias. Outros sujeitos viram as mesmas 60 imagens apresentadas na mesma ordem, mas eles ouviram os nomes das imagens como eles estavam sendo apresentados. Estas duas condições foram destinadas a simular, em algum grau, a diferença entre os materiais de Bartlett (processamento esquemático de prosa) na condição de fotos + história, por um lado, e as condições de aprendizagem de lista da experiência hipermnésia típica em imagens + condições de nomes, por outro. O procedimento de Wheeler e Roediger organiza esta comparação com o material alvo mantido constante entre as condições, de modo que não é necessário fazer uma comparação entre a recolha em prosa, por um lado, e a recolha de algum material completamente diferente apresentado em listas, por outro.

a outra variável principal no experimento Wheeler e Roediger (1992) foi o cronograma de testes recebidos após ver as 60 imagens em uma das duas condições. Todos os sujeitos receberam um breve questionário perguntando-lhes sobre várias características da experiência, tais como estimar o número de fotos apresentadas. Um terço dos sujeitos foram demitidos neste momento e disseram para retornar uma semana depois. (O questionário foi criado para dar aos sujeitos, nesta condição, uma justificação plausível para a sua participação.) Outro terço dos indivíduos recebeu um teste para as imagens; foram-lhes dadas folhas numeradas 1-60 e foi-lhes dito para recordar os nomes de tantas das 60 imagens que tinham estudado anteriormente quanto possível, mas que eles devem adivinhar para encher os 60 espaços. Foram permitidos sete minutos para a recolha. O último terço dos sujeitos foi tratado da mesma forma, exceto que foram submetidos a três testes de recolha forçada de 7 minutos, com intervalos de 1 min entre os testes. Finalmente, todos os sujeitos retornaram uma semana depois e, em seguida, receberam três testes consecutivos de recall forçado para as 60 fotos que tinham sido estudadas na semana anterior.

em resumo, os indivíduos estudaram imagens em uma lista ou no contexto de uma história, em seguida, tirou zero, um, ou três testes de recall forçado nas fotos, e então retornou na semana seguinte e fez mais três testes. Nós previmos que os indivíduos que tomassem os três testes imediatos mostrariam hipermnesia( maior recall sobre os testes), pelo menos na condição em que estudavam imagens e seus nomes (replicando Erdelyi & Becker, 1974, entre muitos outros). No entanto, esperávamos que o esquecimento (não melhoria) ocorreria entre os testes com uma semana de atraso entre eles, e que este esquecimento poderia ser mais pronunciado na condição de imagens + história com o seu processamento orientado esquema.

Os resultados principais são apresentados na Tabela I. Os seis grupos de sujeitos são rotulados na esquerda, com o primeiro número indica o número de exames no dia disciplinas estudadas as imagens (0, 1, ou 3) e o segundo número indica a três testes de uma semana mais tarde (sempre de 3). A recolha de imagens foi maior nas condições de imagens + História do que nas condições de imagens + nomes; colapsando em todas as outras condições, a diferença foi de cerca de quatro itens. No entanto, o tipo de material é irrelevante para o ponto principal aqui, então vamos nos concentrar na imagem + história recordar na parte inferior da tabela i para responder a quatro perguntas de interesse. Primeiro, lembra-se de melhorar nos três testes imediatos? A resposta é claramente sim: a recolha melhorou em 3.8 itens nos testes, e a hipermnésia foi ainda maior na condição de imagens + História do que na condição mais típica de imagens + nomes. Claramente, a hipermnésia pode ser obtida na sequência de uma história (embora de imagens incorporadas na história).

posição numa tabela I. Número de Imagens lembrado como uma Função do Contexto de Apresentação e Testes Schedulea

o Contexto e
grupo
Imediata testes T3 – T1 Atraso testes T3 – T1
1 2 3 1 2 3
Imagens e nomes
3-3 26.6 27.2 28.4 1.8b 25.2 26.3 26.0 0.8
1–3 25.7 20.2 21.7 23.0 2.8b
0–3 16.7 17.5 17.5 0.8
Pictures plus story
3–3 32.7 35.0 36.4 3.8b 31.8 33.0 33.4 1.6b
1–3 31.8 23.3 25.0 25.6 2.3b
0–3 17.4 17.2 18.4 1.0

a Data are from Wheeler and Roediger (1992) and are reprinted by permission of the Cambridge University Press. b These conditions demonstrated reliable hypermnesia across the three tests.

a segunda questão de interesse é se o esquecimento ocorreu entre os testes quando uma semana em vez de poucos minutos decorreram entre eles. Mais uma vez, a resposta é sim. No grupo 3-3 na condição pictures + story, recall caiu de 36,4 itens relembrados para 31,8 ao longo da semana; no grupo 1-3, A queda foi de 31,8 para 23,3. Testes sucessivos com uma semana entre os testes produzem esquecimento, não hipermnesia. Estes resultados mostram que é provável o atraso entre os testes e não o tipo de material que produziu os resultados díspares em experimentos de Ballard (1913) e Bartlett (1932).os resultados da Tabela I também podem ser usados para abordar duas outras questões que são de algum interesse. A hipermnésia pode ser obtida após um intervalo de retenção de uma semana se ocorrerem intervalos curtos entre os testes sucessivos após o atraso da semana? A resposta dada pelas seis Condições do lado direito da mesa parece ser sim. Em todos os seis casos, os indivíduos recordaram mais no terceiro ensaio do que no primeiro ensaio e uma análise da variância apenas dos dados do ensaio retardado produziu um efeito significativo para o número de ensaios, F(2, 114) = 14,35, MSe = 5.03, p < .001. No entanto, o efeito não é particularmente robusto porque foi significativo em apenas três das seis condições em ANOVAs individuais. No entanto, é muito provável que a hipermnésia possa ser obtida de forma fiável após uma semana de atraso.

o ponto final a extrair do quadro I é a potência de um ensaio para auxiliar a recolha posterior. Os sujeitos que fizeram três testes imediatos recordaram mais fotos uma semana depois do que os sujeitos que fizeram apenas um teste, mas estes sujeitos, por sua vez, lembrou as fotos muito melhor do que os sujeitos que não tinham testes após o estudo das fotos inicialmente. Estes resultados são retratados graficamente na Fig. 1, sempre que o desempenho nos três ensaios atrasados tenha sido calculado e traçado em função do número de ensaios imediatos. Os três grupos de sujeitos nas imagens + nomes e imagens + condição de história foram tratados identicamente até o ponto do primeiro teste e, em seguida, quando eles retornaram uma semana depois. A única diferença entre as condições que poderiam afetar o desempenho nos testes posteriores foi o número de testes realizados durante a sessão inicial. Mesmo assim, como figo. 1 shows, retayed recall increased monotonically with the number of prior tests and the enhancing effect of testing affected delayed recall much more powerfully in the pictures + story than in the pictures + names condition. Não temos uma interpretação pronta deste último resultado, mas o nosso ponto aqui é sobretudo documentar o efeito poderoso que a realização de um teste tem sobre a retenção posterior. Muitos outros também fizeram este ponto (por exemplo, Glover, 1989; Izawa, 1971; Spitzer, 1939; Thompson et al., 1978).

Fig. 1. O efeito de teste. O número de testes feitos logo após o estudo de fotos muito afetou recordar uma semana depois.

To return to the main point of the experiment, Wheeler and Roediger (1992) argued that their experiment resolved the puzzle posed by prior inconsistent studies of Ballard (1913) and Bartlett (1932). A resposta é bastante simples: Se houver intervalos curtos entre os testes, então geralmente se encontra hipermnésia sobre testes repetidos. Se os intervalos são longos (uma semana, em nossa experiência), então obtém-se o esquecimento entre os testes. É claro que este último ponto deve ser verdadeiro no caso limitativo—digamos, com 5 anos entre os testes—, mas também ocorre com intervalos tão curtos quanto uma semana.

concluímos que o tipo de material desempenhou pouco papel nas discrepâncias anteriores entre os resultados, porque não encontramos interação com outras variáveis entre as imagens apresentadas em uma lista (a condição de imagens + nomes) e as apresentadas em um contexto de história (as imagens + condição de história). No entanto, esta conclusão pode ser contestada, porque, de certo modo, usamos os mesmos materiais—uma série de 60 imagens—em ambas as condições. Wheeler and Roediger (1992) conducted two further experiments to see whether the basic findings could be obtained with prose materials. Pode a hipermnésia ser obtida com intervalos curtos entre os testes e o esquecimento ser obtido quando o intervalo é alongado para uma semana?os dois experimentos foram similares, exceto para os tipos de materiais e o fato de que um foi realizado como uma demonstração em sala de aula e o outro foi realizado sob condições laboratoriais mais controladas. No entanto, os resultados foram muito semelhantes. No experimento de sala de aula, os alunos em um curso de psicologia cognitiva na Universidade Rice leram “a Guerra dos fantasmas” duas vezes a um ritmo confortável e, em seguida, passou 5 minutos recordando presidentes dos Estados Unidos. Eles foram então Dados 8,5 minutos para recordar a história, bem como possível; após esta tentativa de recall livre, eles chamaram os Estados Unidos por 5 minutos e, em seguida, lembrou a história novamente por 8,5 minutos mais. Uma semana depois, os alunos receberam um teste surpresa e pediram para lembrar a história novamente. O experimento de laboratório foi realizado em condições geralmente similares com um trecho de um conto de John Updike, “The Kid’s Whistling”, servindo como o material alvo.

os resultados das duas experiências são apresentados aqui no quadro II. para ambos os tipos de materiais, os indivíduos apresentaram melhorias modestas mas estatisticamente significativas entre os dois primeiros testes. Seguindo outros (por exemplo, Mandler & Johnson, 1977), marcamos os resultados em termos do número de unidades de ideias (frases significativas ou ideias na passagem) que foram lembradas. A melhoria entre os dois testes iniciais parece modesta, mas cada unidade de idéia é composta de sete a oito palavras, em média, de modo que a melhoria seria maior se marcado desta forma (que, no entanto, é difícil com materiais em prosa). Em ambos os casos, a melhoria foi bastante consistente entre os indivíduos (ver Wheeler & Roediger, 1992 para detalhes). Além disso, em ambos os experimentos recall diminuiu entre o segundo teste e o terceiro uma semana depois. No entanto, em nenhum dos casos os sujeitos mostraram grande confusão e imprecisão no teste atrasado, o que poderia ter sido esperado dos resultados de Bartlett (1932). Voltamos a este ponto mais tarde.

Tabela II. Número de Idéia Unidades Recordou, em Dois Experimentos, A utilização de Diferentes Prosa Passagesa

Material Teste 1 Teste 2 Atraso de teste
“A Guerra dos Fantasmas”b 21.4 22.9 19.0
“O Garoto está Assobiando”c 12.1 13.2 10.7

Dados são de Wheeler e Roediger (1992) e são reimpresso por permissão da Cambridge University Press. B-42 idea units. C-41 idea units.

concluímos das experiências descritas até agora que, para material recentemente aprendido, a recolha melhora entre os testes quando pequenos intervalos os separam, mas esse esquecimento ocorre quando o intervalo é aumentado para uma semana. Bahrick e Hall (1993) argumentaram que esta conclusão pode conter apenas para a memória episódica situações, porque quando os assuntos são repetidamente testados relativamente permanente de conhecimento (por exemplo, de eventos públicos ou rostos famosos), eles mostram melhorias em relação atrasos de tempo entre os testes. Bahrick e Hall (1991) relataram melhorias ao longo de um mês, assim como Hermann, Buschke e Gall (1987). Em um paradigma bastante diferente, Squire, Haist e Shimamura (1989) relataram melhorias significativas com um ano entre os testes. Esses relatórios indicam que hypermnesia podem ser obtidas com intervalos de tempo entre os testes, mas Roediger e Wheeler (1993) observou que uma possível interpretação desses ganhos em conhecimento entre os testes é que os indivíduos podem ser expostos ao material relevante de revistas, jornais, televisão ou livros durante este tempo. (In some cases, such as research by Squire et al. , o procedimento de teste expôs os sujeitos às respostas corretas.) É inerentemente difícil testar o conhecimento geral com intervalos muito espaçados e não ter oportunidades de estudo para o material. Na verdade, o primeiro teste pode sensibilizar os indivíduos para informações relevantes e levá-los a prestar mais atenção se eles forem expostos a ele mais tarde (mas ver Bahrick & Hall, 1991). No entanto, os resultados descritos por Bahrick e Hall (1993) são interessantes e merecem um estudo mais aprofundado.

para concluir esta secção, pensamos que resolvemos o paradoxo colocado pelos resultados díspares de testes repetidos na memória episódica, mostrando que o intervalo entre testes é a variável crítica. Para material recentemente aprendido, como imagens ou passagens em prosa, testes repetidos com intervalos curtos entre os testes produzem melhoria na recolha geral (hipermnésia). (If Bartlett, 1932, had used short intervalos between tests he might have reached very different conclusions about the reconstructive nature of memory. Quando o intervalo entre os testes é estendido para uma semana, então a recolha diminui. No entanto, mesmo com este intervalo mais longo, A maior parte do esquecimento ocorreu como omissões de material; houve poucos erros e confabulações introduzidos, e a maioria deles eram menores. Isso era verdade na experiência da sala de aula com “a Guerra dos fantasmas” e com os outros tipos de material, também. Esta evidência indica que lembrar não é tão reconstrutivo quanto Bartlett (1932), entre muitos outros, nos faria acreditar? Passamos agora a esta questão na próxima secção.