Articles

Aggregate Data

II forskellige effekter af gentagen test

psykologer har brugt gentagne testparadigmer til mange forskellige formål; derfor er flere forskellige traditioner for denne forskning blevet etableret, ofte med lidt krydshenvisning. I dette afsnit beskriver vi forskning fra begyndelsen af dette århundrede, hvor efterforskere testede hukommelsen gentagne gange og nåede diametralt modsatte konklusioner om dens funktion. Mærkeligt, så vidt vi ved, bemærkede ingen Paradokset ved denne tidlige forskning, før to af de nuværende forfattere rejste det i 1992 (hjul & Roediger, 1992).

i nogle af de mest kendte undersøgelser inden for kognitiv psykologi rapporterede Bartlett (1932) sine berømte eksperimenter, hvor han fik engelske universitetsstuderende til at læse en amerikansk indisk historie, “Spøgelseskrigen”, og husk den derefter flere gange. Typisk, det første tilbagekaldelsesforsøg fandt sted 15 minutter eller deromkring efter den indledende undersøgelse, og senere test kan forekomme dage, uger, eller måneder senere. På senere tests fandt Bartlett dramatiske forvrængninger i tilbagekaldelse af historien med mange udeladelser, ændringer af mening og lejlighedsvise tilføjelser. Bartlett understregede hukommelsens konstruktive karakter og argumenterede for, at hans fag sandsynligvis brugte skemaet til et eventyr, en fælles form for disse studerende, til kodning og rekonstruktion af historien. Overnaturlige elementer blev fremhævet, og historien blev ofte gjort mere konsekvent og rationel. Derfor konkluderede Bartlett (1932) fra sin gentagne reproduktionsteknik, at minder ofte bliver mere fejlbehæftede over gentagne tests.

det er værd at bemærke, at Bartlett (1932) ikke producerede nogen samlede data til støtte for hans konklusioner, men snarere præsenterede prøveprotokoller og anekdoter for at styrke hans konklusioner. Interessant nok kan vi kun nævne et forsøg på replikation af Bartletts (1932) banebrydende forskning—en udgivet af Gauld og Stephenson (1967) og diskuteret nedenfor—der forsøgte at bekræfte hans påstande ved hjælp af gentagen reproduktionsteknik. “Spøgelseskrigen” er blevet brugt i en hel del senere forskning, men dette arbejde involverede sjældent gentagen test og blev normalt udført til andre formål end at undersøge hukommelsens rekonstruktive karakter. 1 af samme grund er der udført meget forskning om hukommelsens rekonstruktive karakter, men sjældent har dette interessante arbejde involveret gentagen test; det er mere sædvanligt at vurdere hukommelse via en enkelt genkendelsesprøve for information, der måske er udledt, men ikke faktisk angivet i en prosa-passage (f. eks., Johnson, Bransford, & Solomon, 1973) eller via forkert information givet i en fortælling, efter at emner har været vidne til en begivenhed (f.eks. Loftus, 1979, 1991).

mærkeligt nok nævnte Bartlett (1932) ikke, at hans gentagne testforskning var i konflikt med anden forskning, der går tilbage i mindst 20 år, også udført i England. Ballard (1913) gav skolebørn passager af poesi til at huske og testede dem derefter gentagne gange i intervaller på op til en uge senere. Ballard fandt ud af, at børn ofte ville huske poesilinjer ved senere prøver, som de ikke kunne huske ved tidligere prøver, et fænomen, han kaldte reminiscens. De grundlæggende observationer af tilbagekaldelse på en senere test af materiale, der var gået glip af tidligere tests, blev bekræftet i senere forskning (f.eks. brun, 1923), der blev udført længe før Bartlett (1932) udgav sin bog, så det er underligt, at han ikke i det mindste citerede det. Imidlertid, de grundlæggende fund af Ballard og brun var direkte i strid med Bartletts observationer og konklusioner; i stedet for dramatisk glemme og forvrængning af hukommelsen havde Ballard og brun rapporteret faktiske forbedringer over tid i fagets evner til at huske deres oplevelser. I retfærdighed var Bartletts berømte bog beregnet til at rapportere hans nye eksperimenter, som tilsyneladende begyndte i 1913 (Bartlett, 1932, s. v). Imidlertid kunne han have tilføjet de sociale faktorer, der påvirker historisk hukommelse, tendensen til at se bort fra offentliggjorte beviser i strid med ens opfattelse.observationerne af Ballard (1913) og brun (1923), der indikerer positive virkninger af gentagen test på den samlede tilbagekaldelse, blev undersøgt i nogle år, før de blev forladt i et stykke tid som genstand for seriøs undersøgelse. (1943) gennemgik litteraturen og konkluderede, at reminiscens var et flygtigt fænomen, der ikke forekom så ofte som det så ud. Imidlertid hævdede Payne (1987), at han (1943) nåede sin konklusion, fordi fænomenet reminiscens var blevet omdefineret gennem årene. Ballards (1913) oprindelige definition af udtrykket var af materiale, der ikke kunne tilbagekaldes ved en første test, der blev genvundet ved en anden (eller senere) test. Når total tilbagekaldelse forbedres mellem to tests, skal reminiscens have fundet sted; derfor brugte Ballard undertiden samlet forbedring mellem test som et indeks for forekomsten af reminiscens. Dette synes nu at være en fejl, fordi det førte til, at senere forskere som f.eks. Det er dog helt muligt at have reminiscens (defineret som “intertest recovery”) uden at have en generel forbedring mellem testene, fordi glemme mellem testene kan udligne reminiscensen eller genopretningen. Derfor, da han (1943) konkluderede, at fænomenet var upålideligt, henviste han til en samlet forbedring mellem test, ikke til reminiscens defineret som intertest recovery, som blev bredt opnået. Ikke desto mindre er hans anmeldelse generelt krediteret med faldende forskning på dette område i flere årtier.

forskning om emnet forbedringer i tilbagekaldelse på tværs af gentagne tests blev genoplivet af erdelyi og Becker (1974). De præsenterede emner med billeder eller konkrete ord og fik emner til at huske dem på tre på hinanden følgende prøver, der hver varede 7 min. De brugte også en ny procedure, tvungen tilbagekaldelse, hvor emner dybest set deltog i en gratis tilbagekaldelsestest, men blev tvunget til at producere et forudindstillet antal svar, der var større end antallet af emner, som emner kunne huske. Denne procedure blev brugt til at overvinde argumentet om, at gevinster, der blev observeret ved senere tilbagekaldelsestest, skulle tilskrives afslappede tilbagekaldelseskriterier på disse test. (Vi undersøger virkningerne af tvungen tilbagekaldelse på hukommelsen i et senere afsnit). Erdelyi og Becker rapporterede overordnede forbedringer på tværs af test i tilbagekaldelse af billeder, men ikke af ord. De mærkede denne forbedring hypermnesi (det modsatte af amnesi eller glemme).2

det er værd at bemærke, at stort set alle eksperimenter, der anvender fri eller tvungen tilbagekaldelse, har rapporteret stærk erindring i tilbagekaldelse af både billeder og ord (f. eks., Erdelyi, Finkelstein, Herrell, Miller & Thomas, 1976), skønt forbedringen mellem test i tilfælde af ord opvejes af intertest glemmer i mange eksperimenter. (Nogle forskere har dog rapporteret pålidelig hypermnesi for ord; f.eks. Payne & Roediger, 1987). Der er nu en stor litteratur om hypermnesi (se Erdelyi, 1984; Payne, 1987; og Roediger & Challis, 1989 for anmeldelser). Det punkt, vi ønsker at etablere her, er imidlertid simpelthen, at fænomenerne reminscence og hypermnesi er reelle og ofte replikeres. I et interessant eksperiment viste Scrivner og Safer (1988) forsøgspersoner et videobånd af et indbrud og gav dem derefter gentagne tests for at huske kritiske detaljer om begivenheden. Recall forbedret støt på tværs af fire gentagne tests. Generaliteten af fænomenet hypermnesi fører os tilbage til det oprindelige spørgsmål om, hvorfor to forskellige traditioner for forskning, begge anvender gentagen test, kan nå frem til sådanne forskellige konklusioner vedrørende hentningsprocesser i hukommelsen.(1992) undersøgte tidligere forskning og isolerede to sandsynlige faktorer som potentielle årsager til de forskellige fund og konklusioner: typen af anvendt materiale og længden af intervallet mellem test. Bartlett (1932) brugte prosapassager i de fleste af hans hukommelseseksperimenter, såsom “Spøgelseskrigen.”På den anden side brugte meget af forskningen, der viser forbedringer mellem test, lister over ord, billeder eller lignende materialer. (Payne, 1987, gennemgik 172 sådanne eksperimenter, der dokumenterede fænomenet, alle ved hjælp af lister.) En anden potentiel faktor er intertest-intervallet; Bartlett (1932) brugte temmelig lange intervaller mellem test, ofte dage og undertiden måneder, mens forskere, der studerer hypermnesi, normalt kun indsætter fem minutter eller mindre mellem test.

det fremgår ikke af tidligere forskning, hvilke af disse faktorer der skal være vigtigere, eller om begge er kritiske. For eksempel opnåede Ballard (1913) hypermnesi til passager af poesi, som kan betragtes som forbundet diskurs som prosa. Tilsvarende opnåede Roediger, Payne, Gillespie og Lean (1982) hypermnesi i tilbagekaldelse af kategorier (præsidenter, fugle, sport), som også er i velstrukturerede sæt. På den anden side har nogle forskere opnået hypermnesi over lange intervaller. I eksperimentet af Scrivner og Safer (1988) beskrevet ovenfor blev hypermnesi opnået mellem test over et 48-timers interval. Tilsvarende opnåede erdelyi og Kleinbard (1978) hypermnesi for en liste over billeder over en uge ved at teste emner tre gange om dagen med en tvungen tilbagekaldelsesprocedure.(1992) undersøgte både retentionsinterval og materialetype som de mulige faktorer, der ligger til grund for tidligere uoverensstemmende resultater i flere eksperimenter. De fik forsøgspersoner til at studere 60 billeder under en af to betingelser, før de tog tvungne tilbagekaldelsestest på billederne. I et tilfælde, emner hørte en historie, og navnene på de 60 afbildede objekter fandt sted i historien. De blev bedt om at lære både historien og navnene på billederne. Andre emner så de samme 60 billeder præsenteret i samme rækkefølge, men de hørte navnene på billederne, da de blev præsenteret. Disse to betingelser skulle til en vis grad simulere forskellen mellem Bartletts materialer (skematisk behandling af prosa) i pictures + story condition på den ene side og listeindlærings betingelserne for det typiske hypermnesi eksperiment i pictures + names conditions på den anden side. Denne sammenligning med målmaterialet holdes konstant mellem forholdene, så man behøver ikke foretage en sammenligning mellem prosa tilbagekaldelse på den ene side og tilbagekaldelse af noget helt andet materiale præsenteret i lister på den anden.

den anden hovedvariabel i hjulet og Roediger (1992) eksperiment var tidsplanen for testpersoner, der blev modtaget efter at have set de 60 billeder under en af de to betingelser. Alle emner modtog et kort spørgeskema, der spurgte dem om forskellige funktioner i eksperimentet, såsom at estimere antallet af præsenterede billeder. En tredjedel af emnerne blev afskediget på dette tidspunkt og bedt om at vende tilbage en uge senere. (Spørgeskemaet blev oprettet for at give emner i denne tilstand en plausibel begrundelse for at have deltaget.) En anden tredjedel af emnerne modtog en test for billederne; de fik ark nummereret 1-60 og fik at vide at huske navnene på så mange af de 60 billeder, de tidligere havde studeret som muligt, men at de skulle gætte at fylde de 60 rum. Syv minutter var tilladt til tilbagekaldelse. Den sidste tredjedel af forsøgspersonerne blev behandlet på samme måde, bortset fra at de fik tre 7-min tvungen tilbagekaldelsestest med 1-min pauser mellem testene. Endelig vendte alle forsøgspersoner tilbage en uge senere og modtog derefter tre på hinanden følgende tvungen tilbagekaldelsestest for de 60 billeder, der var blevet undersøgt den foregående uge.

sammenfattende studerede emner enten billeder på en liste eller i sammenhæng med en historie, tog derefter nul, en eller tre tvungne tilbagekaldelsestest på billederne og vendte derefter tilbage den næste uge og tog yderligere tre prøver. Vi forventede, at emner, der tog de tre øjeblikkelige tests, ville vise hypermnesi (forbedret tilbagekaldelse over test), i det mindste i den tilstand, hvor de studerede billeder og deres navne (replikerer erdelyi & Becker, 1974, blandt mange andre). Vi forventede imidlertid, at glemme (ikke forbedring) ville forekomme mellem test med en uges forsinkelse mellem dem, og at denne glemme kunne være mere udtalt i pictures + story-tilstanden med dens skemadrevne behandling.

de grundlæggende resultater er vist i tabel I. De seks grupper af forsøgspersoner er mærket til venstre, hvor det første tal angiver antallet af prøver, der er taget den dag, forsøgspersonerne studerede billederne (0, 1 eller 3), og det andet tal angiver de tre prøver, der er taget en uge senere (altid 3). Recall af billeder var større i billederne + historie betingelser end i billederne + navne betingelser; kollapse på tværs af alle andre betingelser, forskellen var omkring fire elementer. Materialetypen er imidlertid irrelevant for hovedpunktet her, så lad os fokusere på billedet + historien tilbagekaldelse i bunden af tabel i for at besvare fire spørgsmål af interesse. For det første blev recall forbedret i de tre øjeblikkelige tests? Svaret er klart ja: Recall forbedret med 3.8 genstande på tværs af testene, og hypermnesien var endnu større i pictures + story-tilstanden end i den mere typiske pictures + names-tilstand. Det er klart, at hypermnesi kan opnås ved tilbagekaldelse efter en historie (omend af billeder indlejret i historien).

tabel I. Antal billeder tilbagekaldt som en funktion af præsentation kontekst og test Schedulea

kontekst og
gruppe
umiddelbare tests T3 – T1 forsinkede tests T3 – T1
1 2 1 2 3
billeder plus navne
3-3 26.6 27.2 28.4 1.8b 25.2 26.3 26.0 0.8
1–3 25.7 20.2 21.7 23.0 2.8b
0–3 16.7 17.5 17.5 0.8
Pictures plus story
3–3 32.7 35.0 36.4 3.8b 31.8 33.0 33.4 1.6b
1–3 31.8 23.3 25.0 25.6 2.3b
0–3 17.4 17.2 18.4 1.0

a Data are from Wheeler and Roediger (1992) and are reprinted by permission of the Cambridge University Press. b These conditions demonstrated reliable hypermnesia across the three tests.

det andet spørgsmål af interesse er, om glemme opstod mellem testene, når en uge i stedet for få minutter gik mellem dem. Igen er svaret ja. I gruppe 3-3 i pictures + story-tilstanden faldt tilbagekaldelse fra 36,4 genstande tilbagekaldt til 31,8 i løbet af ugen; i gruppe 1-3 var faldet fra 31,8 til 23,3. Successive tests med en uge mellem test producerer glemme, ikke hypermnesi. Disse resultater viser, at det sandsynligvis er forsinkelsen mellem test og ikke den type materiale, der producerede de forskellige resultater i Ballards (1913) og Bartletts (1932) eksperimenter.

resultaterne i tabel I kan også bruges til at løse to andre problemer, der er af interesse. Kan hypermnesi opnås efter et uges tilbageholdelsesinterval, hvis der opstår korte intervaller mellem successive tests efter ugens forsinkelse? Svaret fra de seks betingelser i højre side af bordet jeg synes at være ja. I alle seks tilfælde tilbagekaldte forsøgspersoner mere på den tredje test end på den første test, og en variansanalyse på kun de forsinkede testdata gav en signifikant effekt for antallet af test, F(2, 114) = 14, 35, MSe = 5, 03, p < .001. Effekten er imidlertid ikke særlig robust, fordi den kun var signifikant på tre af de seks betingelser i individuelle ANOVAs. Ikke desto mindre kan hypermnesi efter al sandsynlighed opnås pålideligt efter en uges forsinkelse.

det sidste punkt at tegne fra tabel I er kraften i en test til at hjælpe senere tilbagekaldelse. Emner, der tog tre øjeblikkelige prøver, huskede flere billeder en uge senere end emner, der kun tog en test, men disse emner mindede igen billederne meget bedre end emner, der ikke havde nogen prøver efter at have studeret billederne oprindeligt. Disse resultater er afbildet grafisk i Fig. 1, hvor ydeevnen på de tre forsinkede tests er blevet gennemsnit og plottet som en funktion af antallet af øjeblikkelige tests. De tre grupper af emner i enten billeder + navne og billeder + historiebetingelse blev behandlet identisk op til punktet for den første test og derefter da de vendte tilbage en uge senere. Den eneste forskel mellem forhold, der kunne påvirke ydeevnen på de senere tests, var antallet af tests, der blev taget under den indledende session. Ikke desto mindre, som Fig. 1 viser, forsinket tilbagekaldelse steg monotont med antallet af tidligere tests og den forstærkende effekt af test påvirket forsinket tilbagekaldelse meget kraftigere i billeder + historie end i billeder + navne tilstand. Vi har ingen klar fortolkning af dette sidste resultat, men vores pointe her er primært at dokumentere den kraftige effekt, at tage en test har på senere fastholdelse. Glover, 1989, 1971, 1939, Thompson et al., 1978).

Fig. 1. Testeffekten. Antallet af tests taget kort efter at have studeret billeder stærkt påvirket tilbagekaldelse en uge senere.

for at vende tilbage til hovedpunktet i eksperimentet hævdede hjul og Roediger (1992), at deres eksperiment løste puslespillet fra tidligere inkonsekvente undersøgelser af Ballard (1913) og Bartlett (1932). Svaret er ret ligetil: hvis der er korte intervaller mellem testene, finder man normalt hypermnesi over gentagen test. Hvis intervallerne er lange (en uge i vores eksperiment), får man at glemme mellem testene. Selvfølgelig skal dette sidstnævnte punkt være sandt i det begrænsende tilfælde—sige med 5 år mellem testene—men forekommer også med intervaller så korte som en uge.

vi konkluderer, at type materiale spillede en lille rolle i de tidligere uoverensstemmelser mellem resultaterne, fordi vi ikke fandt nogen interaktion med andre variabler mellem billeder præsenteret på en liste (tilstanden billeder + navne) og dem, der blev præsenteret i en historiekontekst (billederne + historiebetingelsen). Denne konklusion kan dog udfordres, fordi vi på en måde brugte de samme materialer—en serie på 60 billeder—under begge forhold. Roediger og Roediger (1992) gennemførte yderligere to eksperimenter for at se, om de grundlæggende fund kunne opnås med prosa-materialer. Kan hypermnesi opnås med korte intervaller mellem test og glemme opnås, når intervallet forlænges til en uge?

de to eksperimenter var ens, bortset fra materialetyperne og det faktum, at den ene blev udført som en klassedemonstration, og den anden blev udført under mere kontrollerede laboratorieforhold. Ikke desto mindre var resultaterne meget ens. I klasseværelset eksperiment, studerende i en kognitiv psykologi kursus på Rice University læse” krigen af spøgelser ” to gange på en behagelig sats og derefter brugt 5 min minder Amerikanske præsidenter. De fik derefter 8,5 minutter til at huske historien så godt som muligt; efter dette forsøg på fri tilbagekaldelse huskede de amerikanske stater i 5 minutter og huskede derefter historien igen i 8,5 minutter mere. En uge senere fik eleverne en overraskelsestest og bedt om at huske historien igen. Laboratorieeksperimentet blev udført under generelt lignende forhold med et uddrag fra en John Updike novelle, “The Kid ‘ s fløjtende”, der tjener som målmateriale.

resultaterne af de to eksperimenter er vist her i tabel II. for begge typer materialer viste forsøgspersoner beskedne, men statistisk signifikante forbedringer mellem de to første tests. Mandler & Johnson, 1977) scorede vi resultaterne med hensyn til antallet af ideenheder (væsentlige sætninger eller ideer i passagen), der blev tilbagekaldt. Forbedringen mellem de to indledende tests ser beskeden ud, men hver ideenhed består i gennemsnit af syv til otte ord, så forbedringen ville se større ud, hvis den blev scoret på denne måde (hvilket dog er vanskeligt med prosa materialer). I begge tilfælde var forbedringen ret konsistent på tværs af emner (Se hjul & Roediger, 1992 for detaljer). Endvidere i begge eksperimenter tilbagekaldelse faldt mellem den anden test og den tredje en uge senere. I intet tilfælde viste forsøgspersoner imidlertid grov forvirring og unøjagtighed ved den forsinkede test, hvilket kunne have været forventet af Bartletts (1932) resultater. Vi vender tilbage til dette punkt senere.

tabel II. Antal Ideeenheder tilbagekaldt i to eksperimenter ved hjælp af forskellige prosa Passagesa

materiale Test 1 Test 2 forsinket test
“spøgelsens krig”b 21.4 22.9 19.0
“barnets fløjt”c 12.1 13.2 10.7

a data er fra Roediger og Roediger (1992) og er genoptrykt med tilladelse fra Cambridge University Press. b 42 idee enheder. c 41 idee enheder.

vi konkluderer fra de hidtil beskrevne eksperimenter, at for nyligt lært materiale forbedres tilbagekaldelse mellem test, når korte intervaller adskiller dem, men at glemme opstår, når intervallet øges til en uge. Bahrick og Hall (1993) har hævdet, at denne konklusion kun kan gælde for episodiske hukommelsessituationer, fordi når emner gentagne gange testes på relativt permanent viden (f.eks. Bahrick and Hall (1991) rapporterede forbedringer i løbet af en måned, ligesom Hermann, Buschke og Gall (1987). I et ret andet paradigme rapporterede Væbner, Haist og Shimamura (1989) betydelige forbedringer med et år mellem testene. Disse rapporter indikerer, at hypermnesi kan opnås med lange intervaller mellem testene, men Roediger og hjul (1993) bemærkede, at en mulig fortolkning af disse gevinster i viden mellem testene er, at emner kan blive udsat for det relevante materiale fra magasiner, aviser, tv eller bøger i løbet af denne tid. (I nogle tilfælde, som f.eks. , testproceduren udsatte forsøgspersoner for de rigtige svar.) Det er i sagens natur vanskeligt at teste generel viden med vidt adskilte intervaller og ikke have mellemliggende studiemuligheder for materialet. Faktisk kan den første test sensibilisere emner for relevant information og få dem til at være mere opmærksomme, hvis de udsættes for det senere (men se Bahrick & Hall, 1991). Ikke desto mindre er resultaterne beskrevet af Bahrick and Hall (1993) interessante og fortjener yderligere undersøgelse.

for at afslutte dette afsnit tror vi, at vi har løst det paradoks, der er forbundet med de forskellige resultater fra gentagen test i episodisk hukommelse ved at vise, at intervallet mellem test er den kritiske variabel. For nyligt lært materiale såsom billeder eller prosa-passager giver gentagen test med korte intervaller mellem test forbedring i den samlede tilbagekaldelse (hypermnesi). (Hvis Bartlett, 1932, havde brugt korte intervaller mellem testene, kunne han have nået meget forskellige konklusioner om hukommelsens rekonstruktive karakter.) Når intervallet mellem testene forlænges til en uge, så recall falder. Men selv med dette længere interval opstod det meste af glemningen som udeladelser af materiale; der var få fejl og konfabulationer introduceret, og de fleste af disse var mindre. Dette var sandt i klasseværelset eksperiment med “krigen af spøgelser” og med de andre typer af materiale, også. Tyder dette bevis på, at huske ikke er så rekonstruktiv som Bartlett (1932), blandt mange andre, ville have os til at tro? Vi vender os til dette problem i næste afsnit.