Articles

aggregerade Data

II olika effekter av upprepad testning

psykologer har använt upprepade testparadigmer för många olika ändamål; därför har flera olika traditioner för denna forskning etablerats, ofta med liten korsreferens. I det här avsnittet beskriver vi forskning från början av detta århundrade där utredare testade minnet upprepade gånger och nådde diametralt motsatta slutsatser om dess funktion. Märkligt nog märkte ingen paradoxen som denna tidiga forskning utgjorde förrän två av de nuvarande författarna tog upp den 1992 (Wheeler & Roediger, 1992).

i några av de mest kända forskningen inom kognitiv psykologi rapporterade Bartlett (1932) sina berömda experiment där han hade engelska högskolestudenter läst en amerikansk indisk berättelse, ”Spökkriget”, och sedan minns det flera gånger. Vanligtvis inträffade det första återkallningsförsöket 15 minuter eller så efter den första studien, och senare tester kan inträffa dagar, veckor eller månader senare. Vid senare tester fann Bartlett dramatiska snedvridningar i återkallandet av berättelsen, med många utelämnanden, meningsförändringar och tillfälliga tillägg. Bartlett betonade minnets konstruktiva natur och hävdade att hans ämnen sannolikt använde schemat för en saga, en vanlig form för dessa studenter, vid kodning och rekonstruktion av berättelsen. Övernaturliga element var deemphasized, och historien gjordes ofta mer konsekvent och rationell. Därför drog Bartlett (1932) från sin upprepade reproduktionsteknik slutsatsen att minnen ofta blir mer felaktiga över upprepade tester.

det är värt att notera att Bartlett (1932) inte producerade några aggregerade data till stöd för hans slutsatser, utan snarare presenterade provprotokoll och anekdoter för att stärka hans slutsatser. Intressant kan vi bara citera ett försök till replikering av Bartletts (1932) banbrytande forskning—en publicerad av Gauld och Stephenson (1967) och diskuterad nedan—som försökte bekräfta hans påståenden med hjälp av upprepad reproduktionsteknik. ”Spökarnas krig” har använts i en hel del senare forskning, men detta arbete involverade sällan upprepade tester och utfördes vanligtvis för andra ändamål än att undersöka minnets rekonstruktiva natur. 1 på samma sätt har mycket forskning genomförts om minnets rekonstruktiva natur, men sällan har detta intressanta arbete involverat upprepad testning; det är vanligare att bedöma minnet via ett enda igenkänningstest för information som kan ha härletts men inte faktiskt anges i en prosa passage (t. ex., Johnson, Bransford, & Solomon, 1973) eller via felinformation som ges i en berättelse efter att ämnen har bevittnat någon händelse (t.ex. Loftus, 1979, 1991).märkligt nog nämnde Bartlett (1932) inte att hans upprepade testforskning stred mot annan forskning som går tillbaka minst 20 år, som också genomfördes i England. Ballard (1913) gav skolbarn poesipassager att memorera och testade dem sedan upprepade gånger för intervaller på upp till en vecka senare. Ballard fann att barn ofta skulle komma ihåg poesilinjer vid senare tester som de inte kunde komma ihåg vid tidigare tester, ett fenomen som han kallade reminiscens. De grundläggande observationerna av recall på ett senare test av material som hade missats på tidigare tester bekräftades i senare forskning (t.ex. Brown, 1923) som genomfördes långt innan Bartlett (1932) publicerade sin bok, så det är nyfiken att han inte åtminstone citerade den. De grundläggande resultaten från Ballard och Brown stred emellertid direkt mot Bartletts observationer och slutsatser; i stället för dramatisk glömska och förvrängning av minnet hade Ballard och Brown rapporterat faktiska förbättringar över tiden i försökspersonernas förmåga att minnas sina erfarenheter. I rättvisa var Bartletts berömda bok avsedd att rapportera sina nya experiment, som tydligen började 1913 (Bartlett, 1932, s. v). Men han kan ha lagt till de sociala faktorer som påverkar historiskt minne tendensen att bortse från publicerade bevis i strid med ens uppfattning.observationerna av Ballard (1913) och Brown (1923) som indikerar positiva effekter av upprepad testning på övergripande återkallelse undersöktes under några år innan de övergavs, för en tid, som ett föremål för allvarlig studie. Buxton (1943) granskade litteraturen och drog slutsatsen att reminiscens var ett kortvarigt fenomen som misslyckades med att inträffa ungefär lika ofta som det verkade. Payne (1987) hävdade dock att Buxton (1943) nådde sin slutsats eftersom fenomenet reminiscens hade omdefinierats genom åren. Ballards (1913) ursprungliga definition av termen var av material som inte kunde återkallas vid ett första test som återhämtades vid ett andra (eller senare) test. När total återkallelse förbättras mellan två tester måste reminiscens ha inträffat; därför använde Ballard ibland övergripande förbättringar mellan tester som ett index för förekomsten av reminiscens. Detta verkar nu vara ett misstag, eftersom det ledde senare forskare som Buxton (1943) att omdefiniera reminiscens som övergripande förbättring av återkallelse mellan tester. Det är dock fullt möjligt att ha reminiscens (definierad som ”intertest recovery”) utan att ha övergripande förbättringar mellan tester, eftersom att glömma mellan tester kan kompensera reminiscens eller återhämtning. Därför, när Buxton (1943) drog slutsatsen att fenomenet var opålitligt, hänvisade han till en övergripande förbättring mellan tester, inte till reminiscens definierad som intertest återhämtning, vilket erhölls allmänt. Ändå är hans granskning i allmänhet krediterad med minskande forskning inom detta område i flera årtionden.

forskning om ämnet förbättringar i återkallelse över upprepade tester återupplivades av Erdelyi och Becker (1974). De presenterade ämnen med bilder eller konkreta ord och fick ämnen att återkalla dem på tre på varandra följande tester, var och en varade 7 min. De använde också ett nytt förfarande, forced recall, där ämnen i princip deltog i ett fritt återkallningstest men tvingades producera ett förinställt antal svar som var större än antalet objekt som ämnen kunde komma ihåg. Denna procedur användes för att övervinna argumentet att vinster som observerats vid senare återkallningstester bör hänföras till avslappnade återkallningskriterier för dessa tester. (Vi undersöker effekterna av tvingad återkallelse på minnet i ett senare avsnitt). Erdelyi och Becker rapporterade övergripande förbättringar över tester i återkallelse av bilder men inte av ord. De märkte denna förbättring hypermnesi (motsatsen till amnesi eller glömma).2

det är värt att notera att praktiskt taget alla experiment som använder fri eller tvingad återkallelse har rapporterat stark reminiscens vid återkallelse av både bilder och ord (t. ex., Erdelyi, Finkelstein, Herrell, Miller & Thomas, 1976), även om det gäller ord förbättras förbättringen mellan testerna genom att intertest glömmer i många experiment. (Vissa forskare har dock rapporterat tillförlitlig hypermnesi för ord; t.ex. Payne & Roediger, 1987). Det finns nu en stor litteratur om hypermnesi (se Erdelyi, 1984; Payne, 1987; och Roediger & Challis, 1989 för recensioner). Poängen vi vill fastställa här är dock helt enkelt att fenomenen reminscence och hypermnesia är verkliga och ofta replikeras. I ett intressant experiment visade Scrivner och Safer (1988) försökspersoner ett videoband av ett inbrott och gav dem sedan upprepade tester för att återkalla kritiska detaljer om händelsen. Recall förbättrades stadigt över fyra upprepade tester. Generaliteten av fenomenet hypermnesi leder oss tillbaka till den första frågan om varför två olika forskningstraditioner, som båda använder upprepad testning, kan komma fram till sådana olika slutsatser om hämtningsprocesser i minnet.

Wheeler och Roediger (1992) undersökte tidigare forskning och isolerade två troliga faktorer som potentiella orsaker till de olika resultaten och slutsatserna: typen av material som används och längden på intervallet mellan testerna. Bartlett (1932) använde prosa passager i de flesta av hans minnesexperiment, som ”Spökarnas krig.”Å andra sidan använde mycket av forskningen som visade förbättringar mellan tester listor med ord, bilder eller liknande material. (Payne, 1987, granskade 172 sådana experiment som dokumenterade fenomenet, alla med hjälp av listor.) En annan potentiell faktor är intertestintervallet; Bartlett (1932) använde ganska långa intervall mellan tester, ofta dagar och ibland månader, medan forskare som studerar hypermnesi vanligtvis bara placerar fem minuter eller mindre mellan testerna.

det är inte uppenbart från tidigare forskning vilka av dessa faktorer som borde vara viktigare, eller om båda är kritiska. Till exempel fick Ballard (1913) hypermnesi för poesipassager, som kan betraktas som kopplad diskurs som prosa. På samma sätt fick Roediger, Payne, Gillespie och Lean (1982) hypermnesi i återkallelse av kategorier (presidenter, fåglar, sport), som också finns i välstrukturerade uppsättningar. Å andra sidan har vissa forskare fått hypermnesi över långa intervaller. I experimentet av Scrivner och Safer (1988) beskrivet ovan erhölls hypermnesi mellan tester över ett 48-timmars intervall. På samma sätt Erdelyi och Kleinbard (1978) erhöll hypermnesi för en lista med bilder över en vecka genom att testa ämnen tre gånger om dagen med ett tvångsåterkallande förfarande.

Wheeler och Roediger (1992) undersökte både retentionsintervall och typ av material som möjliga faktorer som ligger till grund för tidigare avvikelser resulterar i flera experiment. De fick försökspersoner att studera 60 bilder under ett av två villkor innan de tog tvångsåterkallande tester på bilderna. I ett fall hörde ämnen en historia och namnen på de 60 avbildade objekten inträffade i berättelsen. De fick höra att lära sig både historien och namnen på bilderna. Andra ämnen såg samma 60 bilder presenterade i samma ordning, men de hörde namnen på bilderna när de presenterades. Dessa två villkor var avsedda att i viss utsträckning simulera skillnaden mellan Bartletts material (schematisk bearbetning av prosa) i pictures + story condition, å ena sidan, och listlärningsförhållandena för det typiska hypermnesi-experimentet i pictures + names conditions, å andra sidan. Wheeler och Roedigers förfarande ordnar denna jämförelse med målmaterialet som hålls konstant mellan förhållandena, så man behöver inte göra en jämförelse mellan prosaåterkallande å ena sidan och återkallande av något helt annat material som presenteras i listor å andra sidan.

den andra huvudvariabeln i Wheeler och Roediger (1992) – experimentet var schemat för testämnen som mottogs efter att ha sett de 60 bilderna under ett av de två förhållandena. Alla ämnen fick ett kort frågeformulär som frågade dem om olika funktioner i experimentet, till exempel att uppskatta antalet presenterade bilder. En tredjedel av ämnena avskedades vid denna tidpunkt och berättade att de skulle återvända en vecka senare. (Frågeformuläret skapades för att ge ämnen i detta tillstånd en rimlig motivering för att ha deltagit.) Ytterligare en tredjedel av ämnena fick ett test för bilderna; de fick ark numrerade 1-60 och fick höra att komma ihåg namnen på så många av de 60 bilderna som de tidigare studerat som möjligt, men att de skulle gissa att fylla upp de 60 utrymmena. Sju minuter var tillåtna för återkallelse. Den sista tredjedelen av försökspersonerna behandlades på samma sätt, förutom att de fick tre 7-minuters tvångsåterkallande tester, med 1-min pauser mellan testerna. Slutligen återvände alla ämnen en vecka senare och fick sedan tre på varandra följande tvångsåterkallande tester för de 60 bilderna som hade studerats föregående vecka.

Sammanfattningsvis studerade ämnen antingen bilder i en lista eller i samband med en berättelse, tog sedan noll, en eller tre tvångsåterkallande tester på bilderna och återvände sedan nästa vecka och tog ytterligare tre tester. Vi förväntade oss att ämnen som tog de tre omedelbara testerna skulle visa hypermnesi (förbättrad återkallelse över tester), åtminstone i det tillstånd där de studerade bilder och deras namn (replikera Erdelyi & Becker, 1974, bland många andra). Vi förväntade oss dock att glömma (inte förbättring) skulle inträffa mellan tester med en veckolånga mellan dem, och att denna glömma kan vara mer uttalad i pictures + story-tillståndet med sin schemadrivna bearbetning.

de grundläggande resultaten visas i tabell I. De sex grupperna av försökspersoner är märkta till vänster, med det första numret som anger antalet tester som tagits på dagen försökspersoner studerade bilderna (0, 1 eller 3) och det andra numret som indikerar de tre testerna som tagits en vecka senare (alltid 3). Återkallelse av bilder var större i bilderna + berättelseförhållandena än i bilderna + namnförhållandena; kollapsar över alla andra förhållanden var skillnaden ungefär fyra objekt. Materialtypen är dock irrelevant för huvudpunkten här, så låt oss fokusera på bild + berättelse i botten av tabell I för att svara på fyra frågor av intresse. Först förbättrades återkallelsen i de tre omedelbara testerna? Svaret är klart ja: Recall förbättras med 3.8 objekt över testerna, och hypermnesien var ännu större i pictures + story-tillståndet än i det mer typiska pictures + names-tillståndet. Det är uppenbart att hypermnesi kan erhållas i återkallelse efter en berättelse (om än av bilder inbäddade i berättelsen).

tabell I. Antal bilder återkallas som en funktion av Presentation sammanhang och testning Schedulea

sammanhang och
grupp
omedelbara tester T3 – T1 fördröjda tester T3 – T1
1 3 2 3
bilder plus namn
3-3 26.6 27.2 28.4 1.8b 25.2 26.3 26.0 0.8
1–3 25.7 20.2 21.7 23.0 2.8b
0–3 16.7 17.5 17.5 0.8
Pictures plus story
3–3 32.7 35.0 36.4 3.8b 31.8 33.0 33.4 1.6b
1–3 31.8 23.3 25.0 25.6 2.3b
0–3 17.4 17.2 18.4 1.0

a Data are from Wheeler and Roediger (1992) and are reprinted by permission of the Cambridge University Press. b These conditions demonstrated reliable hypermnesia across the three tests.

den andra frågan av intresse är om glömma inträffade mellan tester när en vecka snarare än några minuter förflutit mellan dem. Återigen är svaret ja. I Grupp 3-3 i pictures + story condition sjönk recall från 36,4 artiklar återkallade till 31,8 under veckan; i Grupp 1-3 var droppen från 31,8 till 23,3. Successiva tester med en vecka mellan testerna ger glömma, inte hypermnesi. Dessa resultat visar att det sannolikt är förseningen mellan tester och inte den typ av material som producerade de olika resultaten i Ballards (1913) och Bartletts (1932) experiment.

resultaten i tabell I kan också användas för att ta itu med två andra frågor som är av intresse. Kan hypermnesi erhållas efter en veckas retentionsintervall om korta intervaller inträffar mellan på varandra följande tester efter veckans fördröjning? Svaret från de sex villkoren i höger sida av tabellen jag verkar vara ja. I alla sex fall återkallade ämnen mer på det tredje testet än på det första testet och en analys av varians på endast de fördröjda testdata gav en signifikant effekt för antalet tester, F(2, 114) = 14, 35, MSe = 5, 03, p < .001. Effekten är dock inte särskilt robust eftersom den var signifikant på endast tre av de sex förhållandena i enskilda Anovor. Ändå kan hypermnesi med all sannolikhet uppnås på ett tillförlitligt sätt efter en veckas fördröjning.

den sista punkten att dra från Tabell i är kraften i ett test för att hjälpa senare återkallelse. Ämnen som tog tre omedelbara tester återkallade fler bilder en vecka senare än försökspersoner som bara tog ett test, men dessa ämnen återkallade i sin tur bilderna mycket bättre än försökspersoner som inte hade några tester efter att ha studerat bilderna från början. Dessa resultat visas grafiskt i Fig. 1, där prestanda på de tre försenade testerna har i genomsnitt och ritats som en funktion av antalet omedelbara tester. De tre grupperna av ämnen i antingen bilder + namn och bilder + berättelse skick behandlades identiskt fram till den punkt av det första testet och sedan när de återvände en vecka senare. Den enda skillnaden mellan förhållanden som kan påverka prestanda vid de senare testerna var antalet tester som togs under den första sessionen. Ändå, som Fig. 1 visar, fördröjd återkallelse ökade monotont med antalet tidigare tester och den förstärkande effekten av testning påverkade fördröjd återkallelse mycket mer kraftfullt i bilderna + berättelsen än i bilderna + namnens tillstånd. Vi har ingen klar tolkning av detta sista resultat, men vår poäng här är främst att dokumentera den kraftfulla effekten som ett test har på senare retention. Glover, 1989; Izawa, 1971; Spitzer, 1939; Thompson et al., 1978).

Fig. 1. Testeffekten. Antalet tester som tagits strax efter att ha studerat bilder påverkade starkt återkallelsen en vecka senare.

För att återgå till experimentets huvudpunkt hävdade Wheeler och Roediger (1992) att deras experiment löste pusslet som tidigare inkonsekventa studier av Ballard (1913) och Bartlett (1932). Svaret är ganska enkelt: om det finns korta mellanrum mellan testerna, hittar man vanligtvis hypermnesi över upprepad testning. Om intervallen är långa (en vecka, i vårt experiment), får man glömma mellan testerna. Naturligtvis måste denna senare punkt vara sant i det begränsande fallet—säg med 5 år mellan testerna—men förekommer också med intervaller så korta som en vecka.

vi drar slutsatsen att typ av material spelade liten roll i de tidigare skillnaderna mellan resultaten, eftersom vi inte hittade någon interaktion med andra variabler mellan bilder som presenteras i en lista (bilderna + namnens tillstånd) och de som presenteras i ett berättelsekontext (bilderna + berättelsens tillstånd). Denna slutsats kan emellertid utmanas, för på sätt och vis använde vi samma material—en serie med 60 bilder—under båda förhållandena. Wheeler och Roediger (1992) genomförde ytterligare två experiment för att se om de grundläggande resultaten kunde erhållas med prosa material. Kan hypermnesi erhållas med korta intervaller mellan tester och glömma erhållas när intervallet förlängs till en vecka?

de två experimenten var likartade, förutom materialtyperna och det faktum att en genomfördes som en klassrumsdemonstration och den andra genomfördes under mer kontrollerade laboratorieförhållanden. Resultaten var dock mycket lika. I klassrummet experiment, studenter i en kognitiv psykologi kurs vid Rice University läsa” kriget spöken ” två gånger på en bekväm takt och sedan tillbringade 5 min erinrar Amerikanska Presidenter. De fick sedan 8,5 min för att återkalla historien så bra som möjligt; efter detta fria återkallningsförsök återkallade de amerikanska staterna i 5 minuter och återkallade sedan historien igen i 8,5 minuter. En vecka senare fick eleverna ett överraskningstest och bad om att komma ihåg historien igen. Laboratorieexperimentet genomfördes under allmänt liknande förhållanden med ett utdrag ur en John Updike novell, ”The Kid ’ s Whistling”, som fungerar som målmaterial.

resultaten av de två experimenten visas här i tabell II. för båda typerna av material visade försökspersoner blygsamma men statistiskt signifikanta förbättringar mellan de två första testerna. Efter andra (t.ex. Mandler & Johnson, 1977) gjorde vi resultaten i termer av antalet idea-enheter (signifikanta fraser eller ideer i avsnittet) som återkallades. Förbättringen mellan de två första testerna ser blygsam ut, men varje idea-enhet består i genomsnitt av sju till åtta ord, så förbättringen skulle se större ut om det görs på detta sätt (vilket dock är svårt med prosamaterial). I båda fallen var förbättringen ganska konsekvent mellan försökspersoner (se Wheeler & Roediger, 1992 för detaljer). Vidare minskade i båda experimenten mellan det andra testet och det tredje en vecka senare. I inget fall visade emellertid försökspersonerna grov förvirring och felaktighet i det försenade testet, vilket kunde ha förväntats från Bartletts (1932) resultat. Vi återvänder till denna punkt senare.

tabell II. antal Idea enheter återkallas i två experiment, med olika prosa passager

Material Test 1 Test 2 fördröjd test
”spökarnas krig”b 21.4 22.9 19.0
”barnets visslande”c 12.1 13.2 10.7

a Data är från Wheeler och roediger (1992) och återges med tillstånd från Cambridge University Press. b 42 idea enheter. c 41 idea enheter.

vi drar slutsatsen från de experiment som hittills beskrivits att för nyligen lärt material förbättras återkallandet mellan tester när korta intervaller skiljer dem men att glömma uppstår när intervallet ökas till en vecka. Bahrick och Hall (1993) har hävdat att denna slutsats endast kan hålla för episodiska minnessituationer, för när ämnen testas upprepade gånger på relativt permanent kunskap (t.ex. om offentliga evenemang eller kända ansikten), visar de förbättringar över långa förseningar mellan testerna. Bahrick and Hall (1991) rapporterade förbättringar under en månad, liksom Hermann, Buschke och Gall (1987). I ett ganska annorlunda paradigm rapporterade Squire, Haist och Shimamura (1989) betydande förbättringar med ett år mellan testerna. Dessa rapporter indikerar att hypermnesi kan erhållas med långa mellanrum mellan testerna, men Roediger och Wheeler (1993) noterade att en möjlig tolkning av dessa vinster i kunskap mellan testerna är att ämnen kan utsättas för relevant material från tidskrifter, tidningar, tv eller böcker under denna tid. (I vissa fall, såsom forskning av Squire et al. , testproceduren exponerade ämnen för rätt svar.) Det är i sig svårt att testa allmän kunskap med brett mellanrum och inte ha mellanliggande studiemöjligheter för materialet. Faktum är att det första testet kan sensibilisera ämnen för relevant information och få dem att ägna mer uppmärksamhet om de utsätts för det senare (men se Bahrick & Hall, 1991). Ändå är resultaten som beskrivs av Bahrick och Hall (1993) intressanta och förtjänar ytterligare studier.

för att avsluta detta avsnitt tror vi att vi har löst paradoxen som orsakas av de olika resultaten från upprepad testning i episodiskt minne genom att visa att intervallet mellan tester är den kritiska variabeln. För nyligen lärt material som bilder eller prosa passager, upprepad testning med korta intervaller mellan tester ger förbättring av övergripande återkallelse (hypermnesi). (Om Bartlett, 1932, hade använt korta intervaller mellan tester kunde han ha nått mycket olika slutsatser om minnets rekonstruktiva natur.) När intervallet mellan testerna förlängs till en vecka, sedan minns minskar. Men även med detta längre intervall inträffade det mesta av glömskan som utelämnanden av material; det fanns få fel och konfabulationer införda, och de flesta av dessa var mindre. Detta var sant i klassrummet experiment med ”kriget spöken” och med andra typer av material, för. Tyder detta bevis på att minnet inte är lika rekonstruktivt som Bartlett (1932), bland många andra, skulle få oss att tro? Vi vänder oss till denna fråga i nästa avsnitt.