Articles

Aggregate Data

II Ulike Effekter Av Gjentatt Testing

Psykologer har brukt gjentatte testparadigmer for mange forskjellige formål; derfor har flere forskjellige tradisjoner i denne forskningen blitt etablert, ofte med lite kryssreferanse. I denne delen beskriver vi forskning fra tidlig i dette århundret der etterforskere testet minne gjentatte ganger og nådde diametralt motsatte konklusjoner om sin drift. Merkelig, så vidt vi vet, la ingen merke til paradokset fra denne tidlige forskningen før to av de nåværende forfatterne reiste det i 1992 (Wheeler & Roediger, 1992).I Noen av de mest kjente forskning i kognitiv psykologi, bartlett (1932) rapporterte sine berømte eksperimenter der han hadde engelske studenter lese En Amerikansk Indisk historie, «The War Of The Ghosts,» og deretter huske det flere ganger. Vanligvis skjedde det første tilbakekallingsforsøket 15 minutter eller så etter første studie, og senere tester kan forekomme dager, uker eller måneder senere. På senere tester Bartlett funnet dramatiske forvrengninger i tilbakekalling av historien, med mange utelatelser, endringer av mening, og sporadiske tillegg. Bartlett framhevet minnets konstruktive natur og argumenterte for at hans undersåtter sannsynligvis benyttet skjemaet til et eventyr, en vanlig form for disse elevene, i koding og rekonstruering av fortellingen. Overnaturlige elementer ble deemphasized, og historien ble ofte gjort mer konsekvent og rasjonell. Derfor, Fra hans gjentatte reproduksjonsteknikk, Konkluderte Bartlett (1932) at minner ofte blir mer feil utsatt over gjentatte tester.Det er verdt å merke Seg At Bartlett (1932) ikke produserte aggregerte data til støtte for sine konklusjoner, men presenterte heller prøveprotokoller og anekdoter for å styrke sine konklusjoner. Interessant nok kan Vi bare nevne Ett forsøk på replikering Av Bartletts (1932) banebrytende forskning—en publisert Av Gauld og Stephenson (1967) og diskutert nedenfor—som forsøkte å bekrefte hans påstander ved hjelp av gjentatt reproduksjonsteknikk. «The War Of The Ghosts» har blitt brukt i en god del senere forskning, men dette arbeidet sjelden involvert gjentatt testing og ble vanligvis utført for andre formål enn å undersøke rekonstruktiv natur minne. 1 på samme måte har det blitt utført mye forskning på minnets rekonstruktive natur, men sjelden har dette interessante arbeidet involvert gjentatt testing; det er mer vanlig å vurdere minne via en enkelt gjenkjennelsestest for informasjon som kan ha blitt utledet, men ikke faktisk oppgitt i en prosa-passasje (f. eks., Johnson, Bransford, & Solomon, 1973) eller via feilinformasjon gitt i en fortelling etter at emner har vært vitne til en hendelse (F.Eks. Loftus, 1979, 1991).Merkelig Nok nevnte Bartlett (1932) ikke at hans gjentatte testforskning var i konflikt med annen forskning som dateres tilbake minst 20 år, også utført i England. Ballard (1913) ga skolebarn passasjer av poesi å huske og deretter testet dem gjentatte ganger i intervaller på opptil en uke senere. Ballard fant at barn ofte ville huske poesilinjer på senere tester som de ikke kunne huske på tidligere tester, et fenomen han kalte reminiscens. De grunnleggende observasjoner av tilbakekalling på en senere test av materiale som hadde vært savnet på tidligere tester ble bekreftet i senere forskning (F. Eks Brown, 1923) gjennomført i god tid Før Bartlett (1932) publiserte sin bok, så det er merkelig at han ikke minst sitere det. Imidlertid var De grunnleggende funnene Av Ballard Og Brown direkte i strid Med Bartletts observasjoner og konklusjoner; I stedet for dramatisk glemme og forvrengning av minne, Hadde Ballard Og Brown rapportert faktiske forbedringer over tid i fagets evner til å huske sine erfaringer. I rettferdighet Var Bartletts berømte bok ment å rapportere sine nye eksperimenter, som tilsynelatende begynte i 1913 (Bartlett, 1932, s. v). Imidlertid kan han ha lagt til de sosiale faktorene som påvirker historisk minne tendensen til å se bort fra publisert bevis i strid med ens oppfatning.observasjonene Av Ballard (1913) Og Brown (1923) som indikerer positive effekter av gjentatt testing på generell tilbakekalling ble undersøkt i noen år før de ble forlatt, for en tid, som et objekt for seriøs studie. Buxton (1943) gjennomgikk litteraturen og konkluderte med at erindring var et flyktig fenomen som ikke skjedde omtrent like ofte som det så ut. Men payne (1987) hevdet At Buxton (1943) nådde sin konklusjon fordi fenomenet erindring hadde blitt omdefinert gjennom årene. Ballards (1913) opprinnelige definisjon av begrepet var av materiale som ikke kunne tilbakekalles på en første test som ble gjenopprettet på en andre (eller senere) test. Når total recall forbedrer mellom to tester, må reminisens ha skjedd; Derfor brukte Ballard noen ganger generell forbedring mellom tester som en indeks for forekomsten av reminisens. Dette virker nå en feil, fordi det førte senere forskere Som Buxton (1943) for å omdefinere reminiscens som generell forbedring i tilbakekalling mellom tester. Det er imidlertid fullt mulig å ha reminisens (definert som «intertest recovery») uten å ha generell forbedring mellom tester, fordi å glemme mellom tester kan oppveie reminisensen eller utvinningen. Derfor, da Buxton (1943) konkluderte med at fenomenet var upålitelig, refererte Han til en generell forbedring mellom tester, ikke til reminiscens definert som intertest recovery, som ble oppnådd mye. Likevel er hans gjennomgang generelt kreditert med avtagende forskning på dette området i flere tiår.

Forskning på temaet forbedringer i tilbakekalling over gjentatte tester ble gjenopplivet Av Erdelyi og Becker (1974). De presenterte fag med bilder eller konkrete ord og hadde fag huske dem på tre påfølgende tester, hver varig 7 min. De brukte også en ny prosedyre, tvunget tilbakekalling, der fagene i utgangspunktet engasjert i en gratis tilbakekallingstest, men ble tvunget til å produsere et forhåndsinnstilt antall svar som var større enn antall elementer fagene kunne huske. Denne prosedyren ble brukt til å overvinne argumentet om at gevinster observert på senere tilbakekallingstester bør tilskrives avslappede tilbakekallingskriterier på disse testene. (Vi undersøker effekten av tvungen tilbakekalling på minne i et senere avsnitt). Erdelyi og Becker rapporterte generelle forbedringer på tvers av tester i tilbakekalling av bilder, men ikke av ord. De merket denne forbedringen hypermnesia(motsatt av hukommelsestap, eller glemme).2

det er verdt å merke seg at praktisk talt alle eksperimenter med fri eller tvungen tilbakekalling har rapportert sterk erindring i tilbakekalling av både bilder og ord (f. eks., Erdelyi, Finkelstein, Herrell, Miller & Thomas, 1976), men i tilfelle av ord er forbedringen mellom tester kompensert av intertest glemme i mange eksperimenter. (Noen forskere har imidlertid rapportert pålitelig hypermnesi for ord, For Eksempel payne & Roediger, 1987). Det er nå en stor litteratur om hypermnesia (Se Erdelyi, 1984; Payne, 1987; Og Roediger & Challis, 1989 for anmeldelser). Poenget vi ønsker å etablere her, er imidlertid ganske enkelt at fenomenene reminscence og hypermnesia er ekte og ofte replikert. I et interessant eksperiment viste Scrivner and Safer (1988) fagene et videobånd av et innbrudd og ga dem gjentatte tester for å huske kritiske detaljer om hendelsen. Recall forbedret jevnt over fire gjentatte tester. Generaliteten av fenomenet hypermnesi fører oss tilbake til det første spørsmålet om hvorfor to forskjellige tradisjoner for forskning, både ved bruk av gjentatt testing, kan komme til slike forskjellige konklusjoner om gjenfinningsprosesser i minnet.Wheeler and Roediger (1992) undersøkte tidligere forskning og isolerte to sannsynlige faktorer som potensielle årsaker til de forskjellige funnene og konklusjonene: typen materiale som brukes og lengden på intervallet mellom testene. Bartlett (1932) brukte prosa passasjer i de fleste av hans minne eksperimenter, slik som » The War Of The Ghosts.»På den annen side brukte mye av forskningen som viste forbedringer mellom tester lister over ord, bilder eller lignende materialer. (Payne, 1987, gjennomgikk 172 slike eksperimenter som dokumenterte fenomenet, alle ved hjelp av lister. Bartlett (1932) brukte ganske lange intervaller mellom tester, ofte dager og noen ganger måneder, mens forskere som studerer hypermnesi vanligvis bare legger inn fem minutter eller mindre mellom tester.Det er ikke åpenbart fra tidligere forskning hvilke av disse faktorene som bør være viktigere, eller om begge er kritiske. For Eksempel, Ballard (1913) fikk hypermnesia for passasjer av poesi, som kan betraktes som koblet diskurs som prosa. På samme måte oppnådde Roediger, Payne, Gillespie og Lean (1982) hypermnesi i tilbakekalling av kategorier (presidenter, fugler, sport), som også er i godt strukturerte sett. På den annen side har enkelte forskere oppnådd hypermnesi over lange intervaller. I forsøket Av Scrivner og Safer (1988) beskrevet ovenfor ble hypermnesi oppnådd mellom tester over et 48-timers intervall. På samme måte oppnådde Erdelyi Og Kleinbard (1978) hypermnesi for en liste over bilder over en uke ved å teste fag tre ganger om dagen med en tvungen tilbakekallingsprosedyre.Wheeler and Roediger (1992) undersøkte både retensjonsintervall og type materiale som de mulige faktorene som ligger til grunn for tidligere avviksresultater i flere eksperimenter. De hadde fagene studere 60 bilder under en av to forhold før du tar tvungen tilbakekalling tester på bildene. I ett tilfelle hørte fag en historie og navnene på de 60 avbildede gjenstandene skjedde i historien. De ble fortalt å lære både historien og navnene på bildene. Andre fag så de samme 60 bildene presentert i samme rekkefølge, men de hørte navnene på bildene som de ble presentert. Disse to forholdene var ment å simulere, til en viss grad, forskjellen Mellom Bartlett materialer (skjematisk prosessering av prosa) i bilder + historie tilstand, på den ene siden, og listen-læringsforhold av den typiske hypermnesia eksperiment i bilder + navn forhold, på den andre. Wheeler og Roediger prosedyre arrangerer denne sammenligningen med målet materialet holdt konstant mellom forholdene, så man trenger ikke gjøre en sammenligning mellom prosa tilbakekalling på den ene siden og tilbakekalling av noe helt annet materiale presentert i lister, på den andre.

den andre hovedvariabelen I Wheeler og Roediger (1992) eksperimentet var tidsplanen for testpersoner mottatt etter å ha sett de 60 bildene i en av de to forholdene. Alle fagene mottok et kort spørreskjema som spurte dem om ulike funksjoner i forsøket, for eksempel å estimere antall bilder som ble presentert. En tredjedel av fagene ble avvist på dette punktet og fortalt å komme tilbake en uke senere. (Spørreskjemaet ble opprettet for å gi fag i denne tilstanden en plausibel begrunnelse for å ha deltatt.) En annen tredjedel av fagene fikk en test for bildene; de fikk ark nummerert 1-60 og fikk beskjed om å huske navnene på så mange av de 60 bildene de tidligere hadde studert som mulig, men at de skulle gjette å fylle opp 60 mellomrom. Syv minutter var tillatt for tilbakekalling. Den siste tredjedel av individene ble behandlet på samme måte, bortsett fra at de fikk tre 7-min tvungen tilbakekallingstester, med 1-min pauser mellom testene. Til slutt returnerte alle fagene en uke senere og mottok deretter tre påfølgende tvungen tilbakekallingstester for de 60 bildene som ble studert forrige uke.i sammendraget studerte fagene enten bilder i en liste eller i sammenheng med en historie, tok deretter null, en eller tre tvunget tilbakekallingstester på bildene, og returnerte deretter neste uke og tok tre tester. Vi forventet at fag som tok de tre umiddelbare testene, ville vise hypermnesi (forbedret tilbakekalling over tester), i det minste i tilstanden der de studerte bilder og deres navn (replikere Erdelyi & Becker, 1974, blant mange andre). Vi forventet imidlertid at glemme (ikke forbedring) ville oppstå mellom tester med en ukeforsinkelse mellom dem, og at denne glemme kan være mer uttalt i pictures + story-tilstanden med sin skjemadrevne behandling.de grunnleggende resultatene er vist I Tabell I. de seks gruppene av forsøkspersoner er merket til venstre, med det første tallet som angir antall tester tatt den dagen forsøkspersonene studerte bildene (0, 1 eller 3) og det andre tallet som angir de tre testene tatt en uke senere (alltid 3). Tilbakekalling av bilder var større i bildene + historien forhold enn i bildene + navn forhold; kollapset over alle andre forhold, forskjellen var omtrent fire elementer. Men typen materiale er irrelevant til hovedpunktet her, så la oss fokusere på bildet + historien tilbakekalling i bunnen Av Tabellen jeg å svare på fire spørsmål av interesse. Først ble tilbakekallingen forbedret i de tre umiddelbare testene? Svaret er klart ja: Recall forbedret med 3.8 elementer på tvers av testene, og hypermnesia var enda større i bilder + historie tilstand enn i de mer typiske bilder + navn tilstand. Det er klart at hypermnesi kan oppnås i tilbakekalling etter en historie (om enn bilder innebygd i historien).

Tabell I. Antall Bilder Tilbakekalt som En Funksjon Av Presentasjon Kontekst og Testing Schedulea

Kontekst og
gruppe
Umiddelbare tester T3 – T1 Forsinkede tester t3 – t1
1 3 2
bilder pluss navn
3-3 26.6 27.2 28.4 1.8b 25.2 26.3 26.0 0.8
1–3 25.7 20.2 21.7 23.0 2.8b
0–3 16.7 17.5 17.5 0.8
Pictures plus story
3–3 32.7 35.0 36.4 3.8b 31.8 33.0 33.4 1.6b
1–3 31.8 23.3 25.0 25.6 2.3b
0–3 17.4 17.2 18.4 1.0

a Data are from Wheeler and Roediger (1992) and are reprinted by permission of the Cambridge University Press. b These conditions demonstrated reliable hypermnesia across the three tests.

det andre spørsmålet av interesse er om glemme skjedde mellom tester når en uke i stedet for få minutter gikk mellom dem. Igjen, svaret er ja. I Gruppe 3-3 i pictures + story-tilstanden falt tilbakekallingen fra 36.4-elementer tilbakekalt til 31.8 i løpet av uken; I Gruppe 1-3 var dråpen fra 31.8 til 23.3. Suksessive tester med en uke mellom tester gir glemme, ikke hypermnesi. Disse resultatene viser at det er sannsynlig forsinkelsen mellom tester og ikke typen materiale som produserte de forskjellige utfallene I Ballards (1913) Og Bartlett ‘ s (1932) eksperimenter.

resultatene I Tabellen jeg kan også brukes til å løse to andre problemer som er av interesse. Kan hypermnesi oppnås etter en ukes retensjonsintervall hvis korte intervaller oppstår mellom suksessive tester etter ukens forsinkelse? Svaret gitt fra de seks forholdene i Høyre Side av Bordet synes jeg å være ja. I alle seks tilfeller tilbakekalte personer mer på den tredje testen enn på den første testen, og en analyse av varians på bare forsinkede testdata ga en signifikant effekt for antall tester, F(2, 114) = 14,35, MSe = 5,03, p < .001. Effekten er imidlertid ikke særlig robust fordi den var signifikant på bare tre av de seks forholdene i individuelle ANOVAs. Likevel, med all sannsynlighet, kan hypermnesi oppnås pålitelig etter en ukes forsinkelse.

det siste punktet å trekke Fra Tabell i er kraften i en test i å hjelpe senere tilbakekalling. Emner som tok tre umiddelbare tester, husket flere bilder en uke senere enn fagpersoner som bare tok en test, men disse fagene husket igjen bildene mye bedre enn fag som ikke hadde noen tester etter å ha studert bildene i utgangspunktet. Disse resultatene er portrettert grafisk I Fig. 1, hvor ytelsen pa de tre forsinkede testene er gjennomsnittlig og plottet som en funksjon av antall umiddelbare tester. De tre gruppene av fag i enten bildene + navn og bilder + historie tilstand ble behandlet identisk opp til det punktet av den første testen og deretter når de kom tilbake en uke senere. Den eneste forskjellen mellom forhold som kan påvirke ytelsen på de senere testene var antall tester som ble tatt under den første økten. Likevel, Som Fig. 1 viser, forsinket tilbakekalling økte monotont med antall tidligere tester og den forsterkende effekten av testing påvirket forsinket tilbakekalling mye mer kraftfullt i bildene + historien enn i bilder + navn tilstand. Vi har ingen klar tolkning av dette siste resultatet, men vårt poeng her er hovedsakelig å dokumentere den kraftige effekten som å ta en test har på senere oppbevaring. Mange andre har også gjort dette punktet (F. Eks. Glover, 1989; Izawa, 1971; Spitzer, 1939; Thompson et al., 1978).

Fig. 1. Testeffekten. Antall tester tatt kort tid etter å ha studert bilder sterkt påvirket tilbakekalling en uke senere.

For å gå tilbake til hovedpunktet i eksperimentet, Wheeler og Roediger (1992) hevdet at deres eksperiment løst gåten ut av tidligere inkonsekvente studier Av Ballard (1913) Og Bartlett (1932). Svaret er ganske greit: hvis det er korte intervaller mellom tester, finner man vanligvis hypermnesi over gjentatt testing. Hvis intervallene er lange (en uke, i vårt eksperiment), får man glemme mellom tester. Selvfølgelig må dette siste punktet være sant i begrensende tilfelle-si med 5 år mellom tester – men oppstår også med intervaller så kort som en uke.

vi konkluderer med at type materiale spilte liten rolle i de tidligere avvikene mellom utfall, fordi vi fant ingen interaksjon med andre variabler mellom bilder presentert i en liste (bilder + navn tilstand) og de som presenteres i en historie sammenheng (bildene + historien tilstand). Denne konklusjonen kan imidlertid utfordres, fordi vi på en måte brukte de samme materialene—en serie på 60 bilder—i begge forhold. Wheeler og Roediger (1992) gjennomførte ytterligere to eksperimenter for å se om de grunnleggende funnene kunne oppnås med prosa materialer. Kan hypermnesi oppnås med korte intervaller mellom tester og glemme oppnås når intervallet forlenges til en uke?

de to forsøkene var like, bortsett fra materialtypene og det faktum at den ene ble utført som en klasseromsdemonstrasjon og den andre ble utført under mer kontrollerte laboratorieforhold. Likevel, resultatene var veldig mye likt. I klasserommet eksperimentet, studenter i en kognitiv psykologi kurs ved Rice University lese» The War Of The Ghosts » to ganger på en behagelig hastighet og deretter brukt 5 min minnes AMERIKANSKE presidenter. De ble deretter gitt 8,5 minutter for å huske historien så godt som mulig; etter dette gratis tilbakekallingsforsøket tilbakekalte DE AMERIKANSKE stater i 5 minutter og tilbakekalte historien igjen i 8,5 minutter. En uke senere ble studentene gitt en overraskelsestest og bedt om å huske historien igjen. Laboratorieforsøket ble utført under generelt lignende forhold med et utdrag Fra En John Updike novelle, «The Kid ‘ S Whistling», som tjener som målmateriale.

resultatene av de to forsøkene er vist her I Tabell II. for begge typer materialer viste fagene beskjedne, men statistisk signifikante forbedringer mellom de to første testene. Etter andre (F. eks Mandler & Johnson, 1977), scoret vi resultatene i form av antall ideenheter (signifikante setninger eller ideer i passasjen) som ble tilbakekalt. Forbedringen mellom de to første testene ser beskjeden ut, men hver ideenhet består i gjennomsnitt av syv til åtte ord, slik at forbedringen vil se større ut hvis den skåres på denne måten (som imidlertid er vanskelig med prosamaterialer). I begge tilfeller var forbedringen ganske konsistent på tvers av forsøkspersonene (Se Wheeler & Roediger, 1992 for detaljer). Videre, i begge forsøkene tilbakekalling redusert mellom den andre testen og den tredje en uke senere. Men i begge tilfeller viste fagene grov forvirring og unøyaktighet på den forsinkede testen, som Kan ha vært forventet Fra Bartlett ‘ s (1932) resultater. Vi kommer tilbake til dette punktet senere.

Tabell II. Antall Idee Enheter Tilbakekalt I To Eksperimenter, Ved Hjelp Av Ulike Prosa Passagesa

Materiale Test 1 Test 2 Forsinket test
«spøkelsenes krig»b 21.4 22.9 19.0
«Barnets Plystring»c 12.1 13.2 10.7

fra wheeler and roediger (1992) og er gjengitt med tillatelse fra cambridge university press. b 42 idee enheter. c 41 ideen enheter.

vi konkluderer fra forsøkene som er beskrevet så langt at tilbakekallingen for nylig lært materiale forbedres mellom tester når korte intervaller skiller dem, men det glemmer oppstår når intervallet økes til en uke. Bahrick and Hall (1993) har argumentert for at denne konklusjonen kan holde bare for episodisk minne situasjoner, fordi når fag er gjentatte ganger testet på relativt permanent kunnskap (f. eks av offentlige arrangementer eller kjente ansikter), de viser forbedringer over lange forsinkelser mellom testene. Bahrick and Hall (1991) rapporterte forbedringer over en måned, Det samme Gjorde Hermann, Buschke og Gall (1987). I Et ganske annet paradigme rapporterte Squire, Haist, And Shimamura (1989) betydelige forbedringer med ett år mellom tester. Disse rapportene indikerer at hypermnesi kan oppnås med lange intervaller mellom tester, Men Roediger og Wheeler (1993) bemerket at en mulig tolkning av disse gevinstene i kunnskap mellom tester er at fag kan bli utsatt for relevant materiale fra magasiner, aviser, fjernsyn eller bøker i løpet av denne tiden. (I noen tilfeller, for eksempel forskning Ved Squire et al. , testprosedyren utsatt fag til de riktige svarene.) Det er iboende vanskelig å teste generell kunnskap med store mellomrom og ikke å ha mellomliggende studiemuligheter for materialet. Faktisk kan den første testen sensibilisere fag til relevant informasjon og føre dem til å være mer oppmerksom hvis de blir utsatt for det senere (men se Bahrick & Hall, 1991). Likevel er resultatene beskrevet Av Bahrick And Hall (1993) interessante og fortjener videre studier.for å avslutte denne delen tror vi at vi har løst paradokset fra de ulike resultatene fra gjentatt testing i episodisk minne ved å vise at intervallet mellom tester er den kritiske variabelen. For nylig lært materiale som bilder eller prosa passasjer, gjentatt testing med korte intervaller mellom tester gir forbedring i total recall (hypermnesia). (Hvis Bartlett, 1932, hadde brukt korte intervaller mellom tester, kunne han ha kommet til svært forskjellige konklusjoner om minnets rekonstruktive natur.) Når intervallet mellom testene er utvidet til en uke, så recall avtar. Men selv med dette lengre intervallet skjedde det meste av glemselen som utelatelser av materiale; det var få feil og confabulations introdusert, og de fleste av disse var små. Dette var sant i klasserommet eksperiment med «The War Of The Ghosts» og med de andre typer materiale, også. Betyr dette bevis at huske er ikke så rekonstruktiv Som Bartlett (1932), blant mange andre, ville ha oss til å tro? Vi vender oss til dette problemet i neste avsnitt.