Articles

Aggregierte Daten

II Unterschiedliche Auswirkungen wiederholter Tests

Psychologen haben wiederholte Testparadigmen für viele verschiedene Zwecke verwendet; Daher haben sich verschiedene Traditionen dieser Forschung etabliert, oft mit wenig Querverweisen. In diesem Abschnitt beschreiben wir die Forschung von Anfang dieses Jahrhunderts, in der Forscher das Gedächtnis wiederholt getestet und diametral entgegengesetzte Schlussfolgerungen über seine Funktionsweise gezogen haben. Seltsamerweise bemerkte unseres Wissens niemand das Paradoxon dieser frühen Forschung, bis zwei der derzeitigen Autoren es 1992 ansprachen (Wheeler & Roediger, 1992).In einigen der bekanntesten Forschungen in der kognitiven Psychologie berichtete Bartlett (1932) über seine berühmten Experimente, bei denen er englische College-Studenten eine indianische Geschichte, „The War of the Ghosts“, lesen ließ und sich dann mehrmals daran erinnerte. Typischerweise trat der erste Rückrufversuch etwa 15 Minuten nach der ersten Studie auf, und spätere Tests konnten Tage, Wochen oder Monate später auftreten. Bei späteren Tests fand Bartlett dramatische Verzerrungen in Bezug auf die Geschichte, mit vielen Auslassungen, Bedeutungsänderungen und gelegentlichen Ergänzungen. Bartlett betonte die konstruktive Natur des Gedächtnisses und argumentierte, dass seine Untertanen wahrscheinlich das Schema eines Märchens verwendeten, eine gemeinsame Form für diese Studenten, bei der Kodierung und Rekonstruktion der Geschichte. Übernatürliche Elemente wurden weniger betont, und die Geschichte wurde oft konsistenter und rationaler gemacht. Daher schloss Bartlett (1932) aus seiner Technik der wiederholten Reproduktion, dass Erinnerungen bei wiederholten Tests oft fehleranfälliger werden.Es ist erwähnenswert, dass Bartlett (1932) keine aggregierten Daten zur Unterstützung seiner Schlussfolgerungen erstellte, sondern Musterprotokolle und Anekdoten präsentierte, um seine Schlussfolgerungen zu untermauern. Interessanterweise können wir nur eine versuchte Replikation von Bartletts (1932) Pionierforschung zitieren — eine von Gauld und Stephenson (1967) veröffentlichte und unten diskutierte —, die versuchte, seine Behauptungen unter Verwendung der Technik der wiederholten Reproduktion zu bestätigen. „Der Krieg der Geister“ wurde in vielen späteren Forschungen verwendet, aber diese Arbeit beinhaltete selten wiederholte Tests und wurde normalerweise zu anderen Zwecken als der Untersuchung der rekonstruktiven Natur des Gedächtnisses durchgeführt. 1 Aus dem gleichen Grund wurde viel über die rekonstruktive Natur des Gedächtnisses geforscht, aber selten hat diese interessante Arbeit wiederholte Tests beinhaltet; Es ist üblicher, das Gedächtnis über einen einzigen Erkennungstest auf Informationen zu bewerten, die möglicherweise abgeleitet, aber nicht tatsächlich in einer Prosapassage angegeben wurden (z., Johnson, Bransford, & Solomon, 1973) oder über Fehlinformationen, die in einer Erzählung gegeben werden, nachdem die Probanden ein Ereignis miterlebt haben (z. B. Loftus, 1979, 1991).Seltsamerweise erwähnte Bartlett (1932) nicht, dass seine wiederholte Testforschung im Widerspruch zu anderen Forschungen stand, die mindestens 20 Jahre zurückreichen und auch in England durchgeführt wurden. Ballard (1913) gab Schulkindern Gedichtpassagen zum Auswendiglernen und testete sie dann wiederholt für Intervalle von bis zu einer Woche später. Ballard fand heraus, dass Kinder sich bei späteren Tests oft an Gedichtzeilen erinnerten, an die sie sich bei früheren Tests nicht erinnern konnten, ein Phänomen, das er Reminiszenz nannte. Die grundlegenden Beobachtungen des Rückrufs bei einem späteren Test von Material, das bei früheren Tests übersehen worden war, wurden in späteren Forschungen (z. B. Brown, 1923) bestätigt, die lange vor der Veröffentlichung seines Buches durch Bartlett (1932) durchgeführt wurden. Die grundlegenden Ergebnisse von Ballard und Brown standen jedoch in direktem Widerspruch zu Bartletts Beobachtungen und Schlussfolgerungen; anstatt dramatisch zu vergessen und das Gedächtnis zu verzerren, hatten Ballard und Brown im Laufe der Zeit tatsächliche Verbesserungen der Fähigkeiten der Probanden gemeldet, sich an ihre Erfahrungen zu erinnern. Fairerweise sollte Bartletts gefeiertes Buch über seine neuen Experimente berichten, die anscheinend 1913 begannen (Bartlett, 1932, S. v). Er könnte jedoch zu den sozialen Faktoren, die das historische Gedächtnis beeinflussen, die Tendenz hinzugefügt haben, veröffentlichte Beweise zu ignorieren, die im Widerspruch zur eigenen Vorstellung stehen.Die Beobachtungen von Ballard (1913) und Brown (1923), die auf positive Auswirkungen wiederholter Tests auf den allgemeinen Rückruf hinwiesen, wurden einige Jahre lang untersucht, bevor sie für einige Zeit als Gegenstand ernsthafter Studien aufgegeben wurden. Buxton (1943) überprüfte die Literatur und kam zu dem Schluss, dass Reminiszenz ein vergängliches Phänomen war, das nicht so oft auftrat, wie es schien. Payne (1987) argumentierte jedoch, dass Buxton (1943) zu seiner Schlussfolgerung gelangt sei, weil das Phänomen der Reminiszenz im Laufe der Jahre neu definiert worden sei. Ballards (1913) ursprüngliche Definition des Begriffs bestand aus Material, das bei einem ersten Test nicht abgerufen werden konnte und bei einem zweiten (oder späteren) Test wiederhergestellt wurde. Wann immer sich der totale Rückruf zwischen zwei Tests verbessert, muss die Reminiszenz aufgetreten sein; Daher verwendete Ballard manchmal die Gesamtverbesserung zwischen den Tests als Index für das Auftreten von Reminiszenz. Dies scheint nun ein Fehler zu sein, da es spätere Forscher wie Buxton (1943) dazu veranlasste, die Reminiszenz als allgemeine Verbesserung des Rückrufs zwischen den Tests neu zu definieren. Es ist jedoch durchaus möglich, eine Reminiszenz (definiert als „Intertest-Wiederherstellung“) zu haben, ohne eine allgemeine Verbesserung zwischen den Tests zu erzielen, da das Vergessen zwischen den Tests die Reminiszenz oder Wiederherstellung ausgleichen kann. Als Buxton (1943) zu dem Schluss kam, dass das Phänomen unzuverlässig sei, bezog er sich daher auf eine allgemeine Verbesserung zwischen den Tests, nicht auf eine Reminiszenz, die als Intertest-Erholung definiert wurde, die weithin erhalten wurde. Nichtsdestotrotz wird seiner Rezension im Allgemeinen zugeschrieben, dass die Forschung in diesem Bereich seit mehreren Jahrzehnten abnimmt.

Die Forschung zum Thema Verbesserungen des Rückrufs bei wiederholten Tests wurde von Erdelyi und Becker (1974) wiederbelebt. Sie präsentierten den Probanden Bilder oder konkrete Worte und ließen die Probanden sie in drei aufeinanderfolgenden Tests mit einer Dauer von jeweils 7 Minuten abrufen. Sie verwendeten auch ein neues Verfahren, erzwungener Rückruf, bei dem die Probanden im Grunde genommen an einem freien Rückruftest teilnahmen, aber gezwungen waren, eine voreingestellte Anzahl von Antworten zu erzeugen, die größer war als die Anzahl der Gegenstände, an die sich die Probanden erinnern konnten. Dieses Verfahren wurde verwendet, um das Argument zu überwinden, dass die bei späteren Rückruftests beobachteten Gewinne auf entspannte Rückrufkriterien für diese Tests zurückzuführen sind. (Wir untersuchen die Auswirkungen des erzwungenen Rückrufs auf das Gedächtnis in einem späteren Abschnitt). Erdelyi und Becker berichteten über allgemeine Verbesserungen bei den Tests beim Abrufen von Bildern, aber nicht von Wörtern. Sie bezeichneten diese Verbesserung als Hypermnesie (das Gegenteil von Amnesie oder Vergessen).2

Es ist erwähnenswert, dass praktisch alle Experimente mit freiem oder erzwungenem Rückruf starke Reminiszenzen beim Rückruf von Bildern und Wörtern (z., Erdelyi, Finkelstein, Herrell, Miller & Thomas, 1976), obwohl bei Wörtern die Verbesserung zwischen den Tests durch das Vergessen zwischen den Tests in vielen Experimenten ausgeglichen wird. (Einige Forscher haben jedoch eine zuverlässige Hypermnesie für Wörter gemeldet; z. B. Payne & Roediger, 1987). Es gibt inzwischen eine große Literatur über Hypermnesie (siehe Erdelyi, 1984; Payne, 1987; und Roediger & Challis, 1989 für Rezensionen). Der Punkt, den wir hier feststellen wollen, ist jedoch einfach, dass die Phänomene der Reminiszenz und Hypermnesie real sind und oft repliziert werden. In einem interessanten Experiment zeigten Scrivner und Safer (1988) den Probanden ein Videoband eines Einbruchs und gaben ihnen dann wiederholte Tests, um sich an kritische Details des Ereignisses zu erinnern. Der Rückruf verbesserte sich stetig über vier wiederholte Tests. Die Allgemeinheit des Phänomens der Hypermnesie führt uns zu der anfänglichen Frage zurück, warum zwei verschiedene Forschungstraditionen, die beide wiederholte Tests verwenden, zu so unterschiedlichen Schlussfolgerungen in Bezug auf Abrufprozesse im Gedächtnis kommen können.Wheeler und Roediger (1992) untersuchten frühere Forschungsergebnisse und isolierten zwei wahrscheinliche Faktoren als mögliche Ursachen für die unterschiedlichen Ergebnisse und Schlussfolgerungen: die Art des verwendeten Materials und die Länge des Intervalls zwischen den Tests. Bartlett (1932) verwendete Prosapassagen in den meisten seiner Gedächtnisexperimente, wie „Der Krieg der Geister.“ Auf der anderen Seite verwendete ein Großteil der Forschung, die Verbesserungen zwischen Tests zeigte, Listen von Wörtern, Bildern oder ähnlichen Materialien. (Payne, 1987, überprüfte 172 solcher Experimente, die das Phänomen dokumentieren, alle unter Verwendung von Listen. Bartlett (1932) verwendete ziemlich lange Intervalle zwischen Tests, oft Tage und manchmal Monate, während Forscher, die Hypermnesie untersuchen, normalerweise nur fünf Minuten oder weniger zwischen Tests legen.

Aus früheren Untersuchungen ist nicht ersichtlich, welcher dieser Faktoren wichtiger sein sollte oder ob beide kritisch sind. Zum Beispiel erhielt Ballard (1913) Hypermnesie für Passagen der Poesie, die als zusammenhängender Diskurs wie Prosa betrachtet werden könnten. In ähnlicher Weise erhielten Roediger, Payne, Gillespie und Lean (1982) Hypermnesie in Bezug auf Kategorien (Tiere, Vögel, Sport), die sich ebenfalls in gut strukturierten Sätzen befinden. Auf der anderen Seite haben einige Forscher Hypermnesie über lange Intervalle erhalten. In dem oben beschriebenen Experiment von Scrivner und Safer (1988) wurde Hypermnesie zwischen Tests über ein 48-Stunden-Intervall erhalten. In ähnlicher Weise erhielten Erdelyi und Kleinbard (1978) Hypermnesie für eine Liste von Bildern über eine Woche, indem sie Probanden dreimal täglich mit einem erzwungenen Rückrufverfahren testeten.Wheeler und Roediger (1992) untersuchten in mehreren Experimenten sowohl das Retentionsintervall als auch die Art des Materials als mögliche Faktoren, die früheren diskrepanten Ergebnissen zugrunde lagen. Sie ließen die Probanden 60 Bilder unter einer von zwei Bedingungen untersuchen, bevor sie erzwungene Rückruftests an den Bildern durchführten. In einem Fall hörten die Probanden eine Geschichte und die Namen der 60 abgebildeten Objekte traten in der Geschichte auf. Sie sollten sowohl die Geschichte als auch die Namen der Bilder lernen. Andere Probanden sahen die gleichen 60 Bilder in der gleichen Reihenfolge, aber sie hörten die Namen der Bilder, während sie präsentiert wurden. Diese beiden Bedingungen sollten bis zu einem gewissen Grad den Unterschied zwischen Bartletts Materialien (schematische Verarbeitung von Prosa) in der pictures + Story-Bedingung einerseits und den List-Learning-Bedingungen des typischen Hypermnesia-Experiments in pictures + Names-Bedingungen andererseits simulieren. Das Verfahren von Wheeler und Roediger ordnet diesen Vergleich mit dem Zielmaterial an, das zwischen den Bedingungen konstant gehalten wird, so dass man keinen Vergleich zwischen dem Rückruf einerseits und dem Rückruf eines völlig anderen Materials, das in Listen dargestellt ist, andererseits vornehmen muss.Die andere Hauptvariable im Experiment von Wheeler und Roediger (1992) war der Zeitplan der Testpersonen, die nach dem Sehen der 60 Bilder unter einer der beiden Bedingungen erhalten wurden. Alle Probanden erhielten einen kurzen Fragebogen, in dem sie nach verschiedenen Merkmalen des Experiments gefragt wurden, z. B. nach der Schätzung der Anzahl der präsentierten Bilder. Ein Drittel der Probanden wurde zu diesem Zeitpunkt entlassen und aufgefordert, eine Woche später zurückzukehren. (Der Fragebogen wurde erstellt, um Probanden in diesem Zustand eine plausible Begründung für die Teilnahme zu geben.) Ein weiteres Drittel der Probanden erhielt einen Test für die Bilder; sie erhielten Blätter mit den Nummern 1-60 und sollten sich die Namen so vieler der 60 Bilder, die sie zuvor studiert hatten, wie möglich merken, aber raten, um die 60 Felder auszufüllen. Sieben Minuten waren für den Rückruf erlaubt. Das letzte Drittel der Probanden wurde auf die gleiche Weise behandelt, mit der Ausnahme, dass sie drei 7-minütige Forced-Recall-Tests mit 1-minütigen Pausen zwischen den Tests erhielten. Schließlich kehrten alle Probanden eine Woche später zurück und erhielten dann drei aufeinanderfolgende Forced-Recall-Tests für die 60 Bilder, die in der Vorwoche untersucht worden waren.Zusammenfassend studierten die Probanden entweder Bilder in einer Liste oder im Kontext einer Geschichte, machten dann null, einen oder drei Forced-Recall-Tests an den Bildern und kehrten dann in der nächsten Woche zurück und machten drei weitere Tests. Wir erwarteten, dass Probanden, die die drei Soforttests machten, Hypermnesie (verbesserter Rückruf über Tests) zeigen würden, zumindest in dem Zustand, in dem sie Bilder und ihre Namen studierten (Replizieren Erdelyi & Becker, 1974, unter vielen anderen). Wir erwarteten jedoch, dass das Vergessen (keine Verbesserung) zwischen den Tests mit einer Verzögerung von einer Woche auftreten würde und dass dieses Vergessen in der pictures + Story-Bedingung mit ihrer schemagesteuerten Verarbeitung ausgeprägter sein könnte.Die sechs Gruppen von Probanden sind links beschriftet, wobei die erste Zahl die Anzahl der Tests angibt, die an dem Tag durchgeführt wurden, an dem die Probanden die Bilder untersuchten (0, 1 oder 3) und die zweite Zahl die drei Tests angibt, die eine Woche später durchgeführt wurden (immer 3). Der Rückruf von Bildern war in den pictures + Story-Bedingungen größer als in den pictures + Names-Bedingungen; Bei allen anderen Bedingungen betrug der Unterschied etwa vier Punkte. Die Art des Materials ist jedoch für den Hauptpunkt hier irrelevant, also konzentrieren wir uns auf den Picture + Story Recall am Ende von Tabelle I, um vier Fragen von Interesse zu beantworten. Erstens, hat sich der Rückruf in den drei unmittelbaren Tests verbessert? Die Antwort ist eindeutig ja: Rückruf um 3 verbessert.8 punkte in den Tests, und die Hypermnesie war in der pictures + Story-Bedingung noch größer als in der typischeren pictures + Names-Bedingung. Offensichtlich kann Hypermnesie im Rückruf nach einer Geschichte erhalten werden (wenn auch von Bildern, die in die Geschichte eingebettet sind).

Tabelle I. Anzahl der Bilder, die als Funktion des Präsentationskontexts und des Testplans abgerufen wurdena

Kontext und
Gruppe
Sofortige Tests T3 – T1 Verzögerte Tests T3 – T1
1 2 3 1 2 3
Bilder plus Namen
3-3 26.6 27.2 28.4 1.8b 25.2 26.3 26.0 0.8
1–3 25.7 20.2 21.7 23.0 2.8b
0–3 16.7 17.5 17.5 0.8
Pictures plus story
3–3 32.7 35.0 36.4 3.8b 31.8 33.0 33.4 1.6b
1–3 31.8 23.3 25.0 25.6 2.3b
0–3 17.4 17.2 18.4 1.0

a Data are from Wheeler and Roediger (1992) and are reprinted by permission of the Cambridge University Press. b These conditions demonstrated reliable hypermnesia across the three tests.

Die zweite interessante Frage ist, ob zwischen den Tests Vergessen wurde, wenn zwischen ihnen eine Woche und nicht wenige Minuten verstrichen sind. Auch hier lautet die Antwort ja. In Gruppe 3-3 im Zustand pictures + Story sank der Rückruf im Laufe der Woche von 36,4 auf 31,8 zurückgerufene Artikel; In Gruppe 1-3 war der Rückgang von 31,8 auf 23,3. Aufeinanderfolgende Tests mit einer Woche zwischen den Tests führen zu Vergessen, nicht zu Hypermnesie. Diese Ergebnisse zeigen, dass es wahrscheinlich die Verzögerung zwischen den Tests und nicht die Art des Materials ist, die die unterschiedlichen Ergebnisse in Ballards (1913) und Bartletts (1932) Experimenten hervorbrachte.

Die Ergebnisse in Tabelle I können auch verwendet werden, um zwei andere Probleme anzugehen, die von Interesse sind. Kann Hypermnesie nach einer Woche Retentionsintervall erhalten werden, wenn kurze Intervalle zwischen aufeinanderfolgenden Tests nach der Verzögerung der Woche auftreten? Die Antwort aus den sechs Bedingungen auf der rechten Seite von Tabelle I scheint ja zu sein. In allen sechs Fällen erinnerten sich die Probanden beim dritten Test mehr als beim ersten Test, und eine Varianzanalyse nur der verzögerten Testdaten ergab einen signifikanten Effekt für die Anzahl der Tests, F(2, 114) = 14, 35, MSe = 5, 03, p < .001. Der Effekt ist jedoch nicht besonders robust, da er nur bei drei der sechs Bedingungen in einzelnen ANOVAs signifikant war. Dennoch kann aller Wahrscheinlichkeit nach eine Hypermnesie nach einer Woche Verzögerung zuverlässig erhalten werden.

Der letzte Punkt, der aus Tabelle I gezogen werden muss, ist die Stärke eines Tests, um einen späteren Rückruf zu unterstützen. Probanden, die drei sofortige Tests machten, erinnerten sich eine Woche später an mehr Bilder als Probanden, die nur einen Test machten, aber diese Probanden erinnerten sich wiederum viel besser an die Bilder als Probanden, die nach dem Studium der Bilder zunächst keine Tests hatten. Diese Ergebnisse sind in Fig. 1, wobei die Leistung bei den drei verzögerten Tests gemittelt und als Funktion der Anzahl der sofortigen Tests aufgetragen wurde. Die drei Gruppen von Probanden in den Zuständen pictures + names und pictures + story wurden bis zum ersten Test und dann, als sie eine Woche später zurückkehrten, identisch behandelt. Der einzige Unterschied zwischen den Bedingungen, die die Leistung bei den späteren Tests beeinträchtigen könnten, war die Anzahl der Tests, die während der ersten Sitzung durchgeführt wurden. Dennoch ist, wie Fig. 1 zeigt, nahm der verzögerte Rückruf mit der Anzahl der vorherigen Tests monoton zu und der verstärkende Effekt des Testens beeinflusste den verzögerten Rückruf in der pictures + story viel stärker als in der pictures + names Bedingung. Wir haben keine fertige Interpretation dieses letzten Ergebnisses, aber unser Punkt hier ist hauptsächlich, den starken Effekt zu dokumentieren, den ein Test auf die spätere Retention hat. Viele andere haben diesen Punkt auch gemacht (z. B. Glover, 1989; Izawa, 1971; Spitzer, 1939; Thompson et al., 1978).

Abb. 1. Der Testeffekt. Die Anzahl der Tests, die kurz nach dem Studium der Bilder durchgeführt wurden, beeinflusste den Rückruf eine Woche später stark.

Um zum Hauptpunkt des Experiments zurückzukehren, argumentierten Wheeler und Roediger (1992), dass ihr Experiment das Rätsel gelöst habe, das sich aus früheren inkonsistenten Studien von Ballard (1913) und Bartlett (1932) ergab. Die Antwort ist ziemlich einfach: Wenn es kurze Intervalle zwischen den Tests gibt, dann findet man normalerweise Hypermnesie über wiederholte Tests. Wenn die Intervalle lang sind (eine Woche, in unserem Experiment), dann erhält man Ergebnisse zwischen den Tests. Letzterer Punkt muss natürlich im Grenzfall zutreffen – etwa bei 5 Jahren zwischen den Tests -, tritt aber auch bei Intervallen von nur einer Woche auf.

Wir kommen zu dem Schluss, dass die Art des Materials bei den früheren Diskrepanzen zwischen den Ergebnissen nur eine geringe Rolle spielte, da wir keine Interaktion mit anderen Variablen zwischen Bildern in einer Liste (die Bedingung Bilder + Namen) und denen in einem Story-Kontext (die Bedingung Bilder + Story) fanden. Diese Schlussfolgerung kann jedoch in Frage gestellt werden, da wir in gewissem Sinne unter beiden Bedingungen die gleichen Materialien — eine Serie von 60 Bildern — verwendet haben. Wheeler und Roediger (1992) führten zwei weitere Experimente durch, um zu sehen, ob die grundlegenden Ergebnisse mit anderen Materialien erhalten werden konnten. Kann hypermnesia mit kurzen Abständen zwischen Tests erhalten werden und kann erhalten werden, wenn das Intervall auf eine Woche verlängert wird?

Die beiden Experimente waren ähnlich, mit Ausnahme der Materialarten und der Tatsache, dass eines als Demonstration im Klassenzimmer und das andere unter kontrollierten Laborbedingungen durchgeführt wurde. Dennoch waren die Ergebnisse sehr ähnlich. Im Klassenzimmerexperiment lasen Studenten eines Kurses für kognitive Psychologie an der Rice University zweimal „Der Krieg der Geister“ mit einer angenehmen Geschwindigkeit und verbrachten dann 5 Minuten damit, sich an US-Präsidenten zu erinnern. Sie erhielten dann 8,5 Minuten, um sich so gut wie möglich an die Geschichte zu erinnern; Nach diesem Versuch des freien Rückrufs erinnerten sie sich 5 Minuten lang an US-Bundesstaaten und erinnerten sich dann noch 8,5 Minuten lang an die Geschichte. Eine Woche später erhielten die Schüler einen Überraschungstest und wurden gebeten, sich an die Geschichte zu erinnern. Das Laborexperiment wurde unter allgemein ähnlichen Bedingungen durchgeführt, wobei ein Auszug aus einer John Updike-Kurzgeschichte, „The Kid’s Whistling“, als Zielmaterial diente.

Die Ergebnisse der beiden Experimente sind hier in Tabelle II. Für beide Arten von Materialien, Probanden zeigten bescheidene, aber statistisch signifikante Verbesserungen zwischen den ersten beiden Tests. Nach anderen (z. B. Mandler & Johnson, 1977) bewerteten wir die Ergebnisse in Bezug auf die Anzahl der Ideeneinheiten (signifikante Phrasen oder Ideen in der Passage), die abgerufen wurden. Die Verbesserung zwischen den beiden ersten Tests sieht bescheiden aus, aber jede Ideeneinheit besteht im Durchschnitt aus sieben bis acht Wörtern, so dass die Verbesserung größer aussehen würde, wenn sie auf diese Weise bewertet würde (was jedoch bei Prosamaterialien schwierig ist). In beiden Fällen war die Verbesserung über die Probanden hinweg ziemlich konsistent (siehe Wheeler & Roediger, 1992 für Details). Darüber hinaus verringerte sich in beiden Experimenten der Rückruf zwischen dem zweiten und dem dritten Test eine Woche später. In keinem Fall zeigten die Probanden jedoch eine grobe Verwirrung und Ungenauigkeit des verzögerten Tests, was von Bartletts (1932) Ergebnissen zu erwarten gewesen wäre. Wir kehren später zu diesem Punkt zurück.

Tabelle II. Anzahl der in zwei Experimenten mit unterschiedlichen Prosapassagen zurückgerufenen Ideeneinheiten

Material Test 1 Test 2 Verzögerter Test
„Der Krieg der Geister“b 21.4 22.9 19.0
„Das Pfeifen des Kindes“c 12.1 13.2 10.7

a Daten stammen von Wheeler und Roediger (1992) und werden mit Genehmigung der Cambridge University Press nachgedruckt. b 42 Idee Einheiten. c 41 Idee Einheiten.

Wir schließen aus den bisher beschriebenen Experimenten, dass sich der Rückruf für kürzlich erlerntes Material zwischen den Tests verbessert, wenn kurze Intervalle sie trennen, aber dass das Vergessen auftritt, wenn das Intervall auf eine Woche erhöht wird. Bahrick und Hall (1993) haben argumentiert, dass diese Schlussfolgerung nur für episodische Gedächtnissituationen gelten kann, denn wenn Probanden wiederholt auf relativ permanentes Wissen getestet werden (z. B. auf öffentliche Ereignisse oder berühmte Gesichter), zeigen sie Verbesserungen über lange Verzögerungen zwischen Tests. Bahrick und Hall (1991) berichteten über Verbesserungen über einen Monat, ebenso wie Hermann, Buschke und Gall (1987). In einem etwas anderen Paradigma berichteten Squire, Haist und Shimamura (1989) über signifikante Verbesserungen mit einem Jahr zwischen den Tests. Diese Berichte weisen darauf hin, dass Hypermnesie mit langen Intervallen zwischen den Tests erhalten werden kann, aber Roediger und Wheeler (1993) stellten fest, dass eine mögliche Interpretation dieser Wissensgewinne zwischen den Tests darin besteht, dass die Probanden während dieser Zeit dem relevanten Material aus Zeitschriften, Zeitungen, Fernsehen oder Büchern ausgesetzt sein können. (In einigen Fällen, wie Forschung von Squire et al. , das Testverfahren setzte Themen den richtigen Antworten aus.) Es ist von Natur aus schwierig, Allgemeinwissen in weit auseinander liegenden Intervallen zu testen und keine dazwischenliegenden Lernmöglichkeiten für das Material zu haben. Tatsächlich kann der erste Test die Probanden für relevante Informationen sensibilisieren und sie dazu bringen, mehr Aufmerksamkeit zu schenken, wenn sie später damit konfrontiert werden (siehe jedoch Bahrick & Hall, 1991). Dennoch sind die von Bahrick und Hall (1993) beschriebenen Ergebnisse interessant und verdienen weitere Untersuchungen.

Zum Abschluss dieses Abschnitts glauben wir, das Paradoxon der unterschiedlichen Ergebnisse wiederholter Tests im episodischen Gedächtnis gelöst zu haben, indem wir zeigen, dass das Intervall zwischen den Tests die kritische Variable ist. Für kürzlich erlerntes Material wie Bilder oder Prosapassagen führt wiederholtes Testen mit kurzen Intervallen zwischen den Tests zu einer Verbesserung des allgemeinen Rückrufs (Hypermnesie). (Wenn Bartlett, 1932, kurze Intervalle zwischen den Tests verwendet hätte, wäre er möglicherweise zu sehr unterschiedlichen Schlussfolgerungen über die rekonstruktive Natur des Gedächtnisses gekommen.) Wenn das Intervall zwischen den Tests auf eine Woche verlängert wird, nimmt der Rückruf ab. Aber auch mit diesem längeren Intervall, die meisten der Vergessen aufgetreten als Auslassungen von Material; es gab nur wenige Fehler und Konfabulationen eingeführt, und die meisten von ihnen waren gering. Dies galt für das Klassenexperiment mit „Der Krieg der Geister“ und auch für die anderen Arten von Material. Deuten diese Beweise darauf hin, dass das Erinnern nicht so rekonstruktiv ist, wie Bartlett (1932) unter vielen anderen uns glauben machen möchte? Wir wenden uns diesem Thema im nächsten Abschnitt zu.