วิกฤตการทำซ้ำในจิตวิทยาเผยให้เห็นว่าการศึกษาที่มีชื่อเสียงที่สุดไม่สามารถทำซ้ำได้

ทีมชุมชน BigGo
วิกฤตการทำซ้ำในจิตวิทยาเผยให้เห็นว่าการศึกษาที่มีชื่อเสียงที่สุดไม่สามารถทำซ้ำได้

จิตวิทยาได้เผชิญกับการตรวจสอบความเป็นจริงอย่างรุนแรงในช่วงหลายปีที่ผ่านมา ผลการวิจัยที่โด่งดังที่สุดของสาขานี้หลายชิ้น - ตั้งแต่การโพสท่าทางเพื่อเพิ่มพลัง ( power posing ) ไปจนถึงการทดสอบมาร์ชแมลโลว์ ( marshmallow test ) - ได้พังทลายลงภายใต้การตรวจสอบทางวิทยาศาสตร์ เมื่อนักวิจัยพยายามทำการทดลองที่มีชื่อเสียงเหล่านี้ซ้ำ พวกเขาไม่สามารถได้ผลลัพธ์เดียวกันได้ สิ่งนี้ได้จุดประกายการถกเถียงอย่างเข้มข้นเกี่ยวกับความน่าเชื่อถือของการวิจัยทางจิตวิทยาและผลกระทบต่อสังคม

ปัญหานี้ลึกกว่าการศึกษาที่ไม่ดีเพียงไม่กี่ชิ้น การอภิปรายในชุมชนเผยให้เห็นว่าจิตวิทยาได้ต่อสู้กับแนวปฏิบัติทางสถิติที่ไม่ดีมาหลายทศวรรษ สาขานี้ได้พัฒนาวัฒนธรรมที่นักวิจัยจัดการข้อมูลเพื่อให้ได้ผลลัพธ์ที่สามารถตีพิมพ์ได้ ซึ่งเป็นแนวปฏิบัติที่เรียกว่า p-hacking สิ่งนี้ไม่จำเป็นต้องเกิดจากการขาดทักษะ แต่เป็นนิสัยที่ฝังรากลึกที่ให้ความสำคัญกับการได้รับการตีพิมพ์มากกว่าการได้ผลลัพธ์ที่ถูกต้อง

ปัญหาทางสถิติที่ลึกซึ้ง

ประเด็นหลักอยู่ที่วิธีการดำเนินการและวิเคราะห์การวิจัยทางจิตวิทยา ไม่เหมือนกับการทดลองทางวิศวกรรมที่มีการควบคุมและการวัดที่แม่นยำ จิตวิทยาต้องจัดการกับพฤติกรรมของมนุษย์ ซึ่งเป็นสิ่งที่ซับซ้อนและแปรผันมากกว่า ผู้คนเปลี่ยนแปลงการกระทำของพวกเขาตามบริบทและสิ่งที่พวกเขาคิดว่านักวิจัยกำลังวัด สิ่งนี้ทำให้การออกแบบการทดลองที่ถูกต้องอย่างแท้จริงเป็นเรื่องยากอย่างเหลือเชื่อ แม้แต่สำหรับนักวิทยาศาสตร์ที่มีประสบการณ์

วิธีการทางสถิติที่สอนและใช้กันทั่วไปในภาควิชาจิตวิทยามักจะส่งเสริมปัญหาเหล่านี้ นักวิจัยเรียนรู้เทคนิคที่ทำให้ง่ายต่อการค้นหารูปแบบในข้อมูล แม้ว่ารูปแบบเหล่านั้นอาจเป็นเพียงสัญญาณรบกวนแบบสุ่มก็ตาม แรงกดดันในการตีพิมพ์ผลการค้นพบใหม่ที่น่าตื่นเต้นมากกว่าการทำซ้ำงานที่มีอยู่ได้สร้างระบบที่ผลลัพธ์ที่ฉูดฉาดแต่ไม่น่าเชื่อถือได้รับความสนใจมากกว่าวิทยาศาสตร์ที่มั่นคงและทำซ้ำได้

ความล้มเหลวที่มีชื่อเสียงในหลายพื้นที่

รายการของการทำซ้ำที่ล้มเหลวครอบคลุมเกือบทุกพื้นที่ของจิตวิทยา จิตวิทยาสังคมได้รับผลกระทบอย่างหนัก โดยมีอัตราการทำซ้ำต่ำถึง 37% การศึกษาที่อ้างว่าการคิดเกี่ยวกับเงินทำให้ผู้คนเห็นแก่ตัว หรือการได้รับการเปิดรับคำที่เกี่ยวข้องกับผู้สูงอายุทำให้ผู้คนเดินช้าลง ล้วนล้มเหลวในการยืนหยัดภายใต้การตรวจสอบอย่างใกล้ชิด

แม้แต่การศึกษาที่ดูเหมือนจะมีการประยุกต์ใช้ในทางปฏิบัติก็พังทลายลง ทฤษฎีการหมดพลังของอีโก ( ego depletion theory ) ซึ่งชี้ให้เห็นว่าพลังใจทำงานเหมือนแบตเตอรี่ที่หมดลงตลอดทั้งวัน ไม่สามารถทำซ้ำได้ในความพยายามทำซ้ำขนาดใหญ่ ในทำนองเดียวกัน การแทรกแซงที่อิงตามทฤษฎี growth mindset - การสอนนักเรียนว่าสติปัญญาสามารถปรับปรุงได้ผ่านความพยายาม - ได้แสดงผลลัพธ์ที่หลากหลายในกรณีที่ดีที่สุด

จากประสบการณ์สั้นๆ ของฉันในการทำงานข้อมูลในการวิจัยจิตวิทยา ท่ามกลางปัญหาอื่นๆ มากมาย พวกเขาแย่มากในเรื่องสถิติ และมันไม่ใช่ปัญหาเรื่องทักษะเท่าไหร่ แต่เป็นปัญหาเรื่องวัฒนธรรม

อัตราการทำซ้ำการทดลองตามสาขาจิตวิทยา:

  • จิตวิทยาสังคม: 37%
  • จิตวิทยาการรู้คิด: 42%
  • จิตวิทยาคลินิก: 44%
  • จิตวิทยาบุคลิกภาพ: 55%

ผลกระทบในโลกแห่งความเป็นจริง

การทำซ้ำที่ล้มเหลวเหล่านี้ไม่ใช่เพียงความอยากรู้อยากเห็นทางวิชาการ - พวกมันได้มีอิทธิพลต่อนโยบายและการตัดสินใจจริง การวิจัย stereotype threat ซึ่งอ้างว่าการเตือนผู้หญิงเกี่ยวกับ stereotype เชิงลบทำร้ายประสิทธิภาพทางคณิตศาสตร์ของพวกเขา ถูกใช้เพื่อให้เหตุผลสำหรับการแทรกแซงทางการศึกษาต่างๆ เมื่อการศึกษาดังกล่าวล้มเหลวในการทำซ้ำ มันทำให้เกิดคำถามเกี่ยวกับนโยบายที่สร้างขึ้นบนรากฐานทางวิทยาศาสตร์ที่ไม่มั่นคง

โลกธุรกิจก็ได้รับผลกระทบเช่นกัน บริษัทต่างๆ ใช้เงินกับโปรแกรมการฝึกอบรมที่อิงตามการวิจัย power posing โดยเชื่อว่าท่าทางของร่างกายบางอย่างสามารถเพิ่มความมั่นใจและประสิทธิภาพได้ แผนก HR ลงทุนในการทดสอบบุคลิกภาพและเครื่องมืออื่นๆ ที่อิงตามทฤษฎีทางจิตวิทยาที่อาจไม่น่าเชื่อถือ

การทำซ้ำที่ล้มเหลวที่น่าสนใจ:

  • ผลกระทบการหมดพลังของอีโก้ - พลังใจเป็นทรัพยากรที่สามารถหมดได้ ( Baumeister et al. 1998 )
  • การโพสท่าทางแสดงอำนาจ - ท่าทางของร่างกายส่งผลต่อฮอร์โมนและความมั่นใจ ( Carney, Cuddy & Yap 2010 )
  • การทดสอบมาร์ชแมลโลว์ - การควบคุมตนเองในวัยเด็กทำนายผลลัพธ์ในชีวิต ( Shoda, Mischel, & Peake 1990 )
  • ผลกระทบ Mozart - ดนตรีคลาสสิกช่วยเพิ่มความฉลาดชาญชั่วคราว ( Rauscher, Shaw, & Ky 1993 )
  • การคุกคามจากแบบแผนความคิด - แบบแผนความคิดเชิงลบรบกวนการแสดงผล ( Spencer, Steele, & Quinn 1999 )

เส้นทางข้างหน้า

แม้จะมีปัญหาเหล่านี้ ชุมชนจิตวิทยาได้เริ่มให้ความสำคัญกับวิกฤตการทำซ้ำอย่างจริงจัง นักวิจัยหลายคนตอนนี้ลงทะเบียนการศึกษาของพวกเขาล่วงหน้า หมายความว่าพวกเขาผูกพันกับวิธีการและการวิเคราะห์เฉพาะก่อนที่จะรวบรวมข้อมูล สิ่งนี้ทำให้การจัดการผลลัพธ์หลังเก็บข้อมูลยากขึ้นมาก

บางคนแนะนำว่าปริญญาเอกจิตวิทยาทุกคนควรต้องทำซ้ำการศึกษาที่มีอยู่เป็นส่วนหนึ่งของการฝึกอบรม สิ่งนี้จะสร้างแรงจูงใจมากขึ้นสำหรับงานการทำซ้ำในขณะที่สอนวิธีการวิจัยที่เหมาะสมแก่นักเรียน คนอื่นๆ เสนอว่าวารสารควรต้องการการทำซ้ำอิสระก่อนการตีพิมพ์ผลลัพธ์

สาขานี้ยังคงสร้างข้อมูลเชิงลึกที่มีค่า - การทดสอบ IQ เป็นตัวอย่าง ยังคงเป็นหนึ่งในผลการค้นพบที่เชื่อถือได้และทำซ้ำได้ดีที่สุดของจิตวิทยา ความท้าทายตอนนี้คือการแยกวิทยาศาสตร์ที่มั่นคงออกจากสัญญาณรบกวนทางสถิติ และสร้างวัฒนธรรมที่ให้ค่ากับความถูกต้องมากกว่าความแปลกใหม่

อ้างอิง: Famous Cognitive Psychology Experiments that Failed to Replicate