Category: Psychometrics

  • แบบทดสอบทางจิตวิทยาน่าเชื่อถือแค่ไหน? แนะนำให้รู้จักกับ Reliability และ Validity — 2 ลักษณะที่ทุกคนควรรู้ เพื่อประเมินประสิทธิภาพของแบบทดสอบทางจิตวิทยาได้ด้วยตัวเอง (ไม่ต้องเป็นนักจิตวิทยาก็ทำได้)

    แบบทดสอบทางจิตวิทยาน่าเชื่อถือแค่ไหน? แนะนำให้รู้จักกับ Reliability และ Validity — 2 ลักษณะที่ทุกคนควรรู้ เพื่อประเมินประสิทธิภาพของแบบทดสอบทางจิตวิทยาได้ด้วยตัวเอง (ไม่ต้องเป็นนักจิตวิทยาก็ทำได้)

    แบบทดสอบทางจิตวิทยา (psychological test) เป็นเครื่องมือที่ช่วยเราประเมินลักษณะทางจิตวิทยาได้อย่างมีมาตรฐาน เช่น:

    • Personality
    • Intelligence (IQ)
    • Value
    • Emotion
    • Self-concept

    แบบทดสอบทางจิตวิทยาเป็นที่นิยมอย่างแพร่หลาย โดยในแต่ละปีมีคนทำแบบทดสอบทางจิตวิทยาราว 80–100 ล้านคน (Goldberg, 2023; Leikvoll, 2022)

    เราใช้แบบทดสอบทางจิตวิทยา เช่น 16personalities ทั้งในชีวิตประจำวันและในการทำงาน เราทำแบบทดสอบเพื่อเข้าใจตัวเองมากขึ้น (เช่น ดูว่าเรามีนิสัยเหมือนคนดังหรือตัวละครใดจาก Game of Throne) ในการทำงาน เราใช้แบบทดสอบเพื่อคัดกรองผู้สมัครและวางแผนพัฒนาบุคลากรให้เหมาะสมกับองค์กร

    แม้ว่าแบบทดสอบทางจิตวิทยาจะใช้งานอย่างแพร่หลาย แต่ในหลาย ๆ ครั้งประสิทธิภาพของแบบทดสอบยังขาดความชัดเจน นั่นคือ เราไม่รู้ว่า ผลจาก 16personalities ที่บอกว่าเรานิสัยเหมือน John Snow เชื่อถือได้ไหม

    คำถามนี้อาจไม่สำคัญมากเมื่อเราทำแบบทดสอบด้วยเหตุผลส่วนตัว (เช่น ทำตามกระแส) แต่ประสิทธิภาพของแบบทดสอบอาจกลายมาเป็นประเด็นใหญ่ได้เมื่อบริษัทที่เราสมัครงานจะคัดเราออก เพราะเรานิสัยเหมือน John Snow

    แบบทดสอบที่เราใช้งานมีประสิทธิภาพเพียงพอที่จะตัดสินชีวิตของเราได้มากน้อยขนาดไหน?

    อะไรที่จะบอกเราได้ว่าแบบทดสอบสามารถประเมินสิ่งที่เราต้องการประเมินได้จริง?

    เราสามารถวิเคราะห์ประสิทธิภาพของแบบทดสอบได้จากหลายมุมมอง เช่น:

    • จำนวนข้อคำถาม (item)
    • รูปแบบการตอบ (เช่น เขียนตอบ, เลือกตอบ)
    • รูปแบบของแบบทดสอบ (เช่น ประเมินตัวเอง, สัมภาษณ์, เล่นเกม)
    • การแปลผล (เช่น แปลผลโดยอิงกลุ่มหรืออิงคะแนนตัวเอง)

    อย่างไรก็ตาม ไม่ว่าจะเป็นการวิเคราะห์แบบไหน คำตอบที่ได้จะย้อนกลับมาที่ 2 ลักษณะหลักที่ทุกแบบทดสอบจะต้องมี ได้แก่:

    1. Reliability (ความเที่ยง)
    2. Validity (ความตรง)

    ดังนั้น แม้ว่าเราอาจจะไม่ใช่นักจิตวิทยาหรือผู้เชี่ยวชาญในการทดสอบ ถ้าเราเข้าใจลักษณะทั้งสองอย่างนี้แล้ว เราจะสามารถบอกได้ว่า แบบทดสอบมีประสิทธิภาพภาพหรือไม่

    ในบทความนี้ เราจะไปทำความรู้จักกับทั้งสองลักษณะนี้กัน เพื่อที่เราจะได้มีความสามารถในการประเมินประสิทธิภาพของแบบทดสอบ โดยไม่จำเป็นต้องเป็นนักจิตวิทยาหรือผู้เชี่ยวชาญ

    ถ้าพร้อมแล้ว ไปเริ่มกันเลย


    1. 📏 Reliability
      1. ⌚ Test-Retest Reliability
      2. 🤌 Internal Consistency
      3. 🅰️ Alternate Form Reliability
    2. 📐 Intro to Validity
    3. 💭 Validity, Part I: Opinion-Based Approach
      1. 🙃 Face Validity
      2. 🧐 Content Validity
    4. 👁️ Validity, Part II: Empirical Approach
      1. 🏗️ Construct Validity
      2. 🌡️ Criterion Validity
    5. 💪 Summary
    6. 👀 See for Yourself: Is 16Personalities Reliable & Valid?
    7. 📚 Further Reading
    8. 📃 References
    9. ✅ R Book for Psychologists: หนังสือภาษา R สำหรับนักจิตวิทยา

    📏 Reliability

    Reliability หมายถึง ความเสถียรของคะแนนแบบทดสอบ

    ถ้าเราเปรียบแบบทดสอบเหมือนตลับเมตร reliability คือ การที่เราวัดโต๊ะตัวเดียวกันและได้ความยาวเท่าเดิมทุกครั้ง

    สำหรับแบบทดสอบทางจิตวิทยา เราสามารถประเมิน reliability ได้ 3 แบบ ได้แก่:

    1. Test-retest reliability: ความเสถียรในมิติเวลา
    2. Internal consistency: ความเสถียรภายในตัวเอง
    3. Alternate form reliability: ความเสถียรระหว่างต้นฉบับและ alternate form

    .

    ⌚ Test-Retest Reliability

    Test-retest reliability เป็น reliability ที่ประเมินตามมิติเวลา นั่นคือ ถ้าเราเก็บคะแนนแบบทดสอบ 2 ครั้งในเวลาที่ต่างกัน คะแนนทั้งสองครั้งจะเหมือนหรือต่างกันแค่ไหน

    เรามักใช้ correlation ในการวิเคราะห์ test-retest reliability

    Correlation มีค่าอยู่ระหว่าง 0 กับ 1 โดย:

    • 0 หมายถึง คะแนนสองครั้งไม่มีความสอดคล้องกันเลย
    • 1 หมายถึง คะแนนเหมือนกัน 100%

    ดังนั้น ยิ่งค่า correlation เข้าใกล้ 1 มากเท่าไร ก็แสดงว่ามี test-retest reliability สูงขึ้นเท่านั้น

    ยกตัวอย่างเช่น เรามีแบบทดสอบ IQ ที่มีค่า correlation ระหว่างคะแนน 2 ครั้ง (เช่น เดือนที่แล้วกับวันนี้) ต่ำ (เช่น .10) แสดงว่าคะแนนมีความแตกต่างมาก (เช่น IQ = 10 และ IQ = 100) และแบบทดสอบมีความเสถียรน้อย

    ในทางกลับกัน ถ้าแบบทดสอบมี correlation สูง (เช่น .80) แสดงว่า คะแนนมีความคล้ายกันสูง (เช่น IQ = 100 และ IQ = 101) และแบบทดสอบมีความเสถียรสูง

    ทั้งนี้ test-retest reliability เหมาะกับแบบทดสอบที่ประเมินลักษณะที่มีความคงที่และเปลี่ยนแปลงน้อย (เช่น personality, intelligence ซึ่งไม่เปลี่ยนวันต่อวัน)

    ถ้าเราต้องการประเมิน reliability ของแบบทดสอบที่ประเมินลักษณะที่เปลี่ยนแปลงได้ง่าย (เช่น อารมณ์) เราควรใช้ reliability ประเภทอื่นอย่าง internal consistency และ alternate form reliability ในการประเมินแบบทดสอบ

    .

    🤌 Internal Consistency

    Internal consistency เป็น reliability ที่ดูความสอดคล้องระหว่างข้อคำถาม โดยแนวคิด คือ ถ้าข้อคำถามประเมินลักษณะเดียวกัน คะแนนของทุกข้อควรเป็นไปในทิศทางเดียวกัน

    ยกตัวอย่างเช่น ถ้าแบบทดสอบ extraversion มี reliability สูง คนตอบแบบทดสอบก็ควรให้คะแนนทุกข้อเหมือนกัน เช่น:

    • ชอบคุยกับคนอื่น → 5/5 (สูง)
    • ชอบเที่ยวกับเพื่อน → 4/5 (สูง)
    • ชอบไปปาร์ตี้ → 5/5 (สูง)

    ในทางกลับกัน ถ้าแบบทดสอบมี reliability ต่ำ คะแนนของทุกข้อจะแตกต่างกัน เช่น:

    • ชอบคุยกับคนอื่น → 1/5 (ต่ำ)
    • ชอบเที่ยวกับเพื่อน → 3/5 (ปานกลาง)
    • ชอบไปปาร์ตี้ → 5/5 (สูง)

    การคำนวณ internal consistency มีหลายวิธี แต่วิธีที่นิยมที่สุด คือ การคำนวณ Cronbach’s alpha (α) ซึ่งมีค่าอยู่ระหว่าง 0 กับ 1 โดย:

    • 0 หมายถึง internal consistency ต่ำสุด
    • 1 หมายถึง internal consistency สูงสุด

    α ในระดับที่ “ยอมรับได้ (acceptable)” มีค่าตั้งแต่ .70 ขึ้นไป (Ashton, 2018)

    วิธีอื่น ๆ ในการประเมิน internal consistency ได้แก่:

    1. Split-half reliability: แบ่งแบบทดสอบเป็น 2 ส่วนและดูว่า คะแนนสองส่วนเหมือนกันขนาดไหน
    2. Inter-rater reliability: ดูความสอดคล้องระหว่างคะแนนจากผู้สังเกตการณ์ตั้งแต่ 2 คนขึ้นไป

    .

    🅰️ Alternate Form Reliability

    สุดท้าย alternate form reliability เป็น reliability ที่ดูความสอดคล้องระหว่างแบบทดสอบต้นฉบับและ alternate form

    Alternate form หมายถึง version ของแบบทดสอบที่ค่าทางสถิติต่าง ๆ เหมือนกับต้นฉบับ เช่น:

    • Mean
    • Standard deviation
    • Correlation กับแบบทดสอบอื่น ๆ

    ถ้าคะแนนของต้นฉบับเหมือนกับคะแนนของ alternate form แสดงว่า แบบทดสอบของเรามี reliability สูง

    Alternate form reliability ไม่เป็นที่นิยมใช้ เนื่องจากข้อจำกัด 2 อย่าง ได้แก่:

    1. การสร้างแบบทดสอบอีกฉบับให้เป็น alternate form มีความท้าทายสูง (การทำให้ค่าสถิติเหมือนกันเป็นเรื่องยาก)
    2. แม้ว่า เราจะสามารถสร้าง alternate form ได้แล้ว เราไม่สามารถมั่นใจได้ 100% ว่า คะแนนของ alternate form จะสะท้อนถึงสิ่งเดียวกับต้นฉบับ (เช่น คะแนน 100 ของต้นฉบับอาจหมายถึง extraversion แต่คะแนน 100 ของ alternate form อาจหมายถึง IQ ก็ได้) ทำให้การเปรียบเทียบต้นฉบับและ alternate form ไม่มีความหมาย เพราะ เรากำลังเปรียบเทียบแบบทดสอบที่ประเมินลักษณะที่แตกต่างกัน

    📐 Intro to Validity

    ในขณะที่ reliability ประเมินความเสถียรของคะแนน validity ประเมินว่า แบบทดสอบสามารถประเมินในสิ่งที่เราต้องการได้หรือไม่

    Reliability และ validity มีความเกี่ยวข้องกัน โดยแบบทดสอบจะไม่มี validity ถ้าไม่มี reliability เพราะถ้าคะแนนแบบทดสอบไม่คงที่ (reliability) เราจะไม่สามารถรู้ได้ว่า แบบทดสอบกำลังประเมินอะไรอยู่ (validity)

    การที่แบบทดสอบจะมี validity ได้ จะต้องมี reliability ก่อน อย่างไรก็ตามการมี reliability ไม่ได้หมายความว่า แบบทดสอบจะมี validity

    ยกตัวอย่างเช่น แบบทดสอบ extraversion อาจให้คะแนนเหมือนเดิมทุกครั้ง แต่แบบทดสอบอาจไม่ได้วัด extraversion แต่วัดลักษณะอื่นอย่าง intelligence (ซึ่งมีคะแนนคงที่) ก็ได้

    ดังนั้น แบบทดสอบจะมี validity ได้จะต้องมี reliability ก่อน แต่เมื่อมี reliability แล้ว เราจะต้องทดสอบ validity เพื่อดูว่า แบบทดสอบสามารถประเมินสิ่งที่ต้องประเมินได้หรือไม่

    Validity แบ่งเป็น 2 กลุ่มใหญ่ ๆ ได้แก่:

    1. Opinion-based approach: validity ตามความคิดเห็น
    2. Empirical approach: validity ตามหลักฐานเชิงประจักษ์ (หลักฐานที่สามารถมองเห็นและตรวจสอบได้)

    💭 Validity, Part I: Opinion-Based Approach

    ในกลุ่ม opinion-based approach เรามี validity 2 ประเภท ได้แก่:

    1. Face validity
    2. Content validity

    .

    🙃 Face Validity

    Face validity คือ validity ตามความเห็นของผู้ตอบแบบทดสอบ

    ถ้าคนที่ตอบแบบทดสอบบอกว่า แบบมาทดสอบ “สามารถ” วัดสิ่งที่เราต้องการได้ แสดงว่าแบบทดสอบเรามี face validity สูง

    เนื่องจาก face validity เป็นเพียงความคิดเห็น การมี face validity จึงไม่ได้หมายความว่าแบบทดสอบจะสามารถประเมินสิ่งที่เราต้องการได้จริง

    เราสามารถเห็นแบบทดสอบที่มี face validity ต่ำ แต่สามารถประเมินสิ่งที่ต้องการได้ เช่น:

    • IAT ที่วัดความลำเอียงต่อกลุ่มคน (เช่น คนผิวสี) แม้ว่า เราจะตอบว่า คนผิวสี = “ดี” แต่แบบทดสอบก็สามารถบอกได้ว่า เรามีความลำเอียงไหม
    • Name Letter Preference Task ที่ให้คนให้คะแนนความชอบต่อตัวอักษรต่าง ๆ ซึ่งสามารถประเมิน self-esteem ได้ (คนส่งนใหญ่จะให้คะแนนตัวอักษรในชื่อตัวเองมากกว่าตัวอักษรอื่น)
    • Iowa Gambling Task ที่เป็นเกมไพ่สำหรับประเมินความสามารถในการตัดสินใจ

    แม้ว่า face validity อาจไม่ใช่ตัวบ่งชี้ validity ที่ดี แต่ face validity มีประโยชน์เมื่อเราต้องการสร้างแรงจูงใจให้ผู้ตอบ: เมื่อแบบทดสอบดูเหมือนจะประเมินในสิ่งที่ควรประเมิน (มี face validity) ผู้ตอบจะมีแรงจูงใจที่จะทำแบบทดสอบให้เสร็จ มากกว่าเมื่อแบบทดสอบขาด face validity

    .

    🧐 Content Validity

    เช่นเดียวกับ face validity, content validity เกิดมาจากความคิดเห็น แต่แทนที่จะมาจากคนทั่วไป content validity เป็นความเห็นของผู้เชี่ยวชาญ

    ถ้าผู้เชี่ยวชาญประเมินแบบทดสอบของเราแล้วยกนิ้วให้ 👍 แสดงว่าแบบทดสอบเรามี content validity สูง

    เช่นเดียวกับ face validity, content validity ไม่ได้การันตีว่าแบบทดสอบเราจะสามารถวัดสิ่งที่ต้องการวัดได้ เพราะความเห็นของผู้เชี่ยวชาญยังมีความผิดพลาดได้

    Content validity มีประโยชน์ในขั้นต้นของการพัฒนาแบบทดสอบ เราสามารถให้ผู้เชี่ยวชาญประเมินและตัดข้อคำถามที่ไม่น่าเกี่ยวข้องกับสิ่งที่เราจะวัดออกได้

    ไม่ว่าแบบทดสอบจะมีหรือไม่มี face validity และ content validity เราจะไม่รู้เลยว่า แบบทดสอบสามารถประเมินสิ่งที่เราต้องการได้ไหม จนกว่าเราจะทดสอบให้เห็นกับตา (empirical approach)


    👁️ Validity, Part II: Empirical Approach

    Validity ในกลุ่ม empirical approach มีอยู่ 2 ประเภท ได้แก่:

    1. Construct validity
    2. Criterion validity

    .

    🏗️ Construct Validity

    Construct หมายถึง ลักษณะทางจิตวิทยาซึ่งเรามองไม่เห็นและไม่สามารถจับต้องได้ เช่น personality, intelligence, self-concept

    Construct validity หมายถึง validity ของแบบทดสอบในการประเมิน construct ที่ต้องการ

    เราสามารถวิเคราะห์ construct validity ได้ด้วยการดูความสัมพันธ์ระหว่างแบบทดสอบของเรากับแบบทดสอบอื่น ๆ ซึ่งสามารถแบ่งได้เป็น 2 แบบ ได้แก่:

    1. Convergent validity
    2. Divergent validity (หรือ discriminant validity)

    สำหรับ convergent validity เราจะดูว่า แบบทดสอบมีความสัมพันธ์กับแบบทดสอบอื่น ๆ ที่ควรมีไหม

    ยกตัวอย่างเช่น แบบทดสอบ IQ ซึ่งสะท้อนความฉลาดรอบด้าน ควรมีความสัมพันธ์กับแบบทดสอบความสามารถอื่น ๆ เช่น แบบทดสอบเลข แบบทดสอบความรู้ทั่วไป ถ้าแบบทดสอบ IQ มีความสัมพันธ์กับแบบทดสอบเหล่านี้ ก็แสดงว่ามี convergent validity

    Divergent validity คือ การที่แบบทดสอบของเราไม่มีความสัมพันธ์กับแบบทดสอบที่ไม่ควรเกี่ยวข้องด้วย

    ยกตัวอย่างเช่น ถ้าแบบทดสอบ IQ จะมี divergent validity ได้ จะต้องไม่มีความสัมพันธ์กับแบบทดสอบที่ไม่เกี่ยวข้องกับสามารถทางปัญญา เช่น ความทดสอบ integrity หรือแบบทดสอบความสุภาพ

    ในการวิเคราะห์ construct validity ยิ่งเราทดสอบ convergent validity และ divergent validity ได้มากเท่าไรก็ยิ่งดี เพราะเราจะยิ่งมั่นใจได้ว่า แบบทดสอบของเราสามารถประเมินสิ่งที่ต้องการประเมินได้จริง

    ยกตัวอย่างเช่น เราควรหา convergent validity ของแบบทดสอบ IQ กับแบบทดสอบหลาย ๆ วิชา เช่น ข้อสอบเลข, ข้อสอบภาษา, ข้อสอบสังคม แทนการหา convergent validity กับวิชาใดวิชาหนึ่ง

    เรามักใช้ correlation ในการวิเคราะห์ construct validity ดังนี้:

    1. Convergent validity: ยิ่ง correlation สูงยิ่งดี (เช่น .7 หรือ -.7) *
    2. Divergent validity: ยิ่ง correlation น้อยก็ยิ่งดี (เช่น .10 หรือ -.10)

    Note: * convergent validity ไม่ควรสูงเกิน เพราะนั่นอาจหมายความว่า แบบทดสอบเราอาจประเมินสิ่งเดียวกับแบบทดสอบอื่น เช่น แบบทดสอบ IQ กำลังประเมินความสามารถด้านคณิตศาสตร์แทน IQ (ความฉลาดรอบด้าน)

    .

    🌡️ Criterion Validity

    Criterion validity คือ validity ที่ดูความสอดคล้องระหว่างแบบทดสอบกับเกณฑ์ (criterion) ที่มีความสำคัญ

    ยกตัวอย่างเช่น:

    • แบบทดสอบ IQ กับเกรดการเรียน
    • แบบทดสอบ extraversion กับจำนวนเพื่อน
    • แบบทดสอบ integrity กับพฤติกรรมการโกง
    • แบบทดสอบ depression กับภาวะซึมเศร้า

    Criterion validity มีอยู่ 2 แบบ ได้แก่:

    1. Concurrent validity: ดูว่าแบบทดสอบมีความเกี่ยวข้องกับเกณฑ์ที่เกิดขึ้นในเวลาเดียวกันไหม (เช่น คะแนนสอบวันนี้)
    2. Predictive validity (aka incremental validity): ดูว่า แบบทดสอบมีความเกี่ยวข้องกับเกณฑ์ที่จะเกิดขึ้นในอนาคตไหม (เช่น คะแนนสอบในอีก 2 เดือนข้างหน้า)

    เช่นเดียวกับ construct validity ยิ่งเรามี concurrent validity และ predictive validity มากเท่าไรก็ยิ่งดี เพราะจะทำให้เรายิ่งมั่นใจในแบบทดสอบมากขึ้น

    และเช่นเดียวกับ construct validity เรามักใช้ correlation ในการประเมิน criterion validity ซึ่งหมายความว่า ยิ่ง correlation สูงก็ยิ่งมี criterion validity สูง


    💪 Summary

    ในบทความนี้ เราได้ไปทำความรู้จักกับ 2 ลักษณะที่ช่วยให้เราประเมินประสิทธิภาพของแบบทดสอบทางจิตวิทยาได้ ซึ่งได้แก่:

    ลักษณะที่ 1. Reliability หรือ ความเสถียรของคะแนนแบบทดสอบ ซึ่งมี 3 ประเภท ได้แก่:

    TypeDescription
    Test-retest reliabilityความเสถียรตามมิติเวลา
    Internal consistencyความเสถียรระหว่างข้อคำถาม
    Alternate form reliabilityความเสถียรระหว่างต้นฉบับและ alternate form

    ลักษณะที่ 2. Validity ซึ่งบอกว่า แบบทดสอบวัดสิ่งที่ต้องการวัดได้ขนาดไหน และแบ่งได้เป็น 2 กลุ่มใหญ่ ได้แก่:

    กลุ่มที่ 1. Opinion-based approach หรือ validity ตามความเห็น:

    TypeDescription
    Face validityValidity ตามความเห็นของคนทั่วไป
    Content validityValidity ตามความเห็นของผู้เชี่ยวชาญ

    กลุ่มที่ 2. Empirical approach หรือ validity ที่มีหลักฐานเชิงประจักษ์:

    Construct validity:

    TypeDescription
    Convergent validityความสัมพันธ์ระหว่างแบบทดสอบกับปัจจัยที่ควรเกี่ยวข้อง
    Divergent validityความสัมพันธ์ระหว่างแบบทดสอบกับปัจจัยที่ไม่ควรเกี่ยวข้อง

    Criterion validity:

    TypeDescription
    Concurrent validityความสัมพันธ์ระหว่างแบบทดสอบกับเกณฑ์ในปัจจุบัน
    Predictive validityความสัมพันธ์ระหว่างแบบทดสอบกับเกณฑ์ในอนาคต

    👀 See for Yourself: Is 16Personalities Reliable & Valid?

    ตอนนี้ เรารู้จักกับ reliability และ validity แล้ว และสามารถประเมินประสิทธิภาพของแบบทดสอบทางจิตวิทยาได้แล้ว

    แบบทดสอบต่าง ๆ มักจะรายงานผลการทดสอบ reliability และ validity ไว้ ดังนั้น เราสามารถประเมินประสิทธิภาพของแบบทดสอบได้โดยไม่ต้องทำการทดสอบเอง

    ถ้าแบบทดสอบใดที่ไม่มีการรายงานค่าเหล่านี้ เราสามารถตั้งคำถามได้ว่าแบบทดสอบสามารถใช้งานได้จริงหรือไม่

    เราสามารถดูตัวอย่างการรายงาน reliability และ validity ได้จากรายงานของ 16personalities ซึ่งประกอบ:

    1. Internal consistency
    2. Test-retest reliability
    3. Discriminant (divergent) validity

    ใครที่ลองอ่านรายงานของ 16personalities สามารถทิ้งคอมเม้นท์ไว้ได้ว่า แบบทดสอบนี้น่าเชื่อถือแค่ไหน

    .

    (ใครที่ยังไม่ได้ดูรายงาน 16personalities ให้ข้ามบรรทัดล่างไปก่อนนะครับ 😁)

    (Note: รายงานไม่ได้ระบุ validity ประเภทอื่น ๆ ไว้ ทำให้เราไม่รู้ว่า 16personalities ประเมิน 4 มิติของบุคลิกภาพตามที่ออกแบบไว้หรือไม่)


    📚 Further Reading

    สำหรับคนที่สนใจอ่านเพิ่มเติมเกี่ยว reliability และ validity สามารถอ่าน

    • Ashton (2018): บทเรียนเกี่ยวกับ reliability และ validity เบื้องต้น
    • Geisinger (2013): บทเรียนเกี่ยวกับ reliability เชิงลึก
    • Sireci และ Sukin (2013): บทเรียนเกี่ยวกับ validity เชืงลึก
    • Part II และ III ของ Furr และ Bacharach (2014): บทเรียนเชิงทฤษฎีและสถิติของ reliability และ validity

    📃 References

    • Ashton, M. C. (2018). Basic concepts in psychological measurement. In M. C. Ashton (Ed.), Individual differences and personality (3rd ed., pp. 1–28). Academic Press. https://doi.org/10.1016/B978-0-12-809845-5.00001-9
    • Furr, R. M., & Bacharach, V. R. (2014). Psychometrics: An introduction (2nd ed.). Sage.
    • Geisinger, K. F. (2013). Reliability. In K. F. Geisinger, B. A. Bracken, J. F. Carlson, J. I. C. Hansen, N. R. Kuncel, S. P. Reise, & M. C. Rodriguez (Eds.), APA handbook of testing and assessment in psychology, Vol. 1. Test theory and testing and assessment in industrial and organizational psychology (pp. 21–42). American Psychological Association. https://doi.org/10.1037/14047-002
    • Goldberg, E. (2023, March 5). The $2 billion question of who you are at work. The New York Times. https://www.nytimes.com/2023/03/05/business/remote-work-personality-tests.html
    • Leikvoll, V. (2022, September 14). 80% of Fortune 500 companies use personality tests, but are they ethical? Leaders. https://leaders.com/articles/business/personality-tests/
    • Rindskopf, D. (2001). Reliability: Measurement. In N. J. Smelser & P. B. Baltes (Eds.), International encyclopedia of the social & behavioral sciences (pp. 13023–13028). Pergamon. https://doi.org/10.1016/B0-08-043076-7/00722-1
    • Sireci, S. G., & Sukin, T. (2013). Test validity. In K. F. Geisinger, B. A. Bracken, J. F. Carlson, J. I. C. Hansen, N. R. Kuncel, S. P. Reise, & M. C. Rodriguez (Eds.), APA handbook of testing and assessment in psychology, Vol. 1. Test theory and testing and assessment in industrial and organizational psychology (pp. 61–84). American Psychological Association. https://doi.org/10.1037/14047-004

    ✅ R Book for Psychologists: หนังสือภาษา R สำหรับนักจิตวิทยา

    📕 ขอฝากหนังสือเล่มแรกในชีวิตด้วยนะครับ 😆

    🙋 ใครที่กำลังเรียนจิตวิทยาหรือทำงานสายจิตวิทยา และเบื่อที่ต้องใช้ software ราคาแพงอย่าง SPSS และ Excel เพื่อทำข้อมูล

    💪 ผมขอแนะนำ R Book for Psychologists หนังสือสอนใช้ภาษา R เพื่อการวิเคราะห์ข้อมูลทางจิตวิทยา ที่เขียนมาเพื่อนักจิตวิทยาที่ไม่เคยมีประสบการณ์เขียน code มาก่อน

    ในหนังสือ เราจะปูพื้นฐานภาษา R และพาไปดูวิธีวิเคราะห์สถิติที่ใช้บ่อยกัน เช่น:

    • Correlation
    • t-tests
    • ANOVA
    • Reliability
    • Factor analysis

    🚀 เมื่ออ่านและทำตามตัวอย่างใน R Book for Psychologists ทุกคนจะไม่ต้องพึง SPSS และ Excel ในการทำงานอีกต่อไป และสามารถวิเคราะห์ข้อมูลด้วยตัวเองได้ด้วยความมั่นใจ

    แล้วทุกคนจะแปลกใจว่า ทำไมภาษา R ง่ายขนาดนี้ 🙂‍↕️

    👉 สนใจดูรายละเอียดหนังสือได้ที่ meb: