חזרה לאתר הראשי

שיטות מחקר לעבודה סוציאלית -סיכום מושגים


סיכום -משתנים

למה חשוב ללמוד שיטות מחקר?

מטרות המחקרים במדעי החברה להסביר ולנבא התנהגות אנושית ולמצוא סדר וחוקיות בדברים. השאיפה היא להגיע להכללה.

מחקר אנטיר - דיסיפילינרי- בין תחומי. בגלל שיש חפיפה בין התחומים במדעי החברה מתמקדים במחקרים אלו.

למחקר מדעי יש 2 תכונות בסיסיות:

  1. אובייקטיביות- מחקר משוחרר משיפוטים אישיים של החוקר המעורב בו. (אסור לחוקר להביא את זהותו האישית למחקר).
  2. אמפיריות- טענות שניתן להפריך או לאשש אותם באמצעות מחקר, איסוף נתונים, בדיקה שיטתית וכד'.

גישה מדעית מבוססת על 5 שלבים:

  1. ניסוח בעיה- סוגיה שאנו לא יודעים עליה מספיק.
  2. ניסוח השערות המחקר- חוק כללי שמקשר בין 2 משתנים או יותר.
  3. ניסוח של היקש- איך אפשר לבדוק את השערתנו באופן אמפירי.
  4. בדיקה- עריכת המחקר עצמו.
  5. הסקת המסקנות ופענוח נתונים- פרשנות הנתונים שנאספו במחקר.

ניבוי- רצון באמצעות המחקר לדעת לנבא תוצאה. הניבוי הוא תמיד הסתברותי.

משתנה- ביטוי שערכיו משתנים. לכל משתנה יש ערכי המשתנה- מה הוא יכול לקבל. ערכים שהם אובייקטיבים לחלוטין (גיל, ציון) מקבלים ערכים מדויקים/ברורים ולהפך. בתופעות מחקריות מחפשים קשר לפחות בין 2 משתנים כאשר אחד הוא משתנה המסביר את התופעה והשני הוא המוסבר.

יש 2 סוגי קשרים:

  1. קשר סיבתי- אחד מהמתנים גורם לשני.
  2. קשר מתאמי- 2 התופעות מתרחשות במקביל, בלי שאף אחת משפיעה על השניה.

ע"מ שנוכל להוכיח קשר בין 2 תופעות באופן מדעי אנו צריכים:

  1. דרישת הרלוונטיות- קשר סטטיסטי בין 2 התופעות. אם אין קשר סטטיסטי המתאם הוא 0.
  2. אמפיריות- שנצליח לבחון זאת באמצעות מחקר. כל הסבר מדעי על קשר בין המשתנים צריך להיות מבוסס על בחינה אמפירית.

משתנה תלוי- המשתנה המוסבר, המנובא.

משתנה בלתי תלוי- המשתנה המסביר, המנבא.

משתני ייחוס- משתנים שהאדם בא איתם וא"א לשנותם (גיל, מקום מגורים, עמדות, משתנים דמוגרפים). משתנים אלו יכולים להיות תלויים או בלתי תלויים.

משתנה דיכוטומי- משתנה שיכול לקבל רק 2 ערכים (לדוג': מין).

יש 2 סוגי הגדרות:

  1. הגדרה נומינלית- הגדרה כללית של המשתנה שנחקר.
  2. הגדרה אופרציונלית- אומרת מה הפעולות שיש לבצע כדי למדוד את המושג הנחקר.

תיאוריה-

מערכת של טענות על קשרים בין משתנים. צריך שיהיה קשר בין 2 משתנים ושתהיה טענה לגביהם. תיאוריה כוללת השקפה מסוימת על תופעה, תפקיד ההשקפה הוא להסביר ולנבא. התיאוריה מציגה טענה על קשר שצפוי בין המשתנים. חלק מהקשרים הם מבוססים וידועים ולכן נוצרה התיאוריה. חלק מהקשרים צריכים להיות מוכחים במסגרת בניית התיאוריה.

בשביל לבדוק תיאוריה צריך להעבירה מהרמה התיאורטית לרמה האופרציונלית. אחרי שהגדרנו בצורה אופרציונלית, צריך לערוך מחקר שבודק את הקשרים בין המשתנים. אם נמצאו קשרים סטטיסטיים מובהקים- נוכל לאשש את התיאוריה. צריך לעשות הרבה מחקרים. אחרי שסיימנו לעשות את המחקר ברמה האופרציונלית צריך לחזור לרמה התיאורטית. את הממצאים הסטטיסטיים צריך להעביר לרמה של התיאוריה (מעגלי).

כאשר מחקר לא מצליח לאשש את התיאוריה אפשר להגיד אחד מ- 2 דברים:

בכל מקרה א"א להפריך או לאושש תיאוריה ע"י מחקר אחד.

שלבי המחקר המדעי:

  1. מבוא- הרקע התיאורטי של המחקר. מה ידוע לנו היום מהספרות על הנושא שרוצים לחקור. בסוף המבוא החוקר מציג את המטרות וההשערות הספציפיות שלו למחקר.
  2. שיטה- מציגים את מערך המחקר ואת הכלים שבהם יעשה שימוש במחקר שלו (מתאמי/ ניסויי).
  3. תוצאות- ממצאים של המחקרים שערכנו. בפרק זה יש סיכום של התוצאות באופן ענייני- הוא לא מפרש אותם.
  4. סיכום ודיון- מסקנות המחקר, פרשנות החוקר לגבי מה שהתקבל.

בפועל התהליך הרבה יותר סבוך כי הרבה פעמים קשה לשער השערות. המדגם/ האוכלוסייה שעליה נבדוק את המחקר היא גורם מאוד חשוב. איכות המחקר נקבעת עפ"י המדגם. ההחלטה על כלי המחקר ואיכותם (תוקף ומהימנות) קובעת גם את איכות המחקר. ז"א האם עשינו את המחקר באופן איכותי והאם אפשר להכליל מה שקיבלנו במחק על האוכלוסייה.

בעיות/ שאלות מחקר-

כשמחליטים מה עומדים לחקור צריך לחשוב על בעיות שאנו רוצים לתת להם מענה באמצעות המחקר. הנושא נבחר כדי לספק תשובה מתוך סקרנות אינטלקטואלית (תפיסה, סף תגובה). הנושא יכול לבוא גם מתוך רצון לספק תשובות יישומיות לבעיות שנתקלנו בהם (תאונות דרכים, דעת קהל, סקרי בחירות).

בעיית המחקר מצביעה בד"כ על קשר בין 2 משתנים או יותר, כאשר היא חייבת להיות מנוסחת בבהירות וחייבת להיות נתונה לבחינה אמפירית, כי אחרת היא לא מדעית.

בד"כ בעיות המחקר מנוסחות בצורת שאלות. ההשערות הן טענות אמפיריות שניתן לבדוק אותן- לאשש או להפריך באמצעות מחקר, כאשר השערת מחקר יכולה לבטא קשר או אי קיומו של קשר בין המשתנים ולתת כיוון של קשר בין משתנים.

ככל שהשערות מנוסחות בצורה כללית יותר, כך קשה יותר לעבור להגדרות אופרציונליות מדידות. ככל שההשערות תהיינה מפורטות יותר, כך יהיה ברור יותר איך לבחון אותן. לא תמיד אפשר לנסח השערה בתחילת הדרך המחקרית. לפעמים מדובר בנושא חדש ועורכים מחקר גישוש. מטרתו של המחקר לסייע בעיצוב השערות מפורטות.

H0- מציין העדר קשר בין המשתנים או העדר קשר בין האוכלוסיות.

H1- מציין שיש קשר בין המשתנים או יש קשר בין האוכלוסיות.

השערה חד כיוונית- החוקר משער לא רק על קיומו של קשר בין המשתנים/ הבדל בין אוכלוסיות, אלא גם על כיוון הקשר.

כאשר בודקים השערה יש 3 שלבים:

1) הגדרת השאלה/השערה.

2) הגדרת רמת המובהקות (אלפא).

3) הפעלת מבחנים הסטטיסטיים המתאימים לבדיקת ההשערה.


צריך להבחין בין 2 סוגי השערות:

  1. קשר בין תופעות- השערות מסוג זה יכולות להתייחס להתפלגות של משתנה מסוים באוכלוסייה (סקרי בחירות).
  2. השערות של סיבתיות- במקרים אלו אנו רוצים לגלות האם משתנה אחד משפיע באופן כלשהו על משתנה אחר. מחקרים שמבוססים על השערות סיבתיות הם בד"כ קשים יותר לביצוע מאחר שהם מחייבים אותנו איזה משתנה קדם לשני. לפעמים כדי להוכיח שיש קשר בין 2 המשתנים צריך לתפעל את אחד מהם (במדעי החברה כמעט ולא נמצא השערות סיבתיות. ידיעת רצף ההתרחשות עוזרת לנו לקבוע את סוג היחסים בין המשתנים.

סוגי קשרים:

מערכי המחקר ושיטות לביצוע מחקרים- מערך המחקר מהווה את האסטרטגיה של המחקר, תכנון עקרוני איך יראה המחקר ואופן השגת המטרות.

יש 2 סוגי מערכים:

  1. מערך ניסויי- החוקר עצמו מתפעל את המשתנה הבלתי תלוי ע"מ לבדוק את התגובה במשתנה התלוי ולהוכיח קשרים סיבתיים. את המערך הזה מאפיינת העובדה שיש קב' ניסוי וקב' ביקורת.
  2. מערך מתאמי- הנבדקים מגיעים למחקר עם תכונות/עמדות שלהם והחוקר לא משפיע עליהם (הוא לא מתפעל) במהלך המחקר אלא רק בוחן ובודק אותם (משתני ייחוס).

מתי משתמשים במערך מתאמי ומתי בניסויי?

  1. מערך ניסויי- משתמשים כשרוצים ליצור תנאים מיוחדים במחקר שהנבדק לא בהכרח מגיע עמם למחקר, רוצים לשלוט על סדר הדברים- יוצרים תנאים לניסוי.
  2. מערך מתאמי- משתמשים במקרים שרוצים לבדוק קשרים בין משתנים כפי שהם במציאות, או כשיש דברים שא"א לתפעל (כמו מין).

איך אוספים נתונים?- ראיונות, תצפיות, שאלונים, ניתוח חומר קיים.

יש 3 סוגי מערכים:

  1. מערך איכותני- דבר הוליסטי וגדול, מחקר שנכנס לעומק, יותר תצפיות, תופעות רגשיות שלא ניתנות לצפייה, וכד'. יש ייחודיות לכל נבדק.
  2. מערך כמותי- סקר, בד"כ שאלון שמועבר להרבה אנשים, הכל מאוד מובנה וסגור, לוקחים דגימה. קל לניתוח, אך לא תמיד נותן את מגוון התשובות הרצויות.
  3. ניסויי- הרבה יותר מצומצם, בשליטת החוקר והוא מתפעל ויוצר שינויים (עושה מניפולציה) ואז בודק את התגובה.

מדידה-

ייחוס של מספרים לאובייקטים או לאירועים בהתאם לחוקים מסוימים. המספרים מקפים כמות, דרגה ועוצמה- תכונה מסוימת של האובייקטים.

סוגי דגימה אקראית:



סוגי דגימה לא אקראית:

סולמות מדידה: (כל סולם מכיל את הסולם שמתחתיו)

  1. סולם נומינלי- מהות המדידה בו היא שנותנים שם לאובייקטים או לערכים שונים של המשתנה. המהות שלו היא זהות או שוני בין הערכים (מספרים חסרי משמעות).
  2. סולם אורדינלי (סידורי)- יש משמעות לסדר שבו כתובים הערכים, יש משמעות למספרים (מידת שביעות רצון). אין יחס בין המשתנים וא"א לעשות פעולות חשבון.
  3. סולם אינטרוולי (רווח)- אפשר להקיש מהמספרים על זהות/שוני, סדר הערכים וההפרש בניהם (טמפרטורה). אין נק' 0 מוחלטת, כלומר ל- 0 יש משמעות (פעולות חיבור וחיסור).
  4. סולם רציונלי (יחס)- מלמד על זהות/ שוני, סדר הערכים, ההפרש ובנוסף על ה- 0 המוחלט. אפשר לעשות את 4 פעולות החשבון.

ההחלטה אם לבחור בסולם מסוים היא לא שרירותית.

איכות המדידה:

משתנה הטעות- ההפרש בין הערך האמיתי לערך הנצפה.

מדידה מהימנה- ככל שמרכיב הטעות קטן יותר. מדידה לא מהימנה- מרכיב הטעות גדול.

השונות בין המדידות מלמדת על הדיוק. ככל שהשונות של המדידות יותר גדולה- המדידה פחות מדויקת, פחות מהימנה. ככל שהמדידות דומות יותר- הטעות קטנה יותר והמהימנות גדולה יותר. מהימנות מוגדרת כיחס שבין השונות האמיתית לשונות הנצפית והיא מבוטאת באמצעות מקדמי מהימנות (בין 0 ל- 1).

דרכים לבדיקת מהימנות:

    1. יציבות המדידה/ מבחן חוזר- יוצאת מתוך נק' הנחה שמבחן מהימן יותר ככל שהמתאם בין מדידות שנעשו ב- 2 ההעברות שלו גבוה יותר (עושים את אותו מבחן פעמיים לפחות לאותו אדם). מבחן הטרוגני לדוג': מבחן וקסלר.

חסרונות: * אם יש בעיה עם שאלות מסוימות במבחן, המבחן החוזר לא יגלה אותם. * ההעברה הראשונה של השאלון משפיעה על איך האנשים יענו בפעם ה- 2, כי אנשים מנסים להיות עקביים. * שאלון שמודד ידע, כשאדם לומד/מתרגל הוא משפר את הציון שלו וזה לא ינבע מכך שהמבחן אל מדויק אלא בגלל הלמידה. * זה מרגיז ומתסכל לענות פעמיים על מבחן וזה ישפיע על מענה השאלון.

    1. אקוויוולנטיות (מקבילות)- משתמשים ב- 2 נוסחים מקבילים של המבחן ואם נמצא מתאם גדול בניהם המבחן מהימן. השאלות ב- 2 המבחנים צריכות להיות בעלי אותם אפיונים סטטיסטיים- זה מאוד קשה.
    2. א) עקביות פנימית (מקדם אלפא של קורנבאך)- יוצאת מהנחה שונה שהשאלות במבחן הן מדגם של שאלות אפשריות שמייצגות את התכונה הנמדדת,שכל אחד מהם וכולם יחד מיועדים למדוד את אותו משתנה. במקרה זה, המבחן מהימן יותר ככל שהמתאם בין פרטיו השונים גבוה יותר. הרעיון במבחן- שאם כל הפריטים בודקים תכונה אחת, הם אמורים להיות מאוד קשורים בניהם ואם לא יש בעיה בשאלון. יתרון וחיסרון- המבחן מועבר רק פעם אחת. לדוג': שאלון שחיקה לעובדים. מבחן הומוגני.

ב) מבחן חצוי (ספירמן בראון)- כאשר אין מידע על כל פריטי המבחן, מחלקים את המבחן ל- 2 ובודקים את המתאם בין 2 חלקי המבחן.

    1. מהימנות בין שופטים- כאשר צופים ישירות בהתנהגות, קביעת הציון במבחן כרוכה בשיקולים סובייקטיביים של השופט עצמו, לדוג': תצפיות, מבחנים השלכתים (הנחקר נדרש להגיב לגירוי עמום, השלמת מילים). אחת הדרכים המקובלות לבחון את גודל שונות הטעויות, הנובעת ממקור זה, היא לתת ליותר משופט/מעריך אחד לצפות ולהעריך את אותה התנהגות, ולבדוק את מידת ההלימה בין השיפוטים.

מתי משתמשים בסוגי מהימנות השונים?

    1. כאשר המבחן הומוגני, נבחר בעקביות פנימית- אלפא של קורנבך.
    2. כאשר השאלון הטרוגני- בודק מס' תכונות וכישורים, נעדיף להשתמש במבחן של יציבות המדידה, אין הנחה שצריכה להיות עקביות בין המדדים.
    3. כאשר יש מבחן שמבוסס על מגבלות זמן (פסיכומטרי), אין טעם לבדוק עקביות פנימית כי אין צפייה שאנשים יענו על כל המבחן ועדיף להשתמש במדד של יציבות המדידה או אקוויוולנטיות.
    4. אם יש תכונה שיציבה לאורך זמן, ניתן לבדוק באמצעות יציבות המדידה.

3 סוגי תוקף:

    1. תוקף ניבוי/ תלוי קריטריון- כאשר בודקים משתנה מסוים כדי לאמוד/ לנבא דרכו משתנה אחר. במקרה כזה מעריכים את תוקף המדידה לפי מידת הצלחתה באומדן או בניבוי. במקרה של תוקף הניבוי, מכשיר המדידה משמש כאומדן לערכי המשתנה המסוים.

סוגי תוקף ניבוי:

אחת הבעיות של תוקף ניבוי היא קיצוץ טווח, כלומר לא בודקים את כל האוכלוסייה.

מנבא= כלי. קריטריון= מה הוא רוצה לבדוק.

    1. תוקף תוכן- נותן מענה לשאלה עד כמה פריטי המבחן מייצגים את עולם התוכן אותו מעונינים לבדוק. מודד ביצוע באופן ישיר. כדי להבטיח תוקף תוכן יש להקפיד על: * ניתוח טוב של עולם התוכן שבו מעונינים. * אוסף מייצג של הפריטים מעולם תוכן זה. * בנייה טובה של המכשיר (המבחן, שאלון).
    2. תוקף מבנה- משתמשים בו כאשר אין הסכמה מלאה לגבי הגדרה אופרציונלית. רמזים לקיומו של תוקף מבנה:

תוקף מבנה מתחלק ל- 2:

כדי שלמבחן יהיה תוקף מבנה צריך שיהיה לו את שניהם.

במהימנות- מצפים שיהיו כמה שפחות טעויות במדידה (אמינות). יותר קל לבדוק במיוחד אם זו יציבות פנימית.

בתוקף- בודקים האם הכלי ממלא את ייעודו. דורש יותר עבודה מהמהימנות, לכן תמיד שאלות התוקף נפתרות בזמן פיתוח הכלי.

כשהמדידה פחות מדויקת היא בהחלט מורידה מתוקף הכלי ולא רק מהמהימנות (מהימנות נמוכה מעידה על תקפות נמוכה. לעומת זאת, כשכלי הוא מהימן (מדויק) שונות הטעויות קטנה, אין זה בהכרח שהוא לא תקף. כלי יכול להיות מהימן ולא תקף. מהימנות היא כלי הכרחי לתוקף אך לא מספק.


יחידה 3: הערכת טיבו של כלי מדידה


מדידה: "ייחוס מספרים לאובייקטים או אירועים בהתאם לחוקים מסוימים".

התכונה הנמדדת היא משתנה תיאורטי שמתאר את המציאות. ההגדרה האופרציונלית של המשתנה מאפשרת לייצג אמפירית את המשתנה התיאורטי.

מהימנות המדידה ותוקפה הם שני קריטריונים שעל-פיהם ניתן לשפוט את איכות המשתנה האופרציונלי שעליו מבוססת המדידה.

3.1 סולמות מדידה

המספרים המיוחסים לאובייקטים או לאירועים משקפים את הכמות, הדרגה או סוג התכונה של האובייקט.

קיימים ארבעה סולמות מדידה:

1. סולם שמי (נומינלי) – מספרים שונים מייצגים ערכים שונים של המשתנה, המספרים חייבים להיות שונים זה מזה (רווק-1, נשוי-2, גרוש-3, אלמן-4).

(טרנספורמציה שומרת זהות: כלל המתרגם מערכת מספרים אחת לשנייה, תוך הקפדה על שמירת זהות הערכים.)

2. סולם סדר – המספרים מבטאים את זהות הערכים (כסולם שמי) וגם את סדרם. (טרנספורמציה שומרת סדר: כלל המקשר בין מערכות מספרים שונות, השומרות על סדר ערכי המשתנה.)

3. סולם רווחים (אינטרוולי)- מבטאים, בנוסף לזהות המספרים וסדרם, את ההפרשים שבין הערכים. (טרנספורמציה ליניארית חיובית: כלל המקשר בין מערכות מספרים שונות, השומרת על זהות, סדר והפרש).

4. סולם מנה – סולם רווחים בו נקודת האפס מוחלטת (ניתן להסיק מהיחסים שבין המספרים). (טרנספורמציה כללית של הכפלה בקבוע חיובי לשם מעבר בין שתי מערכות מספרים).

סולמות המדידה מכתיבים:

לחוקר- את דרך עיבוד הנתונים (לדוגמא, חישוב ממוצע, סטיית תקן וכד' רק לנמדד בסולם רווח או מנה).

לקורא- את המשמעות שיש לתת למדדים השונים המדווחים במחקר.

3.2 מהימנות

הגדרה תיאורטית

הגדרת מהימנות מושלמת: מדידת ערכי משתנה בדייקנות מוחלטת, כאשר הערכים המתקבלים במדידה זהים לערכיו האמיתיים. לא ניתן למדוד את הערכים האמיתיים אך ניתן לאמודם על פי הערכים המתקבלים במדידה (ערכים נצפים):

משתנה טעות Xe (error) + משתנה אמיתי Xt(true)= המשתנה הנצפהXo (observed)

משתנה הטעות יכול להכיל טעות קבועה וטעות מקרית.

טעות קבועה: כאשר כל ערכי משתנה הטעות זהים ולכן שונות הטעות היא אפס.

טעות מקרית: (1) כאשר ערכי הטעות שונים זה מזה ולכן שונות הטעות שונה מאפס.

(2) תוחלת הטעות המקרית שווה אפס (הטעויות השונות מקזזות אחת את השנייה).

(3) המתאם בין משתנה הטעות למשתנה האמיתי הוא אפס. לא ניתן לנבא את גודל הטעות או כיוונה על סמך הציון האמיתי.

או לחילופין המהימנות שווה לאחד פחות היחס שבין שונות הטעויות לשונות הנצפית.

בצורה ציורית ניתן לתאר את המהימנות:

ייתכן שהדפדפן שלך אינו תומך בתצוגה של תמונה זו. ייתכן שהדפדפן שלך אינו תומך בתצוגה של תמונה זו. השונות הנצפית 2oייתכן שהדפדפן שלך אינו תומך בתצוגה של תמונה זו.

שונות טעויות

2eייתכן שהדפדפן שלך אינו תומך בתצוגה של תמונה זו.

ייתכן שהדפדפן שלך אינו תומך בתצוגה של תמונה זו. ייתכן שהדפדפן שלך אינו תומך בתצוגה של תמונה זו. ייתכן שהדפדפן שלך אינו תומך בתצוגה של תמונה זו. ייתכן שהדפדפן שלך אינו תומך בתצוגה של תמונה זו. ייתכן שהדפדפן שלך אינו תומך בתצוגה של תמונה זו. ייתכן שהדפדפן שלך אינו תומך בתצוגה של תמונה זו. שונות אמיתית
2tייתכן שהדפדפן שלך אינו תומך בתצוגה של תמונה זו.

ייתכן שהדפדפן שלך אינו תומך בתצוגה של תמונה זו.

מקדם המהימנות שווה ליחס בין השטח המקווקו לכלל שטח המלבן.

כשאין שום טעות מדידה, שונות הטעויות שווה לאפס, והשונות הנצפית שווה לשונות האמיתית. במקרה זה המהימנות תהיה מרבית וערך מקדם המהימנות יהיה אחד. כשכל השונות הנצפית מורכבת יותר משונות טעויות, ללא שונות אמיתית, המהימנות תהיה אפס. ככל שמרכיב שונות הטעויות גדל כך קטנה מהימנותו של המכשיר.

שורש המהימנות של המשתנה (rxo,xt) הנו חסם עליון למתאם בינו לבין כל משתנה נצפה אחר (rxo,yo). המתאם בין שני משתנים נצפים, X ן-Y, לא יהיה גבוה משורש המהימנות של X ומשורש מקדם המהימנות של X או של Y. שורש מקדם המהימנות הנמוך מבין השניים (של X ו-Y) הוא, אם כן, אומדן למתאם הגבוה ביותר האפשרי בין שני המשתנים הנצפים.
דוגמא: אם מקדם המהימנות הוא 0.87, שורש המקדם הוא 0.93. אם נחשב את המתאם בין Xo לבין כל משתנה נצפה אחר, נצפה שהמתאם לא יהיה גבוה מ 0.93. כל מתאם הנמוך מערך זה הנו אפשרי.

כיצד יש למדוד את המהימנות כשלמעשה אין דרך להעריך את גודל השונות האמיתית ואת חלקה בשונות הנצפית? להלן דרכים עקיפות...

הגדרות אופרציונליות

בכל השיטות לבדיקת מהימנות, שיופיעו להלן, ניתן להוכיח זהות מתמטית בין השיטה להגדרה התיאורטית של מהימנות. היחסים שיובאו שווים ליחס שבין השונות האמיתית לשונות הנצפית.

מהימנות כיציבות

הגדרה: מבחן מהימן יותר ככל שהמתאם בין המדידות, שנעשו בשתי העברות שלו, גבוה יותר. כלומר, יציבותן של המדידות לאורך זמן מלמדת שהיא אינה רגישה לשינויים במידת המוטיבציה של הנשאלים, מצב רוחם, במזג האוויר וכיוצא בזה.


חסרונות השיטה:

1. בשיטה זו לא בא לידי ביטוי אותו חלק בשונות הטעויות שנובע מבחירת השאלות. למשל כשהתכונה הנמדדת רגישה לסוג השאלות הנשאלות. אזי הנבדק מגיב אחרת לשאלות שונות הבודקות לכאורה את אותה תכונה ולכן מקבל ציונים שונים בתכונה הנמדדת. רגישות זו לא תתגלה במתאם בין שתי העברות של אותו מבחן עם אותן שאלות.

2. להעברה הראשונה של המבחן עלולה להיות השפעה על ההעברה השנייה (הנבדק זוכר חלק מתשובותיו, חושב שהוא זוכר, השפעת הזיכרון אינה אחידה לנבדקים).

מהימנות כאקוויוולנטית (מבחנים מקבילים)

הגדרה: ביסוס מקדם המהימנות על מתאם בין שני נוסחים מקבילים (אקוויוולנטים) של אותו מבחן.

הנוסחים צריכים למדוד את אותה התכונה ועליהם להיות בעלי תכונות סטטיסטיות דומות (מתקבלים משניהם התפלגות דומה של הציונים).

חסרונות השיטה:

1. גם בשיטה זו יתכן שההעברה הראשונה תשפיע על השנייה, אולם במידה פחותה להשפעה שבשיטת "היציבות". יתרונה העיקרי הוא ברגישות של המקדם לשונות שמקורה בדגימת השאלות.

2. קיים קושי לבניית נוסחים מקבילים בעלי תכונות סטטיסטיות זהות ולכן לא מרבים לעשות שימוש בשיטה.

מהימנות כעקיבות פנימית

מבוססת על ההנחה שהמבחן הוא מדגם של פריטים, שכל אחד מהם וכולם יחד מיועדים למדוד את אותו משתנה. לכן נצפה למתאמים גבוהים בין הציונים, זוהי עקיבות פנימית גבוהה.

ככל שהמתאמים בין הפריטים השונים גבוהים יותר כך המבחן מהימן יותר.

יתרון:

הסתפקות בהעברה חד פעמית של המבחן (מונעת בעיות מהשיטות האחרות).

חסרון:

המדד אינו רגיש לשונות הטעות הנובעת מהשפעות זמניות, כי המבחן מועבר רק פעם אחת.

החישוב לעקיבות הפנימית נעשה על ידי מבחן אלפא קרונבאך לחישוב מקדם המהימנות.

מבחן חצוי split-half method- כשאין מידע על כל פריטי המבחן, אומדים את העקיבות הפנימית שלו על ידי חישוב מתאם אחד בין שני חלקים של אותו מבחן. מחלקים את כל פריטי המבחן לשתי קבוצות ומחשבים את המתאם בין הציון הנצפה הסופי בחלק אחד לציון הנצפה הסופי בחלק השני בעזרת נוסחת ספירמן בראון (סימונה S-B).

מהימנות בין שופטים

כשלא ניתן למדוד את המשתנה הרצוי במבחן אובייקטיבי יש לצפות ישירות בהתנהגותו. הצופה מעבד את התנהגות הנבדקים ומעריך אותה על פי סולם כלשהו. בניגוד למבחנים הקודמים, כאן נתינת הציון כרוכה בשיפוט אנושי ורק לאחריו ניתן הציון למשתנה הנמדד. חסרונות השיטה:

1. קיימת בעיה של סובייקטיביות.

2. נוסף מרכיב של שונות טעויות הנובע מהשופט עצמו כגון חוסר עקביות במתן הציונים, אינו מגדיר כהלכה את התכונה הנמדדת ועוד.

ניסיון להתגבר על הבעייתיות שבשיטה היא לתת ליותר משופט אחד לתת ציון, ולבדוק את מידת ההלימה בין השיפוטים. ככל ששיפוטיהם קרובים זה לזה כך מרכיב הטעות שנובע מן השופט עצמו קטן יותר. כשיש סכנה ששונות הטעויות הנובעת מן השופט עצמו גדולה, מחשבים מדד מהימנות הקרוי מהימנות בין השופטים על ידי מתאם בין שני שופטים (אם יש יותר משני שופטים מחשבים מדד לכל זוג שופטים).

באיזה מדד לבחור?

סוג המדידה או המבחן והמטרה שלשמה מחשבים את המהימנות הם הקובעים באיזה מדד כדאי להשתמש.

מבחן הומוגני או הטרוגני? מבחן הומוגני כשכל פריטיו נועדו למדוד גורם יחיד, מצפים שיהיה מהימן במובן של עקיבות פנימית. או מבחן הטרוגני שפריטיו מיועדים לבחון היבטים שונים של תופעה מסוימת, בודק כמה תכונות או קשרים. בהטרוגני יש לבדוק יציבות.

מבחן מהירות או כושר? מבחני מהירות מוגבלים בזמן ולא כולם מספיקים לסיימם לכן אין לבדוק בהם עקיבות (המתאם בין הפריטים הראשונים לאחרונים נמוך) ומדדי המהימנות הרלוונטיים הם יציבות ואקוויוולנטיות.

העקיבות הפנימית של המבחן היא אולי הביטוי הקרוב ביותר למשמעות התיאורטית של המהימנות. ומלמדת, יותר מהשיטות האחרות, עד כמה הערך שהתקבל קרוב לערך שהנבדק היה מקבל לו היה לנו מדד מושלם.

גובה המתאם בין נוסחים מקבילים מצביע, בין היתר, על מידת התלות של תוצאות המדידה בתוכן הייחודי של פריטי המבחן (דגימת השאלות).

אין בהכרח קשר בין עקיבות פנימית ליציבות, אולם בדרך כלל ישנו קשר בין עקיבות פנימית לאקוויוולנטיות. אם יש מתאם פנימי בין פריטי המבחן השונים, אפשר לצפות למתאם בין פריטים אלו לבין מערך פריטים מקביל. אם העקיבות הפנימית גבוהה בהרבה מן האקוויולנטיות סימן שיש הבדלי תוכן משמעותיים בין שני הנוסחים. או לחילופין הבדל בביצוע בין ההעברות.

קיימת הסכמה שמקדמי מהימנות הנמוכים מ- 0.8 אינם רצויים.

3.3 תוקף (המדידה)

הגדרה תיאורטית

הגדרה: כמה כלי הבדיקה מודד את מה שהוא אמור למדוד, מידת ההלימה שבין המשתנה התצפיתי למשתנה התיאורטי.

תוקף הוא מונח יחסי. שאלה: האם המדידה תקפה? תשובה: תקפה למה?

הגדרות אופרציונליות- סוגי תוקף

להלן שלוש הגדרות לתקוף, המייצגות שלוש סוגים שונים של תוקף:

תוקף ניבוי

הגדרה: התוקף יקבע לפי מידת ההצלחה בניבוי משתנה אחד על פי מדידת המשתנה האחר (נקרא גם תוקף קריטריון. קריטריון הנו המשתנה אותו רוצים לנבא). כדי לאמוד את תוקף הניבוי של מכשיר המדידה מחשבים את המתאם בין ציוני מכשיר המדידה לבין ציוני הקריטריון. ככל שמדד הקשר גבוה כך גם תוקף הניבוי גבוה.

במקרה של תוקף מנבא, מכשיר המדידה משמש כאומדן לערכי המשתנה המסוים.

קיימים שלושה אפשרויות מדידה (אך אין חשיבות לסדר שבו נאספו הנתונים): הקריטריון נמדד לפני המשתנה המנבא (תוקף לאחר מעשה); כשהקריטריון והמשתנה המנבא נמדדים בו זמנית (תוקף מקביל); כשהקרטריון נמדד לאחר מדידת המשתנה המנבא.

בדרך כלל אין לצפות לערכי תוקף גבוהים במדעי החברה, עקב מורכבות בני אדם. אך גם לערכים נמוכים יכול להיות ערך רב, אם מתייחסים למדד התוקף כמבטא שיפור בניבוי לעומת מצב שבו אין משתמשים בשום מכשיר מדידה.

עיקר חשיבותו המעשית של תוקף ניבוי הוא בבעיות שביישום מבחני מיון שונים.

תוקף ניבוי לרוב אינו ממצה את עיקר המשמעות של תוקף. כמו כן לעיתים ישנה בעיה להעריכו עקב ספקות באשר למידת המהימנות או התוקף של הקריטריון עצמו.

תוקף תוכן

המידה שבה המבחן מייצג את עולם התוכן שבו מעונין החוקר. את עולם התוכן ניתן לחלק לשטחות. המבחן יכלול שאלה שכוללת מרכיב מכל אחת מהשטחות.

בכדי להבטיח תוקף תוכן בשיטה זו, א) עיקר המאמץ מוקדש לניתוח יסודי של עולם התוכן. ב) אוסף מייצג של פריטים מעולם תוכן זה (תוך התייחסות לשטחות השונות ולמרכיביהן) ג) בנייה טובה של המבחן/שאלון.

בדיקת תוקף תוכן מתבססת בעיקר על הגיון ולא על סטטיסטיקה. השיפוט של המבחן היא ההתרשמות מן המידה שבה הוא מייצג את עולם התוכן הרצוי.

תוקף מבנה

הגדרה: כאשר רוצים לתקף מכשיר מדידה, ההגדרה האופרציונלית, שנועד למדוד משתנה תיאורטי (מבנה הוא מונח נרדף ל"משתנה תיאורטי").השאלה הנשאלת היא מהי מידת ההלימה בין המשתנה התצפיתי למשתנה התיאורטי?

הקושי לתקף מדדי משתנים גדל ככל שפוחתת ההסכמה לגבי הגדרתם האופרציונלית. מדובר במספר שיטות לגלות תוקף מבנה ובחירת השיטה למקרה הפרטי תלויה בתיאוריה שבה מעוגן המשתנה התיאורטי.

דרכים למדידת תוקף מבנה:

חקר מתאמים- התיאוריה שבה מעוגן המבנה מכתיבה, לעיתים קרובות, אלו קשרים ניתן לשער שקיימים בין המשתנה הנמדד למשתנים האחרים.

חקר הבדלים בין קבוצות – התיאוריה מנבאת הבדלים בין שתי הקבוצות בתוצאות המדידה. מציאת הבדלים אלו תומכת בתוקף המבנה של המכשיר.

תוקף הניבוי כחלק מתוקף המבנה – החישובים הסטטיסטים שנועדו לבדוק תוקף ניבוי הם חלק מהתהליך הקשה והמורכב יותר של בדיקת תוקף המבנה של המכשיר.

בדיקת מהימנות כחלק מתוקף מבנה- התיאוריה שבה מעוגן המשתנה הנמדד מכתיבה את מידת העקיבות הפנימית של פריטי המבחן והיציבות של תוצאותיו לאורך זמן. אלו יתרמו לתוקף המבנה.

בכדי לענות על שאלת תוקף המבנה יש לענות על שתי שאלות ספציפיות:

תוקף מתכנס: באיזו מידה המשתנה התצפיתי ממצה את מרכיבי המשתנה התיאורטי? (מיצוי)

תוקף מבחין: באיזו מידה המשתנה התצפיתי בודק רק את מרכיבי המשתנה התיאורטי? (בלבדיות)

בכדי לבחון תוקף מתכנס יש לבדוק את מידת החפיפה בין מכשיר מדידה אחד (משתנה ב"ת) לבין מכשיר מדידה נוסף, האמורים לבחון את אותו משתנה תלוי (תאורטי). נרצה לבחון את המיצוי על ידי מבחנים שונים ככל האפשר. למרות השוני נצפה למתאם גבוה, אם שניהם אכן בודקים את אותו המשתנה, אזי שני המדדים מתכנסים ושניהם בעלי תוקף מתכנס(אם נבחר מבחנים דומים מאד המתאם הגבוה שיתקבל ילמד יותר על מהימנות המבחן מאשר על התוקף המתכנס).

בכדי לבדוק שהמכשיר אינו מודד משתנים אחרים (בעל תוקף מבחין) יש לקבל מתאם נמוך בינו לבין המבחן האחר. (יש לחשוב על משתנים אחרים שחשוב להבחינם מן המשתנה הנמדד).

לדוגמא ניתן לבחון את התוקף המתכנס על ידי המתאם שבין שתי שיטות מדידה (ראיון ושאלון) שמודדות את אותו משתנה. ותוקף מבחין בין שני שאלונים (שתי הגדרות אופרציונליות) שמודדים משתנה שונה.

מטריצה מרובת תכונות ושיטות:

דוגמא: המתאמים בין העמדות כלפי האב, המעביד והחבר, כפי שנמדדו באמצעות ראיון ושאלון

ראיון שאלון
אב מעביד חבר אב מעביד חבר
ראיון אב
מעביד 0.64
חבר 0.65 0.76
שאלון אב 0.40 0.08 0.09 0.24
מעביד 0.19 0.10- 0.03- 0.23 0.34
חבר 0.27 0.11 0.23 0.21 0.45 0.55

לפי הפינה הימנית התחתונה:

  1. לעמדות כלפי המעביד אין תוקף מתכנס (0.10-=r), לכן אין לדבר על תוקף מבחין.
  2. לעמדות כלפי חבר אין תוקף מתכנס ואין תוקף מבחין. המתאם בין חבר בשאלון לאב בראיון הוא 0.27 אין תוקף מבחין, והוא אף גבוה מהחבר בשאלון לבין החבר בראיון 0.23, אין תוקף מתכנס.
  3. רק למדידת אב יש הוכחות לתוקף מתכנס (0.40 בין אב לאב בשאלון ובראיון) ולתוקף מבחין בין שיטות שונות (מתאם נמוך בין אב בראיון למעביד בשאלון 0.19, בין אב בראיון לחבר בשאלון 0.27).

תוקף המבנה ובדיקת התיאוריה

כשממצאי המחקר עומדים בסתירה לניבוי,שנבע מהתיאוריה שבה מעוגן המשתנה הנחקר, ניתן להסיק:

  1. המבחן (הניסוי, המכשיר) אינו מודד את המשתנה הנחקר ולכן אינו תקף.
  2. המערכה התיאורטית מוטעית.
  3. מערך המחקר (הניסוי) אינו בודק את ההשערה כראוי. (היו שיבושים במהלך העברת השאלון, סיכום הציון הסופי וכדומה).

הקשר שבין תוקף למהימנות:

ככל שגדל מרכיב שונות הטעויות בציונים המתקבלים במכשיר מסוים, כך קטנה מהימנותו של המכשיר. שורש המהימנות של המכשיר הוא חסם עליון לכל מתאם אפשרי בין הנתונים המתקבלים מאותו מכשיר לבין נתוניו של כל משתנה אחר. בפרט, שורש המהימנות הוא חסם עליון לכל מתאם שמחשבים לצורך תיקוף המכשיר. לכן, ככל שגדלה שונות טעויות כך קטנה המהימנות ותוקף המכשיר. לעומת זאת, אומנם שונות טעיות קטנה מבטיחה את מהימנות המכשיר אך לא את תוקפו.

משמע: מהימנות היא תנאי הכרחי אך לא מספיק לתוקף.

סיכום:

יש לבנות את הכלי ולבחון אותו טרם איסוף הנתונים ולא במדגם המחקר. יש להיזהר משימוש בכלים קיימים ולבדוק את המהימנות והתוקף עבור אוכלוסיית המחקר החדש. ללא תוקף, מסקנות המחקר יעורערו (הסבר חלופי שכיח נוגע בתוקף המדידה).

*
Locations of visitors to this page