סטטיסטיקה למתקדמים

בדיקת השערות באמצעות מדגם של מקרה יחיד מהאוכלוסיה - דוגמא

בדיקת השערות באמצעות מדגם של מקרה יחיד מהאוכלוסיה - דוגמא

חוקר רפואי טוען שפיתח תרופה להגבהת ילדים בני 10 בצורה משמעותית.
לראיה הוא הביא את יוסי, ילד בן 10 שקיבל את התרופה, ושגובהו היה 135 ס"מ.
ידוע שגובהם של ילדים בני 10 מתפלג נורמלית עם תוחלת של 120 ס"מ (μ=120) וסטיית תקן של 10 ס"מ (σ=10).
הסטטיסטיקאים היו מעוניינים לבדוק האם התרופה אכן תורמת להגבהה.

תרשים 6.5 – התפלגות הגובה של ילדים בני 10 ומיקומו של יוסי

התפלגות הגובה של ילדים בני 10 ומיקומו של יוסי

בפני הסטטיסטיקאים עומדות 2 השערות:

  1. ההשערה הבסיסית המכונה השערת ה- 0 (מסומנת H0):
    השערה זו מאמצת את הגישה שהתרופה איננה גורמת להגבהה, ותוחלת הגובה של ילד שקיבל את התרופה יהיה 120 ס"מ (כמו אצל ילדים שלא קיבלו את התרופה).
  2. ההשערה הנגדית (מסומנת H1):
    השערה זו מאמצת את הגישה שהתרופה תורמת לעליה בגובה, ותוחלת הגובה של ילד שקיבל את התרופה יהיה גדול מ-120 ס"מ.

על הסטטיסטיקאים להחליט מי משתי ההשערות מקבלת תמיכה סטטיסטית.

מכיוון שההשערה הנגדית טוענת כי התרופה גורמת להגבהה יציבו הסטטיסטיקאים קו אדום אחד מימין לתוחלת, כאשר תחום הסביר יהיה משמאל לקו האדום והתחום החריג יהיה מימין לקו האדום.

  • קבלה של השערת ה-0: אם הגובה של יוסי (135 ס"מ) יהיה בתחום הסביר הסטטיסטיקאים יטענו שהשערת ה-0 היא הנכונה ושהתרופה איננה מגביהה.
  • דחיה של השערת ה-0: אם הגובה של יוסי יהיה בתחום החריג, יטענו הסטטיסטיקאים כי ניתן לדחות את השערת ה-0, וכי התרופה גורמת לעליה בגובה.  

הסטטיסטיקאים החליטו לבדוק את ההשערה ברמת מובהקות של 5%, ולכן הקו האדום ימוקם 1.64 סטיות תקן מימין לתוחלת כלומר בערך 136.4 ס"מ `(136.4=10*1.64+120)` .

התחום הסביר יכיל את כל הערכים שמתחת ל-136.4 ס"מ, והתחום החריג יכיל כל הערכים שמעל 136.4 ס"מ. הגובה של יוסי, שהוא 135 ס"מ, נמצא בתוך האזור הסביר, ולכן הסטטיסטיקאים יקבלו את השערת ה-0 (יחליטו שהשערת ה-0 היא הנכונה, והתרופה לא גורמת להגבהה).

תרשים 6.6

בדיקת השערות 

אילו הסטטיסטיקאים היו מחליטים לבדוק את ההשערה ברמת מובהקות של 10%, הקו האדום היה ממוקם 1.28 סטיות תקן מימין לתוחלת כלומר בערך 132.8 ס"מ `(132.8=10*120+1.28)`  

במקרה זה, התחום הסביר מכיל את כל הערכים שמתחת ל-132.8 ס"מ, והתחום החריג מכיל את כל הערכים שמעל 132.8 ס"מ. הגובה של יוסי, שהוא 135 ס"מ, נמצא הפעם בתחום החריג ולכן הסטטיסטיקאים ידחו את השערת ה-0 (יקבעו שהתוצאה איננה סבירה, כלומר ההשערה הנגדית היא הנכונה והתרופה גורמת להגבהה).

כפי שניתן לראות ההחלטה אם השערת ה-0 נכונה או לא נכונה איננה מוחלטת, וברמות מובהקות שונות ניתן לקבל תוצאות שונות (נתייחס לעניין זה בהמשך).

בדיקת השערות באמצעות מדגם של מקרה יחיד מהאוכלוסיה – תאור כללי

נתאר את הפעולות שביצעו הסטטיסטיקאים:

  1. הגדרה של השערת ה-0 (0H)
    השערת ה-0 מייצגת את הגישה שאין סטייה מהתוחלת של המצב המקורי, כלומר ששינוי כלשהו (שבוצע ע"י חוקר או שקרה מעצמו) אינו משפר ואינן מרע את המצב הקיים (למשל, שהתרופה לא גורמת לשינוי בתוחלת הגובה).
    השערת ה- 0 היא ההשערה המועדפת על הסטטיסטיקאים, וכל עוד לא ניתן לסתור אותה באמצעות מבחנים סטטיסטים, מקבלים אותה.
  2. הגדרה של ההשערה הנגדית (1H)
    ההשערה הנגדית מייצגת גישה שונה מהשערת ה- 0. ההשערה הנגדית קובעת אם השינוי מגדיל את התוחלת, או מקטין את התוחלת, או משנה את התוחלת בלי להחליט על כיוון השינוי (למשל, שהתרופה גורמת לגידול בתוחלת הגובה).
    ההשערה הנגדית מתקבלת כאשר השערת ה- 0 אינה מקבלת תמיכה סטטיסטית, והסטטיסטיקאים נאלצים לדחות אותה.
  3. ביצוע מדגם וקבלת תוצאה מהמדגם
    דוגמים מקרה אחד מתוך האוכלוסיה שבה היה שינוי (שינוי שבוצע ע"י החוקר או שקרה מעצמו), ומתקבלת תוצאה (בדוגמא שלעיל, תוצאת המדגם היא הגובה של יוסי, 135 ס"מ).
  4. החלטה על רמת מובהקות וקביעת הקווים האדומים
    -אם לפי ההשערה הנגדית התוחלת גדולה מהתוחלת המקורית יהיה קו אדום אחד מימין לתוחלת המקורית.
    -אם לפי ההשערה הנגדית התוחלת קטנה מהתוחלת המקורית יהיה קו אדום אחד משמאל לתוחלת המקורית.
    -אם לפי ההשערה הנגדית התוחלת שונה מהתוחלת המקורית (ללא קביעה אם גדולה או קטנה) יהיו שני קווים אדומים. המיקום המדוייק של הקווים יקבע לפי רמת המובהקות, שקובעת מיקום הקווים האדומים בסטיות תקן, ובגודל של סטיית התקן של המשתנה.
  5. בדיקת מיקום תוצאת המדגם ביחס לקווים האדומים
    אם תוצאת המדגם הינה בתחום הסביר, מקבלים את השערת ה-0. אם תוצאת המדגם הינה בתחום החריג, דוחים את השערת ה-0 ומקבלים את ההשערה הנגדית. 

בדיקת השערות באמצעות מדגם של מקרה יחיד מהאוכלוסיה - דוגמא550בדיקת השערות באמצעות מדגם של מקרה יחיד מהאוכלוסיה - דוגמא