סטטיסטיקה למתקדמים

טעויות בקבלת החלטות - לקבל או לדחות השערת אפס

ישנן 2 סוגי טעויות שאנו יכולים לעשות בשעה שאנו מקבלים החלטה.

טעות מסוג ראשון
בדוגמא שלעיל, אנו יכולים לדחות את השערת ה- 0 ולקבל את טענת החוקר שהתרופה מגביהה, למרות שבפועל הדבר איננו נכון.
הטעות אפשרית מהסיבה הפשוטה שבהתפלגות הגובה של ילדים בני 10 ישנם תמיד ילדים שגובהם הוא בתחום החריג. וכל פעם שנמדוד ילד כזה נחליט לדחות את השערת ה- 0.

טעויות בקבלת ההחלטה

לדוגמא אם שטח התחום החריג הוא 10% מההתפלגות (השטח האפור בתרשים) אזי  10% מהילדים נמצאים בתחום הזה, והסיכוי לעשות טעות הוא 10%.

טעות מסוג שני
יתכן מאוד שהחוקר אכן מצליח להגביה את הילדים, לדוגמא הוא מגביה כל ילד ב - 3 ס"מ, אך אנו בכל זאת נחליט לקבל את השערת ה – 0, ולדחות את טענתו.
וההסבר: נניח שהתפלגות A בתרשים 6.8 משקפת את התפלגות הגובה של ילדים לפני קבלת התרופה.
מאפייני ההתפלגות הם: התפלגות נורמלית, עם תוחלת של 120 ס"מ (μ=120), ועם סטיית תקן של 10 ס"מ (σ=10). או בקיצור: (120,10)N .
אם אכן החוקר יכול להגביה כל ילד ב - 3 ס"מ אזי התפלגות הגובה של הילדים בני 10 שקיבלו תרופה תהיה התפלגות B, שמאפייניה הם: התפלגות נורמלית, עם תוחלת של 123 ס"מ ׁ(μ=123) לעומת 120 ס"מ בהתפלגות A, ועם סטיית תקן של 10 ס"מ (σ=10) כמו בהתפלגות A. או בקיצור:(123,10)N .

 תרשים 6.8

 טעות מסוג שני     

לאור זאת, ייתכן שנערוך מדידה לילד בשם דוד שעבר טיפול וגובהו עכשיו 129 ס"מ.

אך במתכונת קבלת ההחלטות שלנו, שמתבצעת על בסיס התפלגות A, נקבל למרבה הצער את השערת ה- 0. שכן הגובה של דוד נופל באזור הסביר ונדחה את טענת החוקר, שתרופתו אכן עוזרת.

 

בדיקת השערות באמצעות מדגם של מספר מקרים מהאוכלוסיה – דוגמא

הדרך המקובלת לקבלה או דחייה של השערת ה- 0 היא באמצעות עריכת מדגם על מספר מקרים באוכלוסיה.

נתייחס לדוגמת המדען הטוען שהצליח לפתח תרופה שמגביהה את הילדים. ההשערות הנבחנות הן:

השערת ה- 0 – התרופה אינה יעילה. כלומר, התפלגות הגובה של הילדים שקיבלו את התרופה אינה שונה מזו של כלל הילדים בני 10, שמאפייניה: (120,10)N .
ההשערה הנגדית – התרופה יעילה. כלומר, התפלגות הגובה של הילדים שקיבלו את התרופה  שונה מזו של כלל הילדים בני 10.

הגובה הוא משתנה הבסיס ונסמלו ב- B1.

הסטטיסטיקאי עורך מדגם המכיל 25 ילדים שקיבלו את התרופה ומחשב את גובהם הממוצע.
התוצאה שהתקבלה: 134 ס"מ.

התוצאה היא תוצאה של משתנה הממוצע של מדגם בגודל 25. נסמל את משתנה הממוצע ב- B25.
המשתנים: B1 ו- B25 שייכים לאותה משפחה.
אנו בודקים את השערת ה- 0 באמצעות משתנה המדגם – B25, שהפרמטרים שלו ידועים מראש.
התוחלת שלו שווה לתוחלת של B1, כלומר 120 ס"מ.
סטיית התקן שלו (של B25) שווה ל- 2 ס"מ, (לתזכורת, הסבר בע״מ 13,14), `[Sigma/sqrt(25)=10/5=2]`
``

אם נחליט שרמת המובהקות של 5%, ימוקם הקו האדום 1.64 סטיות תקן מימין לתוחלת כלומר בערך 123.28 ס"מ `(123.28=2*1.64+120)` . התחום הסביר יכיל את כל הערכים שמתחת ל-123.28 ס"מ, והתחום החריג יכיל כל הערכים שמעל 123.28 ס"מ. ערכו של המשתנה מהמדגם, שהוא 134 ס"מ, נמצא בתחום החריג, ולכן נדחה את השערת ה-0 (נחליט שההשערה הנגדית היא הנכונה, והתרופה גורמת להגבהה).

בדיקת השערות באמצעות מדגם של מספר מקרים מהאוכלוסיה – תאור כללי

נתאר את הפעולות הנדרשות:

  1. הגדרה של השערת ה-0 (H0)
    השערת ה-0 מייצגת את הגישה שאין סטייה מהתוחלת של המצב המקורי, כלומר ששינוי כלשהו (שבוצע ע"י חוקר או שקרה מעצמו) אינו משפר ואינן מרע את המצב הקיים (למשל, שהתרופה לא גורמת לשינוי בתוחלת הגובה).
    השערת ה- 0 היא ההשערה המועדפת על הסטטיסטיקאים, וכל עוד לא ניתן לסתור אותה באמצעות מבחנים סטטיסטים, מקבלים אותה.
  2. הגדרה של ההשערה הנגדית (H1)
    ההשערה הנגדית מייצגת גישה שונה מהשערת ה- 0. ההשערה הנגדית קובעת אם השינוי מגדיל את התוחלת, או מקטין את התוחלת, או משנה את התוחלת בלי להחליט על כיוון השינוי (למשל, שהתרופה גורמת לגידול בתוחלת הגובה).
    ההשערה הנגדית מתקבלת כאשר השערת ה- 0 אינה מקבלת תמיכה סטטיסטית, והסטטיסטיקאים נאלצים לדחות אותה. 
  3. ביצוע מדגם וקבלת תוצאה מהמדגם
    דוגמים מספר מקרים מתוך האוכלוסיה שבה היה שינוי (שינוי שבוצע ע"י החוקר או שקרה מעצמו), מחשבים ממוצע של המדגם ובנוסף מחשבים את סטיית התקן של משתנה הממוצע.
    בדוגמא שלעיל סטיית התקן של משתנה הבסיס נתונה, 10 ס"מ, ונתון גודל המדגם, 25 ילדים. מנתונים אלה חישבנו את סטיית התקן של הממוצע, 2 ס"מ.
  4. החלטה על רמת מובהקות וקביעת הקווים האדומים
    -אם לפי ההשערה הנגדית התוחלת גדולה מהתוחלת המקורית יהיה קו אדום אחד מימין לתוחלת המקורית.
    -אם לפי ההשערה הנגדית התוחלת קטנה מהתוחלת המקורית יהיה קו אדום אחד משמאל לתוחלת המקורית.
    -אם לפי ההשערה הנגדית התוחלת שונה מהתוחלת המקורית (ללא קביעה אם גדולה או קטנה) יהיו שני קווים אדומים.
    המיקום המדוייק של הקווים יקבע לפי רמת המובהקות, שקובעת מיקום הקווים האדומים בסטיות תקן, ובגודל של סטיית התקן של משתנה הממוצע.
  5. בדיקת מיקום תוצאת המדגם ביחס לקווים האדומים
    אם תוצאת המדגם הינה בתחום הסביר, מקבלים את השערת ה-0. אם תוצאת המדגם הינה בתחום החריג, דוחים את השערת ה-0 ומקבלים את ההשערה הנגדית.

 

דוגמא לשאלה

ידוע כי ההתפלגות של משקל דג בכנרת הינה נורמלית בעלת תוחלת של 1,000 גרם וסטיית תקן של 50 גרם. זה יהיה משתנה הבסיס שלנו, ונסמלו D1.
חוקר טוען, כי בשל ההתחממות הגלובלית השתנה משקלם של הדגים, אך הוא איננו יודע אם הוא עלה או ירד.
במדגם המכיל 625 דגים, עלה כי המשקל הממוצע הוא 1,010 גרם. זהו ערכו של משתנה הממוצע, שנסמלו D625.
ברמת מובהקות של 5%, האם המשקל אכן השתנה כפי שטוען החוקר, או שההתחממות הגלובלית לא השפיעה על משקל הדגים והחוקר טועה?

 

פתרון השאלה:

השערת ה-0 היא שהמשקל לא השתנה והתוחלת היא עדיין 1,000 גרם.
ההשערה הנגדית היא שהמשקל השתנה והוא כבר איננו 1,000 גרם.
לפי ההשערה הנגדית יהיו שני קווים אדומים (כי לפי ההשערה לא ידוע אם המשקל עלה או ירד). לפי רמת המובהקות, שהיא 5%, יהיו הקווים האדומים במרחק של 1.96 סטיות תקן מהתוחלת, גם לצד ימין וגם לצד שמאל.
סטיית התקן של משתנה הממוצע  D625 היא 2 גרם `[50/sqrt(625)=50/25=2]` .
הקו האדום שמימין לתוחלת ימוקם ב-1,003.92 גרם `(1003.92 = 2*1.96 + 1000)` .
הקו האדום שמשמאל לתוחלת ימוקם ב-996.08 גרם `(996.08 = 2*1.96 - 1000)` .
התחום הסביר נמצא בין 996.08 גרם לבין 1,003.92 גרם. ערכים שמתחת 996.08 גרם וערכים שמעל 1,003.92 גרם נמצאים בתחום החריג.
מהמדגם קיבלנו ערך של 1,010 גרם. ערך זה נמצא בתחום החריג ולכן אנו דוחים את השערת ה-0, וקובעים כי משקל הדגים בכנרת השתנה.


דוגמא נוספת לשאלה

מקובל להניח שמשך החיים של עכבר מתפלג נורמלית עם תוחלת של 30 ימים (μ=30) וסטיית תקן של 6 ימים (σ=6). משך החיים של עכבר הוא משתנה הבסיס, שנסמלו D1.
חוקר טוען שהצליח, באמצעות תוסף מזון, להאריך את משך חייהם של עכברים.
לבדיקת טענתו אנו נערוך ניסוי שבו ניתן לקבוצה של 9 עכברים את התוסף, ונחשב את הממוצע של משך החיים שלהם. זהו משתנה הממוצע, שנסמלו D9.
במסגרת הניסוי אנו נבחן את השערת ה- 0, לפיה התוסף לא יעיל, בהנחת מובהקות של 10% (שטח הפעמון בתחום החריג הוא 10%).
התקבל שממוצע משך החיים בקבוצה של 9 העכברים היה 34. האם התוסף מעלה את משך החיים של עכברים?

 

פתרון השאלה:

מהנתונים שלעיל נדרש לקבוע קו אדום אחד מימין לתוחלת (כי ההשערה הנגדית קובעת כי משך החיים גדל). הקו האדום יהיה במרחק של 1.28 סטיות תקן מהתוחלת (כי רמת המובהקות היא 10%). גודל סטיית התקן של משתנה הממוצע, D9, הוא יומיים `[6/sqrt(9)=6/3=2]` . מכאן, שהקו האדום ימוקם בערך של 32.56 ימים `(32.56 = 2*30+1.28)` .
ערך משתנה הממוצע, 34 ימים, נמצא בתחום החריג, כפי שמוצג בתרשים 6.9.

תרשים 6.9 – התפלגות משך החיים הממוצע של 9 עכברים

התפלגות משך החיים הממוצע של 9 עכברים

מהתרשים ניתן ללמוד כי משך חיים ממוצע של 34 ימים הינו חריג ביחס למצופה באוכלוסיה שלא קיבלה את התוסף. אנו דוחים את השערת ה-0, ומקבלים את טענת החוקר, שהיא הטענה הנגדית.

טעויות בקבלת החלטות - לקבל או לדחות השערת אפס573טעויות בקבלת החלטות - לקבל או לדחות השערת אפס