לא ניתן לסמוך על אומדן מסויים.

ידוע כי משקל הדגים בכנרת מתפלג נורמלית, עם סטיית תקן 500. התוחלת לא ידועה ועלינו למצוא אותה.
לא נוכל למצוא בדיוק את התוחלת מכיוון שלשלם כך, עלינו לדוג את כל אוכלוסיית הדגים בכנרת, לשקול אותם, ולחשב את הממוצע. דבר זה אינו ישים.
עם זאת נוכל להשתמש במדגם של 100 דגים, שאותם נשקול ואת הממוצע שלהם נחשב. הממוצע של המדגם הוא אומדן לתוחלת.
נניח שעשינו זאת וגילינו שממוצע המשקל של 100 דגים הוא 1,100 גרם.
כלומר, האומדן שלנו לתוחלת הוא 1,100 גרם.
האם יכול להיות ש-1,100 גרם הוא בדיוק התוחלת?
יכול להיות, אבל ההסתברות לכך היא אפסית.
אם כן, מה ההסתברות שהטענה “התוחלת של משקל דג בכנרת היא 1,100 גרם” היא טענה נכונה? ההסתברות לכך היא 0, ואנחנו לא יכולים לסמוך על הטענה.


ניתן לסמוך על מרווח.

במקום לטעון שהתוחלת היא מספר מסויים נוכל לטעון שהתוחלת נמצאת במרווח מסויים של מספרים, למשל במרווח שבין 1,090 גרם לבין 1,110 גרם (שימו לב שהממוצע שמצאנו נמצא באמצע תחום זה). על טענה זו אנו כבר יכולים לסמוך, אבל כמובן לא ב-100%. בהמשך נלמד לחשב מה ההסתברות שהתוחלת נמצאת במרווח זה.

הערך הקטן במרווח נקרא הגבול התחתון.
במקרה שלנו 1,090 גרם הוא הגבול התחתון. הערך הגדול במרווח נקרא הגבול העליון. במקרה שלנו 1,110 גרם הוא הגבול העליון.

אם נגדיל את הגבול העליון ל-1,200 גרם, ונקטין את הגבול התחתון ל-1,000 גרם, נקבל מרווח גדול יותר (בין 1,000 גרם לבין 1,200 גרם), ההסתברות שהתוחלת נמצאת במרווח זה היא גדולה יותר מהמרווח הקודם שהצגנו.

 

כיצד נוכל לדעת כמה אנחנו יכולים לסמוך על מרווח?

נתווה פעמון שהמרכז שלו הוא האומדן שמצאנו.
השטח של הפעמון שנמצא בתחום של המרווח נותן לנו את התשובה לשאלה כמה אנחנו יכולים לסמוך על המרווח.
דוגמא
כמה ניתן לסמוך על המרווח שבין 1,090 גרם לבין 1,110 גרם?
נתווה פעמון שמרכזו ב-1,100 גרם, נסמן על הציר האופקי את גבולות המרווח, ונתבונן בשטח של הפעמון במרווח זה:


פעמון זה מייצג את משתנה הממוצע. מכיוון שסטיית התקן של משקל דג בודד הוא 500, ובמדגם היו 100 דגים, סטיית התקן של משתנה הממוצע היא (ראה הסבר בע״מ 13 סעיף [2]) `500/sqrt(100)=50`
נוכל לחשב את ציוני התקן של 1,110 ושל 1,090 ולמצוא את גודל השטח המסומן:
  • ציון התקן עבור 1,090:  `(1090-1100)/50=-0.2`
  • ציון התקן עבור 1,110:  `(1100-1100)/50=-0.2`

לפי הטבלה של ההתפלגות הנורמלית השטח שמשמאל ל- 0.2- הוא 0.4207, והשטח שמשמאל ל-0.2 הוא 0.5793. השטח המסומן הוא ההפרש ביניהם:

`15.58% = 0.1586 = 0.4207 – 0.5793`

מסקנה: ההסתברות שהתוחלת נמצאת במרווח שבין 1,090 גרם לבין 1,110 היא 15.86%. לכן, ניתן לסמוך על הטענה שהתוחלת נמצאת במרווח שבין 1,090 גרם לבין 1,110 גרם רק ב-15.86%.

בשפה מקצועית אומרים כי המרווח שבין 1,090 לבין 1,110 הוא מרווח סמך לתוחלת ברמת סמך של 15.86%.

 

מהי רמת הסמך של המרווח שבין 1,000 גרם לבין 1,200 גרם?

ציון התקן עבור 1,000: `(1000-1100)/50=-2`
ציון התקן עבור 1,200: `(1200-1100)/50=2`
לפי הטבלה של ההתפלגות הנורמלית השטח שמשמאל ל- 2- הוא 0.0227, והשטח שמשמאל ל-2 הוא 0.9772. רמת הסמך היא ההפרש ביניהם:
`95.45% = 0.9545 = 0.0227 – 0.9772`
ההסתברות שהתוחלת נמצאת במרווח שבין 1,000 גרם לבין 1,200 גרם היא 95.45%.

מרווחי סמך מקובלים

מרווחי סמך מקובלים הינם מרווחים ברמת סמך של 95% ושל 90%.
כדי שרמת הסמך תהיה 95% הגבול התחתון של מרווח בסמך צריך להיות 1.96 סטיות תקן מתחת לאומדן, והגבול העליון – 1.96 סטיות תקן מעל לאומדן.
כדי שרמת הסמך תהיה 90% הגבול התחתון של מרווח בסמך צריך להיות 1.64 סטיות תקן מתחת לאומדן, והגבול העליון – 1.64 סטיות תקן מעל לאומדן.

 

דוגמא

הגובה של תלמידי כיתה ג' בבית-ספר מסויים (משתנה הבסיס) מתפלג נורמלית עם תוחלת לא ידועה ועם סטיית תקן 10. במדגם של 25 תלמידים היה הגובה הממוצע 140 ס”מ.

יש לבנות מרווח סמך לתוחלת ברמת סמך של 90%.

 

פתרון

סטיית התקן של משתנה הבסיס היא 10, וגודל המדגם הוא 25.
לכן סטיית התקן של משתנה הממוצע היא `2=10/sqrt(25)` .
כדי שרמת הסמך תהיה 90%, הגבול התחתון של מרווח בסמך צריך להיות 1.64 סטיות תקן מתחת לאומדן, והגבול העליון – 1.64 סטיות תקן מעל לאומדן.
גבול תחתון – הערך הנמצא 1.64 סטיות תקן מתחת לאומדן הוא  `136.72=2*1.64-140` .
גבול עליון – הערך הנמצא 1.64 סטיות תקן מעל לאומדן הוא  `143.28=2*1.64+140` .
התוחלת נמצאת בין 136.72 ס”מ לבין 143.28 ס”מ בהסתברות של 90%.