סטטיסטיקה למתחילים

סטית התקן

נלמד לחשב את סטית התקן באמצעות שני המדגמים האחרונים:

  • מדגם א': 9 8 7 6 5 4 3 2 1
  • מדגם ב': 9 5 5 5 5 5 5 5 1

את מדגם א' אין טעם לערוך בטבלת שכיחויות כי כל ערך מופיע רק פעם אחת. לכן, נחשב את סטית התקן ממדגם הנתון ברשימה.

תחילה יש לחשב את הממוצע:  `(1+2+3+4+5+6+7+8+9)/9=5`

כעת יש להחסיר את הממוצע מכל אחד מהערכים ואת התוצאה להעלות בריבוע:

הערך

הממוצע

הפרש בין הערך לבין הממוצע

‚ (2) - (1)

ריבוע ההפרש הנ"ל

(3)

1

5

-4

16

2

5

-3

9

3

5

-2

4

4

5

-1

1

5

5

0

0

6

5

1

1

7

5

2

4

8

5

3

9

9

5

4

16

 

כעת נחשב ממוצע של המספרים שבטור 4 (ממוצע של ריבוע ההפרשים): `(16+9+4+1+0+1+4+9+16)/9=6.67`

סטית התקן היא השורש הריבועי של המספר שקיבלנו.
במקרה שלנו: `Sigma=sqrt(6.67)=2.582`

את מדגם ב' נערוך תחילה בטבלת שכיחויות לשם חישוב הממוצע.



‚

ƒ

„

הערך

השכיחות

השכיחות היחסית

התרומה לממוצע

(מעוגל)

1

1

11.11%

0.11

5

7

77.78%

3.89

9

1

11.11%

1.00

 

9

100.00%

5.00

הממוצע הוא 5.

כעת נבנה טבלת שכיחויות נוספת לחישוב סטית התקן:

הערך

השכיחות

השכיחות

היחסית

הממוצע

ההפרש בין הערך לבין הממוצע

ריבוע ההפרש הנ"ל

התרומה לפיזור

1

1

11.11%

5

4-=5-1

16=2(4-)

1.78=16·11.11%

5

7

77.78%

5

0=5-5

0=02

0.00=0·77.78%

9

1

11.11%

5

4=5-9

16=42

1.78=16·11.11%

 

9

100.00%

 

 

 

3.56

סטית התקן:
`Sigma=sqrt(3.56)=1.886` שהיא, כמו שצפינו קטנה מסטיית התקן של מדגם א'. וכך ראינו שגם החישוב אימת את האינטואיציה שלנו שמדגם א' מפוזר יותר ממדגם ב'.

 

המשמעות של סטית התקן כמדד פיזור בתהליך קבלת החלטות

דוגמא:

במדינה א' מתקיים מידי שנה טורניר לבחירת מלך הסלים מחצי מגרש. כל מועדון כדורסל שולח נציג אחד לטורניר.

כל משתתף בטורניר קולע 10 פעמים מנקודת החצי­. הזוכה בטורניר (מי שקולע יותר סלים) מקבל פרס בגובה של 1 מיליון ש"ח וגם מאמנו במועדון מקבל סכום דומה.

במועדון הכדור סל "מכבים" המאמן בוחר את נציגו מתוך 4 שחקנים מצטיינים בשיטה הבאה: הוא מקיים 5 סיבובי "זריקות אמצע". בכל סיבוב כל שחקן זורק לסל 10 פעמים. נבחר מי שממוצע הקליעות שלו ב - 5 הסיבובים הוא הגדול ביותר.

להלן תוצאות סיבובי הזריקות של שחקניו:

 

שחקן 4

שחקן 3

שחקן 2

שחקן 1

תוצאות סיבוב 1

    8 סלים

    6 סלים

    3 סלים

    1 סלים

"            "         2

    2    "

    4    "

    2    "

    0    "

"            "         3

    8    "

    6    "

    4    "

    2    "

"            "         4

    1    "

    4    "

    0    "

    0    "

"            "         5

    6    "

    5    "

    6    "

    2    "

סה"כ קליעות

    25  "

    25  "

    15  "

    5    "

ממוצע לסיבוב

    5    "

    5    "

    3    "

    1    "

 

המאמן יבחר בשחקן עם ממוצע הקליעות לסיבוב הגבוה ביותר. אך יש שני שחקנים כאלה: שחקן 3 ושחקן 4.

מאמן "מכבים" צריך לבחור בין שחקן מס' 3 ושחקן מס' 4 והוא מבקש ממך לעזור לו בבחירה.

הוא גם לא שוכח לציין בפניך שתי עובדות חשובות:

  1. בשנה שעברה הזוכה בטורניר קלע 4 סלים.
  2. הוא אמור לקבל פרס של 1 מיליון ש"ח אם נציגו יזכה.

גם ללא חישוב סטית התקן של הקליעות של שני השחקנים קל לראות שהפיזור של שחקן 3 קטן יותר מהפיזור של שחקן 4. המשמעות של ההבדלים בפיזור היא שהיציבות של שחקן 3 גדולה יותר, ואז הוא יסכן פחות את הפרס של המאמן. אילו שחקן מס' 3 היה מפגין את היכולת הנוכחית שלו בטורניר אשתקד, היה לו סיכוי טוב לזכות במקום ראשון או לפחות להיות שותף לזכיה, שכן באף סיבוב הוא לא קלע פחות מ - 4 סלים.

אבל אם ידוע שהשנה עומד להשתתף בתחרות שחקן שתמיד מצליח לקלוע ב - 7 מקרים מתוך ה-10. נעדיף לשלוח לתחרות את שחקן 4. אם הוא "יתפוס יד טובה" ביום התחרות הוא יזכה, ואם לא אז הוא יפסיד. אבל שחקן 3, בגלל היציבות שלו, אף פעם לא עובר את ה - 6 קליעות בסיבוב, ולכן הוא בטוח יפסיד.

סטית התקן581סטית התקן