סטטיסטיקה למתקדמים

מדגם ואמידה

בפרקים הקודמים ניתחנו התפלגויות (משתנים מקריים) מסוגים שונים. אבל בכל המקרים היה לנו מידע מלא על המשתנה המקרי, ויכולנו לחשב במדוייק את התוחלת ואת סטיית התקן של ההתפלגות (או שהיא היתה נתונה לנו במקרה של התפלגות נורמלית).

מפרק זה ובפרקים הבאים המצב מתהפך: יהיה חוסר מידע על ההתפלגויות ואנו ננסה  לגלות את המידע החסר באמצעות מדגמים.

הבעיה שבפניה נעמוד היא שהתפלגות מתייחסת לכלל האוכלוסיה, ואילו מדגם מתייחס רק לחלק מהאוכלוסיה ולכן לא יכול לשקף באופן מדוייק את ההתנהגות של האוכלוסיה כולה.

 

דוגמה

נניח כי יש בידנו מטבע לא הוגנת, כך שאם אנו זורקים אותה ההסתברות לקבל "עץ" היא 0.55 ואילו ההסתברות לקבל "פלי" היא 0.45.

ההסתברויות משקפות את ההתפלגות של אינסוף זריקות (כל האוכלוסיה). אם היתה לנו אפשרות לזרוק את המטבע אינסוף פעמים, אז בדיוק ב-55% מהמקרים היה מתקבל "עץ" ובדיוק ב-45% מהמקרים היה מתקבל "פלי".

אבל אם נסתכל רק על מדגם, למשל על מדגם של 100 זריקות, יכול להיות שנקבל 60 פעמים "עץ" (שזה לא בדיוק 55% אלא רק קרוב ל-55%).

מסקנה: מדגם משקף באופן לא מדוייק את האוכלוסיה, אבל בכל זאת ניתן ללמוד ממנו משהו על האוכלוסיה.
כמו כן, ככל שהמדגם יותר גדול, הוא משקף את האוכלוסיה באופן מדוייק יותר .

 

מדגם ואמידה523מדגם ואמידה