סטטיסטיקה למתחילים

הנתונים הגולמיים

בחברה אין עובדים שצעירים מגיל 20. כל מי שלא עבר את יום ההולדת השלושים שייך לקבוצה 20- 30. מי שעבר את יום ההולדת השלושים, אפילו ביום אחד, אך עדיין לא הגיע לגיל 40, שייך לקבוצה 30-40. מי שיום הולדתו העגול (30,40,50 וכו') חל בדיוק ביום מילוי השאלון, התבקש לשייך את עצמו לאפשרות הצעירה יותר. למשל, עובד שבדיוק ביום מילוי השאלון הוא בן 30, יסמן  20-30 ולא 30-40.

הסטודנט ערך את התשובות לשאלונים בטבלה הבאה באופן מקרי:

מין

מצב משפחתי

מספר ילדים

סטטוס בעבודה

גיל

גבר

רווק

0

זוטר

20-30

אשה

רווקה

0

בינוני

20-30

גבר

נשוי

2

בכיר

40-50

אשה

גרושה

2

בינוני

30-40

גבר

נשוי

2

זוטר

30-40

אשה

נשואה

1

זוטר

20-30

אשה

נשואה

3

זוטר

40-50

גבר

נשוי

3

בינוני

40-50

גבר

גרוש

3

בכיר

50-60

אשה

נשואה

4

בכיר

40-50

אשה

אלמנה

2

בכיר

50-60

גבר

רווק

0

זוטר

20-30

אשה

גרושה

1

זוטר

30-40

אשה

נשואה

1

בינוני

30-40

אשה

נשואה

2

בינוני

30-40

גבר

נשוי

2

בינוני

40-50

אשה

נשואה

3

זוטר

40-50

אשה

נשואה

3

זוטר

50-60

גבר

נשוי

3

זוטר

50-60

אשה

רווקה

0

זוטר

30-40

אשה

נשואה

1

זוטר

30-40

אשה

נשואה

2

זוטר

40-50

אשה

נשואה

2

בכיר

50-60

אשה

גרושה

2

זוטר

40-50

אשה

רווקה

0

בינוני

20-30

אשה

נשואה

1

זוטר

30-40

אשה

נשואה

2

זוטר

40-50

אשה

נשואה

3

בינוני

50-60

אשה

רווקה

0

זוטר

40-50

אשה

נשואה

4

זוטר

50-60

כל שורה בטבלה זו נקראת תצפית. אוסף כל התצפיות נקרא מדגם.

הטבלה הזו היא המדגם. במקרה זה המדגם מכיל 30 תצפיות.

האינפורמציה המצויה במדגם היא מפורטת מאוד ועמוסה מאוד בפרטים. כאשר הסטודנט ירצה לחקור,למשל, רק את סעיף המין של העובדים, הוא יעדיף לערוך טבלה חדשה, קצרה יותר ואינפורמטיבית יותר, כפי שנראה מיד.

הנתונים הגולמיים522הנתונים הגולמיים