אקונומטריקה

בדיקת מובהקות באמצעות רווח סמך

פעמים רבות ישאלו אותנו: "האם האומד שקיבלנו הוא מובהק?"

משמעות השאלה היא: "האם יתכן (בסבירות מספקת) ש-  האמיתי הוא 0?"

אם התשובה לשאלה זו היא "כן" (כלומר, יתכן ש- ), אז המודל שלנו לא נכון.

הסבר: המודל שלנו הוא , כאשר  מייצגת את מידת ההשפעה של X על Y. אם , אז X כלל לא משפיע על Y, ו-X  איננו משתנה מסביר. במקרה כזה מומלץ למצוא משתנה מסביר אחר.

כיצד נענה על שאלה זו באמצעות רווח הסמך?

אם המספר 0 נמצא בתוך רווח הסמך של , הרי שיתכן ש-, והאומד איננו מובהק.

אם המספר 0 לא נמצא בתוך רווח הסמך של , האומד מובהק.

דוגמא

באמידה התקבל כי , ו-.

האם האומד מובהק?

פתרון

נחשב את רווח הסמך בדרך הפשוטה יותר:

הגבול התחתון של רווח הסמך יהיה: 

הגבול העליון של רווח הסמך יהיה: 

רווח הסמך הוא בין  לבין 2.9. המספר 0 נמצא בתחום של רווח הסמך ולכן האומד איננו מובהק.

בדיקת השערות (מבחן t)

לחוקר מתחום החקלאות יש מידע מוקדם לגבי גידול עגבניות. לפי מידע זה לגידול עגבניות דרוש מזג אוויר חם, וכל עליה של הטמפרטורה במעלה אחת מעלה את כמות העגבניות הגדלות בערוגה סטנדרטית ב- 3.1 ק"ג.

החוקר חושד שהמידע הנ"ל איננו נכון והוא מעוניין לבצע בדיקה שבסופה הוא יוכל לאמת את המידע או לסתור אותו.

לשם כך, הכין החוקר 10 ערוגות לניסוי (בחממות בתנאי מעבדה). בכל ערוגה הוא זרע אותה כמות של זרעים והשקה באותה כמות של מים, אבל לכל ערוגה הוא סיפק חימום שונה. בסוף הניסוי הוא קטף את העגבניות מכל ערוגה ושקל אותן.

הניסוח האקונומטרי של המודל יהיה: 

כאשר:

האינדקס i מייצג את מספר התצפית (מספר הערוגה). i מקבל את הערכים 1 עד 10.

  מייצג את כמות העגבניות שנקטפו בסוף תקופת הגידול בערוגה ה- i

 מייצג את הטמפרטורה שסיפק החוקר לעגבניות שבערוגה ה- i

המשמעות של  היא תוספת כמות העגבניות שתגדל בכל ערוגה בעקבות העלאה של הטמפרטורה במעלה אחת.

החוקר רוצה לבדוק האם באמת יתכן ש- (בהתאם למידע המוקדם), או שהמידע המוקדם איננו נכון ו- .

את המידע המוקדם אנו מכנים השערת האפס ומסמנים אותה כך: 

אם לא נוכל לאשר את נכונות המידע המוקדם נקבל את ההשערה האלטרנטיבית שנסמן כך: 

לאחר שהחוקר קטף ושקל את העגבניות הכניס את כל הנתונים לתוכנת האמידה (אקסל או תוכנה אחרת) הוא קיבל ש  ו-.

כעת, החוקר צריך לבדוק עד כמה התוצאה שהתקבלה (3) רחוקה מהמידע המוקדם (3.1). את המרחק מודדים בסטיות תקן (במקרה הזה 0.084861).

למרחק הזה קוראים t סטטיסטי.

החוקר חישב את ה-t הסטטיסטי: 

החישוב נעשה ע"י מציאת ההפרש בין האומד לבין אגף ימין של השערת האפס () וחלוקתו בסטית התקן של האומד.

התוצאה שהתקבלה (3) נמצאת במרחק של 1.178 סטיות תקן מתחת למידע המוקדם (3.1). 

כעת נשאלת השאלה: האם זהו מרחק גדול או קטן?

התשובה המקובלת היא: אם ה- t הסטטיסטי (בערך מוחלט) קטן מ- 2, המרחק הוא קטן ותוצאת האמידה שקיבלנו קרובה למידע המוקדם. אם ה- t הסטטיסטי (בערך מוחלט) גדול מ- 2, המרחק הוא גדול ותוצאת האמידה שקיבלנו רחוקה מהמידע המוקדם.

ומה המסקנה? אם תוצאת האמידה קרובה למידע המוקדם, לא ניתן לסתור את המידע המוקדם, ואנו מחליטים שהמידע המוקדם נכון (מקבלים את השערת האפס).

אם תוצאת האמידה רחוקה מהמידע המוקדם, הדבר סותר את המידע המוקדם, ואנו מחליטים שהמידע המוקדם לא נכון (דוחים את השערת האפס, ומקבלים את ההשערה האלטרנטיבית).

לסיכום:

       התוצאה הנאמדת קרובה למידע המוקדם         לא דוחים את 

       התוצאה הנאמדת רחוקה מהמידע המוקדם         דוחים את 

במקרה שלנו, הערך המוחלט של ה- t הסטטיסטי שקיבל החוקר הוא 1.178, והוא קטן 

מ- 2. לא נוכל לדחות את השערת האפס, ונחליט שהמידע המוקדם ש-  נכון.

כפי שניתן לראות, הערך שאליו משווים את ה- t הסטטיסטי הוא 2. אם משתמשים בערך זה, הסיכוי לטעות בהחלטה הוא בערך 5%. אם רוצים שהסיכוי לטעות בהחלטה יהיה

בדיוק 5% צריך להשתמש בערך המופיע בטבלה t לפי מספר דרגות החופש כפי שלמדנו בחישוב רווחי סמך.

דוגמא נוספת

בפני חוקר אחר עמד מידע מוקדם אחר, שההשערות הנובעות ממנו הן:

תוצאות האמידה היו: , .

נחשב את ה-t הסטטיסטי: 

במקום להשתמש להשוואה בערך 2 נשתמש בערך המדויק מהטבלה: במדגם יש 10 תצפיות ובמודל 2 פרמטרים, ולכן מספר דרגות החופש הוא 8 (= 10-2). הערך בטבלה המתאים ל- 8 דרגות חופש הוא 2.306.

מכיוון ש-, אנו דוחים את , ומחליטים שהמידע המוקדם איננו נכון.

השערה המנוסחת באופן לא מפורש

אם יציבו בפנינו לבדיקה את ההשערה הבאה: , נטפל תחילה בביטוי באמצעות אלגברה, עד שנגיע למצב שבו הפרמטר β מבודד באגף שמאל:

ורק במצב זה (כאשר הפרמטר מבודד באגף שמאל) נחשב את ה- t הסטטיסטי, נשווה אותו ל- 2 (או לערך מדוייק יותר מטבלה t), ונקבל החלטה.

את ההשערה הזו כבר בדקנו בדוגמא שלעיל, ודחינו אותה.

בדיקת מובהקות באמצעות רווח סמך532 בדיקת מובהקות באמצעות רווח סמך