מבחן T הוא דרך להחליט אם יש הבדלים מובהקים סטטיסטית בין מערכי נתונים, באמצעות התפלגות t של סטודנט. מבחן T באקסל הוא מבחן T דו-דגמים המשווה את האמצעים של שתי דוגמאות. מאמר זה מסביר מה המשמעות של מובהקות סטטיסטית ומראה כיצד לבצע מבחן T ב-Excel.
ההוראות במאמר זה חלות על Excel 2019, 2016, 2013, 2010, 2007; Excel עבור Microsoft 365 ו-Excel Online.
מהי מובהקות סטטיסטית?
דמיין שאתה רוצה לדעת איזו משתי קוביות תיתן ניקוד טוב יותר. אתה מטיל את הקוביה הראשונה ומקבל 2; אתה מטיל את הקוביה השנייה ומקבל 6.האם זה אומר לך שהקוביה השנייה נותנת בדרך כלל ציונים גבוהים יותר? אם עניתם, "כמובן שלא", אז כבר יש לכם הבנה מסוימת של מובהקות סטטיסטית. אתה מבין שההבדל נבע מהשינוי האקראי בניקוד, בכל פעם שמטילים קובייה. מכיוון שהמדגם היה קטן מאוד (רק גליל אחד) הוא לא הראה שום דבר משמעותי.
עכשיו דמיין שאתה מטיל כל קובייה 6 פעמים:
- הקוביה הראשונה מטילה 3, 6, 6, 4, 3, 3; ממוצע=4.17
- הקוביה השנייה מטילה 5, 6, 2, 5, 2, 4; ממוצע=4.00
האם זה עכשיו מוכיח שהקוביה הראשונה נותנת ציונים גבוהים יותר מהשנייה? כנראה שלא. מדגם קטן עם הבדל קטן יחסית בין האמצעים סביר להניח שההבדל עדיין נובע משונות אקראיות. ככל שאנו מגדילים את מספר הטלת הקוביות, קשה לתת תשובה הגיונית לשאלה - האם ההבדל בין הציונים הוא תוצאה של וריאציה אקראית או שמא אחד מהם באמת ייתן ציונים גבוהים יותר מהשני?
משמעות היא ההסתברות שההבדל שנצפה בין הדגימות נובע משונות אקראיות. המשמעות נקראת לעתים קרובות רמת אלפא או פשוט 'α'. רמת הביטחון, או פשוט 'c,' היא ההסתברות שההבדל בין המדגמים אינו נובע משונות אקראית; במילים אחרות, שיש הבדל בין האוכלוסיות הבסיסיות. לכן: c=1 – α
אנו יכולים להגדיר 'α' בכל רמה שנרצה, כדי להרגיש בטוחים שהוכחנו חשיבות. לעתים קרובות מאוד נעשה שימוש ב-α=5% (ביטחון של 95%), אך אם אנו רוצים להיות בטוחים באמת שההבדלים אינם נגרמים משונות אקראית, אנו עשויים להחיל רמת ביטחון גבוהה יותר, באמצעות α=1% או אפילו α=0.1 %.
מבחנים סטטיסטיים שונים משמשים לחישוב מובהקות במצבים שונים. משתמשים במבחני T כדי לקבוע אם האמצעים של שתי אוכלוסיות שונים ומבחני F משמשים כדי לקבוע אם השונות שונות.
למה לבדוק מובהקות סטטיסטית?
כאשר משווים בין דברים שונים, עלינו להשתמש בבדיקת מובהקות כדי לקבוע אם אחד מהם טוב יותר מהשני. זה חל על שדות רבים, לדוגמה:
- בעסק, אנשים צריכים להשוות מוצרים ושיטות שיווק שונות.
- בספורט, אנשים צריכים להשוות בין ציוד, טכניקות ומתחרים שונים.
- בהנדסה, אנשים צריכים להשוות עיצובים והגדרות פרמטרים שונים.
אם אתה רוצה לבדוק אם משהו מתפקד טוב יותר ממשהו אחר, בכל תחום, אתה צריך לבדוק מובהקות סטטיסטית.
מהי חלוקת ה-T של סטודנט?
התפלגות t של תלמיד דומה להתפלגות נורמלית (או גאוסית). שתיהן התפלגויות בצורת פעמון כאשר רוב התוצאות קרובות לממוצע, אך כמה אירועים נדירים רחוקים למדי מהממוצע בשני הכיוונים, המכונה זנבות ההתפלגות.
הצורה המדויקת של התפלגות ה-t של התלמיד תלויה בגודל המדגם. עבור דגימות של יותר מ-30 זה דומה מאוד להתפלגות הנורמלית. ככל שגודל המדגם מצטמצם, הזנבות הולכים וגדלים, ומייצגים את חוסר הוודאות המוגבר הנובע מהסקת מסקנות על סמך מדגם קטן.
איך לעשות מבחן T באקסל
לפני שתוכל להחיל מבחן T כדי לקבוע אם יש הבדל מובהק סטטיסטית בין האמצעים של שתי דגימות, תחילה עליך לבצע מבחן F. הסיבה לכך היא שבוצעו חישובים שונים עבור מבחן ה-T בהתאם לשאלה האם יש הבדל משמעותי בין השונות.
תזדקק לתוסף Analysis Toolpak לאפשר לבצע ניתוח זה.
בדיקה וטעינה של תוספת ה- Analysis Toolpak
כדי לבדוק ולהפעיל את ערכת הכלים לניתוח, בצע את השלבים הבאים:
- בחר בכרטיסייה FILE >בחר Options.
-
בתיבת הדו-שיח 'אפשרויות', בחר Add-Ins מהכרטיסיות בצד שמאל.
-
בתחתית החלון, בחר בתפריט הנפתח ניהול ולאחר מכן בחר תוספות Excel. בחר Go.
- ודא שתיבת הסימון שליד Analysis Toolpak מסומנת, ולאחר מכן בחר OK.
- חבילת הכלים לניתוח פעילה כעת ואתה מוכן להחיל מבחני F ו-T-Tests.
ביצוע F-Test ו-T-Test ב-Excel
-
הזן שני מערכי נתונים לגיליון אלקטרוני. במקרה זה, אנו שוקלים מכירות של שני מוצרים במהלך שבוע. ערך המכירות היומי הממוצע עבור כל מוצר מחושב גם הוא, יחד עם סטיית התקן שלו.
-
בחר בכרטיסייה Data > ניתוח נתונים
-
בחר F-Test Two-Sample for Variances מהרשימה, ולאחר מכן בחר OK.
מבחן ה-F רגיש מאוד לאי-נורמליות. לכן אולי בטוח יותר להשתמש במבחן Welch, אבל זה קשה יותר ב-Excel.
-
בחר את טווח משתנה 1 וטווח משתנה 2; הגדר את האלפא (0.05 נותן 95% ביטחון); בחר תא עבור הפינה השמאלית העליונה של הפלט, בהתחשב בכך שזה ימלא 3 עמודות ו-10 שורות. בחר OK.
עבור טווח עבור משתנה 1, יש לבחור את המדגם עם סטיית התקן (או השונות) הגדולה ביותר.
-
הצג את תוצאות ה-F-Test כדי לקבוע אם יש הבדל משמעותי בין השונות. התוצאות נותנות שלושה ערכים חשובים:
- F: היחס בין השונות.
- P(F<=f) one-tail: ההסתברות שלמשתנה 1 אין למעשה שונות גדולה יותר ממשתנה 2. אם זה גדול מאלפא, אשר הוא בדרך כלל 0.05, אז אין הבדל משמעותי בין השונות.
- F זנב אחד קריטי: הערך של F שיידרש כדי לתת P(F<=f)=α. אם ערך זה גדול מ-F, זה גם מציין שאין הבדל משמעותי בין השונות.
ניתן לחשב P(F<=f) גם באמצעות פונקציית FDIST עם F ודרגות החופש עבור כל דגימה כקלט שלה. דרגות חופש הן פשוט מספר התצפיות במדגם מינוס אחת.
-
עכשיו, כשאתה יודע אם יש הבדל בין השונות, אתה יכול לבחור את ה-T-Test המתאים. בחר בכרטיסייה Data > Data Analysis, ולאחר מכן בחר t-Test: Two-Sample Assuming Equal Variancesor t-Test: שני מדגם בהנחה של שונות לא שוות
-
לא משנה באיזו אפשרות בחרת בשלב הקודם, תוצג בפניך אותה תיבת דיאלוג להזין את פרטי הניתוח. כדי להתחיל, בחר את הטווחים המכילים את הדוגמאות עבור Variable 1 Range ו- Variable 2 Range.
- בהנחה שברצונכם לבדוק ללא הבדל בין האמצעים, הגדר את ה- הפרש הממוצע בהשערות לאפס.
- הגדר את רמת המובהקות אלפא (0.05 נותן 95% ביטחון), ובחר תא לפינה השמאלית העליונה של הפלט, בהתחשב בכך שזה ימלא 3 עמודות ו-14 שורות. בחר OK.
-
עיין בתוצאות כדי להחליט אם יש הבדל משמעותי בין האמצעים.
בדיוק כמו ב-F-Test, אם ערך ה-p, במקרה זה P(T<=t), גדול מאלפא, אז אין הבדל משמעותי. עם זאת, במקרה זה ניתנים שני ערכי p, האחד עבור מבחן זנב אחד והשני עבור מבחן דו זנב. במקרה זה, השתמש בערך שני זנבות שכן כל משתנה בעל ממוצע גדול יותר יהיה הבדל משמעותי.