רגרסיה ב-Excel היא דרך להפוך את התהליך הסטטיסטי של השוואה של מספר קבוצות מידע כדי לראות כיצד שינויים במשתנים בלתי תלויים משפיעים על שינויים במשתנים תלויים. אם אי פעם רצית למצוא מתאם בין שני דברים, שימוש בניתוח רגרסיה באקסל הוא אחת הדרכים הטובות ביותר לעשות זאת.
ההוראות במאמר זה חלות על Excel 2019, Excel 2016, Excel 2013, Excel 2010.
מה המשמעות של רגרסיה?
רגרסיה היא גישת מודלים סטטיסטיים שבה משתמשים אנליסטים כדי לקבוע קשרים בין משתנים מרובים.
ניתוח רגרסיה מתחיל במשתנה בודד שאתה מנסה לנתח ומשתנים בלתי תלויים שאתה בודק כדי לראות אם הם משפיעים על המשתנה הבודד הזה.הניתוח בוחן את השינויים במשתנים הבלתי תלויים ומנסה לתאם את השינויים הללו עם השינויים הנובעים במשתנה היחיד (תלוי).
זה אולי נשמע כמו סטטיסטיקה מתקדמת, אבל Excel הופך את הניתוח המורכב הזה לזמין לכל אחד.
ביצוע רגרסיה ליניארית ב-Excel
הצורה הפשוטה ביותר של ניתוח רגרסיה היא רגרסיה ליניארית. רגרסיה ליניארית פשוטה בוחנת את הקשר בין שני משתנים בלבד.
לדוגמה, הגיליון האלקטרוני הבא מציג נתונים המכילים את מספר הקלוריות שאדם אכל בכל יום ואת משקלו באותו יום.
מכיוון שגיליון אלקטרוני זה מכיל שתי עמודות של נתונים, ומשתנה אחד עשוי להשפיע על השני, אתה יכול להפעיל ניתוח רגרסיה על נתונים אלה באמצעות Excel.
Enabling Analysis ToolPak Add-On
לפני שתוכל להשתמש בתכונת ניתוח הרגרסיה של Excel, עליך להפעיל את התוסף Analysis ToolPak במסך אפשרויות Excel.
-
ב-Excel, בחר בתפריט File ובחר Options.
-
בחר תוספות בתפריט הניווט השמאלי. לאחר מכן, ודא ש- תוספי Excel נבחר בשדה Manage.
-
לבסוף, בחר בלחצן Go.
-
בחלון המוקפץ של תוספות. אפשר Analysis ToolPack על ידי לחיצה על התיבה שלפניה כדי להוסיף סימן ביקורת ובחר OK.
כעת, כאשר Analysis ToolPak מופעל, אתה מוכן להתחיל לבצע ניתוח רגרסיה ב-Excel.
איך לבצע רגרסיה ליניארית פשוטה ב-Excel
תשתמש בגיליון האלקטרוני של משקל וקלוריות כדוגמה, אתה יכול לבצע ניתוח רגרסיה ליניארי ב-Excel באופן הבא.
-
בחר בתפריט Data. לאחר מכן, בקבוצת Analysis, בחר Data Analysis.
-
בחלון Data Analysis, בחר Regression מהרשימה ולחץ על OK.
-
הקלט Y Range הוא טווח התאים שמכיל את המשתנה התלוי. בדוגמה זו, זה המשקל. טווח X קלט הוא טווח התאים שמכיל את המשתנה הבלתי תלוי. בדוגמה זו, זו עמודת הקלוריות.
-
בחר Labels עבור תאי הכותרת, ולאחר מכן בחר New Worksheet כדי לשלוח את התוצאות לגיליון עבודה חדש. בחר OK כדי לגרום לאקסל להפעיל את הניתוח ולשלוח את התוצאות לגיליון חדש.
-
בדוק את גיליון העבודה החדש. לפלט הניתוח יש מספר ערכים שאתה צריך להבין כדי לפרש את התוצאות.
לכל אחד מהמספרים האלה יש את המשמעויות הבאות:
- Multiple R: מקדם המתאם. 1 מציין מתאם חזק בין שני המשתנים, בעוד ש-1 אומר שיש קשר שלילי חזק. 0 אומר שאין מתאם.
- R ריבוע: מקדם הקביעה, המראה כמה נקודות בין שני המשתנים נופלות על קו הרגרסיה. סטטיסטית, זהו סכום הסטיות בריבוע מהממוצע.
- Adjusted R Square: ערך סטטיסטי בשם R ריבוע המותאם למספר המשתנים הבלתי תלויים שבחרת.
- שגיאה סטנדרטית: עד כמה מדויקות תוצאות ניתוח הרגרסיה. אם השגיאה הזו קטנה, תוצאות הרגרסיה שלך מדויקות יותר.
- תצפיות: מספר התצפיות במודל הרגרסיה שלך.
שאר הערכים בפלט הרגרסיה מספקים לך פרטים על רכיבים קטנים יותר בניתוח הרגרסיה.
- df: ערך סטטיסטי הידוע כדרגות חופש הקשורות למקורות השונות.
- SS: סכום של ריבועים. היחס בין הסכום השיורי של הריבועים לעומת סך ה-SS צריך להיות קטן יותר אם רוב הנתונים שלך מתאימים לקו הרגרסיה.
- MS: ריבוע ממוצע של נתוני הרגרסיה.
- F: סטטיסטיקת F (מבחן F) להשערת אפס. זה מספק את המשמעות של מודל הרגרסיה.
- משמעות F: ערך סטטיסטי הידוע כ-P-value של F.
אלא אם אתה מבין סטטיסטיקה ומודלים של רגרסיה חישובים, לערכים בתחתית הסיכום לא תהיה משמעות רבה. עם זאת, הריבוע R ו-R המרובים הם השניים החשובים ביותר.
כפי שאתה יכול לראות, בדוגמה זו, לקלוריות יש מתאם חזק למשקל הכולל.
ניתוח רגרסיה ליניארית מרובה באקסל
כדי לבצע את אותה רגרסיה ליניארית אך עם משתנים בלתי תלויים מרובים, בחר את הטווח כולו (מספר עמודות ושורות) עבור Input X Range.
בעת בחירת משתנים בלתי תלויים מרובים, סביר פחות שתמצא מתאם חזק, כי יש כל כך הרבה משתנים.
עם זאת, ניתוח רגרסיה ב-Excel יכול לעזור לך למצוא מתאמים עם אחד או יותר מהמשתנים האלה שאולי לא הבנת שקיימים רק על ידי סקירת הנתונים באופן ידני.