Вот как можно использовать встроенные инструменты Excel, чтобы упростить статистический анализ.

Остаточные графики играют важную роль в регрессионном анализе. Они говорят вам, насколько точно ваша линия регрессии представляет взаимосвязь между двумя переменными. В следующем руководстве объясняется, как рассчитать и построить график остатков Excel двумя способами.

Но прежде чем перейти к главному, давайте кратко разберемся с остатками и их важностью в регрессионном анализе.

Что такое остатки и почему они важны?

Остаток — это разница между наблюдаемым (фактически) значением и прогнозируемым значением. Проще говоря, остаток — это ошибка. Например, если наблюдаемое значение равно 10, а ваша модель дала значение 8, то остаточное значение будет равно 2.

С другой стороны, остаточный график — это точечный график, в котором независимая переменная (возраст) отложена по горизонтальной оси, а остатки (ошибки) — по вертикальной оси.

Хорошо, вы знаете, что такое остатки, но почему они важны? Чтобы понять это, рассмотрим следующий случай:

instagram viewer

Мы хотим понять взаимосвязь между возрастом и уровнем сбережений. Для этого построим линию регрессии. Однако мы не уверены, точно ли линия регрессии представляет взаимосвязь между двумя переменными. Вот и появляются остатки. Мы используем остаточный график, чтобы проверить точность линии регрессии.

Теперь, когда вы знаете, что такое остатки, давайте узнаем, как создать график остатков в Excel:

Как создать остаточный график, используя уравнение линии тренда

Первый метод построения остатков в Excel использует уравнение линии тренда для расчета прогнозируемых значений для наших данных. Получив это, мы можем вычислить остатки, вычитая предсказанные значения из наблюдаемых значений. Наконец, мы создаем точечную диаграмму с предикторами на горизонтальной оси и остатками на вертикальной оси.

Хотя этот метод требует больше шагов, чем второй метод, это отличный способ понять концепцию. Как только у вас появится приличное понимание, вы можете использовать второй метод, который требует меньше времени и усилий.

Давайте проведем вас через процесс, шаг за шагом:

Шаг 1: введите данные

Начнем с ввода значений предиктора (под Икс столбец) и наблюдаемые значения (под Д столбец):

Шаг 2: Создайте точечную диаграмму данных

Теперь мы создаем точечную диаграмму данных, выполнив следующие шаги:

Если вы не знакомы с точечными диаграммами, вот подробная статья о создание точечной диаграммы в Excel и представление ваших данных. Вы также можете научиться использовать точечную диаграмму в Excel для прогнозирования поведения данных.

  1. Выберите данные (под Икс и Д столбцы).
  2. Перейти к Лента Excel и нажмите Вставлять.
  3. в Графики раздел, нажмите на стрелку под диаграмма рассеяния вариант.
  4. Выберите первую диаграмму рассеяния (Scatter только с маркерами).
  5. Вы получите точечную диаграмму, похожую на следующую диаграмму:

Шаг 3. Добавьте линию тренда и отобразите уравнение линии тренда на диаграмме рассеяния.

Выполните следующие действия, чтобы добавить линию тренда на диаграмму рассеяния:

  1. Нажмите на точечную диаграмму.
  2. Перейти к Лента Excel и нажмите Макет.
  3. в Фон раздел, нажмите на стрелку под линия тренда икона.
  4. Выберите Линейная линия тренда вариант.

Теперь вы увидите линию (линию тренда), пересекающую точки на графике рассеяния. Чтобы отобразить уравнение линии тренда на диаграмме рассеяния, выполните следующие действия:

  1. Идите снова к линия тренда значок и щелкните стрелку под ним.
  2. Нажмите Дополнительные параметры линии тренда.
  3. А Формат линии тренда появится диалоговое окно.
  4. Проверить Отображение уравнения на графике вариант в самом низу Формат линии тренда диалоговое окно. Уравнение линии тренда отобразится на графике.

Шаг 4: Рассчитайте прогнозируемые значения

Чтобы рассчитать прогнозируемые значения, создайте еще один столбец (Z) рядом с вашими данными и выполните следующие действия:

  1. Введите формулу линии тренда, показанную на графике, и вставьте ее в столбец Z (ячейка С2). Изменить Икс в формуле со значениями в столбце X.
  2. Таким образом, для первого прогнозируемого значения формула будет выглядеть следующим образом:
    =1,5115*А2+23,133
  3. Заменять А2 с А3 в формуле линии тренда для второго заданного значения.
  4. Для третьего прогнозируемого значения замените А3 с А4и так далее, пока вы не получите все предикативные значения для соответствующих предикторов.

Шаг 5: Найдите остаточные значения

Теперь, когда у нас есть предсказанные значения, мы можем найти остаточные значения, вычитая предсказанные значения из наблюдаемых (фактических) значений в столбце Y. Формула для первой остаточной стоимости будет =В2-С2. Для второго формула будет =B3-C3, и так далее.

Шаг 6: Создайте остаточный график

Чтобы создать остаточный график, нам нужны предиктор и остаточные значения. Теперь, когда у нас есть оба, выполните следующие действия:

  1. Выберите столбцы Д и Z.
  2. Щелкните правой кнопкой мыши и выберите Скрывать.
  3. Теперь выберите Икс и Остатки столбцы.
  4. Перейти к Вставлять вкладку на ленте Excel.
  5. Нажмите на стрелку под Разброс икона.
  6. Выберите Scatter только с маркерами вариант.
  7. Вы получите остаточный график, как показано ниже.

Для второго метода все, что вам нужно сделать, это предоставить Excel данные, и он сделает всю работу. Вы можете создать остаточный график всего за несколько кликов. Но для этого вам нужно загрузить пакет инструментов анализа Excel. Давайте начнем:

  1. Перейти к Файл вкладку и нажмите Параметры.
  2. Параметры Excel появится диалоговое окно.
  3. Перейти к Управлять поле (внизу), выберите Надстройки Excelи нажмите Идти.
  4. Ан Надстройки появится диалоговое окно.
  5. Проверить Пакет инструментов анализа поле и нажмите хорошо.
  6. Теперь перейдите к Лента Excel и нажмите Данные.
  7. Вы найдете Анализ данных значок в Анализ раздел.

Шаг 2: введите данные

  1. Выберите столбцы А и Д, и щелкните правой кнопкой мыши. Нажмите Показать.
  2. Теперь скопируйте Икс и Д столбцы.

    Вы заметите, что график изменился после отображения столбцов. Чтобы вернуть исходный остаточный график, нам нужно скрыть Д и Z столбцы (выбрав Д и Z столбцы, щелкнув правой кнопкой мыши и выбрав Скрывать).

  3. Откройте новый лист Excel и вставьте Икс и Д столбцы.
  4. Щелкните вновь появившийся Анализ данных вариант в Анализ раздел Данные вкладка
  5. А Анализ данных появится диалоговое окно.
  6. Найдите и выберите Регрессия под Инструменты анализа.
  7. Нажмите ХОРОШО. Регрессия появится диалоговое окно.
  8. Введите значения в поле Д столбец (предикторы, Б2:Б11) в Входной диапазон Y поле.
  9. Введите диапазон ячеек в поле Икс столбец (независимые переменные, А2:А11) в Входной диапазон X поле.

Шаг 3: Создайте остаточный график

в Регрессия диалоговое окно под Параметры вывода, проверять Новый слой рабочего листаи нажмите ХОРОШО.

Excel автоматически создаст остаточный график вместе со следующими выходными данными, которые вы можете использовать для проверки надежности вашей регрессионной модели:

  • Статистика регрессии
  • Таблица дисперсионного анализа
  • Таблица коэффициентов
  • Остаточный результат

Пакет анализа Excel предлагает ряд полезных статистических функций, которые можно использовать для анализа наборов данных. После создания остаточного графика с помощью пакета инструментов анализа Excel вы можете начать чесать голову, просматривая все сложные таблицы. Но как только вы научитесь проводить фундаментальный анализ данных в Excel, цифры уже не будут выглядеть такими уж пугающими.