Такие читатели, как вы, помогают поддерживать MUO. Когда вы совершаете покупку по ссылкам на нашем сайте, мы можем получать партнерскую комиссию.
Кривые распределения Гаусса, широко известные как кривые нормального распределения, представляют собой графики нормального распределения, которые помогают в анализе дисперсии в наборах данных. На кривой нормального распределения самая высокая точка (которая также является средней) представляет наиболее вероятное событие. происходить, а остальные события распределяются симметрично относительно иметь в виду.
От относительных оценок студентов и создания конкурентных систем оценки до прогнозирования доходов — кривые нормального распределения имеют широкий спектр применений. Здесь мы проведем вас через процесс создания кривой нормального распределения в Excel.
Основы создания кривой нормального распределения в Excel
Чтобы понять, как создать кривую нормального распределения в Excel, давайте предположим, что вы профессор истории, которому нужно оценивать студентов на основе их результатов на тесте. Предположим, в классе 16 учеников со следующими отметками:
Теперь, прежде чем вы сможете создать кривую нормального распределения любого набора данных, вам нужно рассчитать его:
- Иметь в виду - среднее значение набора данных (указывает центр кривой)
- Среднеквадратичное отклонение - измеряет, насколько точки данных разбросаны по отношению к среднему (дает разброс кривой)
Нахождение среднего
Вы можете использовать встроенные функции в Excel для расчета базовой статистики такие как среднее значение, стандартное отклонение, процент и т. д. Чтобы найти среднее значение, используйте функцию СРЗНАЧ в Excel:
Тип =СРЕДНЕЕ(B2:B16) чтобы найти среднее значение листа оценок, приведенного выше. Вы заметите, что он дает значение 53,93.
Если вам нужно целочисленное значение, которое вам обычно требуется, вы можете использовать функцию ОКРУГЛ. Для этого введите:
= КРУГЛЫЙ (СРЕДНИЙ (B2: B16); 0)
Теперь среднее становится 54.
Нахождение стандартного отклонения
Excel показывает две формулы для стандартного отклонения:
- СТАНДОТКЛОН.П используется, когда вы знаете, что ваши данные полны, то есть это совокупность.
- СТАНДОТКЛОН.С используется, когда ваши данные неполные, т. е. у вас есть выборка населения.
В статистике люди часто выбирают образцы из совокупности, поэтому СТЭВ.С обычно используется. Поскольку у вас есть полные данные, то есть оценки всех учеников в классе, мы будем использовать СТАНДОТКЛОН.П. Чтобы получить стандартное отклонение данного листа оценок, введите:
=СТАНДОТКЛОН.P(B2:B16)
Вы получите 27.755. Если вы хотите, чтобы ваше значение было целым числом, просто округлите его, набрав:
= КРУГЛЫЙ(СТАНДОТКЛОН.P(B2:B16),0)
Вы получите 28.
Сортировка данных в порядке возрастания
Чтобы вы могли создать форму колокола для диаграммы нормального распределения, данные должны быть в порядке возрастания. Если ваши данные не в порядке возрастания (как в нашем примере), просто выберите все значения (тестовые отметки) в вашем наборе данных, перейдите к Сортировать и фильтровать на верхней панели и выберите Сортировать по возрастанию.
Как сделать кривую нормального распределения в Excel
Теперь, когда у вас есть и стандартное отклонение, и среднее (среднее), пришло время вычислить нормальное распределение заданных значений. Как только мы получим это, у нас будет все, что нам нужно, чтобы создать нашу кривую колокола, используя опцию диаграммы рассеяния Excel. Давайте сначала найдем нормальное распределение всех значений внутри набора данных:
1. Поиск нормального распределения
Пришло время рассчитать нормальное распределение точек данных. В Excel вы можете найти нормальное распределение, используя НОРМ.РАСП функция, которая требует следующих переменных:
- Икс точка данных, для которой вы хотите рассчитать нормальное распределение.
- Иметь в виду является средним значением данных (уже рассчитанных).
- Среднеквадратичное отклонение стандартное отклонение заданных данных (уже рассчитано).
- кумулятивный это логическое значение, используемое для указания типа необходимого распределения.
Чтобы рассчитать нормальное распределение результатов наших тестов:
- Тип =НОРМ.РАСП( в новую ячейку (ячейка С2 в нашем случае)
- Введите требуемые значения с запятыми между значениями, как показано в синтаксисе.
- Для х введите Би 2, что дает первую точку данных, то есть 12.
- Для среднего введите Д2, что дает среднее значение наших данных, и нажмите F4. F4 блокирует значение среднего значения, обозначенного знаком доллара ($D$2), чтобы при копировании этой формулы для разных значений в наших данных значение среднего оставалось прежним.
- Для стандартного отклонения введите Е2 чтобы получить стандартное отклонение и заблокировать его значение, нажав F4.
- Наконец, введите ЛОЖЬ вместо совокупного логического значения и закройте круглые скобки. Набрав ЛОЖЬ, вы получите нормальную функцию плотности вероятности (PDF). Примечание: Вам нужно будет ввести истинный чтобы получить кумулятивную функцию нормального распределения (CDF).
- Получив нормальное распределение для первого значения, просто перетащите его, чтобы получить нормальное распределение для остальных значений вашего набора данных.
2. Создание точечной диаграммы
Теперь, когда у вас есть точки данных и нормальное распределение, у вас есть все необходимое для создания кривой нормального распределения. Для этого вы должны сделать точечную диаграмму в экселе выполнив шаги, указанные ниже:
- Выберите набор данных (оценки учащихся) и их нормальное распределение.
- Идти к Вставка > Точечная диаграмма.
- Выбирать Разброс с плавными линиями.
- И у вас есть кривая колокола.
Вы можете видеть, что график не имеет идеальной колоколообразной формы. Это связано с тем, что набор данных (оценки учащихся) не распределен нормально (т. е. среднее значение, медиана и мода набора данных не совпадают).
3. Настройка кривой Белла
У нас уже есть кривая колокола, но мы можем сделать ее немного лучше, настроив ее. Во-первых, давайте обновим заголовок нашей кривой, дважды щелкнув заголовок и введя желаемый заголовок. (Вы можете изменить тип шрифта, размер шрифта и положение заголовка, среди прочего.)
Вы можете удалить Серия1 написано в нижней части кривой колокола, выключив Легенда переключать. Чтобы придать кривой колокола лучшую форму, вы можете определить максимальное и минимальное значения диаграммы колокола. Для этого дважды щелкните ось X, и вы получите вкладку «Параметры оси», откуда вы можете внести необходимые изменения.
Использование кривых нормального распределения в Excel
Теперь, когда у вас есть колоколообразная кривая, которая показывает подробные данные о распределении, вы можете использовать ее для оценки своих учеников. Вы можете применить тот же процесс для создания кривой нормального распределения для любых заданных данных.
Хотя колоколообразная кривая показывает вероятность конкретной точки данных в вашем наборе данных, существуют несколько других графиков, которые вы можете создать в Excel, чтобы найти другие интересные идеи о ваших данных набор.