Как рассчитать накопленную частоту

Как рассчитать накопленную частоту

Поскольку
, то
и площадь каждого прямоугольника такой гистограммы равна частоте соответствующего интервала, а общая площадь гистограммы равна численности совокупности.

Если на графике откладываются относительные плотности
, то
, то площадь каждого прямоугольника равна частости соответствующего интервала, а общая площадь гистограммы равна 1.
При равноинтервальной группировке графики распределений составленные по частотам, частостям и плотностям, подобны друг другу.
Графики распределений с неравными интервалами различаются в зависимости от того, по какой частотной характеристике они строятся.
Для характеристики рядов распределения применяют так же графики накопленных частот или куммуляты .
Пример: Распределение хозяйств по урожайности зерновых.

Число хозяйств, Накопленная
частота, До 6 2 2 6-10 8 10 (2+8) 10-14 17 27 (10+17) 14-18 12 39 (12+27) 18-22 6 45 (6+39) Свыше 22 2 47 (25+2) Итого 47

Накопленная частота – это сумма частот данного и всех предшествующих интервалов.
Куммулята позволяет определить, какая часть совокупности обладает значениями изучаемого признака не превышающими заданного предела, а какая часть – наоборот – превышает этот предел.

1. Понятие средней величины.
2. Средняя арифметическая величина и ее расчет прямым способом.
3. Свойства средней арифметической величины.
4. Практическое использование свойств средней арифметической.
5. Степенные средние.
6. Мода и процентили.

1. Понятие средней величины.
Уровень любого показателя формируется под воздействием существенных закономерных для данного явления, а так случайных причин. Поскольку случайных причин множество и их действия носят стихийный разнонаправленный характер, необходимо нивелировать (устранить) результат такого воздействия, для того чтобы определить типичный закономерный для данных условий места и времени уровень показателей. Таким уровнем является средняя величина .
Средняя – это обобщающая характеристика количественно и качественно однородной совокупности в определенных условиях. Среднее определяется по какому-либо признаку. Среднее проявляется в результате действия закона больших чисел, когда в массовых совокупностях индивидуальные отклонения от типичного уровня взаимопогашаются. Среднее позволяет заменить множество значений показателей одним типичным, что значительно упрощает последующий анализ явлений.
Средняя является объективной характеристикой только для однородных явлений. Средние для неоднородных совокупностей называются огульными и могут применяться только в сочетании с частными средними однородных совокупностей.
Средняя применяется в статистических исследованиях для оценки сложившегося уровня явления, для сравнения между собой нескольких совокупностей по одному и тому же признаку, для исследования динамики развития изучаемого явления во времени, для изучения взаимосвязей явлений.
Средние широко применяются в различных плановых, прогнозных, финансовых расчетах.

2. Средняя арифметическая величина и ее расчет прямым способом.
Средняя арифметическая – наиболее распространенный на практике вид средних. Различают 2 вида арифметических средних:
§Невзвешенную (простую);
§Взвешенную.
Средняя арифметическая невзвешенная рассчитывается для несгруппированных данных по формуле:
, где
-сумма вариантов, N – их число – применяется обычно для совокупностей численностью N
15.
Для массовых статистических совокупностей рассчитывается взвешенная средняя арифметическая по формуле:
, где
-частоты.
Пример: Расчет средней выработки рабочими токарного цеха.

Число рабочих,
чел., Объем производства, До 300 3 290 870 300-320 9 310 2790 320-340 15 330 4950 340-360 12 350 4200 360-380 6 370 2220 Свыше 380 6 390 2340 Итого 51

Из таблицы:
1. Средняя величина всегда тяготеет к вариантам с наибольшими частотами.
2. Средняя величина может не совпадать ни с одним из вариантов дискретного ряда.
3. Средняя величина находится внутри интервала значений вариантов ряда.
Сумма
помимо чисто математического, как правило, имеет смысловое значение, наличие смыслового значения – один из способов проверки правильности выбора средней.
Даже если варианты ряда представлены целыми числами, среднее может быть смешанным числом, иногда такой результат логически неправомерен. В этом случае его надо округлять, переводить в проценты или в промили.

3. Свойства средней арифметической величины.
Свойства средней важны для понимания механизма расчета этого показателя, а так же для разработки ряда более сложных статистических методик.
Свойства :
1. Если из всех вариантов ряда вычесть или ко всем вариантам добавить постоянное число, то средняя арифметическая соответственно уменьшится или увеличится на это число.
.
2. Если все варианты ряда умножить или разделить на постоянное число, то средняя арифметическая соответственно увеличится или уменьшится в это число раз.
.
3. Если все частоты увеличить или уменьшить в постоянное число раз, то средняя от этого не изменится.
.
4. Сумма отклонений всех вариантов ряда от средней арифметической равна 0. (Нулевое свойство средней).
.
5. Общая средняя совокупности равна средней арифметической из частных средне взвешенных по объемам частных совокупностей.
, где
— средняя арифметическая частных групп,
— численность соответствующих групп,
— общая средняя.
6. Сумма квадратов отклонений всех вариантов ряда от средней арифметической меньше суммы квадратов их отклонений от любого другого постоянного числа.

Средний квадрат отклонений вариантов ряда от произвольного числа А равен дисперсии плюс квадрат разности между средней и этим числом А.
Данное свойство положено в основу метода наименьших квадратов, который широко применяется в исследовании статистических взаимосвязей.

4. Практическое использование свойств средней арифметической.
Свойства средней арифметической используются так же для упрощения методики ее расчета. В условиях малопроизводительной вычислительной техники эта методика обеспечивала значительную экономию времени и труда. В настоящее время данная методика служит наглядным образцом иллюстрации свойств средней.

290 3 -40 -2 1 -2 310 9 -20 -1 3 -3 330 15 5 350 12 20 1 4 4 370 6 40 2 2 4 390 6 60 3 2 6

Данный метод называется так же методом расчета от условного нуля. В качестве условного нуля выбирается произвольное постоянное число А. Обычно это вариант ряда с наибольшей частотой. А=330.
Рассчитываем среднюю по новым вариантам:
.
Пользуясь свойствами средней переходим от условного
к фактической средней величине
.

5. Степенные средние.
Средняя арифметическая величина является частным случаем, который называется степенной средней .
— для несгруппированных данных;
— для сгруппированных данных.
Последовательно придавая k дискретное значение 0, 1, 2, 3, … и т.д. получим различные виды средних.
Если k=-1 степенные средние приобретают вид средней гармонической .
— для несгруппированных данных;
— для сгруппированных данных.
Пример: В течение рабочей смены 3 рабочих изготовляли детали. 1йрабочий затрачивая на изготовление 1 детали – 6 мин., 2й– 8 мин., 3й– 7,5 мин. Определить средние затраты времени на изготовление 1 детали.
Среднюю арифметическую взвешенную нельзя использовать для расчета, так как каждый из рабочих изготавливал за смену разное количество деталей. В числителе формулы отражается количество человеко-силы, а в знаменателе условное количество деталей, изготавливаемых за смену.

Пример: Продавец в течении нескольких дней продавал на рынке морковь. В первые 4 дня цена составляла 6 руб./кг, в последние 5 дней цена поднялась до 7 руб., а оставшаяся морковь была продана за 4,50 руб./кг. Поскольку данные о товарообороте отсутствуют, то для решения задачи применяется средняя гармоническая взвешенная:

При этом число дней продаж моркови по различным ценам рассматривается как показатель условного товарооборота.
Средняя гармоническая применяется в тех случаях, когда частоты ряда выражены в неявном виде.
Если величина k=0 , то степенная средняя приобретает вид средней геометрической .
для несгруппированных данных;
для сгруппированных данных.
Средняя геометрическая применяется в тех случаях, когда отдельные варианты ряда резко отличаются от остальных.
Наиболее часто формулу средней геометрической используют для определения средних валютных курсов, эффективности валютных курсов, реальной эффективности валютных курсов (международная финансовая статистика).
Если k=1 степенная средняя принимает вид средней арифметической, взвешенной и невзвешенной.
Если k=2 , средняя квадрата.
для несгруппированных данных;
— для сгруппированных данных.
Результаты статистического исследования зависят от того, насколько верно избран вид средней. Расчет средних, выполненных на основе одних и тех же данных разными способами дает различные результаты.
В курсе математической статистики доказано, что чем ниже степень средней, тем меньше ее величина. Это называется правилом мажорантности средней .

Читайте также:  Kernel32 createfile2 не найдена

k -1 1 2

Доказано так же, что чем интенсивней колеблются значения вариантов ряда, тем больше разница между ними.

6. Мода и процентили.
Наряду со средними для характеристики распределения применяют такие показатели как мода и процентили, которые дополняют характеристику (обобщающую) и позволяют сравнивать между собой и находить различия в рядах с одинаковыми средними.
Мода – это наиболее часто встречающийся вариант ряда.
В дискретных рядах распределения модой является вариант, имеющий максимальную частотную характеристику.
В интервальных рядах мода определяется в два этапа. В начале определяется интервал, содержащий моду ( модальный интервал ), а затем рассчитывается значение моды по формуле:
, где
— нижняя граница модального интервала, i – величина этого интервала,
,
,
— частоты модального, предшествующего ему и следующего за ним интервалов.

Для последней таблицы (данные о выработке рабочих токарей):

Медиана (вид процентиля), который занимает серединное положение в ряду распределения. Медиана определяется по формуле:
, где
— нижняя граница интервала, содержащего медиану ( интервал определяется по накопленной частоте, первой превышающей 50% суммы частот (в дальнейшем для квартилей, децилей – 25%, 75%, 0,1%, 0,2% и т.д.) ), i – величина этого интервала,
— номер медианы,
— накопленная частота интервала, предшествующего медиане,
— частота медианного интервала.
Поскольку медиана разновидность процентиля то данная формула носит универсальный характер, она может применяться для определения квартилей (Q) и децилей (d).
Квартили (четверти) отсекают от совокупности соответственно 25%, 50% и 75%.
Децили отсекают от совокупности соответственно 10%, 20%, 30% и т.д.
На первом этапе определяется номер процентиля по формуле:
— для ряда четным числом единиц;
— с нечетным числом единиц.
— номер процентиля (порядковый),
— индекс процентиля (выражается десятичной дробью) (
),N– численность совокупности.

Классы группировки Точные границы классов Частоты данных (¦) Накопленные частоты (¦cum) Процентная сумма накопленных частот (%)
54,5-59,5 49,5-54,5 44,5-49,5 39,5-44,5 34,5-39,5 29,5-34,5 24,5-29,5 19,5-24,5 14,5-19,5 9,5-14,5 1,00´100=100 0,98´100=98 0,96´100=96 0,90´100=90 0,82´100=82 0,70´100=70 0,56´100=56 0,32´100=32 0,20´100=20 0,04´100=4

Рис. 1.1.6. Гистограмма и кривая накопленных частот первичных результатов

исследования выборки (см. табл. 1.1.5).

На основе описанного только что метода представления первичных результатов — табличного и графического — может быть произведен расчет статистических показателей. Цель этих расчетов в том, чтобы с помощью простых показателей дать математическую оценку результатов эксперимента или наблюдения. Наиболее часто используемыми статистическими показателями распределения являются меры центральной тенденции и меры рассеивания.

Меры центральной тенденции. Среди множества мер центральной тенденции для обработки результатов психологических исследований чаще всего используют среднюю арифметическую величину (М) и медиану (Me).

В случае небольшого числа первичных результатов и отсутствия предварительной их группировки значение средней арифметической получают путем последовательного суммирования исходных величин (X) с последующим делением этой суммы на общее количество исходных данных (N):

.

Если массив первичных данных был подвергнут предварительной группировке, то для вычисления средней арифметической величины проделывают следующие операции. Для каждого класса группировки определяют произведение частоты класса (f) на центр группировки класса (X), а затем суммируют эти произведения и полученную величину делят на общее количество исходных данных N:

.

Так, для примера, приведенного в табл. 1.1.4, мы имеем: 57+52+141+ +168+222+224+324+132+136+24 =1480 и = 29,60, т. е. М = 29,60.

Второй мерой центральной тенденции, особенно для порядковых величин, является медиана. Медиана — это точка на измерительной шкале, выше которой находится точно половина наблюдений и ниже которой — также точно половина наблюдений. В этом определении важно подчеркнуть, что медиана — это точка на шкале, а не отдельное измерение или наблюдение. На примере данных табл. 1.1.4 продемонстрируем этапы вычисления медианы на основе сгруппированных данных.

1. Находим половину наблюдений в массиве данных т. е. N/2. В нашем примере: 50:2 = 25,0.

2. Суммируем частоты, начиная с минимального класса группировки, до класса, содержащего половину необходимых наблюдений т. е. медиану. Для нашего примера, в котором N =50, половиной наблюдений будет 25. Итак, по данным табл. 1.1.4 это: 2 + 8 + 6 + 12 = 28. Отсюда очевидно, что медиана предположительно расположена в 4-м классе группировки, точные границы которого 24,5 и 29,5.

3. Определяем, сколько же наблюдений из класса, содержащего медиану, необходимо для того, чтобы найти ее. Поскольку сумма накопленных частот из предыдущих трех классов равна 16 (см. табл. 1.1.5), то ясно, что из медианного класса необходимо еще 9 наблюдений, а именно 25-16 =9.

4. Вычисляем ту долю интервала на шкале, которая позволит определить точное положение медианы. Если в медианном классе имеем 12 наблюдений и наблюдения в пределах класса распределены равномерно, то при ширине класса, равной 5 единицам, получаем: 9/12´5 = 3,75.

5. Прибавляем полученный результат к нижней точной границе класса группировки, содержащего медиану: 24,5+3,75 = 28,25. Это и есть ее значение: = 28,25.

Существует аналитическая формула для интерполяции медианы:

,

где l — нижняя точная граница класса группировки содержащего медиану; Fb — сумма частот классов * ниже l; fp — сумма частот класса, содержащего медиану; N — число наблюдении или измерений; i — ширина класса группировки.

* Величина Fb в данной формуле соответствует по своему смыслу величине накопленных частот (fcum), расчет которой был продемонстрирован выше.

Как видно из нашего примера, когда распределение первичных результатов наблюдений или измерений отличается от нормального, то величины средней арифметической и медианы не совпадают: 29,60¹28,25.

Меры изменчивости. В качестве мер изменчивости результатов, характеризующих степень рассеивания отдельных величин вокруг средней арифметической, используются разные меры в зависимости от примененных шкал измерения. Для характеристики рассеивания величин интервальных шкал и шкал отношений пользуются значением среднеквадратичного отклонения (s). Для величин порядковых шкал используют значения полуквартильных отклонений (Q1, и Q3).

При несгруппированных данных произведем расчет так называемого стандартного отклонения, обозначаемого S. Понятие стандартного отклонения (S) на практике чаще всего используется как синоним среднего квадратичного отклонения (s). Расчет делается следующим образом:

1. Рассчитаем среднюю арифметическую величину (М).

2. Находим отклонение (х) каждого результата измерения (X) от средней арифметической величины: х=Х-М.

3. Возводим найденное значение отклонения каждого результата от среднего в квадрат: x 2 .

4. Суммируем значения квадратов отклонений всех результатов: åx 2 .

5. Делим сумму квадратов отклонений на общее число наблюдений (N) и получаем величину, называемую дисперсией(D):

Читайте также:  Когда ставится апостроф в белорусском языке

6. Извлекаем корень квадратный из дисперсии и получаем величину, называемую стандартным отклонением(S), или среднеквадратичное отклонение(s):

, s = .

Расчет дисперсии (D) и стандартного отклонения (S) (при N=10)

Х х х 2
0,2 -3,8 -1,8 2,2 0,2 2,2 -3,8 0,2 2,2 2,2 0,04 14,44 3,24 4,84 0,04 4,84 14,44 0.04 4,84 4,84

Таким образом: D и S .

Приведем все описанные расчеты для конкретного примера и определим дисперсию и стандартное отклонение для выборки, состоящей из результатов 10 измерений: 13; 17; 15; 11; 13; 11; 17; 13; 11; 11. Для начала рассчитаем среднюю арифметическую величину: она оказывается равна 13,2. Для облегчения дальнейших расчетов составляем табл. 1.1.6. В 1 -и графе таблицы записываем первичные данные (X), во 2-й — отклонения их значений от средней арифметической (х) и в 3-й — квадраты отклонений (х 2 ).

При сгруппированных данных формула расчета дисперсии приобретает следующий вид:

,

где f — частота каждого из классов группировки; Xi центр каждого из классов группировки; М — средняя арифметическая величина, а N — число измерений.

Различают два полуквартильных отклонения — для левой и правой сторон распределения экспериментальных данных. Каждое из полуквартильных отклонений представляет собой величину, соответствующую половине области распределения центральных 50% данных на шкале измерений. Очевидно, что любое распределение экспериментальных данных может быть разделено на четыре равные части, каждая из которых охватывает 25% наблюдений. Если отсчитывать наблюдения, начиная от минимальной величины на измерительной шкале, то точка Q1 , отделяющая первые 25% наблюдений от остальных, определит границу первого квартиля. Та же самая процедура счета, производимая от максимальной величины, отделяет последний, т. е. четвертый, квартиль; сама же точка на шкале обозначается как Q3 . Наконец медиана, согласно ее определению, позволяет идентифицировать второй и третий квартили: точка их разделения на шкале и соответствует медиане. Она получила обозначение Q2. Половина же интервала на измерительной шкале, заключенного между точками Q1 и Q3 и есть полуквартильные отклонения. Только в случае нормального, т. е. симметричного, распределения данных точка Q2 совпадает с местоположением медианы. Следовательно, с помощью полуквартильных отклонений можно определять рассеивание экспериментальных данных вокруг медианы.

Обратимся снова к табл. 1.1.4 и расчету мер центральной тенденции. Ранее для приведенных там данных мы рассчитали, что Me = 28,25, и таким образом определили точку Q2. Теперь нам предстоит найти точки Q1и Q3.В случае нормального, т. е. строго симметричного, распределения данных точки Q1и Q3 можно рассматривать в качестве медиан: Q1 для левого интервала (от начала шкалы измерений до точки Q2), a Q3 — для правого интервала (от конца шкалы до той же точки Q2). Поэтому дальнейшие процедуры расчетов значений Q1 и Q3 будут аналогичны той, которую мы рассматривали при вычислении медианы. То есть мы имели право воспользоваться приведенной выше аналитической формулой для интерполяции медианы, а именно

.

1. Прежде всего укажем, что значение i — ширины класса группировки — нам известно, из задания: i = 5 (как для левого интервала, так и для правого).

2. Что касается N — числа измерений, то согласно определению медианы вообще, а в нашем случае точки Q3 в частности, оно должно быть одинаковым в обоих рассматриваемых интервалах: Nл = Nпр = 25 при общем числе измерений, равном 50. Отсюда

3. Анализируя группировку данных, приведенную в табл. 1.1.4, нетрудно заметить, что классом группировки, предположительно содержащим половину наблюдений левого интервала, является 3-й класс, а таким же классом для правого интервала — 6-й класс. Исходя из этого, по табл. 1.1.4 легко определить, что

4. Пользуясь найденными значениями величин, производим необходимые расчеты медиан обоих интервалов:

для левого Q1=19,5 + ×5 = 21,58,

для правого Q3 = 39,5- ×5 = 36,58.

5. Согласно определению квартального отклонения следует, что

,

т. е. в нашем примере Q = .

6. Однако этот результат получен нами для нормального распределения данных. На самом же деле, как показывает табл. 1.1.4, в нашем примере мы имеем дело с явно асимметричным распределением. Поэтому истинные полуквартильные отклонения в данном случае необходимо было рассчитывать с учетом вычисленного значения для медианы (или Q2), a именно, что = 28,25. Тогда мы получаем

для левого интервала Q2 – Q1 = 28,25-21,58 = 6,67,

для правого интервала Q3Q2 = 36,58-28,25 = 8,33.

С помощью данного приема можно очень легко определить право- и левостороннюю асимметрию любого распределения:

если Q3 — Q2 2 — квадрат разностей рангов этих величин.

Для вычисления предстоит проделать ряд операций. Прежде всего надлежит табулировать все первичные результаты (табл. 1.1.7). В 1-й графе записывают номер испытуемого, а во 2-й и 3-й — полученные им суммы баллов по первой методике (переменная X) и по второй (переменная Y).

Табулирование первичных результатов для расчета коэффициента корреляции по Спирмену (r)

Номер испытуемого X Y RX RY d d 2
11,0 4,0 9,0 10,0 14,5 14,5 12,5 1,0 3,0 7,0 6,0 2,0 5,0 8,0 12,5 8,0 6,0 5,0 14,0 15,0 12,0 8,0 3,0 1,0 4,0 10,0 2,0 13,0 8,0 11,0 3,0 2,0 4,0 4,0 0,5 2,5 4,5 2,0 2,0 3,0 4,0 0,0 8,0 0,0 1,5 9,00 4,00 16,00 16,00 0,25 6,25 20,25 4,00 4,00 9,00 16,00 0,00 64,00 0,00 2,25
åd 2 = 71,00

Таким образом: r = =1- =1- =1-0,305=0,695.

Затем каждому первичному результату присваивают ранг. Эта процедура называется ранжированием. Начинают ее с того, что среди всех значений переменной Х находят наибольшее и в одной строке с ним, но уже в 4-й графе (Rx) проставляют единицу, что и означает 1-й ранг. В нашем случае максимальное число баллов по методике Х получил испытуемый № 8, и поэтому именно его результату следует присвоить 1-й ранг. Затем находят второй по величине результат и в его строке указывают соответственно 2-й ранг. В нашем примере необходимо обратить внимание на следующее: испытуемые № 7 и 15 получили по 41 баллу, а испытуемые № 5 и 6 — по 35 баллов. Для таких случаев принято следующее правило: если в ранжируемом ряду встречаются одинаковые величины, то для них находят среднее значение и считают, что оно определяет ранг как одной, так и другой величины. Следовательно, испытуемым № 7 и 15 надо присвоить одинаковый ранг, а именно 12,5, а испытуемым № 5 и 6 — 14,5, поскольку (12+13):2 =12,5 и (14+15): 2 =14,5. Аналогично осуществляют ранжирование по второй методике, т. е. для переменной У. Заметим, что в данном случае уже трое испытуемых № 1, 7 и 14 получили по одинаковому числу баллов — 75. Первичным результатам этих испытуемых должны были бы быть присвоены 7, 8 и 9-й ранги.

Усреднив эти ранги, каждому испытуемому присваивают одинаковый ранг, в данном случае -8-й.

На следующем этапе табулирования определяют разность рангов для каждой пары значений Х и Y и полученные результаты проставляют в 6-й графе: d =RxRy. Наконец, в 7-й графе отражены значения квадратов разности рангов, т. е. d 2 для каждой пары Х и Y. Полученные величины суммируют и записывают в последней строке таблицы: åd 2 . Полученную величину (в нашем примере åd 2 = 171) и подставляют в формулу коэффициента ранговой корреляции.

Читайте также:  Для чего нужно мыло при повешении

В нашем примере r = 0,695. Положительное значение полученного коэффициента позволяет утверждать, что оба опросника — Х и Y — дают возможность выявлять похожие, но не идентичные личностные свойства.

Коэффициент корреляции по формуле Пирсона рассчитывается на основе отклонения первичных результатов и среднего квадратичного отклонения от их среднеарифметического значения. Формула расчета коэффициента корреляции по К. Пирсону может быть представлена следующим образом:

rxy = ,

где х – отклонение величины Х (первичного результата) от средней арифметической Мх; у — отклонение величины Y (первичного результата) от средней арифметической MY; åx×y — алгебраическая сумма произведений отклонений х и у от Мх и MY; N – объем выборки сравниваемых парпервичных результатов; sх – среднее квадратичное отклонение для первичных результатов Х; sy — среднее квадратичное отклонение для первичных результатов Y.

Рассмотрим пример, который позволит проследить этапы расчета. Допустим, что переменная Х представлена результатами измерения (в сантиметрах) величины коленного рефлекса при инструкции расслабить мышцы; переменная Y – то же, но при инструкции напрячь мышцы (табл. 1.1.8). Проверяется гипотеза о том, что величины коленного рефлекса не взаимосвязаны между собой.

Последовательность расчета коэффициента следующая.

Мх = и MY =

находим средние арифметические значения для переменных Х и Y (в нашем примере Мх =7,5; MY = 8,0).

2. Находим величины отклонений каждого из первичных результатов от Мх и MY — соответственно х и у (см. 4-ю и 5-ю графы).

3. Значение каждого отклонения х и у возводим в квадрат: x 2 и у 2 (см. 5-ю и 6-ю графы).

Расчет коэффициента корреляции по Пирсону (r)

Номер пары измерения X Y x y x 2 y 2 x×y
+2,5 +0,5 -1,5 -1,5 +5,5 -1,5 +4,5 +2,5 -4,5 -5,5 +1 +3 -5 +3 -1 +6 +3 -2 -7 6,25 0,25 2,25 2,25 30,25 6,25 20,25 6,25 20,25 30,25 -2,5 +0,5 -4,5 +7,5 +16,5 +2,5 +27,5 +7,5 +9,5 +38,5
å: М: 7,5 8,0 0,0 0,0 124,50 +102,0

Таким образом: rXY = = = = 0,76.

4. По формуле для среднего квадратичного отклонения рассчитываем sх иsy (в нашем примере sх =3,53; sy =3,79).

5. Определяем произведения для каждой пары отклонений (см. 8-ю графу).

6. Полученные величины подставляем в формулу коэффициента корреляции по Пирсону. Полученный для нашего примера коэффициент корреляции rXY = 0,76 свидетельствует о том, что обе величины коленного рефлекса взаимосвязаны, несмотря на различные условия их измерения.

Последнее изменение этой страницы: 2016-08-01; Нарушение авторского права страницы

К структурным средним относятся медиана и мода.

Задача №1 . Нахождение моды и медианы для интервального ряда

Рассчитать моду по данным таблицы. Решение приведем ниже. Сначала выберем модальный интервал, максимальная частота в нашем случае равна 10. Таким образом, получаем:

Группы предприятий по стоимости ОПФ, у.е.

1) По максимальной частоте найдем модальный интервал: Fmax =10 → I = 18-20

2) По соответствующей формуле (формулы моды и медианы приведены ниже)

Мода =18+2(10-6)/(10-6)(10-4)=18,33 млн. руб. – наиболее часто встречающаяся стоимость ОПФ среди 25 предприятий.

Вычислим медиану по приведенным исходным данным.

Как найти медиану? В данной задачи нам даны интервалы.

1) Найдем медианный интервал по накопленной частоте. Нужная накопленная частота определяется путем суммирования частот f до тех пор, пока очередная накопленная частота впервые не превысит половину совокупности n +1/2 или n / 2 .

Для нечетного ряда (25+1)/2= 13→ S = 18 →18-20- медианный интервал.

2) По соответствующей формуле (формулы моды и медианы приведены ниже)

Медиана Ме =18+2[(25+1)/2 — 8/10]=18,9 млн.руб. Из 25 малых предприятий региона 12 пр. имеют стоимость ОПФ менее 18 млн.руб., а 12 пр. более.

Задача №2. Нахождение моды и медианы для дискретного ряда.

тарифный разряд, Xi

Распределение рабочих 5 участков по их квалификации (тарифному разряду)

Найти моду по приведенным данным .

По максимальной частоте найдем соответствующую группу и варианту: f max=8 → Мода=4 разряд. Наиболее часто встречающийся разряд рабочих 4.

Определить медиану по данным таблицы.

Как рассчитать медиану? Прежде всего найдем медианный интервал по накопленной частоте. Нужная накопленную частоту. Накопленная частота определяется путем суммирования частот f до тех пор, пока очередная накопленная частота впервые не превысит половину совокупности n +1/2 или n /2.

Для четного ряда 20/2= 10→ S = 14 → Ме =4 разряд. Половина всех рабочих имеет тарифный разряд меньше 4, другая половина больше 4.

Теория для решения данных задач. Формулы для расчета моды и медианы

Модой в статистике называется величины признака (варианта), которая чаще всего встречается в данной совокупности.

Медианой в статистике называется варианта, которая находится в середине вариационного ряда. Медиана делит ряд пополам. Обозначают медиану символом.

Распределительные средние – мода и медиана, их сущность и способы исчисления.

Данные показатели относятся к группе распределительных средних и используются для формирования обобщающей характеристики величины варьирующего признака.

Мода – это наиболее часто встречающееся значение варьирующего признака в вариационном ряду. Модой распределения называется такая величина изучаемого признака, которая в данной совокупности встречается наиболее часто, т.е. один из вариантов признака повторяется чаще, чем все другие. Для дискретного ряда (ряд, в котором значение варьирующего признака представлены отдельными числовыми показателями) модой является значение варьирующего признака обладающего наибольшей частотой. Для интервального ряда сначала определяется модальный интервал (т.е. содержащий моду), в случае интервального распределения с равными интервалами определяется по наибольшей частоте; с неравными интервалами – по наибольшей плотности, а определение моды требует проведения расчетов на основе следующих формул:

где: — нижняя граница модального интервала;

— величина модального интервала;

— частота модального интервала;

— частота интервала, предшествующего модальному;

— частота интервала, следующего за модальным;

Медиана (Ме) — это значение варьирующего признака, приходящееся на середину ряда, расположенного в порядке возрастания или убывания числовых значений признака, т.е. величина изучаемого признака, которая находится в середине упорядоченного вариационного ряда. Главное свойство медианы в том, что сумма абсолютных отклонений значений признака от медианы меньше, чем от любой другой величины:

Для определения медианы в дискретном ряду при наличии частот, сначала исчисляется полусумма частот, а затем определяется какое значение варьирующего признака ей соответствует. При исчислении медианы интервального ряда сначала определяются медианы интервалов, а затем определяется какое значение варьирующего признака соответствует данной частоте. Для определения величины медианы используется формула:

где: — нижняя граница медианного интервала;

— величина медианного интервала;

— накопленная частота интервала, предшествующего медианному;

— частота медианного интервала;

Медианный интервал не обязательно совпадает с модальным.

Моду и медиану в интервальном ряду распределения можно определить графически. Мода определяется по гистограмме распределения. Для этого выбирается самый высокий прямоугольник, который в данном случае является модальным. Затем правую вершину модального прямоугольника соединяют с правым верхним углом предыдущего прямоугольника. А левую вершину модального прямоугольника – с левым верхним углом последующего прямоугольника. Далее из точки их пересечения опускают перпендикуляр на ось абсцисс.

Ссылка на основную публикацию
Как разобрать принтер hp 1102
Бесплатная техническая библиотека: ▪ Все статьи А-Я ▪ Энциклопедия радиоэлектроники и электротехники ▪ Новости науки и техники ▪ Журналы, книги,...
Как построить контрольную карту в excel
Прежде чем приступать к непосредственному построению контрольных карт, ознакомимся с основными этапами поставленной задачи. Итак, ввиду того, что разные авторы...
Как посчитать слова в сочинении
В данном методе словом считается любая последовательность "непробельных" символов, которые отделены от других символов пробелами или возвратом каретки. Утилита подсчитывает...
Как разобрать мультиварку редмонд rmc m90
Замечательно, когда процесс приготовления пищи механизирован, тогда создание кулинарных шедевров приносит сплошное удовольствие. Увы, но не каждый производитель вкладывает подробную...
Adblock detector