Меню Рубрики

Установка границ и интервалов

Границы интервалов ряда распределения

Число детей в семьях

Число детей (x) Количество семей (f)
Итого

Варианты ряда–это число детей в семье. Количество семей, имеющих определенное количество детей, – это частоты.

Наряду с частотами могут использоваться частости (обозначение «w»)это частоты, выраженные в % к итогу или в долях единицы. Например:

Распределение семей по числу детей

Число детей, xi Число семей
тысяч, fi % к итогу, wi
А
5,9
27,5
21,6
19,6
12,7
7,8
6 и более 4,9
Итого

Для анализа дискретных рядов можно воспользоваться их графическим изображением в виде полигона распределения.

Полигон строится в декартовой системе координат. По оси абсцисс откладываются варианты х,а по оси ординат – частоты f. Полученные точки соединяются ломаной линией – это и есть полигон распределения.

Рис.1.Графическое изображение дискретного ряда

распределения семей по числу детей

Для построения интервального ряда необходимо:

1.Определить число групп.

2.Рассчитать величину интервала.

3.Выполнить разбиение единиц совокупности на интервалы.

Для определения количества групп в рядах с равными интервалами используется формула Г.Стерджесса.

n – число единиц совокупности.

Величина интервала определяется по формуле:

Ваше первое задание в работе состоит в построении интервального ряда распределения предприятий по признаку «Выручка от продажи продукции», при этом надо образовать пять групп с равными интервалами.

Разберем пример выполнения задания, приведенный в самой расчетно-аналитической работе (образец выполнения задания 1). Данные такие:

Имеются следующие выборочные данные за год по предприятиям одной из отраслей экономики региона (выборка 10%-ная механическая):

Исходные данные базового варианта заданий

Номер предприятия п/п Выручка от продажи продукции, млн руб. Прибыль от продажи продукции, млн руб. Номер предприятия п/п Выручка от продажи продукции, млн руб. Прибыль от продажи продукции, млн руб.

1. Построение интервального ряда распределения (признак – выручка).

Расчет величины h и границ интервалов ряда:

= млн руб.

Границы интервалов ряда распределения приведены в табл.1.2.

Границы интервалов ряда распределения

Номер группы Нижняя граница, млн руб. Верхняя граница, млн руб.
170+24=194
194+24=218
218+24=242

Для построения интервального ряда необходимо определить число предприятий, входящих в каждую группу (частоты групп). При этом может возникнуть вопрос, в какую группу включить единицы совокупности, у которых значения признака выступают одновременно и верхней, и нижней границами смежных интервалов. Например, если бы в примере было предприятие с выручкой 218 млн. руб., в какую группу его отнести? Чаще всего поступают так: включают в тот интервал, где это значение признака является нижней границей интервала; т.е. предприятие с выручкой 218 млн. руб. мы бы отнесли в третий интервал «218-242».

Если нам надо построить только вариационный ряд, как сформулировано в задании 1, то мы сразу создаем таблицу следующего вида, в которой просто подсчитаем количество предприятий, попавших в каждый интервал (частоты), и, дополнительно, рассчитаем частости:

Распределение предприятий по объему выручки от продаж

Выручка от продаж, млн. руб. Число предприятий fj Число предприятий в % к итогу
170 – 194 26,7
194 – 218 46,7
218 – 242 13,3
242 – 266 10,0
266 – 290 3,3
Итого 100,0

Но поскольку во втором задании надо будет проводить аналитическую группировку, необходимо построить сначала вспомогательную таблицу, представляющую собой ранжированный ряд по группировочному признаку (Выручка от продажи продукции), в котором по каждой группе подводятся итоги:

Вспомогательная таблица для построения интервального ряда распределения и аналитической группировки

Группы предприятий по выручке от продаж, млн руб. Номер предприятия Выручка от продаж, млн руб. Прибыль от продаж, млн руб.
170 – 194
Итого
194 – 218
Итого
218 – 242
Итого
242 – 266
Итого
266 – 290
Итого
Всего

На основе ранжированного ряда легко построить интервальный ряд распределения предприятий по выручке от продаж:

Распределение предприятий по объему выручки от продаж

Помимо частот и частостей определим накопленные частоты (табл. 1.5). Последние получают путем последовательного суммирования частот (22=8+14; 26=22+4 и т.д.). Накопленная частота показывает,сколько единиц совокупности имеют значения признака не больше данного. Например, накопленная частота 22 свидетельствует, что 22 организации имеют выручку не более 218 млн. руб. В итоге получим следующую таблицу 1.4:

Распределение предприятий по объему выручки от продаж

Выручка от продаж, млн. руб. Число предприятий fj Число предприятий в % к итогу Накопленные частоты Sj
170 – 194 26,7
194 – 218 46,7
218 – 242 13,3
242 – 266 10,0
266 – 290 3,3
Итого 100,0

Вывод. Анализ интервального ряда распределения изучаемой совокупности предприятий показывает, что распределение предприятий по размеру выручки от продажи продукции не является равномерным: преобладают предприятия с размером выручки от 194 млн руб. до 218 млн руб. (это 14 предприятий, доля которых составляет 46,7 %); 22 предприятия имеют размер выручки не более 218 млн руб. (их доля превышает 73%), а 26 — не более 242 млн руб. (их доля составляет13,3%).

Анализ рядов распределения

Средней величиной называется обобщающий показатель, характеризующий типичный уровень явления в конкретных условиях места и времени, отражающий величину количественного признака в расчете на единицу качественно однородной совокупности.

Индивидуальные значения признака отклоняются от его средней величины в ту или иную сторону под влиянием не только систематических факторов (постоянно действующих), но и под воздействием случайных факторов. Однако в средней величине эти случайные отклонения взаимопогашаются (в следствие вследствия закона больших чисел.), в результате чего средняя отражает то общее, что присуще всем единицам совокупности.

Условия применения метода средних величин:статистическая средняя является объективной и типичной, если она рассчитывается при выполнении следующих двух условий:

1. Совокупность должна быть однородной. (Если совокупность не однородная, применяется метод группировки и средние величины вычисляются для каждой группы отдельно).

2. Объём совокупности должен быть достаточно большим.

Существует два больших класса средних величин:

степенные средние,

структурные средние.

Структурные средние: мода, медиана, квартили, децили и др.

Модой называется наиболее часто встречающееся значение признака.

Например, есть следующие данные, представляющие собой дискретный вариационный ряд:

Численность учащихся в группе Число групп

Наибольшую частоту ( ) имеет значение признака , равное 24, следовательно, мода равна 24 ( ).

В интервальном вариационном ряду сначала находят интервал с наибольшей частотой. В нашем примере (таблица 1.4) наибольшую частоту имеет интервал «194 – 218».

Затем проводят расчет моды по формуле:

где хМo – нижняя граница модального интервала (194),

h–величина модального интервала (24),

fMo – частота модального интервала (14),

fMo-1 – частота интервала, предшествующего модальному (8),

fMo+1 – частота интервала, следующего за модальным (4).

млн руб.

Вывод. Для рассматриваемой совокупности предприятий наиболее распространенный размер выручки от продажи продукции характеризуется величиной 203 млн руб.

Медианой называется значение признака, находящееся в середине ранжированного ряда: половина единиц совокупности имеют значения признака не меньшие медианы, другая половина – значения признака не большие медианы.

Рассмотрим ситуацию, когда данные не сгруппированы. Например, имеются следующие данные по квартире о ежемесячном потреблении электроэнергии за первые пять месяцев, квт:

январь февраль март апрель май

В этом случае необходимо сначала данные ранжировать: 200, 210, 230, 240, 280. В центре ранжированного ряда находится третье по величине значение признака, являющееся медианой:

Наши данные сгруппированы (мы имеем ряд распределения). В этом случае сначала находят порядковый номер медианы:

Затем среди накопленных частот (см табл. 1.4) находим ту, которая первой превышает или равна порядковому номеру медианы. Этому условию удовлетворяет накопленная частота SMe =22. Ей соответствует интервал «194 – 218», называемый медианным. Затем расчет медианы проводится по формуле:

Читайте также:  Установка kicx dtc 50

,

где хМе– нижняя граница медианного интервала (194),

h – величина медианного интервала (24),

– сумма всех частот (30),

fМе – частота медианного интервала (14),

SMе-1 – накопленная частота интервала, предшествующего медианному (8).

млн руб.

Вывод. В рассматриваемой совокупности предприятий половина предприятий имеют размер выручки от продажи продукции не более 206 млн руб., а другая половина – не менее 206 млн руб.

Наиболее часто используемые степенные средние: средняя арифметическая, средняя гармоническая, средняя квадратическая, средняя геометрическая. Каждый вид средней имеет свои условия применения.

В зависимости от исходных данных может использоваться:

формула средней арифметической простой:

или формула средней арифметической взвешенной:

Пример 1. На первом курсе учатся четыре группы:

Номер группы Численность учащихся в группе

Определим среднее число учащихся в группе на первом курсе.

Для ответа на поставленный вопрос необходимо воспользоваться следующей логической формулой:

Мы знаем значение признака (численность учащихся) по каждой единице совокупности (по четырем группам). Общее число учащихся получим путем суммирования значений признака по все группам. Таким образом, в данном случае мы можем воспользоваться формулой средней арифметической простой:

Пример 2. Известны следующие данные:

Численность учащихся в группе Число групп

Обратите внимание, что мы имеем сгруппированные данные: учебные группы распределены по численности учащихся. Для определения среднего числа учащихся в одной группе необходимо воспользоваться выше приведенной логической формулой. При этом для расчета общего числа учащихся в колледже следует просуммировать произведения численности учащихся в группе (значений признака ) на число групп с такой численностью (частоты ). Вычисления удобно сделать в таблице:

Численность учащихся в группе Число групп Численность учащихся в группах
Итого

Общее число единиц совокупности (число групп) равно сумме всех частот. Следовательно, в данном случае для расчета среднего числа учащихся в группе необходимо воспользоваться формулой средней арифметической взвешенной:

В расчетно-аналитической работе требуется по интервальному ряду распределения предприятий рассчитать средний размер выручки. Очевидно, что средний размер выручки в расчете на одно предприятие следует рассчитать, используя следующую логическую формулу:

Для проведения расчетов в интервальном ряду сначала находят середину каждого интервала ( ), например:

для интервала 170 – 194 середина равна 182: (170+194)/2= 182;

для интервала 194 – 218 середина равна 206: (194+218)/2=206 и т.д.

Обратите внимание: середины интервалов отличаются друг от друга на 24, т.е. на величину интервала, поскольку ряд с равными интервалами.

Для определения общего объема выручки надо среднюю выручку по каждой группе (середину интервала) умножить на число предприятий в группе.

Результаты расчетов средней величины представим в табличной форме (табл.1.5):

Распределение предприятий по объему выручки от продаж

Выручка от продаж, млн. руб. Число предприятий
170 – 194
194 – 218
218 – 242
242 – 266
266 – 290
Итого

Всегда ли используется средняя арифметическая?

Пример. Известны следующие данные о ценах на бензин Аи-95 и объеме его продаж в трех районах городах за день:

Районы Цена, рублей Объем продаж, тыс. рублей
А 38,6 173,70
Б 39,2 188,64
В 40,1 126,32

Рассчитаем среднюю цену бензина Аи-95. Исходя из экономического содержания показателя, мы можем написать:

Для исчисления средней цены надо сначала определить количество проданного товара, разделив объем продаж на его цену ( см. расчет в следующей таблице):

Районы Цена, рублей Объем продаж, тыс. рублей Количество товара, тыс. л
А 38,6 173,70 4,50
Б 39,2 188,64 4,81
В 40,1 126,32 3,15
Итого 488,66 12,46

В данном случае мы воспользовались формулой средней гармонической взвешенной: объем продаж обозначим через ,значение признака – через , количество проданного товара определим путем деления объема продаж на цену.

Информации о средних значениях признака обычно бывает недостаточным для полного анализа изучаемого явления, т.к. иногда совершенно разные по внутреннему строению совокупности могут иметь равные средние величины.

Читайте также:  Установка агента новая версия

Необходимо учитывать также разброс значений признака единиц совокупности, т.е. вариацию признака единиц.

Вариацией называется изменчивость значений признака у единиц статистической совокупности, т.е. колеблемость признака.

Если вариация велика (т.е. отклонения от средней значительны), то средняя является ненадёжной характеристикой совокупности.

Измеряют вариацию с помощью абсолютных и относительных показателей.

Абсолютные показатели вариации: размах вариации, среднее линейное отклонение, дисперсия, среднее квадратическое отклонение.

Относительные показатели вариации: коэффициент осцилляции, относительное линейное отклонение, коэффициент вариации.

Наиболее часто используются:

· дисперсия: ;

· среднее квадратическое отклонение (показывает, на сколько в среднем отклоняются значения признака от средней величины)

· коэффициент вариации

Принято считать, что при выполнимости неравенства

Vs 33%

колеблемость значений признака незначительная и совокупность является однородной по данному признаку. Если коэффициент вариации более 33%, но не превышает 60% — колеблемость средняя (умеренная); при превышении этого порога – колеблемость значительная и средняя не является надёжной характеристикой совокупности.

Коэффициент вариации используется для сравнения колеблемости признаков в различных рядах распределения, когда сравнивается вариация разных признаков в одной и той же совокупности или же вариация одного и того же признака в различных совокупностях, имеющих разные средние.

Для расчета указанных показателей вариации в таблице 1.6. введены дополнительные графы:

Распределение предприятий по объему выручки от продаж

Выручка от продаж, млн. руб. Число предприятий
170 – 194 – 28
194 – 218 – 4
218 – 242
242 – 266
266 – 290
Итого

Среднее квадратическое отклонение:

млн. руб.

Коэффициент вариации: .

В нашем примере средняя величина, мода и медиана отличаются незначительно. Чем больше величина расхождения между ними, тем более асимметричен ряд. Разности

являются простейшими показателями симметрии в рядах распределения. В нормальном и близких к нему распределениях основная масса единиц (почти 70%) располагается в центральной зоне ряда, в диапазоне ( ).

Вывод. Анализ полученных значений показателей и σ говорит о том, что средний размер выручки от продажи продукции составляет 210,0 млн руб.; отклонение от среднего размера в ту или иную сторону составляет в среднем 24,85 млн руб. (или 11,8 %); наиболее характерные значения размера выручки находятся в пределах от 185,15 млн руб. до 234,85 млн руб. (диапазон ).

Значение Vσ =11,8 % не превышает 33%, следовательно, вариация размера выручки от продажи продукции в исследуемой совокупности предприятий незначительна и совокупность по данному признаку качественно однородна. Расхождение между значениями , Мо и Ме незначительно ( = 210,0 млн руб., Мо=203,0 млн руб., Ме= 206,0 млн руб.), что подтверждает вывод об однородности совокупности предприятий. Таким образом, найденное среднее значение размера выручки от продажи продукции (210,0 млн руб.) является типичной, надежной характеристикой исследуемой совокупности предприятий.

Во втором задании требуется по исходным данным с учетом проведенных по заданию 1 расчетов проанализировать разными методами наличие связи между двумя признаками: выручкой и прибылью.

Прежде всего, можно графически показать, что связь есть и она прямая (в образце выполнения задания вы увидите график).

Следующий метод – метод аналитической группировки. Суть его заключается в следующем: единицы совокупности группируются по факторному признаку (в нашем случае – по выручке от продаж) и в каждой группе рассчитывается среднее значение результативного признака (в нашем случае – прибыли). Если с ростом факторного признака среднее значение результативного расчет – это свидетельствует о наличии прямой зависимости между признаками. Если снижается – это свидетельствует о наличии обратной зависимости.

Для построения аналитической группировки воспользуемся вспомогательной таблицей, которая была составлена нами ранее для построения интервального ряда распределения. На основе расчетов, проведенных во вспомогательной таблице, определим среднее значение прибыли по каждой группе:

— в первой группе суммарная прибыль 481, предприятий 8, следовательно средняя прибыль равна 481/8=60,1

— во второй группе, соответственно 1059/14=75,6 и т.д.

источник