Проблемы статистики 42 » Буквы.Ру Научно-популярный портал<script async custom-element="amp-auto-ads" src="https://cdn.ampproject.org/v0/amp-auto-ads-0.1.js"> </script>

Проблемы статистики 42

<

100713 1147 1 Проблемы статистики 42

ЗАДАНИЕ 1

 

В результате выборочного обследования заработной плати 60-ти работников предприятия промышленности были получены следующие данные (представлены в табл. 1).

Постройте интервальный ряд распределения по результативному признаку, образовав пять групп с равными интервалами.

Определите основные показатели вариации (дисперсию, среднее квадратическое отклонение, коэффициент вариации), среднюю степенную величину (среднее значение признака) и средние структурные (моду и медиану). Изобразите графически в виде: а) гистограммы; б) кумуляты; в) огивы. Сделайте на основании полученных показателей вывод.

 

РЕШЕНИЕ

1. Определим размах вариации по результативному признаку – по производственному стажу по формуле:

 

R = Хmax – Хmin = 38– 5 = 33

 

где Хmax – максимальный размер активов

Хmin – минимальный размер активов

 

2. Определим величину интервала

 

i = R/n = 33/5= 6,6

 

с учетом полученной величины интервалов производим группировку банков и получаем

 

3. Построим вспомогательную таблицу

 

 

Группа призна-ка 

Значение значений в группе

хi

Количество частота признака (частота)

fi

в % к итогу

Накопленная частота

Si

Середина интервала

100713 1147 2 Проблемы статистики 42

 

100713 1147 3 Проблемы статистики 42* fi

 

 

100713 1147 4 Проблемы статистики 42

 

100713 1147 5 Проблемы статистики 42

 

100713 1147 6 Проблемы статистики 42

I

5 – 11,6 

5,5,6,6,6,6,6,

7,7,7,7,8,8,8,8,

9,9,9,9,9,10,10

10,10,10,11 

26 

43,3 

43,3 

9,1 

236,6 

394,03 

-6,4 

40,96 

1064,96

II

11,6 – 18,2

12,12,13,13,14,14,

14, 14, 15,15,16, 17,17,18,18,18, 

16 

26,7 

70,0 

14,9 

238,4

397,83 

-0,6 

0,36 

5,76

III

18,2 – 24,8 

19,19,20,20,21,21,

21,21,21,

22,24 

11 

18,3 

88,3 

21,5 

236,5 

393,45 

6 

36 

396

IV

24,8 –31,4 

25,28,28,29, 

4 

6,7 

95 

28,1 

112,4 

753,08 

12,6 

158,76 

635,04

V

31,4 – 38 

33,35,38, 

3 

5 

100 

34,7 

104,1 

<

520,5 

19,2 

368,64 

1105,92

ИТОГО 

 

60 

100 

 

 

928 

2458,89 

 

604,72 

3207,68

 

4. Среднее значение признака в изучаемой совокупности определяется по формуле арифметической взвешенной:

100713 1147 7 Проблемы статистики 42лет

5. Дисперсия и среднее квадратическое отклонение признака определяется по формуле

100713 1147 8 Проблемы статистики 42

100713 1147 9 Проблемы статистики 42

Определение колеблемости

100713 1147 10 Проблемы статистики 42

Таким образом, V>33,3%, следовательно, совокупность неоднородна.

6. Определение моды

Мода – значение признака, наиболее часто встречающееся в изучаемой совокупности. В исследуемом интервальном вариационном ряду мода рассчитывается по формуле:

100713 1147 11 Проблемы статистики 42

где

x M0
– нижняя граница модального интервала:

iM0 – величина модального интервала;

f M0-1 f M0 f M0+1 – частоты (частости) соответственно модального, домо-дального и послемодального интервалов.

Модальный интервал – это интервал, имеющий наибольшую частоту (частость). В нашей задаче – это первый интервал.

100713 1147 12 Проблемы статистики 42

7. Рассчитаем медиану.

Медиана – вариант, расположенный в середине упорядоченного вариационного ряда, делящий его на две равные части, таким образом, что половина единиц совокупности имеют значения признака меньше, чем медиана, а половина– больше, чем медиана.

В интервальном ряду медиана определяется по формуле:

100713 1147 13 Проблемы статистики 42

где 100713 1147 14 Проблемы статистики 42 – начало медианного интервала;

100713 1147 15 Проблемы статистики 42 – величина медианного интервала

100713 1147 16 Проблемы статистики 42 – частота медианного интервала;

100713 1147 17 Проблемы статистики 42 – сумма накопленных частот в домедианном интервале.

Медианный интервал – это интервал, в котором находится порядковый номер медианы. Для его определения необходимо подсчитать сумму накопленных частот до числа, превышающего половину совокупности.

По данным гр. 5 вспомогательной таблицы находим интервал, сумму накопленных часто в котором превышает 50%. Это второй интервал – от 11,6 до 18,4, он и является медианным.

Тогда

100713 1147 18 Проблемы статистики 42

Следовательно, половина работников имеющих стаж работы меньше 13,25 лет, а половина – больше этой величины.

6. Изобразим ряд в виде полигона, гистограммы, кумулятивной прямой, огивы.

Графическое представление играет важную роль в изучении вариационных рядов, так как позволяет в простой и наглядной форме проводить анализ статистических данных.

Существует несколько способов графического изображения рядов (гистограмма, полигон, кумулята, огива), выбор которых зависит от цели исследования и от вида вариационного ряда.

Полигон распределения в основном используется для изображения дискретного ряда, но можно построить полигон и для интервального ряда, если предварительно привести его к декретному. Полигон распределения представляет собой замкнутую ломаную линию в прямоугольной системе координат с координатами (xi, qi), где xi — значение i-го признака, qi — частота или частость i-ro признака.

Гистограмма распределения применяется для изображения интервального ряда. Для построения гистограммы на горизонтальной оси откладывают последовательно отрезки, равные интервалам признака, и на этих отрезках, как на основаниях, строят прямоугольники, высоты которых равны частотам или частностям для ряда с равными интервалами, плотностям; для ряда с неравными интервалами.

100713 1147 19 Проблемы статистики 42

Кумулята есть графическое изображение вариационного ряда, когда на вертикальной оси откладываются накопленные частоты или частности, а на горизонтальной – значения признака. Кумулята служит для графического представления как дискретных, так и интервальных вариационных рядов.

100713 1147 20 Проблемы статистики 42
100713 1147 21 Проблемы статистики 42

Вывод: Таким образом, были рассчитаны основные показатели вариации исследуемого ряда: среднее значение признака – производственного стажа составляет 15,5 лет, рассчитана дисперсия равна 53,461, в свою очередь среднее квадратическое отклонение признака – 7,312. Мода имеет значение 9,77, в модальным интервалом является – первый интервал изучаемого ряда. Медиана ряда равная 13,25, делит ряд на две равные части говорит о том что в исследуемой организации половина работников имеет стаж работы меньше 13,25 лет, а половина – больше.
ЗАДАНИЕ 2

Имеются следующие исходные данные за 1997 – 2001 г.г. Исчислите основные показатели рядов динамики. Расчет представьте в виде таблицы. Рассчитайте среднегодовые значения этих показателей. В виде графического изображения – полигона обозначьте динамику анализируемого показателя. Сделайте вывод.

РЕШЕНИЕ
Дано
Год19971998199920002001Процент инфицированных туберкулезом детей от общего количества1,61,22,83,04,5
1) Средний уровень динамики рассчитывается по формуле
100713 1147 22 Проблемы статистики 42
2) Цепные и базисные темпы роста рассчитываем следующим образом:
1. Абсолютный прирост определяется по формуле: (млн. руб.)
Аiб = yi – y0
Аiц = yi – yi-1
2. Темп роста определяется по формуле: (%)
Трб = (yi / y0) *100
Трц = (yi / yi-1)*100
3. Темп прироста определяется по формуле: (%)
Тnрб = Трб –100%:
Тnрц = Трц – 100%
4. Средний абсолютный прирост:
100713 1147 23 Проблемы статистики 42
yn – конечный уровень динамического ряда;
y0 – начальный уровень динамического ряда;
nц – число цепных абсолютных приростов.
5. Среднегодовой темп роста:
100713 1147 24 Проблемы статистики 42
6. Среднегодовой темп прироста:
100713 1147 25 Проблемы статистики 42
3) Абсолютное содержание 1% прироста (млн. руб):
А = Хi-1 / 100
Все рассчитанные показатели сводим в таблицу.
ПоказателиГоды19971998199920002001Процент инфицированных туберкулезом детей от общего количества1,61,22,83,04,52. Абсолютный прирост-Aib—0,4+1,2+1,4+2,9Aiц—0,4+1,6+1,2+1,53. Темп роста-Трib-75175187,5281,25Трiц-75233,3107,11504. Темп прироста-Тпib—25+75+87,50+181,25Тпiц—25+133,3+7,1+505. Значение 1% прироста-0,0160,0120,0280,03
5) Среднегодовое значение
100713 1147 26 Проблемы статистики 42
7. Изобразим графически в виде полигона.

100713 1147 27 Проблемы статистики 42
Таким образом, получено следующее. Наибольший абсолютный и относительный прирост процента инфицированных туберкулезом детей от общего количества было достигнуто в 2001 году – 2,9 и +281,25% по сравнению с базовым.. Рассчитан средний уровень динамики – он равен 2,62. Среднегодовой темп роста равнее 123%. Наибольший прирост составил в 199 году, темп роста по сравнению с 1998 годом составил 233%, а отрицательная динамика наблюдалась в 1998 году.

ЗАДАНИЕ 3

По данным о реализации товаров (по шести видам) товаров определите:
а) индивидуальные индексы (ip, iq)
б) сводные индексы (Ip, Iq, Ipq)
в) абсолютное изменение товарооборота за счет:
1) количества товаров;
2) цены

РЕШЕНИЕ
Составим вспомогательную таблицу
ВидБазисноеОтчетноеПроизведениеИндексыКол-во, q0Цена, p0Кол-во, q1Цена, p1q0* p0q1* p1iq=q1/q0ip=p1/p0q1* p0112004013204248000554401,11,0552800225512250,51275111100,880,991222317011018011018700198001,059119800433203031603199600979600,9521,0394800543020547020488150958801,0930,99596350616017,512517280021250,9710,7812187,5ИТОГО—-258525282315—267159,5
100713 1147 28 Проблемы статистики 42
Вывод: Как видим общий прирост товарооборота за год составил 23790, включая влияние изменения количества проданного товара на 8634,5 и из-за изменения цены на товар – 15155,5. Общий прирост товарооборота составил 109,2%
ЗАДАНИЕ 4

Из исходных данных таблицы № 1 (выбрать строки с 14 до 23) провести корреляционно-регрессионный анализ, определить параметры корреляции и детерминации. Построить график корреляционной зависимости между двумя признаками (результативным и факторным). Сделать вывод.
РЕШЕНИЕ
Исходные данные
Производственный стажРазмер заработной платы20180038285014175091580141750201560912107118061355121480
Прямолинейная зависимость
100713 1147 29 Проблемы статистики 42
Параметры уравнения определяются по методу наименьших квадратов, по системе нормальных уравнения
100713 1147 30 Проблемы статистики 42
Для решения системы используем метод определителей.
Параметры рассчитывает по формулам
100713 1147 31 Проблемы статистики 42

№xyxyx2y2120180036000400324000023828501083001444812250031417502450019630625004915801422081249640051417502450019630625006201560312004002433600791210108908114641008711808260491392400961355813036183602510121480177601442190400Итого149165152837603027102403425
Получаем
100713 1147 32 Проблемы статистики 42
Тогда
100713 1147 33 Проблемы статистики 42
Коэффициент корреляции рассчитываем по формуле
100713 1147 34 Проблемы статистики 42
Таким образом, нами получено положительное значение коэффициента корреляции, что говорит о наличии прямой связи между исследуемыми показателями.
Коэффициент детерминации
r2 = 0.0234
Коэффициент детерминации может быть выражен в процентах. В нашем случае на 2,34% заработная плата зависит от стажа работника.
Для построения графика по формуле простой средней рассчитаем средние значения стажа одного работника и среднюю величину заработной платы
100713 1147 35 Проблемы статистики 42 = 14,9
100713 1147 36 Проблемы статистики 42=1651,5
Строим график

100713 1147 37 Проблемы статистики 42 Вывод: Таким образом, между исследуемыми показателями – производственным стажем и заработной платы установлена прямая связь, так к рассчитанный коэффициент корреляции далек от 1, то связь между ними слабая.
ЗАДАНИЕ 5

Рассматривая данные табл. 1 как результаты случайно 10% бесповторной выборки и используя результаты решения первой задачи, определите:
1) доверительный интервал для среднего признака с доверительной вероятностью 0,997;
2) Необходимый объем выборки, обеспечивающий снижение предельной ошибки выборки в 4 раза;
3) Сделать вывод
РЕШЕНИЕ
Генеральная совокупность составила N = 600, выборочная совокупность n =60, дисперсия и среднее значение признака равны 100713 1147 38 Проблемы статистики 42 и 100713 1147 39 Проблемы статистики 42, доверительная вероятность р = 0,997 и t =3
1) 100713 1147 40 Проблемы статистики 42 колеблется в пределах 100713 1147 41 Проблемы статистики 42
100713 1147 42 Проблемы статистики 42– предельная ошибка выборки
100713 1147 43 Проблемы статистики 42
Таким образом,
100713 1147 44 Проблемы статистики 42 колеблется в пределах 100713 1147 45 Проблемы статистики 42
Снижение предельной ошибки выборки в 4 раза равно */4
100713 1147 46 Проблемы статистики 42
3. Возводим обе части в квадрат и рассчитываем значение nв
100713 1147 47 Проблемы статистики 42
Вывод: Таким образом, рассчитанный необходимый объем выборки, обеспечивающий снижение предельной ошибки выборки в 4 раза равен 60, а исследуемое среднее значение результативного признака – производственный стаж колеблется в пределах 100713 1147 48 Проблемы статистики 42
СПИСОК ЛИТЕРАТУРЫ

Адамов В.Е. Факторный индексный анализ. Методология и проблемы.–М: Статистика, 1977
 

  1. Дружинин Н.К. Математическая статистика в экономике. – М.: Статистика, 2002.
  2. Елисеева И.И. Моя профессия – статистик. – М.: Финансы и статистика, 2003.
  3. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. Чл.-корр. РАН И.И.Елисеевой. – М.: Финансы и статистика, 2004.
  4. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики. -М.: ИНФРА-М, 2002
  5. Кривенкова Л.Н., Юзбашев М.М. Область существования показателей вариации и ее применение // Вестник статистики. – 1991. — №6. – С.66-70
  6. Статистика / Под ред. И.И. Елисеевой. –М.: ООО «Витрэм», 2002.

 

 

 

 

 

 

 

 

 

 

 


 

<

Комментирование закрыто.

MAXCACHE: 0.95MB/0.00038 sec

WordPress: 23.21MB | MySQL:120 | 1,623sec