Этапы статистического исследования » Буквы.Ру Научно-популярный портал<script async custom-element="amp-auto-ads" src="https://cdn.ampproject.org/v0/amp-auto-ads-0.1.js"> </script>

Этапы статистического исследования

<

100713 1150 1 Этапы статистического исследования

1. ЭТАПЫ СТАТИСТИЧЕСКОГО ИССЛЕДОВАНИЯ

 

Процесс изучения социально-экономических явлений посредством системы статистических методов и количественных характеристик – системы показателей, называется статистическим исследованием.

Основными этапами проведения статистического исследования являются:

1) статистическое наблюдение;

2) сводка полученных данных;

3) статистический анализ.

В случае необходимости статистическое исследование может содержать дополнительный этап – статистический прогноз.

Статистическое наблюдение – научно организованный сбор данных о явлениях и процессах общественной жизни посредством регистрации по заранее разработанной программе наблюдения их существенных признаков. Данные наблюдения представляют собой первичную статистическую информацию о наблюдаемых объектах, которая является основой для получения их обобщающих характеристик. Наблюдение выступает как один из главных методов статистики и как одна из важнейших стадий статистического исследования.

Проведение статистического исследования невозможно без качественной информационной базы, получаемой в ходе статистического наблюдения. Поэтому, с момента изменения представлений о статистике как о науке описательной, разрабатываются особые правила проведения наблюдения и специальные требования к его результатам – статистическим данным. То есть, наблюдение является одним из основных методов статистики.

Наблюдение является первым этапом статистического исследования, от качества которого зависит достижение конечных задач исследования.

1.1. Наблюдение осуществляется по специально подготовленной программе.

Программа включает в себя перечень характеристик объекта исследования, данные о которых необходимо получить в результате наблюдения.

При подготовке наблюдения необходимо заранее определить:

1. Программу наблюдения, в которой:

а) определен объект наблюдения, т.е. то множество единиц явления, которое необходимо исследовать. Причем, необходимо отличать единицу наблюдения от отчетной единицы. Отчетная единица – единица предоставляющая статистические данные, может состоять из нескольких единиц совокупности, а может совпадать с единицей совокупности. Например, при обследовании населения единицей может быть член домохозяйства, а отчетной единицей – домохозяйство.

б) определены границы объекта наблюдения.

в) определены признаки объекта наблюдения, сведения о которых необходимо получить в результате наблюдения.

2. Время наблюдения объекта – время по состоянию на которое или за которое регистрируются сведения об изучаемом объекте.

3. Сроки проведения наблюдения. То есть, определяются период времени сбора данных и дата завершения наблюдения. Сроки наблюдения влияют на время окончания в целом статистического исследования и на своевременность его выводов.

4. Средства и ресурсы, необходимые для проведения наблюдения: количество квалифицированных специалистов; материальные ресурсы; средства обработки результатов наблюдения.

5. Требования к статистическим данным. Основными требованиями являются: а) достоверность, т.е. сведения об объекте исследования должны отражать реальное его состояние в момент наблюдения; б) сопоставимость данных, т.е. сведения, полученные в результате наблюдения, должны быть сравнимыми, что обеспечивается единой методикой сбора и анализа данных, по единицам измерения и т.д.

1.2. Выделяют несколько видов статистического наблюдения.

1. По охвату единиц совокупности:

а) сплошное;

б) несплошное (выборочное, монографическое, по методу основного массива)

2. По времени регистрации фактов: а) текущее (непрерывное); б) прерывное (периодическое, единовременное)

3. По способу сбора информации: а) непосредственное наблюдение; б) документальное наблюдение; в) опрос (анкетный, корреспондентский и др.)

Сводка – процесс приведения в систему полученных данных, их обработка и подсчет промежуточных и общих итогов, расчет взаимосвязанных величин аналитического характера.

Следующим этапом статистического исследования является подготовка полученных в ходе наблюдения сведений к анализу. Этот этап называется сводка.

Сводка включает в себя:

— систематизацию полученных в ходе наблюдений сведений;

— их группировку;

— разработку системы показателей, характеризующих образованные группы;

— создание разработочных таблиц для сгруппированных данных;

— расчет производных величин по разработочным таблицам.

В литературе по теории статистики часто встречается рассмотрение сводки и группировки как самостоятельных этапов исследования. Однако, следует заметить, что понятие сводки включает в себя действия по группировке статистических данных, поэтому здесь в качестве названия этапа исследования принято понятие «сводка».

Статистический анализ – исследование характерных особенностей структуры, связи явлений, тенденций, закономерностей развития социально-экономических явлений, для чего используются специфические экономико-статистические и математико-статистические методы. Статистический анализ завершается интерпретаций полученных результатов.

Статистический прогноз – научное выявление состояния и вероятных путей развития явлений и процессов, основанное на системе установленных причинно-следственных связей и закономерностей.

 

ЗАДАНИЕ 1

 

В результате выборочного обследования заработной платы 60-ти работников предприятия промышленности были получены следующие данные (табл. 1).

Постройте интервальный ряд распределения по результативному признаку, образовав пять групп с равными интервалами.

Определите основные показатели вариации (дисперсию, среднее квадратическое отклонение, коэффициент вариации), среднюю степенную величину (среднее значение признака) и структурные средние. Изобразите графически в виде: а) гистограммы; б) кумуляты; в) огивы. Сделайте вывод.

 

РЕШЕНИЕ

1. Определим размах вариации по результативному признаку – по производственному стажу по формуле:

R = Хmax – Хmin = 36 – 5 = 31

где Хmax – максимальный размер активов

Хmin – минимальный размер активов

 

2. Определим величину интервала

i = R/n = 31/5= 6,2

с учетом полученной величины интервалов производим группировку банков и получаем

 

3. Построим вспомогательную таблицу

 

 

 

Группа призна-ка 

Значение значений в группе

хi

Количество частота признака (частота)

fi

в % к итогу

ω

Накопленная частота

Si

Середина интервала

100713 1150 2 Этапы статистического исследования

 

100713 1150 3 Этапы статистического исследования* fi

 

100713 1150 4 Этапы статистического исследованияω

 

100713 1150 5 Этапы статистического исследования

 

100713 1150 6 Этапы статистического исследования

 

100713 1150 7 Этапы статистического исследования

I

5 – 11,2

6,8,7,5,8,6,10,9,9,7, 6,6,9,10,7,9,10,10, 11,8,9,8, 7, 6, 9, 10

26

43,3

43,3

8,1

210,6

350,73

-6,8

46,24

1202,24

II

11,2 – 17,4

16,15,13,12,14,14, 12,14,17,13,15,17, 14

13

21,7

65

14,3

185,9

310,31

-0,6

0,36

4,68

III

17,4 – 23,6

18,21,20,20,21,18, 19,22,21,21,21,18, 19

13

21,7

86,7

20,5

266,5

444,85

5,6

31,36

407,68

IV

23,6 –29,8

28,29,25,28, 24

5

8,3

95

26,7

133,5

221,61

11,8

139,24

696,2

V

29,8 – 36

36,35,33,

3

5

100

32,9

98,7

164,5

18

324

972

ИТОГО 

 

60

100

 

 

895,2

1492

 

541,2

3282,8

 

4. Среднее значение признака в изучаемой совокупности определяется по формуле арифметической взвешенной:

100713 1150 8 Этапы статистического исследованиягода

5. Дисперсия и среднее квадратическое отклонение признака определяется по формуле

100713 1150 9 Этапы статистического исследования

100713 1150 10 Этапы статистического исследования

Определение колеблемости

100713 1150 11 Этапы статистического исследования

Таким образом, V>33,3%, следовательно, совокупность неоднородна.

6. Определение моды

Мода – значение признака, наиболее часто встречающееся в изучаемой совокупности. В исследуемом интервальном вариационном ряду мода рассчитывается по формуле:

100713 1150 12 Этапы статистического исследования

где

x M0
– нижняя граница модального интервала:

iM0 – величина модального интервала;

f M0-1 f M0 f M0+1 – частоты (частости) соответственно модального, домо-дального и послемодального интервалов.

Модальный интервал – это интервал, имеющий наибольшую частоту (частость). В нашей задаче – это первый интервал.

100713 1150 13 Этапы статистического исследования

7. Рассчитаем медиану.

Медиана – вариант, расположенный в середине упорядоченного вариационного ряда, делящий его на две равные части, таким образом, что половина единиц совокупности имеют значения признака меньше, чем медиана, а половина– больше, чем медиана.

В интервальном ряду медиана определяется по формуле:

100713 1150 14 Этапы статистического исследования

где 100713 1150 15 Этапы статистического исследования – начало медианного интервала;

100713 1150 16 Этапы статистического исследования – величина медианного интервала

100713 1150 17 Этапы статистического исследования – частота медианного интервала;

100713 1150 18 Этапы статистического исследования – сумма накопленных частот в домедианном интервале.

Медианный интервал – это интервал, в котором находится порядковый номер медианы. Для его определения необходимо подсчитать сумму накопленных частот до числа, превышающего половину совокупности.

По данным гр. 5 вспомогательной таблицы находим интервал, сумму накопленных часто в котором превышает 50%. Это второй интервал – от 11,6 до 18,4, он и является медианным.

Тогда

100713 1150 19 Этапы статистического исследования

Следовательно, половина работников имеющих стаж работы меньше 13,25 лет, а половина – больше этой величины.

6. Изобразим ряд в виде полигона, гистограммы, кумулятивной прямой, огивы.

Графическое представление играет важную роль в изучении вариационных рядов, так как позволяет в простой и наглядной форме проводить анализ статистических данных.

Существует несколько способов графического изображения рядов (гистограмма, полигон, кумулята, огива), выбор которых зависит от цели исследования и от вида вариационного ряда.

Полигон распределения в основном используется для изображения дискретного ряда, но можно построить полигон и для интервального ряда, если предварительно привести его к декретному. Полигон распределения представляет собой замкнутую ломаную линию в прямоугольной системе координат с координатами (xi, qi), где xi — значение i-го признака, qi — частота или частость i-ro признака.

Гистограмма распределения применяется для изображения интервального ряда. Для построения гистограммы на горизонтальной оси откладывают последовательно отрезки, равные интервалам признака, и на этих отрезках, как на основаниях, строят прямоугольники, высоты которых равны частотам или частностям для ряда с равными интервалами, плотностям; для ряда с неравными интервалами.

100713 1150 20 Этапы статистического исследования

Кумулята есть графическое изображение вариационного ряда, когда на вертикальной оси откладываются накопленные частоты или частности, а на горизонтальной – значения признака. Кумулята служит для графического представления как дискретных, так и интервальных вариационных рядов.

 

 

 

 

 

 

 

100713 1150 21 Этапы статистического исследования

Вывод: Таким образом, были рассчитаны основные показатели вариации исследуемого ряда: среднее значение признака – производственного стажа составляет 14,9 лет, рассчитана дисперсия равная 54,713, в свою очередь среднее квадратическое отклонение признака – 7,397. Мода имеет значение 9,13, в модальным интервалом является первый интервал изучаемого ряда. Медиана ряда равная 13,108, делит ряд на две равные части говорит о том что в исследуемой организации половина работников имеет стаж работы меньше 13,108 лет, а половина – больше.

ЗАДАНИЕ 2

 

Имеются следующие исходные данные, характеризующие динамику за 1997 – 2001 г.г. (таблица 2).

Таблица 2 Исходные данные

Год 

1997 

1998 

1999 

2000 

2001 

Выпуск сахарного песка, тыс.т.

1620

1660

1700

1680

1700

 

Определите основные показатели ряда динамики. Расчет представьте в виде таблицы. Рассчитайте среднегодовые значения показателей. В виде графического изображения – полигона, обозначьте динамику анализируемого показателя. Сделайте вывод.

 

РЕШЕНИЕ

Дано

Год 

Годы

1997 

1998 

1999 

2000 

2001 

Количество хирургических операций за период

1620

1660

1700

1680

1700

 

1) Средний уровень динамики рассчитывается по формуле

100713 1150 22 Этапы статистического исследования

2) Цепные и базисные темпы роста рассчитываем следующим образом:

1. Абсолютный прирост определяется по формуле:

Аiб = yi – y0

Аiц = yi – yi-1

2. Темп роста определяется по формуле: (%)

Трб = (yi / y0) *100

Трц = (yi / yi-1)*100

3. Темп прироста определяется по формуле: (%)

Тnрб = Трб –100%:

Тnрц = Трц – 100%

4. Средний абсолютный прирост:

100713 1150 23 Этапы статистического исследования

yn
– конечный уровень динамического ряда;

y0
– начальный уровень динамического ряда;

nц
– число цепных абсолютных приростов.

5. Среднегодовой темп роста:

100713 1150 24 Этапы статистического исследования

6. Среднегодовой темп прироста:

100713 1150 25 Этапы статистического исследования

3) Абсолютное содержание 1% прироста:

А = Хi-1 / 100

Все рассчитанные показатели сводим в таблицу.

Показатели 

Годы 

1997 

1998 

1999 

2000 

2001 

Количество хирургических операций за период

1620

1660

1700

1680

1700

2. Абсолютный прирост 

 

       

Aib 

 

40

80

60

80

Aiц 

 

40

40

-20

20

3. Темп роста 

 

<
       

Трib 

 

102,5

104,9

103,7

104,9

Трiц 

 

102,5

102,4

98,8

101,2

4. Темп прироста

 

       

Тпib 

 

2,5

4,9

3,7

4,9

Тпiц 

 

2,5

2,4

-1,2

1,2

5. Значение 1% прироста 

 

16,2

16,6

17,0

16,8

 

 

5) Среднегодовое значение

 

100713 1150 26 Этапы статистического исследования

 

7. Изобразим графически в виде полигона.

100713 1150 27 Этапы статистического исследования

Таким образом, получено следующее. Наибольший абсолютный и относительный прирост хирургических операций за период было в 1999 году и составило 1700, абсолютный прирост по сравнению с базисным годом составил 80 операций, темп роста по отношению к базовому 1997 годом равен 104,9%, а базовый темп прирост был 4,9%. Наибольшие цепные абсолютные приросты были в 1998 и 1999 году – по 40 операций. Наибольший цепной темп роста наблюдался в 1998 году – 102,5%, а наименьший цепной темп прироста количества операций составляет в 2000 году – 98,8%.

 

 

 

 

 

ЗАДАНИЕ 3

 

Имеются данные о реализации товаров (см. таблицу 3)

 

Таблица 3 Исходные данные о реализации товаров

 

Товар 

Базовый год 

Отчетный год 

кол-во 

цена 

кол-во 

цена 

1 

Н 

800 

55 

700 

50 

2 

О 

1100 

38 

1000 

40 

3 

П 

50 

150 

60 

140 

4 

Р 

30 

1350 

20 

1300 

5 

С 

50 

900 

55

800 

6 

Т 

1650 

16 

1700 

15 

 

Определить: а) индивидуальные индексы (ip, iq); б) общие индексы (Ip, Iq, Ipq); в) абсолютное изменение товарооборота за счет: 1) количества товаров; 2) цены.

На основании исчисленных показателей сделайте вывод.

 

РЕШЕНИЕ

Составим вспомогательную таблицу

Вид 

Базисное 

Отчетное 

Произведение

Индексы 

Кол-во, q0

Цена, p0

Кол-во, q1

Цена, p1

q0* p0

q1* p1

iq=q1/q0

ip=p1/p0

q1* p0

1 

800 

55 

700 

50 

44000

35000

0,875

0,909

38500

2 

1100 

38 

1000 

40 

41800

40000

0,909

1,053

38000

3 

50 

150 

60 

140 

7500

8400

1,200

0,933

9000

4 

30 

1350 

20 

1300 

40500

26000

0,667

0,963

27000

5 

50 

900 

55 

800 

45000

44000

1,100

0,889

49500

6 

1650 

16 

1700 

15 

26400

25500

1,030

0,938

27200

ИТОГО 

 

 

 

 

205200

178900

 

 

189200

 

100713 1150 28 Этапы статистического исследования

Вывод: Как видим общий прирост товарооборота за год составил (-26300) усл.ед., включая влияние изменения количества проданного товара на — 16000 и из-за изменения цены на товар – 10300 усл.ед. Общий прирост товарооборота составил 87,2%. Следует отметить, что согласно рассчитанным индексам количества товара по ассортименту наблюдается незначительный прирост товарооборота по товару «П» на 120% и товару «С» 110%, незначительный рост реализации товара «Т» – всего 103%. Довольно значительно снизилась реализации товара «Р» – всего 66,7% от реализации в базисном году, чуть выше реализация товара «Н» – 87,5% и товара «О» – 90,9% от соответствующего показателя базисного года. Индивидуальный индекс цены показывает, что цена выросла лишь на товар «О» – на 105,3%, в то же время по всем остальным наименованиям товара – «Н», «П», «Р», «С», «Т» индивидуальный индекс цен свидетельствует об отрицательной динамике (снижении) соответственно – 90,9%; 93,3%;, 96,3%, 88,9; 93,8.

Общий индекс физического объема реализации свидетельствует о незначительном снижении общего объема реализации на 94,6%; общий индекс цены свидетельствует об общем снижении цены на реализуемые товары на 92,2%, а общий индекс товарооборота говорит об общем снижении товарооборота на 87,2%.

 

 

 

ЗАДАНИЕ 4

 

Из исходных данных таблицы № 1 (выбрать строки с 14 до 23) по двум признакам – производственному стажу и размеру заработной платы провести корреляционно-регрессионный анализ, определить параметры корреляции и детерминации. Построить график корреляционной зависимости между двумя признаками (результативным и факторным). Сделать вывод.

 

РЕШЕНИЕ

Исходные данные

Производственный стаж 

Размер заработной платы 

20

1800

36

2500

14 

1750 

9 

1580 

14 

1750 

20 

1560 

9 

1210 

9

1860

6 

1355 

12 

1480 

 

Прямолинейная зависимость

100713 1150 29 Этапы статистического исследования

Параметры уравнения определяются по методу наименьших квадратов, по системе нормальных уравнения

100713 1150 30 Этапы статистического исследования

Для решения системы используем метод определителей.

 

Параметры рассчитывает по формулам

100713 1150 31 Этапы статистического исследования

 

x 

y 

xy 

x2

y2

1 

20 

1800 

36000

400 

3240000 

2 

36 

2500 

90000

1296 

6250000 

3 

14 

1750 

24500

196 

3062500 

4 

9 

1580 

14220

81 

2496400 

5 

14 

1750 

24500

196 

3062500 

6 

20 

1560 

31200

400 

2433600 

7 

9 

1210 

10890

81 

1464100

8 

9 

1860 

16740

81 

3459600 

9 

6 

1355 

8130

36 

1836025 

10 

12 

1480 

17760

144 

2190400 

Итого 

149

16845

273940

2911

29495125

 

Получаем

100713 1150 32 Этапы статистического исследования

Тогда

100713 1150 33 Этапы статистического исследования

Коэффициент корреляции рассчитываем по формуле

100713 1150 34 Этапы статистического исследования

Таким образом, нами получено положительное значение коэффициента корреляции, что говорит о наличии прямой связи между исследуемыми показателями.

Коэффициент детерминации

r2 = 0,681

Коэффициент детерминации может быть выражен в процентах. В нашем случае на 68,1% заработная плата зависит от стажа работника.

Для построения графика по формуле простой средней рассчитаем средние значения стажа одного работника и среднюю величину заработной платы

100713 1150 35 Этапы статистического исследования = 14,9

100713 1150 36 Этапы статистического исследования=1684,5

Строим график

 

100713 1150 37 Этапы статистического исследованияВывод: Таким образом, между исследуемыми показателями – производственным стажем и заработной платы установлена прямая связь, так к рассчитанный коэффициент корреляции далек от 1, то связь между ними слабая.

 

ЗАДАНИЕ 5

 

Рассматривая данные табл. 1 как результаты случайно 10% бесповторной выборки и используя результаты решения первой задачи, определите:

1) доверительный интервал для среднего значения признака с доверительной вероятностью 0,997;

2) необходимый объем выборки, обеспечивающий снижение предельной ошибки выборки в 4 раза;

На основании полученных данных сделайте вывод.

 

РЕШЕНИЕ

Генеральная совокупность составила N = 600, выборочная совокупность n =60, дисперсия и среднее значение признака равны 100713 1150 38 Этапы статистического исследования и 100713 1150 39 Этапы статистического исследования, доверительная вероятность р = 0,997 и t =3

1) 100713 1150 40 Этапы статистического исследования колеблется в пределах 100713 1150 41 Этапы статистического исследования

100713 1150 42 Этапы статистического исследования– предельная ошибка выборки

100713 1150 43 Этапы статистического исследования

Таким образом,

100713 1150 44 Этапы статистического исследования колеблется в пределах 100713 1150 45 Этапы статистического исследования

Снижение предельной ошибки выборки в 4 раза равно */4

100713 1150 46 Этапы статистического исследования

3. Возводим обе части в квадрат и рассчитываем значение nв

100713 1150 47 Этапы статистического исследования

Вывод: Таким образом, рассчитанный необходимый объем выборки, обеспечивающий снижение предельной ошибки выборки в 4 раза равен 60, а исследуемое среднее значение результативного признака – производственный стаж колеблется в пределах 100713 1150 48 Этапы статистического исследования

СПИСОК ЛИТЕРАТУРЫ

 

  1. Дружинин Н.К. Математическая статистика в экономике. – М.: Статистика, 2002.
  2. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. Чл.-корр. РАН И.И.Елисеевой. – М.: Финансы и статистика, 2004.
  3. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики. -М.: ИНФРА-М, 2002
  4. Кривенкова Л.Н., Юзбашев М.М. Область существования показателей вариации и ее применение // Вестник статистики. – 1991. — №6. – С.66-70
  5. Статистика / Под ред. И.И. Елисеевой. –М.: ООО «Витрэм», 2002.

     

     

     

     

     

     

     

     

     

     

     


     

<

Комментирование закрыто.

WordPress: 23.41MB | MySQL:121 | 2,213sec