Выборочный метод в статистике, виды выборки, средняя и предельная ошибка » Буквы.Ру Научно-популярный портал<script async custom-element="amp-auto-ads" src="https://cdn.ampproject.org/v0/amp-auto-ads-0.1.js"> </script>

Выборочный метод в статистике, виды выборки, средняя и предельная ошибка

<

100813 1047 1 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка


Наиболее корректный статистический анализ общественного процесса обеспечивают сведения о каждом его проявлении. Или, говоря статистическим языком, полный анализ всей совокупности возможен только при учете значения признака у каждой единицы совокупности. В качестве примера такого анализа можно привести всеобщие переписи населения.

Однако, массовый характер общественного явления часто влечет за собой невозможность исследования его в полном объеме, т.е. во всех его проявлениях. В статистической науке разработан специальный метод, позволяющей исследовать лишь часть явления, а результаты и выводы транспонировать на все явление в целом. Такой метод называется «выборочное наблюдение». Основой метода выборочного наблюдения служит взаимосвязь между единичным и общим, между частью и целым, которая существует в общественных явлениях.

Исследуемая часть статистической совокупности называется выборочной, а количество единиц, составляющих ее объем принято обозначать n. Вся совокупность называется генеральной, объем генеральной совокупности обычно обозначают N.

Можно выделить ряд причин применения выборочного наблюдения:

— недостаток временных ресурсов (как для проведения обследования, так и для анализа полученного большого объема данных);

— недостаток кадровых ресурсов, т.е. квалифицированных специалистов для проведения наблюдения и анализа;

— недостаток материальных ресурсов, т.е. слишком дорогостоящее наблюдение;

— практическая невозможность учета всех единиц совокупности в связи с их уничтожением в результате наблюдения (например, в случае обследования всхожести партии семян, продолжительности горения электроламп и т.д.);

— практическая нецелесообразность наблюдения каждой единицы совокупности (например, определения уровня потребления продукта питания населением региона и т.д.)

Основным принципом выборочного наблюдения является принцип рэндомизации (от англ. random – случай), т.е. принцип случайности отбора единиц совокупности, определяющий равенство единиц по возможности быть отобранными в выборочную совокупность. Данный принцип должен выполняться даже в случае планомерного отбора единиц.

В результате неполного обследования генеральной совокупности могут возникнуть ошибки наблюдения – ошибки репрезентативности. Поэтому, основной задачей исследователя является, во-первых, обеспечение представительности (репрезентативности) выборки, и, во-вторых, определение степени уверенности в соответствии параметров выборочной и генеральной совокупностей.

Определение способа отбора единиц совокупности является важной частью выборочного исследования. Существует множество способов отбора единиц совокупности, все их можно представить в виде трех групп (см. рис. 1.):

100813 1047 2 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка
Рис. 1 Способы отбора единиц совокупности

 

Собственно-случайный отбор – выбор единиц совокупности без какой-либо схемы или системы. Может осуществляться методом жеребьевки или с помощью таблицы случайных чисел. При применении данного способа отбора необходимо удостовериться в выполнении принципа рэндомизации.

Отбор с предварительным выделением структуры генеральной совокупности применяется, если исследуется структурированная распределенная на группы) совокупность. Серийный отбор предполагает выбор одной группы единиц, внутри которой производится сплошное обследование, среди всех групп. Районированный отбор представляет собой определение границ выборочной совокупности с учетом территориальной принадлежности единиц генеральной совокупности. Механический отбор применяется для совокупности, в которой каждой единице присвоен отдельный номер, а выбор осуществляется пропорционально количеству единиц, например, каждая десятая единица и др.

Ступенчатый или смешанный отбор применяется в случае поэтапного проведения выборочного наблюдения, когда на разных этапах наблюдения используют различные варианты отбора единиц.

Серийный отбор – с генеральной совокупности отбираются не отдельные единицы, а целые серии, группы, а затем в каждой попавшей в выборку серии обследуются все без исключения единицы. Например, рабочих отбирают бригадами.

Комбинированный отбор – генеральная совокупность делится на одинаковые группы, затем производится отбор групп из которых отбираются отдельные единицы.

Типический отбор
— генеральная совокупность делится на однородные типические группы из которых собственно случайным или механическим способом производится отбор единиц.

Типический отбор дает самые точные результаты по сравнению с другими способами, т.к. обеспечивается репрезентативность в выборке. Например, рабочие делятся на группы по квалификации.

Прежде чем приступить к осуществлению выборочного наблюдения необходимо определить количество единиц выборочной совокупности, обеспечивающее репрезентативность, и, следовательно, надежность результатов исследования.

На практике для реализации выборочного наблюдения исследователем задаются:

— степень точности исследования (вероятность);

— предельная ошибка, т.е. интервал отклонения, определяемый целями исследования.

Исходя из этих критериев, рассчитывается необходимая численность выборочной совокупности (n) на основе формулы предельной ошибки выборки.

Разность между показателями выборочной и генеральной совокупности называется
ошибкой выборки.
Ошибки выборки подразделяются на ошибки регистрации и ошибки репрезентативности.

Ошибки регистрации возникают из-за неправильных или неточных сведений. Источниками таких ошибок могут быть непонимание существа вопроса, невнимательность регистратора, пропуск или повторный счет некоторых единиц совокупности, описки при заполнении формуляров и т. д.

Среди ошибок регистрации выделяются систематические, обусловленные причинами, действующими в каком-то одном направлении и искажающими результаты работы (например, округление цифр, тяготение к полным пятеркам, десяткам, сотням и т. д.), и случайные, проявляющиеся в различных направлениях, уравновешивающие друг друга и лишь изредка дающие заметный суммарный итог.

Ошибки репрезентативности также могут быть систематическими и случайными. Систематические ошибки репрезентативности возникают из-за неправильного, тенденциозного отбора единиц, при котором нарушается основной принцип научно организованной выборки — принцип случайности. Случайные ошибки репрезентативности означают, что, несмотря на принцип случайности отбора единиц, все же имеются расхождения между характеристиками выборочной и генеральной совокупности. Изучение и измерение случайных ошибок репрезентативности и является основной задачей выборочного метода.

Предельная ошибка выборки определяется для средней величины ( 100813 1047 3 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка) и для доли (w), то, соответственно, имеем два варианта определения необходимой численности выборочной совокупности:

а) для повторного отбора:

100813 1047 4 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка100813 1047 5 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

б) для бесповторного отбора:

100813 1047 6 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка100813 1047 7 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

Разрабатывая программу выборочного наблюдения, сразу задают величину допустимой ошибки выборки и доверительную вероятность. Неизвестным остается тот минимальный объем выборки, который должен обеспечить требуемую точность формулы для определения численности выборки (п) зависят от метода отбора.

Объем выборки можно рассчитать по следующей формуле:

ni = 100813 1047 8 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

где ni – объем выборки из I – й группы;

n – общий объем выборки;

Ni — объем i – й группы;

N — объем генеральной совокупности.

 

 

 

 

 

 

 

 

 

 

 

Задача 1

 

Имеются данные по основным показателям деятельности банков одной из областей России:

№ предприятия 

Сумма активов 

Собственный капитал

Привлеченные ресурсы

1 

645,6 

12,0 

27,1

2 

636,9 

14,2 

56,3

3 

629,0 

70,4 

95,7

4 

619,6 

41,0 

44,8

5 

616,4 

120,8 

108,7

6 

614,4 

49,4 

108,1

7 

608,5 

50,3 

76,1

8 

612,7 

70,0 

26,3

9 

601,8 

52,4

46,0

10 

600,0 

42,0 

24,4

 

Построить группировку коммерческих банков по величине собственного капитала, выделив три группы с равными интервалами. Рассчитать по каждой группе сумме активов всего и в среднем на один банк, число банков, привлеченные ресурсы всего и в среднем на один банк.

 

Решение

 

1. Определим размах вариации по формуле:

R = Хmax – Хmin = 120,8 – 12 = 108,8

2. Определим величину интервала

i = R/4 = 108,8/ 3 = 36,27

 

 

Группируем банки

Группа предприятий

Собственный капитал

Сумма активов

Привлеченные ресурсы

I

12,0 – 48,2

12,0

645,6

27,1

14,2

636,9

56,3

41,0

619,6

44,8

42,0 

600,0

24,4

II

48,27 – 84,54

49,4

614,4

108,1

50,3

608,5

76,1

52,4

601,8

46,0

70,0

612,7

26,3

70,4

629,0

95,7

III

84,54 – 120,8

120,8

616,4

108,7

 

Строим вспомогательную таблицу:

 

Группа предприятий 

Кол-во значений признака (частота)

Собственный капитал

Сумма активов

Привлеченные ресурсы

Всего 

Среднее значение 

Всего 

Среднее значение 

Всего 

Среднее значение 

I

4

109,2

27,3

2502,1

625,5

152,6

38,2

II

5

292,5

58,5

3066,4

613,3

352,2

70,4

III

1

120,8

120,8

616,4

616,4

95,7

95,7

S

10

522,5

52,3

6184,9

618,5

600,5

60,5

 

Таким образом, наибольшее число банков попало во вторую группу, образованную по величине собственного капитала. В этой же группе наибольшая величина суммы активов (3066,4 тыс. руб.), приходящаяся на банки. В то же время. Банками в целом привлечено 600,5 тыс. руб. Наибольшая сумма привлеченных ресурсов приходится на вторую группу, а среднее значение привлеченных ресурсов по всей группе составило 204,3 тыс.руб.

 

 

 

 

 

 

 

Задача 2

 

Предприятие планировало выпуск продукции в 1997 г. по сравнению с 1996 г. на 18%. Фактический же объем продукции составил 112,3%. Определите относительный показатель выполнения плана.

 

Решение

 

Индекс выполнения плана

100813 1047 9 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка = 1,123/1,18 = 0,9516

где 100813 1047 10 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка – индекс фактического объема продукции, равен 1,123;

100813 1047 11 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка – планируемое увеличение выпуска продукции, равен 1,18.

Таким образом, на основе индекса выполнения плана, равного 0,9516, можно сделать вывод, что относительный показатель выполнения плана составила 95,16%.

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 3

 

Рабочие бригады имеют следующий стаж работы на данном предприятии:

Табельный номер рабочего

001 

002 

003 

004 

005 

006 

Стаж работы, лет

14 

9 

11 

13 

8 

10 

 

Решение

 

Так задан только один показатель, то для определения среднего стажа работы используем формулу простой средней

100813 1047 12 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

Получаем

100813 1047 13 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка лет

 

Таким образом, средний стаж работников на данном предприятии составляет 10,8 лет.

 

 

 

 

 

 

 

 

 

 

Задача 4

 

Имеются следующие данные выборочного обследования студентов одного из вузов:

 

Затраты времени на дорогу до института, ч

Число студентов, % к итогу 

До 0,5 

8 

0,5 – 1,0 

19 

1,0 – 1,5 

30 

1,5 – 2,0 

37

Свыше 2,0 

6 

Итого  

100 

 

Вычислите абсолютные и относительные показатели вариации.

 

Решение

 

Рассчитаем средний стаж затрат времени на дорогу до института по формуле

100813 1047 14 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка ч.

 

Составляем вспомогательную таблицу

 

 

 

 

 

 

Вспомогательная таблица

Затраты времени на дорогу до института, ч.

Средние значения времени на дорогу

хi

Число студентов, %

fi

Расчетные показатели 

fi хi

100813 1047 15 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

100813 1047 16 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

<

100813 1047 17 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

До 0,5 

0,25

8

2,0

-1,07

1,449

9,1592

0,5 – 1,0

0,75

19

14,25

-0,57

0,3249

6,1731

1,0 – 1,5 

1,25

30

37,5

-0,07

0,049

0,147

1,5 – 2,0 

1,75

37

64,75

0,43

0,1849

6,8413

Свыше 2,0 

2,25

6

13,5

0,93

0,8649

5,1894

Итого  

100

132

-0,35

2,8727

27,51

 

Дисперсия и среднее квадратическое отклонение признака определяется по формулам:

100813 1047 18 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

Определим коэффициент вариации по формуле:

100813 1047 19 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка (%)

Среднее линейное отклонение рассчитываем по формуле

100813 1047 20 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибкач.

Таким образом, коэффициент вариации равен 3,97% и так как V> 33.3% то, следовательно, совокупность неоднородна.

 

 

 

 

 

 

Задача 5

 

Остатки вкладов населения в сбербанках города в 1997 г. характеризуется следующими данными на 1-е число месяца, тыс. руб.:

Январь 

Февраль 

Март 

Апрель 

Май 

Июнь 

Июль 

911 

920 

915 

921 

917 

921 

926 

 

Определите: а) среднемесячные остатки вкладов населения за первый и второй кварталы; б) абсолютный прирост изменения среднего остатка вклада во втором квартале по сравнению с первым.

 

Решение

 

1) Средний уровень динамики рассчитывается по формуле

100813 1047 21 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

Рассчитаем среднемесячный остаток вкладов населения за первый квартал:

y1= (911 + 920 +915 + 921) / 4 = 916,75 тыс. руб.

Среднемесячный остаток вкладов населения за второй квартал:

y2 = (921 + 917 + 921 + 926) / 4 = 921,25 тыс. руб.

 

2. Средний абсолютный прирост рассчитываем по формуле:

100813 1047 22 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

yn
– конечный уровень динамического ряда;

y0
– начальный уровень динамического ряда;

nц
– число цепных абсолютных приростов.

 

 

Средний абсолютный прирост за первый квартал:

Т1 = ((920 – 911) + ( 915 – 920) + (921 – 915))/ 4 = 2,5 тыс. руб.

Средний абсолютный прирост за первый квартал:

Т2 = ((917 – 921) + ( 921 – 917) + (926 – 921))/ 4 = 1,5 тыс. руб.

Таким образом, абсолютный прирост изменения среднего остатка вклада во втором квартале по сравнению с первым составил 1 тыс. руб. (Т2 – Т1)

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 6

 

Имеются следующие данные о реализации товаров на городском колхозном рынке:

 

Товар 

Средняя цена единицы товара, руб. 

Количество проданного товара, тыс. ед.

февраль

март

февраль

март

Масло

223

275

75

69

Яйца

246

265

19

20

Картофель

286

299

49

45

 

Определите: а) среднемесячные остатки вкладов населения за первый и второй кварталы; б) абсолютный прирост изменении среднего остатка вклада во втором квартале по сравнению с первым.

 

Решение

 

а) Индивидуальный индекс физического объема

iq=q1/q0

Индивидуальный индекс цен

ip=p1/p0

 

Составим вспомогательную таблицу.

Вид 

Базисное 

Отчетное 

Произведение

Индексы 

Кол-во, q0

Цена, p0

Кол-во, q1

Цена, p1

q0* p0

q1* p1

iq=q1/q0

ip=p1/p0

q1* p0

Масло

75 

223 

69 

275 

16725

18975

0,92

1,233

15387

Яйца

19 

246 

20 

265 

4674

5300

1,053

1,077

4920

Картофель

49 

286 

45 

299 

14014

13455

0,918

1,046

12870

Итого

 

 

 

 

35413

37730

 

 

33177

б) Рассчитаем общие индексы товарооборота, физического объема и цен

100813 1047 23 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

в) рассчитаем абсолютные изменения товарооборота, общее и изменения за счет физических объемов и за счет цен реализации

100813 1047 24 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

Таким образом, товарооборот увеличился на 13,7%, физический объем реализации снизился на 6,3%. В то же время прирост цен составил 6,5%. За изменения физического объема товарооборот снизился на 1966 тыс. руб., рост цен внес положительный вклад в сумме 4553 тыс. руб. Общее изменение товарооборота составило 2587 тыс. руб.

 

 

 

 

 

 

 

 

 

 

 

 

 

 

Задача 7

 

Имеются следующие данные о ценах и объемах производства продукции предприятий:

 

Предприятие

1996

1997

Цена единицы продукции, тыс. руб.

Произведено, тыс. шт.

Цена единицы продукции, тыс. руб.

Произведено, тыс. шт.

1

256

45

267

48

2

254

69

259

52

3

249

58

255

61

 

Рассчитайте индексы товарооборота переменного и фиксированного составов, а также индекс структурных сдвигов; проведите факторный анализ.

 

Решение

 

Индекс переменного состава представляет собой соотношение средних величин какого-либо признака в отчетном и базисном периодах:

100813 1047 25 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

Получаем индекс цен переменного состава

100813 1047 26 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

Индекс цен переменного состава характеризует изменение среднего уровня цен за счет влияния двух факторов:

  1. изменения объема реализованной продукция, тыс. руб.;
  2. структурных изменений, включающим изменение доли отдельных видов продукции.

    Индекс постоянного состава (фиксированного) состава отражает средний размер изменения цен и строится как отношение средних взвешенных величин постоянного состава, т.е. с одними и теми же весами:

     

    100813 1047 27 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

    Индекс структурных сдвигов характеризует влияние изменения структуры изучаемой совокупности на динамику цен реализованной продукции:

    100813 1047 28 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

    Таким образом, индекс цене переменного состава свидетельствует об изменении цен на реализованную продукцию на +2,2%, что произошло за счет влияния двух факторов – изменения объема реализованной продукции и структурных изменений, включающими изменение доли отдельных видов продукции в общем объеме реализованной продукции. Индекс постоянного состава свидетельствует об изменении цен примерно на — 6,3%. Данный индекс учитывает изменение цен реализации. Индекс цен структурных сдвигов свидетельствует об изменении цены на -0,2%, которое произошло за счет изменения объема реализованного трех видов продукции

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

    Задача 8

     

    По данным задачи 1 для изучения тесноты связи между суммой активов и собственным капиталом, вычислите линейный коэффициент корреляции, а также уравнение регрессии. Сделайте выводы.

     

    Решение

     

    Уравнение регрессии

     

    100813 1047 29 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

     

    В свою очередь, параметры уравнения определяются по методу наименьших квадратов, по системе нормальных уравнения

     

    100813 1047 30 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

     

    Для решения системы используем метод определителей.

     

    Параметры рассчитывает по формулам:

     

    100813 1047 31 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

     

     

     

     

    x 

    y 

    xy 

    x2

    y2

     

    12,0

    645,6

    7747,2

    144

    416799,6

     

    14,2

    636,9

    9043,98

    201,64

    405641,61

     

    41,0

    619,6

    25403,6

    1681

    383904,16

     

    42,0

    600,0

    25200

    1764

    360000

     

    49,4

    614,4

    30351,36

    2440,36

    377487,36

     

    50,3

    608,5

    30607,55

    2530,09

    370272,25

     

    52,4

    601,8

    31534,32

    2745,76

    362163,24

     

    70,0

    612,7

    42889

    4956,16

    375401,29

     

    70,4

    629,0

    44281,6

    4956,16

    395641

     

    120,8

    616,0

    74412,8

    14592,64

    379456

    Итого 

    522,5

    6184,5

    321471,41

    36011,81

    3826766,51

     

    Получаем 100813 1047 32 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

    Тогда 100813 1047 33 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

    Коэффициент корреляции рассчитываем по формуле

    100813 1047 34 Выборочный	метод в статистике, виды выборки, средняя и   предельная ошибка

    Таким образом, нами получено отрицательное значение коэффициента корреляции, что говорит об отсутствии прямой связи между исследуемыми показателями.

    Коэффициент детерминации

    r2 = 0,163

    Коэффициент детерминации может быть выражен в процентах. В нашем случае на 16,3% сумма активов банков зависит от их собственного капитала. Коэффициент детерминации довольно далек от 1, следовательно, связь нетесная.

     

    Список литературы

     

  3. Бауман М. Типические группы и способы их построения для проведения выборочного обследования // Вопросы статистики. – 1996. – № 11. – С. 19–21.
  4. Дружинин Н.К. Математическая статистика в экономике. – М.: Статистика, 2007.
  5. Елисеева И.И., Юзбашев М.М. Общая теория статистики: Учебник / Под ред. Чл.-корр. РАН И.И.Елисеевой. – М.: Финансы и статистика, 2007.
  6. Ефимова М.Р., Петрова Е.В., Румянцев В.Н. Общая теория статистики. -М.: ИНФРА-М, 2005.
  7. Кривенкова Л.Н., Юзбашев М.М. Область существования показателей вариации и ее применение // Вестник статистики. – 1991. — №6. – С.66-70
  8. Статистика / Под ред. И.И. Елисеевой. –М.: ООО «Витрэм», 2002.
  9. Чернышева Т. Выборочное наблюдение в социально-экономических исследованиях и основные этапы их подготовки // Вопросы статистики. – 1996. – № 11. – С. 12–19.

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     

     


     

<

Комментирование закрыто.

MAXCACHE: 1.05MB/0.00277 sec

WordPress: 23.66MB | MySQL:122 | 2,441sec