Регрессионный анализ. Множественная линейная регрессия

<

101113 1559 1 Регрессионный анализ. Множественная линейная регрессия5. Леня Голубков собирается продать дом. Чтобы решить, какую цену запросить, он собрал данные о 12 недавних продажах. Он принимал во внимание цену, площадь дома, количество этажей, количество ванных т и возраст дома.

 

Цена, тыс. долл. 

Площадь, сотни кв. футов

Этажность 

Количество ванных 

Возраст дома, года 

49,65 

8,9 

1 

1,0 

2 

67,95 

9,5 

1 

1.0 

6 

81,15 

12,6 

2 

1,5 

11 

81,60 

12,9 

2 

1,5

8 

91.50 

19,0 

2 

1,0 

22 

95,25 

17,6 

1 

1,0 

17 

100,35 

20,0 

2 

1,5 

12 

104,25 

20,6 

2 

1,5 

11 

112,65 

20,5 

1 

2,0 

9 

149,70 

25,1 

2 

2,0 

8 

160,65 

22,7 

2 

2,0 

18 

232,50 

40,8 

3 

4,0 

12 

 

Примечание. 1,5 ванны означает, что в доме имеется одна ванная и одна комната с душем.

  1. Найдите уравнение множественной регрессии.
  2. Каков коэффициент детерминации для этого уравнения м что он определяет?
  3. Если дом имеет площадь 1800 кв. футов, один этаж, полторы ванны и возраст 6 лет, по какой цене Леня сможет продать дом ?

 

Решение

 

ОПИСАТЕЛЬНАЯ СТАТИСТИКА. Файл:

Переменная Размер <—Диапазон—> Среднее—Ошибка Дисперс Ст.откл Сумма

цена 12 49,65 232,5 110,6 14,27 2444 49,44 1327

площадь 12 8,9 40,8 19,18 2,468 73,09 8,549 230,2

этаж 12 1 3 1,75 0,1794 0,3864 0,6216 21

ванна 12 1 4 1,667 0,241 0,697 0,8348 20

год 12 2 22 11,33 1,592 30,42 5,516 136

 

Переменная Медиана <—Квартили—> ДовИнтСр. <-ДовИнтДисп-> Ош.СтОткл

цена 97,8 81,26 140,4 31,08 1227 7046 22,7

площадь 19,5 12,68 22,18 5,374 36,68 210,7 3,925

этаж 2 1 2 0,3907 0,1939 1,114 0,2854

ванна 1,5 1 2 0,5248 0,3498 2,009 0,3833

год 11 8 15,75 3,467 15,27 87,71 2,533

 

Переменная Асимметр. Значим Эксцесс Значим

цена 1,281 0,01045 4,12 0,0207

площадь 1,189 0,01604 4,515 0,005425

этаж 0,1483 0,3946 2,481 0,4704

ванна 1,8950,0003199 6,221 1,041E-6

год 0,3626 0,2567 2,638 0,4487

 

 

 

МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ. Файл:

 

Коэфф. a0 a1 a2 a3 a4

Значение -1,381 2,852 -3,713 30,29 1,172

Ст.ошиб. 13,36 1,507 10,13 15,56 1,102

Значим. 0,9172 0,09817 0,7233 0,09071 0,3237

 

Источник Сум.квадр. Степ.св Средн.квадр.

Регресс. 2,561E4 4 6402

Остаточн 1277 7 182,4

Вся 2,689E4 11

 

Множеств R R^2 R^2прив Ст.ошиб. F Значим

0,97596 0,9525 0,92535 13,507 35,090,0003361

Гипотеза 1: <Регрессионная модель адекватна экспериментальным данным>

 

площадь=1800, этаж=1, ванна=1,5, год=6, Y=5182

Xэкcп Yэксп Yрегр остаток Ст.остат Ст.ошиб Довер.инт

8,9 49,65 52,92 -3,272 -0,3036 12,46 29,2

9,5 67,95 59,32 8,628 0,8007 12,38 29,02

12,6 81,15 85,45 -4,305 -0,3995 12,05 28,26

12,9 81,6 82,79 -1,194 -0,1108 12,03 28,2

19 91,5 101,5 -9,962 -0,9246 11,76 27,58

17,6 95,25 95,32 -0,07108-0,006597 11,78 27,62

20 100,3 107,7 -7,385 -0,6854 11,77 27,59

20,6 104,3 108,3 -4,024 -0,3735 11,78 27,61

20,5 112,7 124,5 -11,85 -1,1 11,77 27,61

25,1 149,7 132,7 16,96 1,574 12 28,13

22,7 160,6 137,6 23,04 2,138 11,85 27,77

40,8 232,5 239,1 -6,565 -0,6093 14,58 34,19

 

Вывод: Таким образом, на основании проведенного исследования, мы можем сделать вывод, что данные получены в соответствии с моделью множественной линейной регрессией. А именно на стоимость недвижимости приобретаемой Леней Голубковым повлияли следующие факторы: площадь, этажность, количество ванных комнат, год сдачи дома в эксплуатацию. Таким образом, Леонид Голубков может продать дом, в соответствии с данными параметрами за 5182 тыс. рублей.

 

 

Задача № 3

 

  1. Мы пытаемся предсказать годовой спрос на продукцию, используя следующие факторы :

    — цена за одну единицу продукции , руб. ;

    — доход потребителя , руб. ;

    — замена (цена на заменитель этого товара), руб.

Данные были собраны за 14 лет.

 

Год

Спрос 

Цена 

Доход 

Замена 

1 

40 

9 

400 

10 

<

2 

45 

8 

500 

14 

3 

55 

8 

700 

13 

4 

60 

7 

800 

14 

5 

70 

6 

900 

15 

6 

65 

6 

1000 

16 

7 

65  

8 

1100 

17 

8 

75 

5 

1200 

22 

9 

75 

5 

1300 

19 

10 

80 

5 

1400 

20 

11 

100 

3 

1500 

23 

12 

90 

4 

1600 

18 

13 

95 

3 

1700 

24 

14 

85 

4 

1800 

21 

 

1. Можно ли точно определить знак («+» или «-») регрессионных коэффициентов для факторов. Дайте краткое объяснение. (Заметьте это не статистический вопрос. Вы должны просто подумать о смысле регрессионного коэффициента).

2. Найдите уравнение множественной регрессии.

3. Найдите коэффициент детерминации для данного примера и объясните смысл.

4. Найдите оценку дисперсии ошибок наблюдений для данного примера и объясните ее смысл.

5. Используя уравнение, оцените, какой спрос можно ожидать, если цена – 6 руб., доход – 1200 руб. и цена на заменитель – 17 руб.

 

 

 

 

 

ОПИСАТЕЛЬНАЯ СТАТИСТИКА. Файл:

Переменная Размер <—Диапазон—> Среднее—Ошибка Дисперс Ст.откл Сумма

год 13 1 13 7 1,08 15,17 3,894 91

спрос 13 40 100 70,38 5,047 331,1 18,2 915

цена 13 3 9 5,923 0,5484 3,91 1,977 77

доход 13 400 1700 1085 114,8 1,714E5 414 1,41E4

замена 13 10 24 17,31 1,162 17,56 4,191 225

 

Переменная Медиана <—Квартили—> ДовИнтСр. <-ДовИнтДисп-> Ош.СтОткл

год 7 3,5 10,5 2,328 7,799 41,33 1,75

спрос 70 57,5 85 10,88 170,2 902,2 8,179

цена 6 4,5 8 1,182 2,011 10,66 0,8888

доход 1100 750 1450 247,4 8,814E4 4,671E5 186,1

замена 17 14 21 2,505 9,031 47,86 1,884

 

Переменная Асимметр. Значим Эксцесс Значим

год 0 0,5 1,786 0,1568

спрос 0,000575 0,4996 2,167 0,3018

цена -0,02429 0,4821 1,822 0,1684

доход -0,1504 0,3909 1,911 0,1987

замена 0,06488 0,4524 2,068 0,2595

 

 

МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ. Файл:

 

Коэфф. a0 a1 a2 a3

Значение 73,08 -4,508 0,02315 -0,06405

Ст.ошиб. 19,6 1,576 0,007679 0,6664

Значим. 0,004904 0,01813 0,01417 0,9226

 

Источник Сум.квадр. Степ.св Средн.квадр.

Регресс. 3833 3 1278

Остаточн 140 9 15,56

Вся 3973 12

 

Множеств R R^2 R^2прив Ст.ошиб. F Значим

0,98222 0,96476 0,95301 3,9442 82,13 2,176E-5

Гипотеза 1: <Регрессионная модель адекватна экспериментальным данным>

 

цена=6, доход=1200, замена=17, Y=72,73

Xэкcп Yэксп Yрегр остаток Ст.остат Ст.ошиб Довер.инт

9 40 41,13 -1,129 -0,3304 4,034 9,036

8 45 47,7 -2,696 -0,7894 3,857 8,639

8 55 52,39 2,609 0,7637 3,857 8,639

7 60 59,15 0,8489 0,2485 3,745 8,387

6 70 65,91 4,089 1,197 3,703 8,293

6 65 68,16 -3,162 -0,9258 3,703 8,293

8 65 61,4 3,603 1,055 3,857 8,639

5 75 76,92 -1,917 -0,5613 3,733 8,362

5 75 79,42 -4,425 -1,295 3,733 8,362

5 80 81,68 -1,676 -0,4908 3,733 8,362

3 100 92,82 7,183 2,103 4,003 8,966

4 90 90,94 -0,9438 -0,2763 3,835 8,59

3 95 97,38 -2,383 -0,6977 4,003 8,966

 

 

Вывод: Данный вывод получен на основании множественной линейной модели регрессионного анализа. Такие параметры, как цена (6), доход (1200), цена на заменитель (17) определили спрос в количестве 72, 73. Коэффициент детерминации для данного примера составил 0, 98222. Дисперсия ошибок наблюдения варьируется в зависимости от переменных величин, а именно год, спрос, цена, доход и цена на заменитель.

 

 

МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ. Файл: презент1.std

 

Коэфф. a0 a1 a2 a3 a4 a5 a6 a7

Значение -4,045 -0,3745 -0,1687 0,9823 1,211 -0,07502 4,688 8,3

Ст.ошиб. 5,908 0,2452 0,1543 0,2388 0,4924 0,3159 1,62 1,908

Значим. 0,5031 0,1279 0,27840,0002905 0,01598 0,8081 0,0054430,0001728

 

Источник Сум.квадр. Степ.св Средн.квадр.

Регресс. 5360 7 765,7

Остаточн 1500 61 24,58

Вся 6860 68

 

Множеств R R^2 R^2прив Ст.ошиб. F Значим

0,88397 0,7814 0,75632 4,958 31,15 4,208E-9

Гипотеза 1: <Регрессионная модель адекватна экспериментальным данным>

 

 

Задание 3

В приложении 1.2 приведены данные о стоимости однокомнатных квартир. Проведите регрессионный анализ этих данных взяв в качестве зависимой переменной стоимость квартир, а в качестве факторов данные о площадях квартиры, кухни, жилой комнаты, а также удаленности квартиры от центра и метро. Определите уравнения множественной регрессии используя следующие множества исходных данных.

а) все данные ;

б) данные о квартирах не расположенных на первых и последних этажах ;

в) данные о квартирах расположенных в некирпичных домах и не на первых и не на последних этажах ;

г) данные о квартирах, расположенных в Коньково

Проверьте значимость и адекватность регрессионных на уровне значи- мости α = 0,05.

Определите среднюю стоимость однокомнатной квартиры в одном из районов Юго-Западной части Москвы, если общая площадь равна 40 м2, площадь кухни равна 9,5м2 , а площадь комнаты составляет 21 м2 , при условии, что удаленность от центра равна 9 км, а до ближайшей станции метро надо пройти 7 мин. Найдите 95% -е доверительные интервалы для среднего и индивидуального предсказанного значения. Какова будет средняя стоимость данной квартиры, если она располагается не в кирпичном доме и не на первом или не на последнем этажах ?

Сколько будет стоить данная квартира в Коньково ?

 

 

МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ. Файл: презент1.std

 

Коэфф. a0 a1 a2 a3 a4 a5 a6 a7

Значение -4,045 -0,3745 -0,1687 0,9823 1,211 -0,07502 4,688 8,3

Ст.ошиб. 5,908 0,2452 0,1543 0,2388 0,4924 0,3159 1,62 1,908

Значим. 0,5031 0,1279 0,27840,0002905 0,01598 0,8081 0,0054430,0001728

 

Источник Сум.квадр. Степ.св Средн.квадр.

Регресс. 5360 7 765,7

Остаточн 1500 61 24,58

Вся 6860 68

 

Множеств R R^2 R^2прив Ст.ошиб. F Значим

0,88397 0,7814 0,75632 4,958 31,15 4,208E-9

Гипотеза 1: <Регрессионная модель адекватна экспериментальным данным>

 

distc=9, distm=7, totsq=40, kitsq=9,5, livsq=21, floor=2, cat=2, Y=66,6

 

Вывод: Таким образом, на основании проведенного исследования мы можем сделать вывод, что на стоимость однокомнатной квартиры в Коньково влияют следующие факторы (удаленность от центра, расстояние до метро, этажность дома, категория недвижимости). Таким образом, стоимость однокомнатной квартиры в данном районе составила 6,6 млн. руб. Данные значения были получены на основании 95% доверительного интервала.

<

Комментирование закрыто.

WordPress: 22.45MB | MySQL:122 | 1,905sec