5. Леня Голубков собирается продать дом. Чтобы решить, какую цену запросить, он собрал данные о 12 недавних продажах. Он принимал во внимание цену, площадь дома, количество этажей, количество ванных т и возраст дома.
Цена, тыс. долл. |
Площадь, сотни кв. футов |
Этажность |
Количество ванных |
Возраст дома, года |
49,65 |
8,9 |
1 |
1,0 |
2 |
67,95 |
9,5 |
1 |
1.0 |
6 |
81,15 |
12,6 |
2 |
1,5 |
11 |
81,60 |
12,9 |
2 |
1,5 |
8 |
91.50 |
19,0 |
2 |
1,0 |
22 |
95,25 |
17,6 |
1 |
1,0 |
17 |
100,35 |
20,0 |
2 |
1,5 |
12 |
104,25 |
20,6 |
2 |
1,5 |
11 |
112,65 |
20,5 |
1 |
2,0 |
9 |
149,70 |
25,1 |
2 |
2,0 |
8 |
160,65 |
22,7 |
2 |
2,0 |
18 |
232,50 |
40,8 |
3 |
4,0 |
12 |
Примечание. 1,5 ванны означает, что в доме имеется одна ванная и одна комната с душем.
-
Найдите уравнение множественной регрессии.
-
Каков коэффициент детерминации для этого уравнения м что он определяет?
-
Если дом имеет площадь 1800 кв. футов, один этаж, полторы ванны и возраст 6 лет, по какой цене Леня сможет продать дом ?
Решение
ОПИСАТЕЛЬНАЯ СТАТИСТИКА. Файл:
Переменная Размер <—Диапазон—> Среднее—Ошибка Дисперс Ст.откл Сумма
цена 12 49,65 232,5 110,6 14,27 2444 49,44 1327
площадь 12 8,9 40,8 19,18 2,468 73,09 8,549 230,2
этаж 12 1 3 1,75 0,1794 0,3864 0,6216 21
ванна 12 1 4 1,667 0,241 0,697 0,8348 20
год 12 2 22 11,33 1,592 30,42 5,516 136
Переменная Медиана <—Квартили—> ДовИнтСр. <-ДовИнтДисп-> Ош.СтОткл
цена 97,8 81,26 140,4 31,08 1227 7046 22,7
площадь 19,5 12,68 22,18 5,374 36,68 210,7 3,925
этаж 2 1 2 0,3907 0,1939 1,114 0,2854
ванна 1,5 1 2 0,5248 0,3498 2,009 0,3833
год 11 8 15,75 3,467 15,27 87,71 2,533
Переменная Асимметр. Значим Эксцесс Значим
цена 1,281 0,01045 4,12 0,0207
площадь 1,189 0,01604 4,515 0,005425
этаж 0,1483 0,3946 2,481 0,4704
ванна 1,8950,0003199 6,221 1,041E-6
год 0,3626 0,2567 2,638 0,4487
МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ. Файл:
Коэфф. a0 a1 a2 a3 a4
Значение -1,381 2,852 -3,713 30,29 1,172
Ст.ошиб. 13,36 1,507 10,13 15,56 1,102
Значим. 0,9172 0,09817 0,7233 0,09071 0,3237
Источник Сум.квадр. Степ.св Средн.квадр.
Регресс. 2,561E4 4 6402
Остаточн 1277 7 182,4
Вся 2,689E4 11
Множеств R R^2 R^2прив Ст.ошиб. F Значим
0,97596 0,9525 0,92535 13,507 35,090,0003361
Гипотеза 1: <Регрессионная модель адекватна экспериментальным данным>
площадь=1800, этаж=1, ванна=1,5, год=6, Y=5182
Xэкcп Yэксп Yрегр остаток Ст.остат Ст.ошиб Довер.инт
8,9 49,65 52,92 -3,272 -0,3036 12,46 29,2
9,5 67,95 59,32 8,628 0,8007 12,38 29,02
12,6 81,15 85,45 -4,305 -0,3995 12,05 28,26
12,9 81,6 82,79 -1,194 -0,1108 12,03 28,2
19 91,5 101,5 -9,962 -0,9246 11,76 27,58
17,6 95,25 95,32 -0,07108-0,006597 11,78 27,62
20 100,3 107,7 -7,385 -0,6854 11,77 27,59
20,6 104,3 108,3 -4,024 -0,3735 11,78 27,61
20,5 112,7 124,5 -11,85 -1,1 11,77 27,61
25,1 149,7 132,7 16,96 1,574 12 28,13
22,7 160,6 137,6 23,04 2,138 11,85 27,77
40,8 232,5 239,1 -6,565 -0,6093 14,58 34,19
Вывод: Таким образом, на основании проведенного исследования, мы можем сделать вывод, что данные получены в соответствии с моделью множественной линейной регрессией. А именно на стоимость недвижимости приобретаемой Леней Голубковым повлияли следующие факторы: площадь, этажность, количество ванных комнат, год сдачи дома в эксплуатацию. Таким образом, Леонид Голубков может продать дом, в соответствии с данными параметрами за 5182 тыс. рублей.
Задача № 3
-
Мы пытаемся предсказать годовой спрос на продукцию, используя следующие факторы :
— цена за одну единицу продукции , руб. ;
— доход потребителя , руб. ;
— замена (цена на заменитель этого товара), руб.
Данные были собраны за 14 лет.
Год |
Спрос |
Цена |
Доход |
Замена |
1 |
40 |
9 |
400 |
10 |
2 |
45 |
8 |
500 |
14 |
3 |
55 |
8 |
700 |
13 |
4 |
60 |
7 |
800 |
14 |
5 |
70 |
6 |
900 |
15 |
6 |
65 |
6 |
1000 |
16 |
7 |
65 |
8 |
1100 |
17 |
8 |
75 |
5 |
1200 |
22 |
9 |
75 |
5 |
1300 |
19 |
10 |
80 |
5 |
1400 |
20 |
11 |
100 |
3 |
1500 |
23 |
12 |
90 |
4 |
1600 |
18 |
13 |
95 |
3 |
1700 |
24 |
14 |
85 |
4 |
1800 |
21 |
1. Можно ли точно определить знак («+» или «-») регрессионных коэффициентов для факторов. Дайте краткое объяснение. (Заметьте это не статистический вопрос. Вы должны просто подумать о смысле регрессионного коэффициента).
2. Найдите уравнение множественной регрессии.
3. Найдите коэффициент детерминации для данного примера и объясните смысл.
4. Найдите оценку дисперсии ошибок наблюдений для данного примера и объясните ее смысл.
5. Используя уравнение, оцените, какой спрос можно ожидать, если цена – 6 руб., доход – 1200 руб. и цена на заменитель – 17 руб.
ОПИСАТЕЛЬНАЯ СТАТИСТИКА. Файл:
Переменная Размер <—Диапазон—> Среднее—Ошибка Дисперс Ст.откл Сумма
год 13 1 13 7 1,08 15,17 3,894 91
спрос 13 40 100 70,38 5,047 331,1 18,2 915
цена 13 3 9 5,923 0,5484 3,91 1,977 77
доход 13 400 1700 1085 114,8 1,714E5 414 1,41E4
замена 13 10 24 17,31 1,162 17,56 4,191 225
Переменная Медиана <—Квартили—> ДовИнтСр. <-ДовИнтДисп-> Ош.СтОткл
год 7 3,5 10,5 2,328 7,799 41,33 1,75
спрос 70 57,5 85 10,88 170,2 902,2 8,179
цена 6 4,5 8 1,182 2,011 10,66 0,8888
доход 1100 750 1450 247,4 8,814E4 4,671E5 186,1
замена 17 14 21 2,505 9,031 47,86 1,884
Переменная Асимметр. Значим Эксцесс Значим
год 0 0,5 1,786 0,1568
спрос 0,000575 0,4996 2,167 0,3018
цена -0,02429 0,4821 1,822 0,1684
доход -0,1504 0,3909 1,911 0,1987
замена 0,06488 0,4524 2,068 0,2595
МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ. Файл:
Коэфф. a0 a1 a2 a3
Значение 73,08 -4,508 0,02315 -0,06405
Ст.ошиб. 19,6 1,576 0,007679 0,6664
Значим. 0,004904 0,01813 0,01417 0,9226
Источник Сум.квадр. Степ.св Средн.квадр.
Регресс. 3833 3 1278
Остаточн 140 9 15,56
Вся 3973 12
Множеств R R^2 R^2прив Ст.ошиб. F Значим
0,98222 0,96476 0,95301 3,9442 82,13 2,176E-5
Гипотеза 1: <Регрессионная модель адекватна экспериментальным данным>
цена=6, доход=1200, замена=17, Y=72,73
Xэкcп Yэксп Yрегр остаток Ст.остат Ст.ошиб Довер.инт
9 40 41,13 -1,129 -0,3304 4,034 9,036
8 45 47,7 -2,696 -0,7894 3,857 8,639
8 55 52,39 2,609 0,7637 3,857 8,639
7 60 59,15 0,8489 0,2485 3,745 8,387
6 70 65,91 4,089 1,197 3,703 8,293
6 65 68,16 -3,162 -0,9258 3,703 8,293
8 65 61,4 3,603 1,055 3,857 8,639
5 75 76,92 -1,917 -0,5613 3,733 8,362
5 75 79,42 -4,425 -1,295 3,733 8,362
5 80 81,68 -1,676 -0,4908 3,733 8,362
3 100 92,82 7,183 2,103 4,003 8,966
4 90 90,94 -0,9438 -0,2763 3,835 8,59
3 95 97,38 -2,383 -0,6977 4,003 8,966
Вывод: Данный вывод получен на основании множественной линейной модели регрессионного анализа. Такие параметры, как цена (6), доход (1200), цена на заменитель (17) определили спрос в количестве 72, 73. Коэффициент детерминации для данного примера составил 0, 98222. Дисперсия ошибок наблюдения варьируется в зависимости от переменных величин, а именно год, спрос, цена, доход и цена на заменитель.
МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ. Файл: презент1.std
Коэфф. a0 a1 a2 a3 a4 a5 a6 a7
Значение -4,045 -0,3745 -0,1687 0,9823 1,211 -0,07502 4,688 8,3
Ст.ошиб. 5,908 0,2452 0,1543 0,2388 0,4924 0,3159 1,62 1,908
Значим. 0,5031 0,1279 0,27840,0002905 0,01598 0,8081 0,0054430,0001728
Источник Сум.квадр. Степ.св Средн.квадр.
Регресс. 5360 7 765,7
Остаточн 1500 61 24,58
Вся 6860 68
Множеств R R^2 R^2прив Ст.ошиб. F Значим
0,88397 0,7814 0,75632 4,958 31,15 4,208E-9
Гипотеза 1: <Регрессионная модель адекватна экспериментальным данным>
Задание 3
В приложении 1.2 приведены данные о стоимости однокомнатных квартир. Проведите регрессионный анализ этих данных взяв в качестве зависимой переменной стоимость квартир, а в качестве факторов данные о площадях квартиры, кухни, жилой комнаты, а также удаленности квартиры от центра и метро. Определите уравнения множественной регрессии используя следующие множества исходных данных.
а) все данные ;
б) данные о квартирах не расположенных на первых и последних этажах ;
в) данные о квартирах расположенных в некирпичных домах и не на первых и не на последних этажах ;
г) данные о квартирах, расположенных в Коньково
Проверьте значимость и адекватность регрессионных на уровне значи- мости α = 0,05.
Определите среднюю стоимость однокомнатной квартиры в одном из районов Юго-Западной части Москвы, если общая площадь равна 40 м2, площадь кухни равна 9,5м2 , а площадь комнаты составляет 21 м2 , при условии, что удаленность от центра равна 9 км, а до ближайшей станции метро надо пройти 7 мин. Найдите 95% -е доверительные интервалы для среднего и индивидуального предсказанного значения. Какова будет средняя стоимость данной квартиры, если она располагается не в кирпичном доме и не на первом или не на последнем этажах ?
Сколько будет стоить данная квартира в Коньково ?
МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ. Файл: презент1.std
Коэфф. a0 a1 a2 a3 a4 a5 a6 a7
Значение -4,045 -0,3745 -0,1687 0,9823 1,211 -0,07502 4,688 8,3
Ст.ошиб. 5,908 0,2452 0,1543 0,2388 0,4924 0,3159 1,62 1,908
Значим. 0,5031 0,1279 0,27840,0002905 0,01598 0,8081 0,0054430,0001728
Источник Сум.квадр. Степ.св Средн.квадр.
Регресс. 5360 7 765,7
Остаточн 1500 61 24,58
Вся 6860 68
Множеств R R^2 R^2прив Ст.ошиб. F Значим
0,88397 0,7814 0,75632 4,958 31,15 4,208E-9
Гипотеза 1: <Регрессионная модель адекватна экспериментальным данным>
distc=9, distm=7, totsq=40, kitsq=9,5, livsq=21, floor=2, cat=2, Y=66,6
Вывод: Таким образом, на основании проведенного исследования мы можем сделать вывод, что на стоимость однокомнатной квартиры в Коньково влияют следующие факторы (удаленность от центра, расстояние до метро, этажность дома, категория недвижимости). Таким образом, стоимость однокомнатной квартиры в данном районе составила 6,6 млн. руб. Данные значения были получены на основании 95% доверительного интервала.