Способы расчета доверительного интервала
21 апреля 2016
Часто оценщику приходится анализировать рынок недвижимости того сегмента, в котором располагается объект оценки. Если рынок развит, проанализировать всю совокупность представленных объектов бывает сложно, поэтому для анализа используется выборка объектов. Не всегда эта выборка получается однородной, иногда требуется очистить ее от экстремумов – слишком высоких или слишком низких предложений рынка. Для этой цели применяется доверительный интервал. Цель данного исследования – провести сравнительный анализ двух способов расчета доверительного интервала и выбрать оптимальный вариант расчета при работе с разными выборками в системе estimatica.pro.
Способы расчета доверительного интервала
Доверительный интервал – вычисленный на основе выборки интервал значений признака, который с известной вероятностью содержит оцениваемый параметр генеральной совокупности.
Смысл вычисления доверительного интервала заключается в построении по данным выборки такого интервала, чтобы можно было утверждать с заданной вероятностью, что значение оцениваемого параметра находится в этом интервале. Другими словами, доверительный интервал с определенной вероятностью содержит неизвестное значение оцениваемой величины. Чем шире интервал, тем выше неточность.
Существуют разные методы определения доверительного интервала. В этой статье рассмотрим 2 способа:
- через медиану и среднеквадратическое отклонение;
- через критическое значение t-статистики (коэффициент Стьюдента).
Этапы сравнительного анализа разных способов расчета ДИ:
1. формируем выборку данных;
2. обрабатываем ее статистическими методами: рассчитываем среднее значение, медиану, дисперсию и т.д.;
3. рассчитываем доверительный интервал двумя способами;
4. анализируем очищенные выборки и полученные доверительные интервалы.
Этап 1. Выборка данных
Выборка сформирована с помощью системы estimatica.pro. В выборку вошло 91 предложение о продаже 1 комнатных квартир в 3-ем ценовом поясе с типом планировки «Хрущевка».
Таблица 1. Исходная выборка
№ |
Цена 1 кв.м., д.е. |
1 |
50943 |
2 |
35000 |
3 |
51613 |
4 |
50645 |
5 |
49841 |
… |
… |
86 |
58772 |
87 |
70714 |
88 |
53393 |
89 |
54876 |
90 |
52542 |
91 |
56140 |
Рис.1. Исходная выборка
Этап 2. Обработка исходной выборки
Обработка выборки методами статистики требует вычисления следующих значений:
1. Среднее арифметическое значение
2. Медиана – число, характеризующее выборку: ровно половина элементов выборки больше медианы, другая половина меньше медианы
(для выборки, имеющей нечетное число значений)
3. Размах – разница между максимальным и минимальным значениями в выборке
4. Дисперсия – используется для более точного оценивания вариации данных
5. Среднеквадратическое отклонение по выборке (далее – СКО) – наиболее распространённый показатель рассеивания значений корректировок вокруг среднего арифметического значения.
6. Коэффициент вариации – отражает степень разбросанности значений корректировок
7. коэффициент осцилляции – отражает относительное колебание крайних значений цен в выборке вокруг средней
Таблица 2. Статистические показатели исходной выборки
Показатель |
Значение |
Ср. значение |
54970 |
Медиана |
53934 |
Размах |
39194 |
Дисперсия |
45126821 |
СКО |
6755 |
Коэф. вариации |
12,29% |
Коэф. осциляции |
71,30% |
Коэффициент вариации, который характеризует однородность данных, составляет 12,29%, однако коэффициент осцилляции слишком велик. Таким образом, мы можем утверждать, что исходная выборка не является однородной, поэтому перейдем к расчету доверительного интервала.
Этап 3. Расчёт доверительного интервала
Способ 1. Расчёт через медиану и среднеквадратическое отклонение.
Доверительный интервал определяется следующим образом: минимальное значение - из медианы вычитается СКО; максимальное значение – к медиане прибавляется СКО.
Формула доверительного интервала:
Таким образом, доверительный интервал (47179 д.е.; 60689 д.е.)
Значения, содержащиеся в исходной выборке и не попадающие в доверительный интервал, удаляем. Удалено 20 объектов, что составило 22% выборки.
Рис. 2. Значения, попавшие в доверительный интервал 1.
Способ 2. Построение доверительного интервала через критическое значение t-статистики (коэффициент Стьюдента)
С.В. Грибовский в книге «Математические методы оценки стоимости имущества» описывает способ вычисления доверительного интервала через коэффициент Стьюдента. При расчете этим методом оценщик должен сам задать уровень значимости ∝, определяющий вероятность, с которой будет построен доверительный интервал. Обычно используются уровни значимости 0,1; 0,05 и 0,01. Им соответствуют доверительные вероятности 0,9; 0,95 и 0,99. При таком методе полагают истинные значения математического ожидания и дисперсии практически неизвестными (что почти всегда верно при решении практических задач оценки).
Формула доверительного интервала:
n - объем выборки;
- критическое значение t- статистики (распределения Стьюдента) с уровнем значимости ∝,числом степеней свободы n-1,которое определяется по специальным статистическим таблицам либо с помощью MS Excel ( →"Статистические"→ СТЬЮДРАСПОБР);
∝ - уровень значимости, принимаем ∝=0,01.
Значения, содержащиеся в исходной выборке и не попадающие в доверительный интервал, удаляем. Удалено 62 объекта, что составило 68% выборки.
Рис. 2. Значения, попавшие в доверительный интервал 2.
Этап 4. Анализ разных способов расчета доверительного интервала
Два способа расчета доверительного интервала – через медиану и коэффициент Стьюдента – привели к разным значениям интервалов. Соответственно, получилось две различные очищенные выборки.
Таблица 3. Статистические показатели по трем выборкам.
Показатель |
Исходная выборка |
1 вариант |
2 вариант |
Среднее значение |
54970 |
53593 |
54750 |
Медиана |
53934 |
53425 |
54688 |
Размах |
39194 |
12888 |
3677 |
Дисперсия |
45126821 |
8919645 |
1228707 |
СКО |
6755 |
3008 |
1128 |
Коэф. вариации |
12,29% |
5,61% |
2,06% |
Коэф. осциляции |
71,30% |
24,05% |
6,72% |
Количество выбывших объектов, шт. |
20 |
62 |
На основании выполненных расчетов можно сказать, что полученные разными методами значения доверительных интервалов пересекаются, поэтому можно использовать любой из способов расчета на усмотрение оценщика.
Однако мы считаем, что при работе в системе estimatica.pro целесообразно выбирать метод расчета доверительного интервала в зависимости от степени развитости рынка:
- если рынок неразвит, применять метод расчета через медиану и среднеквадратическое отклонение, так как количество выбывших объектов в этом случае невелико;
- если рынок развит, применять расчет через критическое значение t-статистики (коэффициент Стьюдента), так как есть возможность сформировать большую исходную выборку.
При подготовке статьи были использованы:
1. Грибовский С.В., Сивец С.А., Левыкина И.А. Математические методы оценки стоимости имущества. Москва, 2014 г.
2. Данные системы estimatica.pro
Читайте также:
Расчет корректировок методом парных продаж
Статью подготовили: Наталья Ничкова и Михаил Филимонов