Коэффициент доверия

Содержание
  1. Способы расчета доверительного интервала
  2. Этап 1. Выборка данных
  3. Этап 2. Обработка исходной выборки
  4. Этап 3. Расчёт доверительного интервала
  5. Этап 4. Анализ разных способов расчета доверительного интервала
  6. Как определить размер выборки?
  7. Теоретический минимум
  8. Доверительный интервал, погрешность и размер выборки
  9. Практика — считаем с R
  10. Поправка на ветер
  11. Использованные материалы
  12. Коэффициент доверия t и соответствующие уровни доверительной вероятности
  13. Расширение программы переписи
  14. Ошибки выборочного наблюдения
  15. CFA — Доверительные интервалы для среднего значения совокупности
  16. Определение доверительного интервала
  17. Построение доверительных интервалов
  18. Доверительные интервалы для среднего по совокупности (нормально распределенная совокупность с известной дисперсией)
  19. Факторы надежности для доверительных интервалов на основе стандартного нормального распределения
  20. Доверительные интервалы для среднего по совокупности — z-альтернатива (большая выборка, дисперсия совокупности неизвестна)
  21. Пример (4) расчета доверительного интервала для среднего по совокупности коэффициентов Шарпа с использованием z-статистики
  22. Проверка доверия. Главные индикаторы для оценки эффективности инвестиций
  23. Бенчмарк (BM)
  24. Волатильность (δ (PF) — фонда, δ (BM) – бенчмарка)
  25. Бета (β (BM) – к бенчмарку, β (M) – к рынку)
  26. Регрессионная альфа (α (R))
  27. Альфа Йенсена (α (J))
  28. Коэффициент Шарпа (S)
  29. Коэффициент Трейнора (T)
  30. R-квадрат (R2 (BM) – к бенчмарку, R2 (M) – к рынку)
  31. Вывод

Способы расчета доверительного интервала

Коэффициент доверия

21 апреля 2016

Часто оценщику приходится анализировать рынок недвижимости того сегмента, в котором располагается объект оценки. Если рынок развит, проанализировать всю совокупность представленных объектов бывает сложно, поэтому для анализа используется выборка объектов.

Не всегда эта выборка получается однородной, иногда требуется очистить ее от экстремумов – слишком высоких или слишком низких предложений рынка. Для этой цели применяется доверительный интервал.

Цель данного исследования – провести сравнительный анализ двух способов расчета доверительного интервала и выбрать оптимальный вариант расчета при работе с разными выборками в системе estimatica.pro.

Доверительный интервал – вычисленный на основе выборки интервал значений признака, который с известной вероятностью содержит оцениваемый параметр генеральной совокупности.

Смысл вычисления доверительного интервала заключается в построении по данным выборки такого интервала, чтобы можно было утверждать с заданной вероятностью, что значение оцениваемого параметра находится в этом интервале. Другими словами, доверительный интервал с определенной вероятностью содержит неизвестное значение оцениваемой величины. Чем шире интервал, тем выше неточность.

Существуют разные методы определения доверительного интервала. В этой статье рассмотрим 2 способа:

  • через медиану и среднеквадратическое отклонение;
  • через критическое значение t-статистики (коэффициент Стьюдента).

Этапы сравнительного анализа разных способов расчета ДИ:

1. формируем выборку данных;

2. обрабатываем ее статистическими методами: рассчитываем среднее значение, медиану, дисперсию и т.д.;

3. рассчитываем доверительный интервал двумя способами;

4. анализируем очищенные выборки и полученные доверительные интервалы.

Этап 1. Выборка данных

Выборка сформирована с помощью системы estimatica.pro. В выборку вошло 91 предложение о продаже 1 комнатных квартир в 3-ем ценовом поясе с типом планировки «Хрущевка».

Таблица 1. Исходная выборка

Цена 1 кв.м., д.е.
150943
235000
351613
450645
549841
8658772
8770714
8853393
8954876
9052542
9156140

Рис.1. Исходная выборка

Этап 2. Обработка исходной выборки

Обработка выборки методами статистики требует вычисления следующих значений:

1. Среднее арифметическое значение

2. Медиана – число, характеризующее выборку: ровно половина элементов выборки больше медианы, другая половина меньше медианы

(для выборки, имеющей нечетное число значений)

3. Размах – разница между максимальным и минимальным значениями в выборке

4. Дисперсия – используется для более точного оценивания вариации данных

5. Среднеквадратическое отклонение по выборке (далее – СКО) – наиболее распространённый показатель рассеивания значений корректировок вокруг среднего арифметического значения.

6. Коэффициент вариации – отражает степень разбросанности значений корректировок

7. коэффициент осцилляции – отражает относительное колебание крайних значений цен в выборке вокруг средней

Таблица 2. Статистические показатели исходной выборки

ПоказательЗначение
Ср. значение54970
Медиана53934
Размах39194
Дисперсия45126821
СКО6755
Коэф. вариации12,29%
Коэф. осциляции71,30%

Коэффициент вариации, который характеризует однородность данных, составляет 12,29%, однако коэффициент осцилляции слишком велик. Таким образом, мы можем утверждать, что исходная выборка не является однородной, поэтому перейдем к расчету доверительного интервала.

Этап 3. Расчёт доверительного интервала

Способ 1. Расчёт через медиану и среднеквадратическое отклонение.

Доверительный интервал определяется следующим образом: минимальное значение — из медианы вычитается СКО; максимальное значение – к медиане прибавляется СКО.

Формула доверительного интервала:

Таким образом, доверительный интервал (47179 д.е.; 60689 д.е.)

Значения, содержащиеся в исходной выборке и не попадающие в доверительный интервал, удаляем. Удалено 20 объектов, что составило 22% выборки.

Рис. 2. Значения, попавшие в доверительный интервал 1.

Способ 2. Построение доверительного интервала через критическое значение t-статистики (коэффициент Стьюдента)

С.В. Грибовский в книге «Математические методы оценки стоимости имущества» описывает способ вычисления доверительного интервала через коэффициент Стьюдента.

При расчете этим методом оценщик должен сам задать уровень значимости ∝, определяющий вероятность, с которой будет построен доверительный интервал. Обычно используются уровни значимости 0,1; 0,05 и 0,01. Им соответствуют доверительные вероятности 0,9; 0,95 и 0,99.

При таком методе полагают истинные значения математического ожидания и дисперсии практически неизвестными (что почти всегда верно при решении практических задач оценки).

Формула доверительного интервала:

n — объем выборки;

— критическое значение t- статистики (распределения Стьюдента) с уровнем значимости ∝,числом степеней свободы n-1,которое определяется по специальным статистическим таблицам либо с помощью MS Excel (  →»Статистические»→ СТЬЮДРАСПОБР);

∝ — уровень значимости, принимаем ∝=0,01.

Значения, содержащиеся в исходной выборке и не попадающие в доверительный интервал, удаляем. Удалено 62 объекта, что составило 68% выборки.

Рис. 2. Значения, попавшие в доверительный интервал 2.

Этап 4. Анализ разных способов расчета доверительного интервала

Два способа расчета доверительного интервала – через медиану и коэффициент Стьюдента – привели к разным значениям интервалов. Соответственно, получилось две различные очищенные выборки.

Таблица 3. Статистические показатели по трем выборкам.

ПоказательИсходная выборка1 вариант2 вариант
Среднее значение549705359354750
Медиана539345342554688
Размах39194128883677
Дисперсия4512682189196451228707
СКО675530081128
Коэф. вариации12,29%5,61%2,06%
Коэф. осциляции71,30%24,05%6,72%
Количество выбывших объектов, шт.2062

На основании выполненных расчетов можно сказать, что полученные разными методами значения доверительных интервалов пересекаются, поэтому можно использовать любой из способов расчета на усмотрение оценщика.

Однако мы считаем, что при работе в системе estimatica.pro целесообразно выбирать метод расчета доверительного интервала в зависимости от степени развитости рынка:

  • если рынок неразвит, применять метод расчета через медиану и среднеквадратическое отклонение, так как количество выбывших объектов в этом случае невелико;
  • если рынок развит, применять расчет через критическое значение t-статистики (коэффициент Стьюдента), так как есть возможность сформировать большую исходную выборку.

При подготовке статьи были использованы:

1. Грибовский С.В., Сивец С.А., Левыкина И.А. Математические методы оценки стоимости имущества. Москва, 2014 г.

2. Данные системы estimatica.pro

Источник: http://www.estimatica.info/assessment/standards-and-methods/192-sposoby-rascheta-doveritelnogo-intervala

Как определить размер выборки?

Коэффициент доверия

Статистика знает все. И Ильф и Е. Петров, «12 Стульев»

Представьте себе, что вы строите крупный торговый центр и желаете оценить автомобильный поток въезда на территорию парковки. Нет, давайте другой пример… они все равно этого никогда не будут делать.

Вам необходимо оценить вкусовые предпочтения посетителей вашего портала, для чего необходимо провести среди них опрос. Как увязать количество данных и возможную погрешность? Ничего сложного — чем больше ваша выборка, тем меньше погрешность.

Однако и здесь есть нюансы.

Теоретический минимум

Не будет лишним освежить память, эти термины нам пригодятся далее.

  • Популяция – Множество всех объектов, среди которых проводится исследования.
  • Выборка – Подмножество, часть объектов из всей популяции, которая непосредственно участвует в исследовании.
  • Ошибка первого рода — (α) Вероятность отвергнуть нулевую гипотезу, в то время как она верна.
  • Ошибка второго рода — (β) Вероятность не отвергнуть нулевую гипотезу, в то время как она ложна.
  • 1 — β — Статистическая мощность критерия.
  • μ0 и μ1 — Средние значения при нулевой и альтернативной гипотезе.

Уже в самих определениях ошибки первого и второго рода имеется простор для дебатов и толкований. Как с ними определиться и какую выбрать в качестве нулевой? Если вы исследуете уровень загрязнения почвы или вод, то как сформулируете нулевую гипотезу: загрязнение присутствует, или нет загрязнения? А ведь от этого зависит объем выборки из общей популяции объектов.

Исходная популяция, также как и выборка может иметь любое распределение, однако среднее значение имеет нормальное или гауссово распределение благодаря Центральной Предельной Теореме.

Относительно параметров распределения и среднего значения в частности возможно несколько типов умозаключений. Первое из них называется доверительным интервалом. Он указывает на интервал возможных значений параметра, с указанным коэффициентом доверия. Так например 100(1-α)% доверительный интервал для μ будет таким (Ур. 1).

  • df — Степень свободы = n — 1, от английского «degrees of freedom».
  • — Двусторонняя критическая величина, t-критерий Стьюдента.

Второе из умозаключений — проверка гипотезы. Оно может быть примерно таким.

  • H0: μ = h
  • H1: μ > h
  • H2: μ < h

С доверительным интервалом 100(1-α) для μ можно сделать выбор в пользу H1 и H2 :

  • Если нижний предел доверительного интервала 100(1-α) < h, то тогда отвергаем H0 в пользу H2.
  • Если верхний предел доверительного интервала 100(1-α) > h, то тогда отвергаем H0 в пользу H1.
  • Если доверительного интервала 100(1-α) включает в себя h, то тогда мы не может отвергнуть H0 и такой результат считается неопределенным.

Если нам нужно проверить значение μ для одной выборки из общей совокупности, то критерий обретет вид.

  • Отбраковать H0 и принять H1: μ > h, если .
  • Отбраковать H0 и принять H2: μ < h, если .
  • Невозможно отвергнуть H0, если .

Где .

Доверительный интервал, погрешность и размер выборки

Возьмем самое первое уравнение и выразим оттуда ширину доверительного интервала (Ур. 2).

В некоторых случаях мы можем заменить t-статистику Стьюдента на z стандартного нормального распределения. Еще одним упрощением заменим половину от w на погрешность измерения E. Тогда наше уравнения примет вид (Ур. 3).

Как видим погрешность действительно уменьшается вместе с ростом количества входных данных. Откуда легко вывести искомое (Ур. 4).

Практика — считаем с R

Проверим гипотезу о том, что среднее значение данной выборки количества насекомых в ловушке равно 1.

Насекомые 0123456
Ловушки10955121

> x y = unlist(x, use.names=»false»)> mean(z);sd(z)[1] 1.636364[1] 1.654883

Обратите внимание, что среднее и стандартное отклонение практически равны, что естественно для распределения Пуассона. Доверительный интервал 95% для t-статистики Стьюдента и df=32.

> qt(.975, 32)[1] 2.036933

и наконец получаем критический интервал для среднего значения: 1.05 — 2.22.

> μ=mean(z)> st = qt(.975, 32)> μ + st * sd(z)/sqrt(33)[1] 2.223159> μ — st * sd(z)/sqrt(33)[1] 1.049568

В итоге, следует отбраковать H0 и принять H1 так как с вероятностью 95%, μ > 1.

В том же самом примере, если принять, что нам известно действительное стандартное отклонение — σ, а не ее оценка полученная с помощью случайной выборки, можно рассчитать необходимое n для данной погрешности. Посчитаем для E=0.5.

> za2 = qnorm(.975)> (za2*sd(z)/.5)2[1] 42.08144

Поправка на ветер

На самом деле нет никаких причин, полагать, что нам будет известна σ (дисперсия), в то время как μ (среднее) нам еще только предстоит оценить. Из-за этого уравнение 4 имеет мало практической пользы, кроме особо рафинированных примеров из области комбинаторики, а реалистичное уравнение для n несколько сложнее при неизвестной σ (Ур. 5).

Обратите внимание, что σ в последнем уравнении не с шапкой (), а тильдой (~). Это следствие того, что в самом начале у нас нет даже оценочного стандартного отклонения случайной выборки — , и вместо нее мы используем запланированное — . Откуда же мы берем последнее? Можно сказать, что с потолка: экспертная оценка, грубые прикидки, прошлый опыт и т. д.

А что на счет второго слагаемого правой стороны 5-го уравнения, откуда оно взялось? Так как , необходима поправка Гюнтера.

Помимо уравнений 4 и 5 есть еще несколько приблизительно-оценочных формул, но это уже заслуживает отдельного поста.

Использованные материалы

  1. Sample sizes
  2. Hypothesis testing
  • R
  • статистика
  • выборка
  • нормальное распределение
  • критический интервал

Хабы:

Источник: https://habr.com/ru/post/339798/

Коэффициент доверия t и соответствующие уровни доверительной вероятности

Коэффициент доверия

Статистическое наблюдение можно организовать как сплошное и несплошное. Сплошное предусматривает обследование всех единиц изучаемой совокупности явления, несплошное – лишь ее части. К несплошному относится и выборочное наблюдение.

Выборочное наблюдение является одним из наиболее широко применяемых видов несплошного наблюдения. В основе этого наблюдения лежит идея о том, что отобранная в случайном порядке некоторая часть единиц может представлять всю изучаемую совокупность явления по интересующим исследователя признакам.

Целью выборочного наблюдения является получение информации прежде всего для определения сводных обобщающих характеристик всей изучаемой совокупности.

По своей цели выборочное наблюдение совпадает с одной из задач сплошного наблюдения, и поэтому встает вопрос о том, какое из двух видов наблюдения – сплошное или выборочное – целесообразнее провести.

Выборочным наблюдением называется такое наблюдение, при котором обследованию подвергается часть единиц совокупности, а результаты обследования распространяются на все изучаемое явление.

Отличие выборочного наблюдения от других видов несплошного наблюдения состоит в том, что при выборочном наблюдении заранее определяется сколько единиц генеральной совокупности будет отобрано для наблюдения и заранее определяется способ отбора единиц.

Возможность перехода от сплошного к выборочному состоит в том, что в каждой совокупности имеется ее такая часть, которая по сводным характеристикам (средние и доли) всегда представляет всю совокупность. Причинами перехода от сплошного обследования к выборочному является следующее:

1. Экономия времени и средств

2. Невозможность проведения сплошного наблюдения

Расширение программы переписи

Условия отбора единиц следующие:

Отбор единиц в выборку должен быть строго объективным. Должна быть обеспечена равная возможность каждой единицы попасть в выборочную совокупность.

Число единиц, взятых на выборку для обследования должно быть достаточно большим.

Эти условия следует соблюдать для того, чтобы отобранная часть единиц репрезентировала, т.е. точно воспроизводила генеральную совокупность. Выборочное наблюдение имеет дело с двумя видами обобщающих показателей: со средними и долями.

Ошибки выборочного наблюдения

Между признаками выборочной совокупности и признаками генеральной совокупности, как правило, существует некоторое расхождение, которое называется ошибкой статистического наблюдения.

При массовом наблюдении ошибки неизбежны, но возникают они в результате действия различных причин. Величина возможной ошибки выборочного признака происходит из-за ошибок регистрации и ошибок репрезентативности.

Ошибки регистрации, или технические ошибки, связаны с недостаточной квалификацией наблюдателей, неточностью подсчетов, несовершенством приборов и т. п.

Под ошибкой репрезентативности (представительства) понимают расхождение между выборочной характеристикой и предполагаемой характеристикой генеральной совокупности.

Ошибки репрезентативности бывают случайными и систематическими. Систематические ошибки связаны с нарушением установленных правил отбора.

Случайные ошибки объясняются недостаточно равномерным представлением в выборочной совокупности различных категорий единиц генеральной совокупности.

В результате первой причины выборка легко может оказаться смещенной, так как при отборе каждой единицы допускается ошибка, всегда направленная в одну и ту же сторону. Эта ошибка получила название ошибки смещения. Ее размер может превышать величину случайной ошибки.

Особенность ошибки смещения состоит в том, что, являясь постоянной частью ошибки репрезентативности, она увеличивается с увеличением объема выборки. Случайная же ошибка с увеличением объема выборки уменьшается.

Кроме того, величину случайной ошибки можно определить, тогда как размер ошибки смещения практически определить очень сложно, а иногда и невозможно, поэтому важно знать причины, вызывающие ошибку смещения, и предусмотреть мероприятия по ее устранению.

Ошибки смещения бывают преднамеренные и непреднамеренные. Причиной возникновения преднамеренной ошибки является тенденциозный подход к выбору единиц из генеральной совокупности. Чтобы не допустить появление такой ошибки, необходимо соблюдать принцип случайности отбора единиц.

Непреднамеренные ошибки могут возникать на стадии подготовки выборочного наблюдения, формирования выборочной совокупности и анализа ее данных. Чтобы не допустить появление таких ошибок, необходима хорошая основа выборки, т. е.

та генеральная совокупность, из которой предполагается производить отбор, например список единиц отбора.

Основа выборки должна быть достоверной, полной и соответствовать цели исследования, а единицы отбора и их характеристики должны соответствовать действительному их состоянию на момент подготовки выборочного наблюдения.

Нередки случаи, когда в отношении некоторых единиц, попавших в выборку, трудно собрать сведения из-за их отсутствия на момент наблюдения, нежелания дать сведения и т. п. В таких случаях эти единицы приходится заменять другими. Необходимо следить, чтобы замена осуществлялась равноценными единицами.

Случайная ошибка выборки возникает в результате случайных различий между единицами, попавшими в выборку, и единицами генеральной совокупности, т. е. она связана со случайным отбором. Теоретическим обоснованием появления случайных ошибок выборки является теория вероятностей и ее предельные теоремы.

Сущность предельных теорем состоит в том, что в массовых явлениях совокупное влияние различных случайных причин на формирование закономерностей и обобщающих характеристик будет сколь угодно малой величиной или практически не зависит от случая. Так как случайная ошибка выборки возникает в результате случайных различий между единицами выборочной и генеральной совокупностей, то при достаточно большом объеме выборки она будет сколь угодно мала.

Предельные теоремы теории вероятностей позволяют определять размер случайных ошибок выборки. Различают среднюю (стандартную) и предельную ошибку выборки.

Под средней (стандартной) ошибкой выборки понимают такое расхождение между средней выборочной и генеральной совокупностями (~ —), которое не превышает ±.

Предельной ошибкой выборки принято считать максимально возможное расхождение (~ —), т. е. максимум ошибки при заданной вероятности ее появления.

В математической теории выборочного метода сравниваются средние характеристики признаков выборочной и генеральной совокупностей и доказывается, что с увеличением объема выборки вероятность появления больших ошибок и пределы максимально возможной ошибки уменьшаются.

Чем больше обследуется единиц, тем меньше будет величина расхождений выборочных и генеральных характеристик. На основании теоремы, доказанной П.Л.

Чебышевым, величину стандартной ошибки простой случайной выборки при достаточно большом объеме выборки (n) можно определить по формуле

– стандартная ошибка.

Из этой формулы средней (стандартной) ошибки простой случайной выборки видно, что величина зависит от изменчивости признака в генеральной совокупности (чем больше вариация признака, тем больше ошибка выборки) и от объема выборки n (чем больше обследуется единиц, тем меньше будет величина расхождений выборочных и генеральных характеристик).

Академик A.M. Ляпунов доказал, что вероятность появления случайной ошибки выборки при достаточно большом ее объеме подчиняется закону нормального распределения. Эта вероятность определяется по формуле

В математической статистике употребляют коэффициент доверия t, значения функции F(t) табулированы при разных его значениях, при этом получают соответствующие уровни доверительной вероятности (табл. 6.1).

Таблица 6.1

Коэффициент доверия t и соответствующие уровни доверительной вероятности

Источник: https://studopedia.ru/4_26476_koeffitsient-doveriya-t-i-sootvetstvuyushchie-urovni-doveritelnoy-veroyatnosti.html

CFA — Доверительные интервалы для среднего значения совокупности

Коэффициент доверия

Когда нам нужно получить одно число в качестве оценки параметра совокупности, мы используем точечную оценку. Тем не менее, из-за ошибки выборки, точечная оценка не будет в точности равняться параметру совокупности при любом размере данной выборки.

Часто, вместо точечной оценки, более полезным подходом будет найти диапазон значений, в рамках которого, как мы ожидаем, может находится значение искомого параметра с заданным уровнем вероятности.

Этот подход называется интервальной оценкой параметра (англ. 'interval estimate of parameter'), а доверительный интервал выполняет роль этого диапазона значений.

Определение доверительного интервала

Доверительный интервал (англ. 'confidence interval') представляет собой диапазон, для которого можно утверждать, с заданной вероятностью \(1 — \alpha \), называемой степенью доверия (или степенью уверенности, англ. 'degree of confidence'), что он будет содержать оцениваемый параметр.

Этот интервал часто упоминается как \(100 (1 — \alpha)\% \) доверительный интервал для параметра.

Конечные значения доверительного интервала называются нижним и верхним доверительными пределами (или доверительными границами или предельной погрешностью, англ. 'lower/upper confidence limits').

В этом чтении, мы имеем дело только с двусторонними доверительными интервалами — доверительные интервалами, для которых мы вычисляем и нижние и верхние пределы.

Кроме того, можно определить два типа односторонних доверительных интервалов для параметра совокупности.

Нижний односторонний доверительный интервал устанавливает только нижний предел. Это означает допущение, что с определенной степенью доверия параметр совокупности равен или превышает нижний предел.

Верхний односторонний доверительный интервал устанавливает только верхний предел. Это означает допущение, что с определенной степенью доверия параметр совокупности меньше или равен верхнему пределу.

Инвестиционные аналитики редко используют односторонние доверительные интервалы.

Доверительные интервалы часто дают либо вероятностную интерпретацию, либо практическую интерпретацию.

При вероятностной интерпретации, мы интерпретируем 95%-ный доверительный интервал для среднего значения совокупности следующим образом.

При повторяющейся выборке, 95% таких доверительных интервалов будут, в конечном счете, включать в себя среднее значение совокупности.

Например, предположим, что мы делаем выборку из совокупности 1000 раз, и на основании каждой выборки мы построим 95%-ный доверительный интервал, используя вычисленное выборочное среднее.

Из-за случайного характера выборок, эти доверительные интервалы отличаются друг от друга, но мы ожидаем, что 95% (или 950) этих интервалов включают неизвестное значение среднего по совокупности.

На практике мы обычно не делаем такие повторяющиеся выборки. Поэтому в практической интерпретации, мы утверждаем, что мы 95% уверены в том, что один 95%-ный доверительный интервал содержит среднее по совокупности.

Мы вправе сделать это заявление, потому что мы знаем, что 95% всех возможных доверительных интервалов, построенных аналогичным образом, будут содержать среднее по совокупности.

Доверительные интервалы, которые мы обсудим в этом чтении, имеют структуры, подобные описанной ниже базовой структуре.

Построение доверительных интервалов

Доверительный интервал \(100 (1 — \alpha)\% \) для параметра имеет следующую структуру.

Точечная оценка \(\pm\) Фактор надежности \(\times\) Стандартная ошибка

где

  • Точечная оценка = точечная оценка параметра (значение выборочной статистики).
  • Фактор надежности (англ. 'reliability factor') = коэффициент, основанный на предполагаемом распределении точечной оценки и степени доверия \((1 — \alpha)\) для доверительного интервала.
  • Стандартная ошибка = стандартная ошибка выборочной статистики, значение которой получено с помощью точечной оценки.

Величину (Фактор надежности) \(\times\) (Cтандартная ошибка) иногда называют точностью оценки (англ. 'precision of estimator'). Большие значения этой величины подразумевают более низкую точность оценки параметра совокупности.

Самый базовый доверительный интервал для среднего значения по совокупности появляется тогда, когда мы делаем выборку из нормального распределения с известной дисперсией. Фактор надежности в данном случае на основан стандартном нормальном распределении, которое имеет среднее значение, равное 0 и дисперсию 1.

Стандартная нормальная случайная величина обычно обозначается как \(Z\). Обозначение \(z_\alpha \) обозначает такую точку стандартного нормального распределения, в которой \(\alpha\) вероятности остается в правом хвосте.

Например, 0.05 или 5% возможных значений стандартной нормальной случайной величины больше, чем \( z_{0.05} = 1.65 \).

Предположим, что мы хотим построить 95%-ный доверительный интервал для среднего по совокупности, и для этой цели, мы сделали выборку размером 100 из нормально распределенной совокупности с известной дисперсией \(\sigma2\) = 400 (значит, \(\sigma\) = 20).

Мы рассчитываем выборочное среднее как \( \overline X = 25 \). Наша точечная оценка среднего по совокупности, таким образом, 25.

Если мы перемещаем 1.96 стандартных отклонений выше среднего значения нормального распределения, то 0.025 или 2.5% вероятности остается в правом хвосте. В силу симметрии нормального распределения, если мы перемещаем 1.96 стандартных отклонений ниже среднего, то 0.025 или 2.5% вероятности остается в левом хвосте.

В общей сложности, 0.05 или 5% вероятности лежит в двух хвостах и 0.95 или 95% вероятности лежит между ними.

Таким образом, \( z_{0.025} = 1.96\) является фактором надежности для этого 95%-ного доверительного интервала. Обратите внимание на связь \(100 (1 — \alpha)\% \) для доверительного интервала и \(z_{\alpha/2}\) для фактора надежности.

Стандартная ошибка среднего значения выборки, заданная Формулой 1, равна \( \sigma_{\overline X} = 20 \Big / \sqrt{100} = 2 \).

Доверительный интервал, таким образом, имеет нижний предел \( \overline X — 1.96 \sigma_{\overline X} \) = 25 — 1.96(2) = 25 — 3.92 = 21.08.

Верхний предел доверительного интервала равен \( \overline X + 1.96\sigma_{\overline X} \) = 25 + 1.96(2) = 25 + 3.92 = 28.92.

95%-ный доверительный интервал для среднего по совокупности охватывает значения от 21.08 до 28.92.

Доверительные интервалы для среднего по совокупности (нормально распределенная совокупность с известной дисперсией)

Доверительный интервал \(100 (1 — \alpha)\% \) для среднего по совокупности \( \mu \), когда мы делаем выборку из нормального распределения с известной дисперсией \( \sigma2 \) задается формулой:

\( \Large { \overline X \pm z_{\alpha /2}{\sigma \over \sqrt n} } \) (Формула 4)

Факторы надежности для наиболее часто используемых доверительных интервалов приведены ниже.

Факторы надежности для доверительных интервалов на основе стандартного нормального распределения

Мы используем следующие факторы надежности при построении доверительных интервалов на основе стандартного нормального распределения:

  • 90%-ные доверительные интервалы: используется \(z_{0.05}\) = 1.65
  • 95%-ные доверительные интервалы: используется \(z_{0.025}\) = 1.96
  • 99%-ные доверительные интервалы: используется \(z_{0.005}\) = 2.58

На практике, большинство финансовых аналитиков используют значения для \(z_{0.05}\) и \(z_{0.005}\), округленные до двух знаков после запятой.

Для справки, более точными значениями для \(z_{0.05}\) и \(z_{0.005}\) являются 1.645 и 2.575, соответственно.

Для быстрого расчета 95%-ного доверительного интервала \(z_{0.025}\) иногда округляют 1.96 до 2.

Эти факторы надежности подчеркивают важный факт о всех доверительных интервалах. По мере того, как мы повышаем степень доверия, доверительный интервал становится все шире и дает нам менее точную информацию о величине, которую мы хотим оценить.

«Чем уверенней мы хотим быть, тем меньше мы должны быть уверены»

см. Freund и Williams (1977), стр. 266.

На практике, допущение о том, что выборочное распределение выборочного среднего, по меньшей мере, приблизительно нормальное, часто является обоснованным, либо потому, что исходное распределение приблизительно нормальное, либо потому что мы имеем большую выборку и поэтому к ней применима центральная предельная теорема.

Однако, на практике, мы редко знаем дисперсию совокупности. Когда дисперсия генеральной совокупности неизвестна, но выборочное среднее, по меньшей мере, приблизительно нормально распределено, у нас есть два приемлемых пути чтобы вычислить доверительные интервалы для среднего значения совокупности.

Вскоре мы обсудим более консервативный подход, который основан на t-распределении Стьюдента (t-распределение, для краткости).

Распределение статистики \(t\) называется t-распределением Стьюдента (англ. «Student's t-distribution») из-за псевдонима «Студент» (Student), использованного британским математиком Уильямом Сили Госсеттом, который опубликовал свою работу в 1908 году.

В финансовой литературе, это наиболее часто используемый подход для статистической оценки и проверки статистических гипотез, касающихся среднего значения, когда дисперсия генеральной совокупности не известна, как для малого, так и для большого размер выборки.

Второй подход к доверительным интервалам для среднего по совокупности, основанного на стандартном нормальном распределении, — это z-альтернатива (англ. 'z-alternative'). Он может быть использован только тогда, когда размер выборки является большим (в общем случае, размер выборки 30 или больше, можно считать большим).

В отличии от доверительного интервала, приведенного в Формуле 4, этот доверительный интервал использует стандартное отклонение выборки \(s\) при вычислении стандартной ошибки выборочного среднего (по Формуле 2).

Доверительные интервалы для среднего по совокупности — z-альтернатива (большая выборка, дисперсия совокупности неизвестна)

Доверительный интервал \(100 (1 — \alpha)\% \) для среднего по совокупности \( \mu \) при выборке из любого распределения с неизвестной дисперсией, когда размер выборки большой, задается формулой:

\( \Large { \overline X \pm z_{\alpha /2}{s \over \sqrt n} } \) (Формула 5)

Поскольку этот тип доверительного интервала применяется довольно часто, мы проиллюстрируем его вычисление в Примере 4.

Пример (4) расчета доверительного интервала для среднего по совокупности коэффициентов Шарпа с использованием z-статистики

Предположим, что инвестиционный аналитик делает случайную выборку акций взаимных фондов США и рассчитывает средний коэффициент Шарпа.

[см. также: CFA — Коэффициент Шарпа]

Размер выборки равен 100, а средний коэффициент Шарпа составляет 0.45. Выборка имеет стандартное отклонение 0.30.

Рассчитайте и интерпретируйте 90-процентный доверительный интервал для среднего по совокупности всех акций взаимных фондов США с использованием фактора надежности на основе стандартного нормального распределения.

Фактор надежности для 90-процентного доверительного интервала, как указано ранее, составляет \( z_{0.05} = 1.65 \).

Доверительный интервал будет равен:

Источник: https://fin-accounting.ru/cfa/l1/quantitative/cfa-confidence-intervals-for-population-mean

Проверка доверия. Главные индикаторы для оценки эффективности инвестиций

Коэффициент доверия

Любому инвестору всегда немного тревожно отдавать деньги в чужие руки, даже когда речь идет об управляющих с многолетним опытом и безупречной репутацией.

Как же удостовериться в том, что вы выбрали правильный фонд, а ваша УК правильно обращается с активами, не злоупотребляет риском и не осторожничает сверх меры? Для этих целей разработан целый набор специальных индикаторов, о которых мы подробно расскажем в нашей новой статье.

Пытаясь привлечь клиентов, управляющие часто говорят в первую очередь о доходности стратегий и фондов. Это, безусловно, самый наглядный показатель эффективности инвестиций. Но применим он далеко не всегда.

Вместе с переменчивой и слабо предсказуемой доходностью инвесторам полезно оценить аналитические коэффициенты фондов, которые отражают не только уровень прибыли, но также ее соотношение с риском и рыночной ситуацией.

А главное — они помогают правильно выбрать наиболее подходящий фонд среди нескольких ПИФов с похожими стратегиями и показателями и позволяют объективно судить об эффективности управления вашими средствами.

В течение недели, месяца или даже года стоимость многих активов может сильно колебаться или показывать отрицательную динамику. Но тот же самый актив нередко дает стабильную прибыль, например, в трехлетнем горизонте.

А в десятилетнем — обходит по доходности многие акции, которые казались крайне привлекательными на текущий момент.

В свою очередь, доходность актива за короткий период никак не гарантирует интересной прибыли в более длительной перспективе.

Доходность актива за короткий период никак не гарантирует интересной прибыли в более длительной перспективе

Однако даже для не очень опытных инвесторов есть надежный способ убедиться, что инвестиции нацелены на адекватный уровень прибыли и не подвергаются излишнему риску. Для этого стоит подробно изучить аналитические коэффициенты, которые отражают сразу несколько важных параметров и помогают понять, все ли в порядке с вашими вложениями.

Для ПИФов аналитики и управляющие используют больше десятка таких коэффициентов.

Очень условно их можно разделить на две группы — одни помогают точно оценить доходность инвестиций, не обманываясь мимолетными движениями рынка, другие служат индикаторами риска.

Некоторые коэффициенты отражают и то, и другое. Большинство индикаторов рассчитывается по специальным формулам, и обычному клиенту порой непросто в них разобраться.

Впрочем, рассчитывать все самостоятельно чаще всего нет нужды.

Профессиональные УК, которые не стесняются достигнутых результатов и уверены в своих подходах к управлению, выкладывают информацию о коэффициентах фондов в открытый доступ.

Например, на сайте ТКБ Инвестмент Партнерс оценить эффективность инвестиций в тот или иной ПИФ можно по всем основным показателям, которые управляющие рассчитывают для действующих и будущих клиентов.

Такие коэффициенты особенно полезны, когда необходимо сделать выбор между двумя фондами со схожими параметрами.

Как правило, большего внимания заслуживают те ПИФы, у которых основные индикаторы находятся в положительной зоне.

Они также помогут более точно и объективно сопоставить уровень прибыли с предлагаемым риском, а показатели доходности конкретного фонда — соотнести с ситуацией на рынке.

О чем же должны рассказать эти цифры инвестору?

Бенчмарк (BM)

Показатель очень широко используется в финансовой индустрии, причем далеко не только применительно к паевым инвестиционным фондам. Бенчмарк — базовый ориентир, равняясь на который аналитики оценивают текущее состояние рынка, рыночного сегмента или актива. На основе этого индикатора рассчитывают целый ряд других аналитических коэффициентов.

Чаще всего бенчмарком служит индекс фондового рынка или отдельной отрасли. Почти в каждой стране есть свой базовый индикатор, который используют как общий страновой ориентир. Например, в России для этих целей чаще всего применяют Индекс МосБиржи или Индекс РТС. В США есть сразу три таких индекса — S&P 500, Dow Jones, NASDAQ.

Почти в каждой стране есть свой базовый индикатор, который используют как общий страновой ориентир

Для вложений в диверсифицированный портфель акций российских компаний бенчмарком часто выбирают Индекс МосБиржи. Сравнив его с доходностью этого портфеля, можно будет судить об эффективности отбора бумаг и управления активами.

В качестве бенчмарка для ПИФов выступают индексы, которые больше всего подходят по структуре и соответствуют инвестиционной стратегии фонда.

Например, для ОПИФ рыночных финансовых инструментов «ТКБ Инвестмент Партнерс – Золото» используется индекс SPDR Gold Trust, а бенчмарком для ОПИФ рыночных финансовых инструментов «ТКБ Инвестмент Партнерс –Премиум. Фонд акций» — Индекс МосБиржи.

Если подходящего индекса на рынке нет или он не соответствует требованиям, предъявляемым к ПИФам, управляющие рассчитывают его самостоятельно.

Волатильность (δ (PF) — фонда, δ (BM) – бенчмарка)

Постоянные колебания — нормальное для рынка явление. Более того, именно они позволяют зарабатывать большинству успешных инвесторов. Коэффициент волатильности ПИФа позволяет оценить степень риска и соотнести его с ожидаемой доходностью.

Чем больше значение этого индикатора, тем менее предсказуема и стабильна доходность фонда. К активам с сильной волатильностью стоит относиться с осторожностью — не зря при составлении рейтингов фондов они, как правило, оказываются внизу списка. Хотя, как известно, именно высокий риск зачастую сопутствует высокой прибыли.

Бета (β (BM) – к бенчмарку, β (M) – к рынку)

Этот коэффициент помогает оценить зависимость конкретного актива, портфеля или фонда от рыночных изменений. Он показывает, как сильно рынок воздействует на доходность ваших инвестиций и насколько полученная прибыль (или убыток) объясняются поведением рынка или выбранного для этого фонда бенчмарка. Чем ближе коэффициент к нулю, тем меньше рыночная ситуация влияет на ваши инвестиции.

Положительная «бета» свидетельствует, что доходность данного инструмента будет меняться вслед за доходностью рынка. При отрицательной величине коэффициента можно ожидать, что динамика фонда будет противоположна рыночной. То есть — при падении рынка она станет расти, а при общем росте — падать.

Коэффициент бета может рассчитываться по отношению к рынку или бенчмарку. Например, если бета для фонда акций равняется 2, то при росте Индекса МосБиржи на 10% доходность фонда с высокой вероятностью увеличится на 20%. А если бета составляет -2, скорее всего, 10%-ный рост рынка обернется для инвестора потерей 20% дохода.

Регрессионная альфа (α (R))

Если предыдущий показатель отражал степень влияния рынка на доходность фонда, то регрессионный коэффициент альфа, напротив, подсказывает, насколько доход портфеля не зависит от поведения рынка или бенчмарка.

Индикатор помогает оценить, какой была бы прибыль фонда в условиях нулевой доходности бенчмарка. Тем не менее следует учесть, что регрессионные коэффициенты при анализе краткосрочных периодов практически бесполезны.

ТКБ Инвестмент Партнерс рассчитывает регрессионную альфу на основе еженедельных данных за период в один год. Показатель не стоит путать с «альфой Йенсена», о которой мы расскажем ниже.

Альфа Йенсена (α (J))

Этот индикатор — мечта всех начинающих инвесторов, которые все еще не могут выбрать управляющего или сомневаются в своем выборе. Альфа Йенсена позволяет оценить качество управления фондом и показывает, насколько рост стоимости актива объясняется действиями УК. С помощью этого индикатора легко понять, насколько эффективнее выбранный подход по сравнению с пассивным управлением.

Высокое значение альфы Йенсена подсказывает, что инвестору крайне повезло — его активами управляют очень эффективно. Отрицательная величина означает, что фонд принес меньший доход, чем мог бы принести эталонный портфель. Однако «минус» в этой графе далеко не всегда говорит о неэффективном управлении. Нередко это объясняется расходами фонда, например, комиссиями управляющих.

Коэффициент Шарпа (S)

Индикатор показывает, сколько на каждую единицу риска приходится так называемой избыточной доходности — то есть той прибыли, которую инвестор получил сверх уровня, гарантированного безрисковыми инструментами.

По коэффициенту Шарпа также можно судить об эффективности управления средствами — чем он выше, тем успешнее работает ваша УК. Если значение этого индикатора невелико, значит, получаемая выгода не оправдывает принятого уровня риска. А если показатель и вовсе отрицательный, вероятно, было бы прибыльнее вкладываться в государственные ценные бумаги — то есть тот самый безрисковый инструмент.

Коэффициент Шарпа пригодится в ситуациях, когда нужно выбрать между двумя активами с одинаковым уровнем риска. Более выгодным будет тот, у которого этот индикатор выше.

Коэффициент Трейнора (T)

Показатель во многом похож на коэффициент Шарпа. Он тоже измеряет доходность, полученную свыше уровня безрисковых инвестиций, на единицу принятого риска. Но здесь речь идет не об общем, а только о так называемом недиверсифицируемом или систематическом риске.

Он связан с изменением конъюнктуры всего финансового рынка и объясняется объективными макроэкономическими факторами.

Такой риск существует для всех участников рынка и, как следует из названия, его нельзя устранить за счет диверсификации и более эффективного управления портфелем.

Как и в случае с коэффициентом Шарпа, высокие значения этого индикатора говорят об эффективности работы управляющего. А вот отрицательные показатели — свидетельство того, что портфель приносит меньшую доходность, чем рынок в целом, или вовсе вводит инвестора в убытки.

R-квадрат (R2 (BM) – к бенчмарку, R2 (M) – к рынку)

Коэффициент отражает, насколько тесна взаимосвязь между динамикой рынка и изменением стоимости пая в ПИФе. Его значение может меняться от нуля до единицы или, в некоторых случаях, от 0 до 100%.

Если цифра, например, близится к нулю, значит, цена актива двигается абсолютно независимо от поведения рынка. Чем выше коэффициент, тем теснее взаимосвязь с рыночной динамикой.

Единица или 100% показывают, что стоимость пая точь-в-точь следует за базовым индикатором.

Как и ряд других аналитических показателей, этот коэффициент можно рассчитать не только по отношению к рынку, но и, при необходимости, к бенчмарку или выбранному отраслевому индексу. Используя R-квадрат, легко проверить, не хитрят ли ваши управляющие с портфелем.

Нередко УК, чтобы «подтянуть» показатели прибыли для облигационных фондов, принимаются скупать акции. И если акций в облигационном портфеле действительно много, то индикатор R2, рассчитанный для этого ПИФа по отношению к облигационному индексу RUX-Cbonds, будет низким.

И, напротив, высоким окажется значение R2, рассчитанного для фонда на основе Индекса МосБиржи, который обычно используется для оценки фондов акций.

Вывод

При оценке и, тем более, подсчетах аналитических коэффициентов непрофессиональному инвестору нужно учитывать некоторые нюансы. В частности, помнить о том, что индексы МосБиржи считаются по ценам закрытия, а показатели ПИФов — по средневзвешенным ценам. В периоды с высокой волатильностью это может существенно влиять на расчеты.

Однако даже с учетом статистических погрешностей аналитические коэффициенты полезно иметь ввиду на значимых для инвестора этапах — от выбора конкретной стратегии и фонда между несколькими вариантами до проверки состояния и качества управления инвестициями. Если предполагаемый срок инвестиции составляет, допустим, три года, то уже через год стоит убедиться, что у вашего ПИФа нет заметных негативных отклонений по основным индикаторам.

В то же время, изучая коэффициенты, необходимо помнить, что речь идет все же о ретроспективных статистических показателях. Они, безусловно, могут свидетельствовать о грамотном подходе и эффективной работе управляющих.

Но если в компании сменилась команда или стратегия, рассчитанные за прошедший год индикаторы потеряют всякий смысл. И в любом случае от профессионализма и опыта управляющих будет зависеть, удастся ли сохранить доходность инвестиций не только в тучные, но и в кризисные годы.

Поэтому именно выбору команды, которой вы собираетесь доверить средства, всегда стоит уделять первостепенное внимание.

Источник: https://zen.yandex.ru/media/tkbip/proverka-doveriia-glavnye-indikatory-dlia-ocenki-effektivnosti-investicii--5b58267209a88500a8260238

Все термины
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: