Выборочная доля

Содержание
  1. Тема: ВАРИАЦИОННЫЙ РЯД И СРЕДНИЕ ВЕЛИЧИНЫ. ОЦЕНКА ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ
  2. Таблицы по теме:
  3. 1. Определение вариационного ряда
  4. 2. Построение вариационного ряда:
  5. 3. Виды вариационных рядов
  6. 4. Преобразование вариационных рядов (группировка).
  7. 6. Применение средних величин:
  8. 7. Свойства средней арифметической в вариационном ряду:
  9. 8. Способы расчета средней арифметической (М).
  10. 9. Критерии разнообразия признака и методика их расчета
  11. Практическое применение среднего квадратического отклонения
  12. УЧЕБНОЕ ЗАДАНИЕ К ЗАДАЧАМ:
  13. Условие задачи:
  14. n = 67
  15. ОПРЕДЕЛЕНИЕ НЕОБХОДИМОЙ ЧИСЛЕННОСТИ ВЫБОРКИ
  16. При повторном отборе:
  17. При бесповторном отборе:
  18. ОСНОВНАЯ
  19. ДОПОЛНИТЕЛЬНАЯ:
  20. ЭЛЕКТРОННЫЙ РЕСУРС:
  21. ЗАДАНИЯ
  22. Задача №1.
  23. Задача №2.
  24. Задача №4.
  25. Задача №5.
  26. Задача №6.
  27. Задача №7.
  28. Задача №8.
  29. Задача №9.
  30. Задача №10.
  31. Задача №11.
  32. Задача №12.
  33. Задача №13.
  34. Задача №14.
  35. Задача №15.
  36. Ошибка выборки
  37. Определение предельной ошибки выборки для доли
  38. Определение предельной ошибки выборки для средней
  39. Простыми словами о выборке. Просто о выборке, репрезентативности и…
  40. Выборка и репрезентативность
  41. Методы отбора
  42. Случайные выборки
  43. Неслучайные выборки

Тема: ВАРИАЦИОННЫЙ РЯД И СРЕДНИЕ ВЕЛИЧИНЫ. ОЦЕНКА ДОСТОВЕРНОСТИ РЕЗУЛЬТАТОВ ИССЛЕДОВАНИЯ

Выборочная доля

Для изучения показателей общественного здоровья, для выявления общих закономерностей различных явлений, врачу необходимо знать и владеть методикой вычисления средних величин, так как эти свойства не могут быть обнаружены при анализе единичных явлений.

Таблицы по теме:

Таблица 1. Логическая структура темы «Средние величины»

скачать таблицу 1.

Таблица 2. Логическая структура темы «Вариационный ряд»

скачать таблицу 2.

Таблица 3. Виды вариационных рядов

скачать таблицу 3.

Таблица 4. Вариационная таблица рядя ростаПриложение к таблице 4.

скачать таблицу 4 с приложением

Таблица 5. Коэффициенты К для вычисления среднего квадратичного отклонения по амплитуде вариационного ряда (Аmp) (таблица С.И. Ермолаева)

скачать таблицу 5

Рисунок 1. Структура вариационного ряда по сигмальным отклонениям

скачать рисунок 1

Таблица 6. Оценка достоверности результатов исследования

скачать таблицу 6

Рисунок 2. Определение объема наблюдений при выборочном исследовании

скачать рисунок 2

Рисунок 3. Определение достоверных различий средних величин

скачать рисунок 3

1. Определение вариационного ряда

Вариационный ряд – это ряд чисел (вариант), характеризующих изучаемый признак, расположенных в ранговом порядке (в убывающей или возрастающей последовательности) с соответствующими этим вариантам (V) частотами (Р).

V– варианта, каждое числовое значение изучаемого количественного признака.

Р– численность отдельной варианты в изучаемой совокупности, величина, указывающая сколько раз встречается данная варианта в вариационном ряду.

N– общее число наблюдений, из которых состоит вариационный ряд.

Вариационный ряд применяется для определения среднего уровня признака (средних величин) и уровней разнообразия признака (критериев разнообразия).

2. Построение вариационного ряда:

а) Провести ранжирование вариант ряда, т.е. расположить их в убывающей или возрастающей последовательности.

б) Составить вариационный ряд (ряд) вариант с соответствующими им частотами.

в) Подсчитать число наблюдений (∑ p= n)

3. Виды вариационных рядов

1) Простой – каждой варианте (V) соответствует частота р = 1.

2) Взвешенный – варианты в ряду встречаются с разной частотой (p > 1).

4. Преобразование вариационных рядов (группировка).

Группировка – это способ укорочения вариационного ряда в целях уменьшения последующих счетных операций.

6. Применение средних величин:

  • Для оценки состояния здоровья: показатели физического развития, например: средний вес, средний рост и т.д.; показатели соматического состояния, например: уровень давления, средний уровень холестерина и т.д.
  • Для оценки организации медицинской помощи: показатели деятельности каждого врача в отдельности и лечебно-профилактического учреждения в целом. Например: среднее число посещений в день к врачу, средняя длительность лечения по отдельным заболеваниям.
  • В санитарно-противоэпидемической работе.

7. Свойства средней арифметической в вариационном ряду:

  1. Имеет абстрактный характер;
  2. Занимает серединное положение в вариационном ряду;
  3. Сумма отклонений всех вариант от средней равна нулю (на этом свойстве основан расчет М по способу «моментов»);
  4. Единство суммарного действия (∑ v p = M n).

8. Способы расчета средней арифметической (М).

Среднеарифметический способ расчета применяется для вычисления среднеарифметической простой и среднеарифметической взвешенной.

9. Критерии разнообразия признака и методика их расчета

1) Среднее квадратическое отклонение – сигма(σ):

а) вычисление по способу моментов;

б) по амплитуде ряда

Аmp = Vmax – Vmin

Коэффициент К находим по таблице в зависимости от числа наблюдений n, на пересечении десятков и единиц.

Например,если n = 32, то К = 4,14.

Таблица 5. Коэффициенты К для вычисления среднего квадратичного отклонения по амплитуде вариационного ряда (Аmp) (таблица С.И. Ермолаева)

2) Коэффициент вариации (С)

Практическое применение среднего квадратического отклонения

  • При оценке физического развития индивида и коллективов, при диагностике – для дифференциации устойчивых и неустойчивых признаков.
  • Для определения стандартов одежды, обуви, школьной мебели и др.
  • на основе построения вариационного ряда и определении его структуры – оценки разнообразия какого-либо признака.
  • Для определения параметров «нормы» и патологии (по сигмальной оценке М ±σ).

УЧЕБНОЕ ЗАДАНИЕ К ЗАДАЧАМ:

1. Вычислить среднюю арифметическую величину (М) и критерии разнообразия вариационного ряда (σ, Cv).

2. Оценить полученные результаты и сделать соответствующие выводы.

3. Сравнить полученные данные с результатами других исследований.

Условие задачи:

В районе А. проведено измерение роста 67 девушек 17-летнего возраста (данные представлены ниже). Средний рост девушек 17-летнего возраста района В.

М2 = 165,4 см, σ = ±10,2 см.

n = 67

Таблица к задаче-эталон

Оценивая полученные результаты (Мv), делаем соответствующие выводы.

Средний рост девушек 17-летнего возраста в районе города А cоставляет 165,36 см, σ = ± 5,07 см.

Сравниваем полученные данные с результатами измерения среднего роста 17-летних девушек в районе В.

М = 165,36 см, σ = ± 5,07 см

М2 = 165,4 см, σ = ± 10,2 см , что свидетельствует о большей вариабельности изучаемого признака в районе В.

Оценка достоверности средних величин проводится по ошибке (m)

Оценка достоверности различий средних величин по величине коэффициента t:

Если t = 1,96 и более, то различия достоверны.

ОПРЕДЕЛЕНИЕ НЕОБХОДИМОЙ ЧИСЛЕННОСТИ ВЫБОРКИ

Одной из наиболее важных и ответственных задач при организации и проведении выборочного наблюдения — установление необходимой численности выборочной совокупности. То есть такой ее численности, которая обеспечивала бы получение данных, достаточно правильно отражающих изучаемые свойства генеральной совокупности.

При этом должно быть учтено:

1) с какой степенью точности следует получить предельную ошибку выборки в результате выборочного наблюдения;

2) какова должна быть вероятность того, что будет обеспечена обусловленная точность результатов выборочного наблюдения;

3) какова степень колеблемости изучаемых свойств в исследуемой генеральной совокупности.

Это значит, что необходимая численность выборки (n) устанавливается в зависимости от размеров предельной ошибки выборки (), от величины коэффициента доверия (t) и от размеров величины дисперсии (σ2).

Сами формулы необходимой численности выборки выводятся из формул предельной ошибки выборки следующим образом.

При повторном отборе:

а) для средней

в формуле предельной ошибки выборки

обе ее стороны возводим в квадрат и получаем

откуда

и затем

Таким образом, в этом случае необходимая численность выборочной совокупности равная произведению квадрата коэффициента доверия и дисперсии признака, деленному на квадрат предельной ошибки выборки;

б) для доли

в формуле предельной ошибки выборки

обе ее стороны возводим в квадрат и получаем

откуда

и затем

Таким образом, в этом случае необходимая численность выборочной совокупности равна произведению квадрата коэффициента доверия и дисперсии доли, деленному на квадрат предельной ошибки выборки.

При бесповторном отборе:

а) для средней

из формулы предельной ошибки выборки

после ряда преобразований получаем

Такова формула необходимой численности выборочной совокупности для определения средней путем бесповторного отбора.

б) для доли

Из формулы предельной ошибки выборки

после ряда преобразований получаем

Такова формула необходимой численности выборочной совокупности для определения доли путем бесповторного отбора.

Приведем краткий пример определения необходимой численности выборочной совокупности исходя из условий повторного отбора.

Допустим, что с вероятностью 0,954 требуется определить какое количество историй болезни необходимо отобрать для экспертной оценки качества лечения больных сахарным диабетом при условии, что предельная ошибка выборки не должна превышать 2.

Таким образом:

в этих условиях:

Следовательно, на выборку в порядке случайного отбора должно быть отобрано 50 историй болезни.

Если всего пролечено 500 пациентов, то доля выборки составляет

Заметим, что, так как в данном примере доля выборки очень небольшая, то расчет, полученный по формуле повторной выборки, может быть применен и для выборки бесповторной.

Таким образом, для выборочной проверки должна быть отобрана каждая десятая история болезни.

ОСНОВНАЯ

1. Медик В.А. Общественное здоровье и здравоохранение: руководство к практическим занятиям: учебное пособие / В.А.Медик, В.И.Лисицин, М.С.Токмачев.-2-е изд., испр. и доп. — М.: ГЭОТАР-Медиа, 2018- 464с.

2. Общественное здоровье и здравоохранение: учебник / В.А.Медик. – 3-е изд., испр. и доп. –М.: ГЭОТАР-Медиа, 2018. 656с.: ил.

ДОПОЛНИТЕЛЬНАЯ:

1. Зайцева Н.В., Лебедева Т.М., Окунева Г.Ю.,и др. Об основах охраны здоровья граждан в Российской Федерации. – Пермь. – 2015.

2. Организация медицинской помощи в Российской Федерации: Под редакцией В.А.Решетникова.- Москва.: ООО Издательство «МИА», 2018.- 432с.

ЭЛЕКТРОННЫЙ РЕСУРС:

1. Общественное здоровье и здравоохранение: учебник/Медик В.А., Юрьев В.К.-3-е изд., перераб. и доп.-М.: ГОЭТАР-Медиа, 2015. www//studmedlib.ru/catalogue/ed_med_hi/0054.html

2. Общественное здоровье и здравоохранение: учебник/Лисицын Ю.П., Улумбекова Г.Э.-3-е изд., перераб. и доп.-М.:ГОЭТАР-Медиа, 2015. www//studmedlib.ru/catalogue/ed_med_hi/0054.html

3. Общественное здоровье и здравоохранение: учебник / В.А. Медик, В.И. Лисицин. — 4-е изд., перераб. и доп. — М. : ГЭОТАР-Медиа, 2016. www.studmedlib.ru/book/ISBN9785970437018.html

4. Общественное здоровье и здравоохранение: учебник / Медик В. А., Юрьев В. К. — 2-е изд., испр. и доп. — М. : ГЭОТАР-Медиа, 2016. www.studmedlib.ru/book/ISBN9785970437100.html

5. Двойников С.И. Организационно-аналитическая деятельность: учебник / С. И. Двойников и др. — М. : ГЭОТАР-Медиа, 2015. www.studmedlib.ru/book/ISBN9785970434208.html

ЗАДАНИЯ

На основе представленных в задаче данных требуется вычислить среднюю арифметическую (М), среднеквадратическое отклонение (σ ), коэффициент вариации (Сv) и сделать соответствующие выводы. Сравните полученные данные с результатами других исследований.

Задача №1.

Результаты измерения роста 15-летних подростков, проживающих в 2-х районах города Н.

Таблица к задаче № 1

Задача №2.

Результаты измерения роста 15-летних подростков, проживающих в 2-х районах Н-ской области.

Таблица к задаче № 2

Задача №3.

Результаты измерения массы тела 7-летних мальчиков, проживающих в 2-х районах города Н.

Таблица к задаче № 3

Задача №4.

Результаты измерения массы тела 7-летних мальчиков, проживающих в 2-х сельских районах Н-ской области.

Таблица к задаче № 4

Задача №5.

Результаты измерения роста 7-летних мальчиков, проживающих в 2-х районах города Н (Н-ской области).

Таблица к задаче № 5

Задача №6.

Результаты измерения роста 7-летних мальчиков, проживающих в 2-х сельских районах Н-ской области.

Таблица к задаче № 6

Задача №7.

Результаты изучения сроков лечения больных гипертонической болезнью II ст., находящихся в стационаре А.

Таблица к задаче № 7

Задача №8.

Результаты изучения сроков лечения больных гипертонической болезнью III ст., находящихся в стационаре А.

Таблица к задаче № 8

Задача №9.

При профилактическом осмотре студентов-медиков лечебного факультета в возрасте 20 лет определялась частота пульса.

Таблица к задаче № 9

Задача №10.

Кардиоревматологами диспансера г. А. Н-ской области изучено число обращений детей с активной фазой ревматизма в течение года.

Таблица к задаче № 10

Задача №11.

Кардиоревматологами диспансера №… г. В. Н-ской области изучено число обращений (явок) детей с неактивной фазой ревматизма в течение года.

Таблица к задаче № 11

Задача №12.

Результаты изучения длительности пребывания на больничном листе по поводу гипертонической болезни состоящих под диспансерным наблюдением больных данным заболеванием поликлиники №… г. Н. Городской показатель изучения длительности пребывания на больничном листе с данной нозологией аналогичной группы больных – 23,8 дней. σ = -4,6 дня.

Таблица к задаче № 12

Задача №13.

Результаты изучения длительности пребывания на больничном листе по поводу гипертонической болезни больных, не состоящих под диспансерным наблюдением. Городской показатель по аналогичной группе больных 18 дней, σ = ±5,8 дня.

Таблица к задаче № 13

Задача №14.

Изучена средняя длительность пребывания больного на койке инфекционной больницы №1 г. А. в 2007 году. Внутригородской показатель средней длительности пребывания больного на койке равен 16 дням, , σ = ± 5,8 дней.

Таблица к задаче № 14

Задача №15.

Изучена средняя длительность пребывания больного на койке инфекционной больницы №2 г.В. в 2007 году. Внутригородская средняя длительность пребывания больного на койке равна 20 дням.

σ = ±5,8 дня.

Таблица к задаче № 15

Источник: https://zen.yandex.ru/media/id/5f4e2f3978b8ab69e2e27820/tema-variacionnyi-riad-i-srednie-velichiny-ocenka-dostovernosti-rezultatov-issledovaniia-5f95805a98e57704a16606ae

Ошибка выборки

Выборочная доля

Предельная ошибка выборки равна t-кратному числу средних ошибок выборки: 

μ – средняя ошибка выборки, рассчитанная с учетом поправки, на которую производится корректировка в случае бесповторного отбора;

t – коэффициент доверия, который находят при заданном уровне вероятности. Так для Р=0,997 по таблице значений интегральной функции Лапласа t=3

Величина предельной ошибки выборки может быть установлена с определенной вероятностью.

Вероятность появления такой ошибки, равной или больше утроенной средней ошибки выборки, крайне мала и равна 0,003 (1–0,997).

Такие маловероятные события считаются практически невозможными, а потому вероятность того, что эта разность превысит трехкратную величину средней ошибки, определяет уровень ошибки и составляет не более 0,3%.

Определение предельной ошибки выборки для доли

Условие:

Из готовой продукции, в порядке собственно-случайного бесповторного отбора, было отобрано 200 ц, из которых 8 ц оказалось испорчено. Можно ли полагать с вероятностью 0,954, что потери продукции не превысят 5%, если выборка составляет 1:20 часть ее размера?

Дано:

  • n =200ц – объем выборки (выборочная совокупность)
  • m =8ц  —  кол-во испорченной продукции
  • n:N = 1:20 – пропорция отбора, где N- объем совокупности (генеральная совокупность)
  • Р = 0,954 – вероятность

Определить: ∆ω< 5% (согласуется ли то, что потери продукции не превысят 5%)

Решение:

1. Определим выборочную долю-такую долю составляет испорченная продукция в выборочной совокупности:

2. Определим объем генеральной совокупности:

N=n*20=200*20=4000(ц) – количество всей продукции.                                           

3. Определим предельную ошибку выборки для доли продукции, обладающей соответствующим признаком, т.е.

для доли испорченной продукции: Δ = t*μ,  где µ– средняя ошибка доли, обладающей альтернативным признаком, с учетом поправки, на которую производится корректировка в случае бесповторного отбора; t – коэффициент доверия, который находят при заданном уровне вероятности Р=0,954 по таблице значений интегральной функции Лапласа: t=2

4. Определим границы доверительного интервала для доли альтернативного признака в генеральной совокупности, т.е.

какую долю испорченная продукция составит в общем объеме: поскольку доля испорченной продукции в выборочном объеме составляет ω = 0,04, то с учетом предельной ошибки ∆ω= 0,027 генеральная доля альтернативного признака (p) примет значения:

 ω-∆ω < p < ω+∆ω

  0.04-0.027< p < 0.04+0.027

0.013 < p < 0.067

Вывод: с вероятностью Р=0,954 можно утверждать, что доля испорченной продукции при выборке большего объема не выйдет за пределы найденного интервала (не менее 1,3% и не более 6,7%). Но остается вероятность того, что доля испорченной продукции может превысить 5% в пределах до 6,7%, что, в свою очередь, не согласуется с утверждением  ∆ω< 5%.

*******

Условие:

Менеджер магазина по опыту знает, что 25% входящих в магазин покупателей, совершают покупки. Предположим, что в магазин вошло 200 покупателей.

Определить:

  1. долю покупателей, совершивших покупки
  2. дисперсию выборочной доли
  3. среднее квадратическое отклонение выборочной доли
  4. вероятность того, что выборочная доля будет в пределах между 0,25 и 0,30

Решение:

В качестве генеральной доли (p) принимаем выборочную долю (ω) и определяем верхнюю границу доверительного интервала.

Зная критическую точку (по условию: выборочная доля будет в пределах 0,25-0,30), строим одностороннюю критическую область (правостороннюю).

По таблице значений интегральной функции Лапласа находим Z
Этот же вариант можно рассматривать и как повторный отбор при условии, если один и тот же покупатель, не купив в 1-й раз, возвращается и совершает покупку.

В случае, если выборку рассматривать как бесповторную, необходимо среднюю ошибку скорректировать на поправочный коэффициент. Тогда, подставив скоррекированные значения предельной ошибки для выборочной доли, при определении критической области, изменятся Z и P

Определение предельной ошибки выборки для средней

По данным 17 сотрудников фирмы, где работает 260 человек, среднемесячная заработная плата составила 360 у.е., при s=76 у.е. Какая минимальная сумма должна быть положена на счет фирмы, чтобы с вероятностью 0,98 гарантировать выдачу заработной платы всем сотрудникам?

Дано:

  • n=17 — объем выборки (выборочная совокупность)
  • N=260 — объем совокупности (генеральная совокупность)
  • Хср.=360 — выборочная средняя
  • S=76 — выборочное среднеквадратическое отклонение
  • Р = 0,98 –  доверительная вероятность

Определить: минимально допустимое значение генеральной средней (нижнюю границу доверительного интервала).

Решение:

Для определения доверительного интервала для средней, необходимо найти предельную ошибку для средней: при Р=0,98 по таблице значений интегральной функции Лапласа — t=2.33

Из условия определения границ доверительного интервала для средней:

Хср.-Δх≤Х≤ Хср.+Δх определяем нижнюю границу (левосторонняя критическая область): 360-41,52=318,48

Отсюда: 318,48*260=82804,7 у.е. — такова минимальная сумма, которая должна быть положена на счет фирмы.

Источник: https://helpstat.ru/oshibka-vyborki/

Простыми словами о выборке. Просто о выборке, репрезентативности и…

Выборочная доля

Привет. Я UX-исследователь в СКБ Контур. Чаще всего в работе я использую качественные методы исследований — глубинные интервью и модерируемые юзабилити-тестирования. Количественные исследования без подготовленной инфраструктуры со стороны разработки более ресурсозатратные, поэтому самостоятельно их провести сложнее.

Но самое сложное для меня в проведении количественного исследования — это выборка. Мне ближе гуманитарная сторона исследовательской работы, поэтому разобраться в выборке сложнее, чем в техниках ведения интервью. Если у тебя такая же проблема, эта статья будет полезна.

Ниже я попробовала просто рассказать о выборке, репрезентативности и методах отбора при проведении количественного исследования.

Выборка и репрезентативность

Опрос — это количественный метод, направленный на получение точной, объективной и статистически значимой информации. Если качественные методы помогают в формулировке гипотез, то количественные — масштабируют и проверяют эти гипотезы на всей целевой аудитории.

Поэтому важно проводить отбор респондентов таким образом, чтобы выборочная совокупность отражала состав всей генеральной совокупности.

В социологии есть термин — единица наблюдения. Это может быть один человек, группа или сообщество в зависимости от целей исследования.

Генеральная совокупность — это вся совокупность единиц наблюдения, имеющих отношение к теме исследования.

Например, если ты проводишь продуктовое исследование, то скорее всего твоя генеральная совокупность — это все пользователи сервиса или определенный сегмент.

Выборочная совокупность — часть генеральной совокупности, которую вы изучаете в ходе исследования с помощью разработанных вами инструментов (анкета, гайд и прочее).

Например, в ходе исследования было опрошено 400 респондентов среди всех пользователей сервиса. Это твоя выборочная совокупность.

Выборка должна быть репрезентативной, иначе результаты количественного исследования будут сомнительными.

Репрезентативность — обеспечение в выборочной совокупности наличия всех видов единиц генеральной совокупности в достаточном количестве.

Репрезентативность имеет качественное и количественное выражение. Качественная репрезентация обязывает включить в выборку все возможные варианты респондентов, особенно, если какой-то признак влияет на опыт использования сервиса.

Например, выборка не будет репрезентативной если ты опросишь только новых пользователей (если это не оправдано целями исследования). Особенно это исказит результаты исследования, если длительность использования напрямую влияет на проверку гипотезы.

На практике, особенно в онлайн-опросах, качественная репрезентативность может страдать. Ею можно пренебречь, если вы уверены, что на проверку гипотезы не повлияет принадлежность респондента к той или иной группе. Онлайн-опросы предполагают стихийную выборку и поэтому предусмотреть присутствие всех типов респондентов сложно. Про стихийную выборку подробнее я расскажу ниже.

Чтобы соблюсти количественную репрезентацию нужно обеспечить достаточное число респондентов, в том числе по каждой группе внутри выборки.

Например, если ты пригласишь на опрос 80% новых пользователей и лишь 20% пользователей с опытом — это тоже исказит результаты (опять же если это не предусмотрено дизайном исследования).

И, конечно, для того, чтобы масштабировать результаты опроса на всю генеральную совокупность (в нашем примере — на всех пользователей), нужно в целом рассчитать количество человек, которое ты планируешь пригласить для прохождения опроса.

Что значит «достаточное» количество человек для выборки.

К примеру, если проводить исследование на выборке в 50–100 человек, то погрешность в репрезентативности полученной информации будет выше, чем при опросе 800–1000 человек.

Но увеличивать до бесконечности число опрашиваемых нет смысла. После определенного количества респондентов ошибка выборки остановится на одном уровне.

График с сайта tidydata.ru

Ошибка выборки — разность между характеристиками выборочной и генеральной совокупности. Это отклонение средних характеристик выборочной совокупности от средних характеристик генеральной совокупности.

Где-то после 400 респондентов ошибка выборки не меняется. Поэтому обычно в опросах выборочная совокупность составляет 300–400 человек. При таком значении ты можешь уверенно переносить результаты исследования на всю аудиторию при соблюдении качественной репрезентации и корректно составленной анкеты.

Если генеральная совокупность небольшая, то и выборочная совокупность будет меньше стандартных 300–400 респондентов.

Если хочешь разобраться с формулой расчета выборки подробнее про нее можно узнать здесь.

Также ты можешь провести сплошной опрос. При сплошном опросе ты опрашиваешь всю генеральную совокупность.

Например, если есть интересный и немногочисленный сегмент пользователей (30–100 человек), ты можешь опросить их всех. Или это стартап и уже есть первые пользователи. В таком случае тоже можно провести опрос по всей генеральной совокупности.

На практике требованиями количественной репрезентации иногда пренебрегают в силу нехватки ресурсов на обзвон (если это телефонный опрос) или времени на сбор ответов. Или если опрос проводят для сбора гипотез, а не для принятия конечного решения.

Здесь важно понимать, какое решение должно быть принято на основе исследования.

Если это важный продуктовый или бизнес-вопрос, то лучше потратить время и деньги на проверку гипотезы с репрезентативной выборкой, чтобы не получить неверные выводы.

А если, это, к примеру, опрос для сбора отклика по новой фиче, то можно остановиться на 30–60 респондентах. Основные выводы ты сделаешь, а пользователи по мере работы в сервисе расскажут о том, что ты мог пропустить.

Методы отбора

В количественном исследовании по сравнению с качественным не важно кто перед тобой, потому что все выводы строятся по совокупности ответов респондентов и материал собирается в обезличенном виде. Поэтому в идеале в выборку респонденты должны попадать случайным образом, чтобы сделать результаты максимально свободными от искажений.

Чтобы этого достичь можно использовать один из методов формирования выборки.

Случайные выборки

Они предполагают, что в выборке каждый элемент генеральной совокупности имеет заранее заданную вероятность быть отобранным в исследование.

Простая случайная выборка. Сначала нужно присвоить каждому потенциальному респонденту идентификационный номер. Дальше с помощью генератора случайных чисел определить номера, которые будут включены в выборку для опроса.

Механическая выборка. Как и в простой выборке пользователям присваивается порядковый номер. Только отбор происходит не с помощью генератора случайных чисел, а с шагом равным n. Например, каждый сотый.

Стратифицированная выборка. Для такой выборки нужно поделить генеральную совокупность на сегменты или страты. После чего респонденты внутри каждой группы отбираются случайным образом. Из каждого сегмента выделяют пользователей пропорционально их доле в генеральной совокупности.

Кластерный отбор или гнездовая выборка. Группа потенциальных респондентов отбирается случайным образом из всей генеральной совокупности. Далее внутри этой группы опрашиваются все пользователи. Например, можно опросить всех пользователей, которые зарегистрировались в сервисе в прошлом квартале.

При таком отборе риск искажений выше и важно учитывать внешние и внутренние факторы. Может быть в прошлом квартале в жизни пользователей произошло что-то важное, что повлияло на их желание воспользоваться сервисом. Тогда эта группа будет сильно отличаться от генеральной совокупности.

Неслучайные выборки

Обычно такие методы отбора применяют, если нет возможности или ресурсов для формирования случайной выборки. Например, у тебя мало времени на опрос или нет данных о генеральной совокупности или респонденты труднодоступны.

Квотная выборка. Такой метод можно применять, если у вас есть знания о составе генеральной совокупности.

Например, вы знаете, как ваши пользователи распределяются в разрезе по должности, отрасли компании, возрасту и так далее.

Тогда можно пропорционально этим долям сформировать выборку: в каждом разрезе выбрать такое число респондентов, которое будет отображать статистику по всей аудитории.

Стихийная выборка. Это метод без особых правил. В опрос попадают все, кто захочет пройти опрос. Такая выборка типична для онлайн-опросов, размещенных в свободном доступе.

«Снежный ком». Тоже достаточно популярная и простая методика. Каждого респондента просят порекомендовать нового среди его друзей, коллег и знакомых, которые подходили бы под параметры исследования. Такая выборка часто применяется когда самостоятельно найти интересующих респондентов затруднительно. Например, пользователи, занимающие высокую должность или с высоким доходом.

«Типичный представитель». Из генеральной совокупности отбираются респонденты с типичными признаками целевой аудитории. Только определить, что взять за такой признак, обычно сложно.

Отдельно стоит сказать про многоступенчатые выборки. На практике чаще всего (иногда интуитивно) исследователи используют как раз многоступенчатый метод. Такой отбор предполагает наличие двух или более этапов формирования выборки. Проще говоря, это микс нескольких методов отбора.

Например, ты собрал статистику по своей аудитории и знаешь, что большинство пользователей находятся в Москве. Это будет первая ступень отбора по «типичному представителю». Далее среди пользователей-москвичей ты приглашаешь на опрос каждого сотого (механическая выборка).

«,»author»:»Ð•Ð²Ð³ÐµÐ½Ð¸Ñ Наумова»,»date_published»:»2020-09-14T08:49:55.897Z»,»lead_image_url»:»https://miro.medium.com/max/1200/1*Jl5qnXR9l2cerSnh0nTPwA.png»,»dek»:null,»next_page_url»:null,»url»:»https://medium.com/designkontur/%D0%BF%D1%80%D0%BE%D1%81%D1%82%D1%8B%D0%BC%D0%B8-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D0%BC%D0%B8-%D0%BE-%D0%B2%D1%8B%D0%B1%D0%BE%D1%80%D0%BA%D0%B5-e6709423dfaa»,»domain»:»medium.com»,»excerpt»:»ÐŸÑ€Ð¾ÑÑ‚о о выборке, репрезентативности и методах отбора при проведении количественного исследования»,»word_count»:1154,»direction»:»ltr»,»total_pages»:1,»rendered_pages»:1}

Источник: https://medium.com/designkontur/%D0%BF%D1%80%D0%BE%D1%81%D1%82%D1%8B%D0%BC%D0%B8-%D1%81%D0%BB%D0%BE%D0%B2%D0%B0%D0%BC%D0%B8-%D0%BE-%D0%B2%D1%8B%D0%B1%D0%BE%D1%80%D0%BA%D0%B5-e6709423dfaa

Все термины
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: