Коэффициент квартильный

Анализ концентрации, дифференциации и подобности распределений

Коэффициент квартильный

Развернуть структуру обучения

структуру обучения

Цель работы – освоить приемы анализу концентрации, дифференциации и подобности статистических распределений с помощью MS Excel.

Задание – провести анализ концентрации. Дифференциации и подобности статистических распределений, получить результативные показатели и объяснить полученные результаты.

Внизу приведены основные формулы показателей концентрации, дифференциации и подобности статистических распределений.

Коэффициент децильной дифференциации
Коэффициент локализации
Коэффициент концентрации
Линейный коэффициент структурних сдвигов
Коэффициент подобности структур

Для решения задания 1 и 2 важно распознать суть абсолютных и относительных показателей, показателей локализации, концентрации и структурных сдвигов.

Задание 1

Размер заработной платы.Количество работающих, fi
500-7004
700-9005
900-110017
1100-130020
1300-150025
1500-170014
1700-19009
1900 и больше7

Необходимо рассчитать показатели дифференциации размера заработной платы работающих.

Для расчета коэффициента дифференциации в MS Excel вводим данные в таком виде:

Для того чтобы рассчитать квартильный коэффициент вариации необходимо найти   человек и медиану:

50 человек отвечают накопленной частоте интервала 1300-1500 грн. То есть этот интервал является медианным. Для того чтобы найти медиану используем формулу =B6+B11*(D10/2-E5)/D6

Если данные представлены как не сгруппированный ряд распределения, то медиану можно рассчитать, используя стандартную функцию в Excel – МЕДИАНА.

Рассчитаем первый квартиль:

Используем формулу =B4+B11*(D10/4-E3)/D4

Рассчитаем третий квартиль. Используем следующую формулу =B7+B12*(D10*3/4-E6)/D7

Если данные представлены, как как не сгруппированный ряд распределения, то квартиль можно вычислить, используя стандартную функцию в Excel – КВАРТИЛЬ.

Для того чтобы рассчитать квартильный коэффициент вариации используем формулу =(B15-B14)/(2*B13)

Рассчитаем коэффициент децильной дифференциации. Для этого нам нужно рассчитать первый и девятый дециль.

Рассчитаем первый дециль с помощью формулы =B3+B14*(D10/10-E2)/D3

Теперь рассчитаем девятый дециль по формуле =B8+B15*(D10*9/10-E7)/D8

Теперь у нас есть все нужные данные, чтобы рассчитать коэффициент децильной дифференциации. Используем формулу =B18/B17

Соответственно минимальная заработная плата 10 % работников с максимально заработной платой в 1,47 раз больше максимальной заработной платы 10 % работников с минимальной заработной платой.

Задание 2

В таблице представлены данные про распределения предприятий и объема прибыли по отраслям экономики. С помощью коэффициентов локализации и концентрации нужно определить в какой отрасли вы бы разместили свое предприятие.

Отрасль20112012
Кол-во объектов ЕГРПОУОбъем прибылиОбъем прибыли
Всего10707053485,84204,9
Сельское хозяйство, охота и лесное хозяйство85824252,2277,10291
Рыбное хозяйство156545,46637
Промышленность1162601086,51426,30208
Строительство69866124,392,5078
Оптовая и розничная торговля, торговля транспортными средствами, услуги по ремонту278097330,6317,89044
Отели и рестораны2026430,454,6637
Транспорт и связь32497289,6374,2361
Финансовая деятельность15733118180,8107
Операция с недвижимостью, сдача в аренду и услуги юридическим лицам115249151,6260,7038
Государственное управление37145213,5238,83832
Образование38672409,6527,29446
Охрана здоровья и социальная помощь26007372,6402,82942
Коллективные, общественные и личные услуги131889102,946,2539
Другое10163700

Рассчитаем коэффициенты локализации, концентрации и объема прибыли на предприятиях разных отраслей и оценим интенсивность структурных сдвигов объема прибыли по отраслям экономики.

Для расчета показателей концентрации и подобности распределений в Excel на листе 2 вводим выходные данные.

Для дальнейших расчётов на листе 3 построим таблицу, в которой отображено доли предприятий и доли прибыли по предприятиям. Для этого в ячейке B3 вводим формулу =Лист2!B4/Лист2!$B$3*100. Потом растягиваем эту формулу на весь столбец. В ячейке С3 вводим формулу =Лист2!C4/Лист2!$C$3*100, в ячейки D3 вводим формулу =Лист2!D4/Лист2!$D$3*100, аналогично растягиваем эти формулы на весь столбец.

В итоге получаем такую таблицу.

Для расчета коэффициентов локализации в ячейке Е3 вводим формулу =C3/B3, потом растягиваем введенную формулу на весь столбец.

Рассчитываем коэффициент концентрации: в ячейку F3 вводим формулу =ABS(C3-B3) и растягиваем на весь столбец. В ячейке F18 рассчитываем сумму по столбцу.

Оценку структурных сдвигов и их интенсивность можно прочитать с помощью линейного коэффициента структурных сдвигов: в ячейке G3 вводим формулу =ABS(D3-C3). В ячейке G19 вводим формулу =СРЗНАЧ(G3:G16).

Получаем следующую таблицу:

Линейный коэффициент структурных сдвигов показал, что структура предприятия по объему прибыли в 2012 году по сравнению с 2011 годом изменилась незначительно, приблизительно на 1,48 процентов.

0  

 Коэффициент концентрации | Описание курса | Анализ динамики статистических показателей 

Источник: https://profmeter.com.ua/communication/learning/course/course20/lesson749/?LESSON_PATH=469.686.749

Квартили и интерквартильный интервал (IQR) в EXCEL

Коэффициент квартильный

Для вычисления квартилей в MS EXCEL существует специальная функция КВАРТИЛЬ() . В этой статье дадим определение квартилей и научимся их вычислять для выборки и для непрерывного распределения. Также вычислим интерквартильный интервал.

Квартили (Quartiles) — значения, которые делят выборку (набор значений) на четыре части, содержащие приблизительно равное количество наблюдений (по 25%).

Поясним определение квартиля на примере. Пусть имеется выборка , состоящая из 50 значений в ячейках А7:А56 (см. файл примера , лист Квартиль-выборка). Для наглядности отсортируем значения по возрастанию и построим гистограмму .

Чтобы разделить выборку на 4 части достаточно 3-х квартилей .

Первый квартиль (или нижний квартиль , Q1) делит выборку , на 2 части: примерно 25% значений в выборке меньше Q1, остальные 75% — больше. Для вычисления 1-го квартиля используйте формулу =КВАРТИЛЬ.ВКЛ(A7:A56;1) . Для нашей выборки формула вернет значение 224. Значения 224 нет в выборке , формула произвела интерполяцию на основе 2-х соседних значений 223 и 227.

Примечание : Функция КВАРТИЛЬ.ВКЛ() появилась в MS EXCEL 2010. В более ранних версиях использовалась аналогичная ей функция КВАРТИЛЬ() .

Чтобы убедиться, что примерно 25% значений меньше, чем 224, используем формулу =СЧЁТЕСЛИ(A7:A56;»

Чем в выборке больше значений и меньше повторов , тем точнее деление выборки квартилями на четверти.

Примечание : Первый квартиль — это то же самое, что и 25-я процентиль . Подробнее см. статью про процентили .

Второй квартиль (или медиана , Q2) также делит выборку , на 2 равные части: половина чисел множества больше, чем медиана , а половина чисел меньше, чем медиана . Для вычисления 2-го квартиля используйте формулу =КВАРТИЛЬ.ВКЛ(A7:A56;2) или =МЕДИАНА(A7:A56)

Третий квартиль (или верхний квартиль , Q3) делит выборку , на 2 части: примерно 75% значений в выборке меньше Q3, остальные 25% — больше. Для вычисления 3-го квартиля используйте формулу =КВАРТИЛЬ.ВКЛ(A7:A56;3) или =ПРОЦЕНТИЛЬ.ВКЛ(A7:A56;0,75)

Примечание : Третий квартиль — это то же самое, что и 75-я процентиль .

Второй аргумент функции КВАРТИЛЬ.ВКЛ() может также принимать значения 0 и 4. В первом случае функция вернет минимальное значение , во втором – максимальное .

Интерквартильный размах

Интерквартильным размахом или интерквартильным интервалом (InterQuartile range, IQR) называется разность между третьим и первым квартилями (Q3 — Q1). Интерквартильный размах является характеристикой разброса значений в выборке .

Примечание : Характеристикой разброса значений в выборке является также дисперсия и стандартное отклонение .

Интерквартильный размах , а также квартили используются при построении Блочной диаграммы , которая полезна для оценки разброса значений (variation) в небольших выборках или для сравнения нескольких выборок имеющих сходные распределения.

Подробнее о построении Блочной диаграммы см. статью Блочная диаграмма в MS EXCEL .

Квартили непрерывного распределения

Если функция распределения F (х) случайной величины х непрерывна, то 1-й квартиль является решением уравнения F(х) =0,25, второй — F(х) =0,5, а третий F(х) =0,75.

Примечание : Подробнее о Функции распределения см. статью Функция распределения и плотность вероятности в MS EXCEL .

Если известна функция плотности вероятности p (х) , то 1-й квартиль можно найти из уравнения:

Например, решив аналитическим способом это уравнение для Логнормального распределения lnN(μ; σ 2 ), получим, что медиана (2-й квартиль ) вычисляется по формуле e μ или в MS EXCEL =EXP(μ). При μ=1, медиана равна 2,718.

Обратите внимание на точку Функции распределения , для которой F(х)=0,5 (см. картинку выше или файл примера , лист Квартиль-распределение) . Абсцисса этой точки равна 2,718. Это и есть значение 2-го квартиля ( медианы ), что естественно совпадает с ранее вычисленным значением по формуле e μ .

Примечание : Напомним, что интеграл от функции плотности вероятности по всей области задания случайной величины равен единице:

Поэтому, линии квартилей ( х=квартиль ) делят площадь под графиком функции плотности вероятности на 4 равные части.

Квартили в MS EXCEL

Чтобы вычислить в MS EXCEL квартили заданного распределения необходимо использовать соответствующую обратную функцию распределения .

При вычислении квартилей в MS EXCEL используются обратные функции распределения : НОРМ.СТ.ОБР() , ЛОГНОРМ.ОБР() , ХИ2.ОБР() , ГАММА.ОБР() и т.д. Подробнее о распределениях, представленных в MS EXCEL, можно прочитать в статье Распределения случайной величины в MS EXCEL .

Например, в MS EXCEL 1-й квартиль для логнормального распределения LnN(1;1) можно вычислить по формуле =ЛОГНОРМ.ОБР(0,25;1;1) , а 3-й квартиль для стандартного нормального распределения по формуле =НОРМ.СТ.ОБР(0,75) .

Источник: https://excel2.ru/articles/kvartili-i-interkvartilnyy-interval-iqr-v-ms-excel

Вариация, размах, межквартильный размах, среднее линейное отклонение

Коэффициент квартильный

В этой статье мы приступим к изучению показателей вариации: размах вариации, межквартильный размах, среднее линейное отклонение.

В математической статистике вариация занимает одно из центральных мест. Что же такое вариация? Это изменчивость. Вариация показателя – изменчивость показателя. 

Показатели вариации дают очень важную характеристику процессам и явлениям. Они отражают устойчивость процессов и однородность явлений. Чем меньше показатель вариации, тем более процесс устойчивый, а значит, и более предсказуемый.

Показатели вариации отражают не отдельно взятые значения, а дают характеристику некоторому явлению или процессу в целом. Имея в наличии показатели среднего значения и вариации, можно получить первичное представление о характере данных.

Средняя – это обобщающий уровень, а вариация характеризует, насколько среднее значение (или другой показатель) хорошо обобщает значения некоторой совокупности данных. Если показатель вариации незначительный, то значения совокупности находятся близко к среднему, следовательно, среднее значение хорошо обобщает совокупность.

Если вариация большая, то среднее значение плохо обобщает данные (значения разбросаны далеко друг от друга), и получается «средняя температура по больнице».

Размах вариации

Размах вариации – разница между максимальным и минимальным значением:

Ниже приведена графическая интерпретация размаха вариации.

Видно максимальное и минимальное значение, а также расстояние между ними, которое и соответствует размаху вариации.

С одной стороны, показатель размаха может быть вполне информативным и полезным.

К примеру, максимальная и минимальная стоимость квартиры в городе N, максимальная и минимальная зарплата по профессии в регионе и проч.

С другой стороны, размах может быть очень широким и не иметь практического смысла, т.к. зависит лишь от двух наблюдений. Таким образом, размах вариации очень неустойчивая величина.

Межквартильный размах

В статистике для анализа выборки часто прибегают к другому показателю вариации – межквартильному размаху. Квартиль – это то значение, которые делит ранжированные (отсортированные) данные на части, кратные одной четверти, или 25%.

Так, 1-й квартиль – это значение, ниже которого находится 25% совокупности. 2-й квартиль делит совокупность данных пополам (то бишь медиана), ну и 3-й квартиль отделяет 25% наибольших значений. Так вот межквартильный размах – это разница между 3-м и 1-м квартилями.

У данного показателя есть одно неоспоримое преимущество: он является робастным, т.е. не зависит от аномальных отклонений.

Наглядное отображение размаха вариации и межкварительного расстояния производят с помощью диаграммы «ящик с усами».

Среднее линейное отклонение

Есть показатели вариации, которые учитывают сразу все значения, а не только отдельные наблюдения (типа максимума или минимума). Одним из таких является среднее линейное отклонение.

Этот показатель характеризует меру разброса значений вокруг их среднего. В чем суть? Для того, чтобы показать меру разброса данных, нужно вначале определиться, относительно чего этот самый разброс будет считаться. Обычно это среднее арифметическое.

Далее нужно посчитать, насколько каждое значение отклоняется от средней. Нас интересует среднее из таких отклонений. Однако напрямую складывать положительные и отрицательные отклонения нельзя, т.к. они взаимоуничтожатся и их сумма будет равна нулю.

Поэтому все отклонения берутся по модулю. Средне линейное отклонение рассчитывается по формуле:

где

a – среднее линейное отклонение,

X – анализируемый показатель,

X̅ – среднее значение показателя,

n – количество значений в анализируемой совокупности данных.

Рассчитанное по этой формуле значение показывает среднее абсолютное отклонение от средней арифметической. Наглядная картинка в помощь.

Отклонения каждого наблюдения от среднего указаны маленькими стрелочками. Именно они берутся по модулю и суммируются. Потом все делится на количество значений.

Для полноты картины нужно привести еще и пример. Допустим, имеется фирма по производству черенков для лопат. Каждый черенок должен быть 1,5 метра длиной, но, что еще важней, все должны быть одинаковыми или, по крайней мере, плюс-минус 5 см. Однако нерадивые работники то 1,2 м отпилят, то 1,8 м. Дачники недовольны.

Решил директор провести статистический анализ длины черенков. Отобрал 10 штук и замерил их длину, нашел среднюю и рассчитал среднее линейное отклонение. Средняя получилась как раз, что надо – 1,5 м. А вот среднее линейное отклонение вышло 0,16 м. Вот и получается, что каждый черенок длиннее или короче, чем нужно, в среднем на 16 см.

Есть, о чем поговорить с работниками.

На этом сегодняшнюю заметку закончим. В следующей статье будут рассмотрены такие показатели вариации, как дисперсия, среднеквадратичное отклонение и коэффициент вариации.

в социальных сетях:

Источник: https://statanaliz.info/statistica/opisanie-dannyx/variatsiya-razmakh-srednee-linejnoe-otklonenie/

Все термины
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: