Автоматизированный априорный анализ статистической совокупности в среде MS Excel

Задача 3.

3а). Степень колеблемости признака определяется по значению коэффициента вариации Vsв соответствии с оценочной шкалой колеблемости признака.

Для признака Среднегодовая стоимость основных производственных фондов показатель Vs=17,09.

Для признака Выпуск продукции показатель Vs=21,74.

Вывод: коэффициен

ты вариации Vs=17,09% и Vs=21,74% попадают в диапазон 0%<Vs≤40% - колеблемость признаков незначительная.

3б). Однородность совокупности по изучаемому признакудля нормального и близких к нормальному распределений устанавливается по значению коэффициента вариации V. Если его значение невелико (Vs<33%), то индивидуальные значения признака xi мало отличаются друг от друга, единицы наблюдения количественно однородны.

Для признака Среднегодовая стоимость основных производственных фондов показатель Vs=17,09.

Для признака Выпуск продукции показатель Vs=21,74.

Вывод: для признаков Среднегодовая стоимость основных производственных фондов и Выпуск продукции единицы наблюдения количественно однородны, распределение признаков близко к нормальному.

3в). Сопоставление средних отклонений – квадратического sи линейного позволяет сделать вывод об устойчивости индивидуальных значений признака, т.е. об отсутствии среди них «аномальных» вариантов значений.

В условиях симметричного и нормального, а также близких к ним распределений между показателями sиимеют место равенства s1,25, 0,8s, поэтому отношение показателей и sможет служить индикатором устойчивости данных.

Если >0,8, то значения признака неустойчивы, в них имеются «аномальные» выбросы. Следовательно, несмотря на визуальное обнаружение и исключение нетипичных единиц наблюдений при выполнении Задания 1, некоторые аномалии в первичных данных продолжают сохраняться. В этом случае их следует выявить (например, путем поиска значений, выходящих за границы ()) и рассматривать в качестве возможных «кандидатов» на исключение из выборки.

Для признака Среднегодовая стоимость основных производственных фондов показатель = 0,8043

Для признака Выпуск продукции показатель =0,77.

Вывод: для признака Среднегодовая стоимость основных производственных фондов показатель=0,8043 0,8 значит значения признака неустойчивы, в них имеются «аномальные» выбросы. Выявим их : значения, выходящие за интервал (1053,00;2147,00) являются «кандидатами» на исключение из выборки.

Для признака Выпуск продукции показатель = 0,770,8, значит нет аномалий.

«Кандидаты» на исключение из выборки: предприятие №5, стоимость основных производственных фондов 1025,00 и предприятие №16, стоимость основных производственных фондов 2175,00.

3г). Для оценки количества попаданий индивидуальных значений признаков xi в тот или иной диапазон отклонения от средней , а также для установления процентного соотношения рассеяния значений xi по 3-м диапазонам формируется табл.9 (с конкретными числовыми значениями границ диапазонов).

Таблица 9

Распределение значений признака по диапазонам рассеяния признака относительно

 

Границы диапазонов

Количество значений xi, находящихся в диапазоне

Процентное соотношение рассеяния значений xi по диапазонам, %

 

Первый признак

Второй признак

Первый признак

Второй признак

Первый признак

Второй признак

[1326,5.;1873,5.]

[1173,8;1826,2]

20

19

66,7

63,3

[1053,00.;2147,00]

[847,6;2152,00]

28

28

93,3

93,3

[779,5;2420,5]

[521,4;2478,6]

30

30

100

100

На основе данных табл.9 процентное соотношение рассеяния значений признака по трем диапазонам сопоставляется с рассеянием по правилу «трех сигм», справедливому для нормальных и близких к нему распределений:

68,3% значений располагаются в диапазоне (),

95,4% значений располагаются в диапазоне (),

99,7% значений располагаются в диапазоне ().

Если полученное в табл. 9 процентное соотношение рассеяния х­i по 3-м диапазонам незначительно расходится с правилом «3-х сигм», можно предположить, что изучаемое распределение признака близко к нормальному.

Расхождение с правилом «3-х сигм» может быть существенным. Например, менее 60% значений хi попадают в центральный диапазон () или значительно более 5% значения хi выходит за диапазон (). В этих случаях распределение нельзя считать близким к нормальному.

Страница:  1  2  3  4  5  6  7  8 


Другие рефераты на тему «Экономико-математическое моделирование»:

Поиск рефератов

Последние рефераты раздела

Copyright © 2010-2024 - www.refsru.com - рефераты, курсовые и дипломные работы