Методы обработки информации и прогнозирование для студентов специальности: «Менеджмент организаций». Современные проблемы науки и образования


Задания для самостоятельного изучения дисциплины.

Задание 1. В соответствии с вариантом, осуществить имитацию набора эмпирических данных, получаемых в результате измерения одномерного признака. Для этого необходимо осуществить табулирование функции:

, ,

и получить 15 – 20 последовательных данных. Здесь, предположительно характеристика признака (отражает основную тенденцию признака), а помехи (ошибки) измерений, которые явились следствием проявления случайностей различного рода.

Варианты исходных данных:

Осуществить выявление аномальных уровней получаемого при табулировании функции ряда данных и выполнить их сглаживание:

а). методом Ирвина, по формуле

,

.

Расчетные значения сравниваются с табличными значениями критерия Ирвина:

Таблица критерия Ирвина

В таблице приведены значения критерия Ирвина для уровня значимости (с 5% ошибкой).

б). методом проверки разностей средних уровней, разбивая временной ряд данных, примерно на две равные части и вычисляя для каждой из частей среднее значение и дисперсию. Далее, проверить равенство дисперсий обеих частей с помощью критерия Фишера. Если гипотеза о равенстве дисперсий принимается, перейти к проверке гипотезы об отсутствии тренда с использованием критерия Стьюдента. Для вычисления эмпирического значения статистики, использовать формулы:

,

где среднее квадратическое отклонение разностей средних:

.

Расчетное значение статистики сравнить с табличным.

в). Методом Фостера-Стьюарта.

2. Осуществить механическое сглаживание уровней ряда:

а). методом простой скользящей средней;

б). методом взвешенной скользящей средней;

в). Методом экспоненциального сглаживания.

Задание 2. В таблице данных экономических показателей, приведен временной ряд ежемесячных объемов перевозок (привязанных к определенной местности) сельскохозяйственных грузов в условных единицах.

Применяя метод Четверикова для выделения компонент временного ряда:

а). провести выравнивание эмпирического ряда с использованием центрированной скользящей средней с периодом сглаживания ;

б). полученную предварительную оценку тренда вычесть из исходного эмпирического ряда: .

в). Вычислить для каждого года (по строке) среднее квадратическое отклонение величины , используя для этого формулу

г). найти предварительное значение средней сезонной волны: .

д). получить ряд, лишенный сезонной волны: .

е). полученный ряд сгладить с использованием простой скользящей средней с интервалом сглаживания, равным пяти, и получить новую оценку тренда .

ж). вычислить отклонения ряда от исходного эмпирического ряда :

.

з). полученные отклонения подвергнуть обработке в соответствии с пп. в). и г). для выявления новых значений сезонной волны.

и). произвести вычисление коэффициента напряженности сезонной волны по формулам и далее (сам коэффициент):

.

Коэффициент напряженности не вычисляется для первого и последнего года.

к). Используя коэффициент напряженности, вычислить окончательные значения сезонной компоненты временного ряда: .

Задание 3. Временной ряд задан в таблице:

Осуществить предварительный выбор наилучшей кривой роста:

а). методом конечных разностей (Тинтнера);

б). методом характеристик прироста.

2. Для исходного ряда построить линейную модель , определив ее параметры методом наименьших квадратов.

3. Для исходного временного ряда построить адаптивную модель Брауна с параметром сглаживания и ; выбрать наилучшую модель Брауна , где период упреждения (количество шагов вперед).

4. Оценить адекватность моделей на основе исследований:

а). близости математического ожидания остаточной компоненты нулю; критическое значение статистики Стьюдента принять (для доверительной вероятности 0,70);

б). случайности отклонений остаточной компоненты по критерию пиков (поворотных точек); расчеты выполнить на основе соотношения ;

в). независимости (отсутствия автокорреляции) уровней рядя остатков либо по критерию Дарбина-Уотсона (в качестве критических используйте уровни и ), либо по первому коэффициенту автокорреляции (критический уровень принять равным );

г). нормальности закона распределения остаточной компоненты на основе RS-критерия (в качестве критических уровней принять интервал (2,7 – 3,7)).

5. Оценить точность моделей используя показатели среднего квадратического отклонения и средней относительной ошибки аппроксимации.

6. На основе сравнительного анализа адекватности и точности моделей выбрать лучшую модель, по которой построить точечный и интервальный прогнозы на два шага вперед (). Результаты прогнозирования отразить графически.

Задание 4. Проведена оценка процессоров 10-ти рабочих станций локальной сети, построенной на базе машин приблизительно одного типа, но разных производителей (что предполагает некоторые отклонения параметров работы машин от базовой модели). Для тестирования работы процессоров использована смесь типа ICOMP 2.0 в основу которой положены два основных теста:

1. 125.turb3D – тест моделирования турбулентности в кубическом объеме (прикладное ПО);

2. NortonSI32 – инженерная программа типа AutoCaD

и вспомогательный тест для нормирования времени обработки данных SPECint_base95. Оценка процессоров производилась по взвешенному времени выполнения смеси, нормированному по эффективности базового процессора, в соответствии с формулой

где время выполнения го теста;

вес го теста;

эффективность базового процессора на м тесте.

Если выражение (1) логарифмировать, то получим:

и после переобозначения переменных:

базовое время обработки теста SPECint_base95 ;

логарифм времени обработки первого теста,

логарифм времени обработки второго теста, регрессионный коэффициент, получаемый в оценках (вес теста);

регрессионный коэффициент – вес теста обработки арифметических операций в целых числах (базовый тест).

1. По данным измерений, приведенным в таблице, построить регрессионную (эмпирическую) функцию, оценить коэффициенты регрессии и проверить модель на адекватность (вычислить ковариационную матрицу, коэффициенты парной корреляции, коэффициент детерминации).

Варианты данных:

Вариант 1.

Вариант 2.

Вариант 3.

Вариант 4.

Пусть - наблюдаемая выборка, - построенный по ней вариационный ряд. Проверяемая гипотеза заключается в том, что все принадлежат одной генеральной совокупности (выбросов нет). Альтернативная гипотеза - в наблюдаемой выборке есть выбросы.

Согласно критерию Шовене элемент выборки объема является выбросом, если вероятность его отклонения от среднего значения не больше .

Составляется следующая статистика Шовене :

где среднее значение,

Выборочная дисперсия

Определим, какое распределение имеет статистика при выполнении гипотезы. Для этого сделаем предположении, что уже при малых случайные величины и являются независимыми, тогда плотность распределения случайной величины имеет вид :


Значения этой функции распределения можно вычислить с помощью математического пакета Maple 14, подставляя вместо неизвестных параметров полученные значения.

Если статистика то значение () должно быть признано выбросом. Критические значения приведены в таблице (см. приложение А). Вместо в формулу (1.1) подставляем для проверки на наличие выбросов крайние значения.

Критерий Ирвина

Этот критерий используется в случае, когда дисперсия распределения известна заранее.

Из нормальной генеральной совокупности извлекается выборка объема, и составляется вариационный ряд (упорядочивается по возрастанию). Рассматриваются те же гипотезы и, что и в предыдущем критерии.

При наибольшее (наименьшее) значение признается выбросом с вероятностью. Критические значения занесены в таблицу.

Критерий Граббса

Пусть извлечена выборка, и по ней построен вариационный ряд. Проверяемая гипотеза заключается в том, что все () принадлежат одной генеральной совокупности. При проверке на выброс наибольшего выборочного значения альтернативная гипотеза заключается в том, что принадлежат одному закону, а - некоторому другому, существенно сдвинутому вправо. При проверке на выброс наибольшего значения выборки статистика критерия Граббса имеет вид

где вычисляется по формуле (1.2), а - по (1.3)

При проверке на выброс наименьшего выборочного значения альтернативная гипотеза предполагает, что принадлежит некоторому другому закону, существенно сдвинутому влево. В данном случае вычисляемая статистика принимает вид

где вычисляется по формуле (1.2), а - по (1.3).

Статистики или применяются, когда дисперсия известна заранее; статистики и -- когда дисперсия оценивается по выборке с помощью соотношения (1.3).

Максимальный или минимальный элемент выборки считается выбросом, если значение соответствующей статистики превысит критическое: или, где - задаваемый уровень значимости. Критические значения и приведены в сводных таблицах (см. приложение А). Получаемые в этом критерии статистики при выполнении нулевой гипотезы имеют такое же распределение, как и статистика в критерии Шовене.

При > 25 можно пользоваться приближениями для критических значений

где - -квантиль стандартного нормального распределения.

А аппроксимируется следующим образом

Если в извлеченной выборке известны дисперсия () и математическое ожидание (µ - среднее значение), то используется статистика

Критические значения этой статистики также занесены в таблицы. Если, то выброс признается значимым, и принимается альтернативная гипотеза.

Кроме того, аномальные уровни во временных рядах могут возникать из-за воздействия факторов, имеющих объективный характер, но проявляющихся эпизодически или очень редко – ошибки второго рода , они устранению не подлежат.

Для выявления аномальных уровней временных рядов используются методы, рассчитанные для статистических совокупностей.

Метод Ирвина.

Метод Ирвина предполагает использование следующей формулы:

где среднее квадратическое отклонение рассчитывается в свою очередь с использованием формул:

. (2)

Расчетные значения сравниваются с табличными значениями критерия Ирвина , и если оказываются больше табличных, то соответствующее значение уровня ряда считается аномальным. Значение критерия Ирвина для уровня значимости , т.е. с 5%-ной ошибкой, приведены в таблице 4.

Таблица 4.

2,8 2,3 1,5 1,3 1,2 1,1 1,0

После выявления аномальных уровней ряда обязательно определение причин их возникновения!

Если точно установлено, что аномалия вызвана ошибками первого рода, то соответствующие уровни ряда «поправляются» либо заменой простой средней арифметической соседних уровней ряда, либо значениями, полученными по кривой, аппроксимирующей данный временной ряд в целом.

Метод проверки разностей средних уровней.

Реализация этого метода состоит из четырех этапов.

1. Исходный временной ряд разбивается на две примерно равные по числу уровней части: в первой части первых уровней исходного ряда, во второй – остальных уровней .

2. для каждой из этих частей вычисляются среднее значение и дисперсии:

3. проверка равенства (однородности) дисперсий обеих частей ряда с помощью F-критерия Фишера, которая основана на сравнении расчетного значения этого критерия:

с табличным (критическим) значением критерия Фишера с заданным уровнем значимости (уровнем ошибки) . В качестве чаще всего берут значения 0,1 (10%-ная ошибка), 0,05 (5%-ная ошибка), 0,01 (1%-ная ошибка). Величина называется доверительной вероятностью. Если расчетное (эмпирическое) значение F меньше табличного , то гипотеза о равенстве дисперсий принимается и переходят к четвертому этапу. В противном случае, гипотеза о равенстве дисперсий отвергается и делается вывод, что данный метод для определения наличия тренда ответа не дает.

4. проверяется гипотеза об отсутствии тренда с использованием критерия Стьюдента. Для этого определяется расчетное значение критерия Стьюдента по формуле:

(3)

где среднее квадратическое отклонение разности средних:

.

Если расчетное значение меньше табличного значения статистики Стьюдента с заданным уровнем значимости , гипотеза принимается, то есть тренда нет, в противном случае тренд есть. Заметим, что в данном случае табличное значение берется для числа степеней свободы, равного , при этом данный метод применим только для рядов с монотонной тенденцией.

Метод Фостера-Стьюарта.

Этот метод обладает большими возможностями и дает более надежные результаты по сравнению с предыдущими. Кроме тренда самого ряда (тренда в среднем), он позволяет установить наличие тренда дисперсии временного ряда: если тренда дисперсии нет, то разброс уровней ряда постоянен; если дисперсия увеличивается, то ряд «раскачивается» и т.д.

Реализация метода также состоит из четырех этапов.

1. производится сравнение каждого уровня со всеми предыдущими, при этом определяются две числовые последовательности:

2. вычисляются величины:

Нетрудно видеть, что величина , характеризующая изменение временного ряда, принимает значения от 0 (все уровни ряда равны между собой) до (ряд монотонный). Величина характеризует изменение дисперсии уровней временного ряда и изменяется от (ряд монотонно убывает) до (ряд монотонно возрастает).

1. отклонение величины от величины математического ожидания величины для ряда, в котором уровни расположены случайным образом;

2. отклонение величины от нуля.

Эта проверка проводится с использованием расчетных (эмпирических) значений критерия Стьюдента для средней и для дисперсии:

где математическое ожидание величины , определенной для ряда, в котором уровни расположены случайным образом;

3

1 Технический институт (филиал) ФГАОУ ВПО "Северо-Восточный федеральный университет имени М.К. Аммосова"

2 Институт тектоники и геофизики им. Ю.А. Косыгина ДВО РАН

3 Академия наук Республики Саха (Якутия)

Приведены результаты численного моделирования выявления аномальных (пиковых) уровней положительно определенного временного ряда методом Ирвина. Для моделирования использован ряд числовых данных в виде отдельных пиковых значений, осложненных случайной помехой и синусоидальным сигналом. В рамках аддитивной модели исходного ряда задача разделения нормального и аномального уровней методом Ирвина успешно решается в случаях отдельных импульсов. Однако, даже в этом случае, следующий за пиковым значением член ряда с фоновым уровнем интерпретируется как аномальный. В задачах автоматизированной обработки данных ряды пиков осложняются пропорциональным количеством значений фоновых компонент. Для тех случаев, когда количество пиков превышает 50% от общего количества значений ряда и тем более для подряд стоящих пиков сформированный ряд фоновых данных осложняется пиковой компонентой за счет увеличения дисперсии. В результате численного моделирования была разработана методика в виде модифицированного метода Ирвина для адекватного выделения аномальных уровней ряда. Данная задача актуальна для систем электромагнитного мониторинга грозовых разрядов и поиска различных источников электромагнитного излучения тектонической природы.

электромагнитное излучение

разделение уровней ряда

модификация метода Ирвина

метод Ирвина

аномальные уровни ряда

временные ряды

1. Калинина В. Н., Панкин В. Ф. Математическая статистика. – М.: Высшая школа, 2001. – 336 с.

2. Трофименко С.В. Методы и примеры статистических оценок временных рядов //Международный журнал экспериментального образования", №9, 2013.-С.41-42.

3. Трофименко С.В. Проявление землетрясений на фоне стационарного сейсмического процесса Олекмо-Становой зоны (ОСЗ) Горный информационно-аналитический бюллетень (научно-технический журнал). 2007. Т. 17. №1. С. 208-213.

4. Трофименко С.В. Геофизические поля и сейсмичность Южной Якутии //Горный информационно-аналитический бюллетень (научно-технический журнал). 2007. Т. 17. №1. С. 188-196.

5. Трофименко С.В Детальные геолого-геофизические исследования зон активных разломов и сейсмическая опасность Южно-Якутского региона /А.Н. Овсюченко, Трофименко С.В., Мараханов А.В., П.С., Карасев, Е.А. Рогожин, В.С. Имаев, В. М. Никитин, Н.Н.Гриб // Тихоокеанская геология, 2009. – том 28. – №4. – С. 55-74.

6. Трофименко С.В. Очаговые зоны сильных землетрясений Южной Якутии /Овсюченко А.Н., Трофименко С.В., Мараханов А.В., П.С., Карасев, Е.А. Рогожин, В.С. //Физика Земли. 2009. №2. С. 15-33.

7. Трофименко С.В. Сейсмотектоника переходной области от Байкальской рифтовой зоны к орогенному поднятию Станового хребта /А.Н.Овсюченко, Трофименко С.В., Мараханов А.В., П.С., Карасев, Е.А. Рогожин, В.С. //Геотектоника, 2010, № 1, с. 29-51.

8. Трофименко С.В. Тектоническая интерпретация статистической модели распределений азимутов аномалий гравимагнитных полей Алданского щита. – Тихоокеанская геология. – 2010. – Том 29. – №3. – С. 64-77.

9. Трофименко С.В. Активные нектонические нарушения участка Алдан-Нагорный нефтепроводной системы Восточная Сибирь – Тихий океан /Карасев П.С., Овсюченко А.Н., Мараханов А.В., Трофименко С.В. // Нефтяное хозяйство. – 2008. – № 9. –С. 80-84.

Геофизический мониторинг атмосферных источников электромагнитного излучения, разработанный для регистрации и контроля движения грозовых разрядов, может быть использован для дистанционного отслеживания геодинамических процессов в земной коре , связанных с формирующимися очагами землетрясений и активными разломами земной коры . Важным вопросом при интерпретации аномалий электромагнитного излучения (ЭМИ) является разделение аномалий по типу источника излучения, что детально исследовано в работе .

Суммарный сигнал ЭМИ, можно представить в виде:

где и импульсная аномальная (пики) и фоновые составляющие сигнала, - случайный компонент. Причем, априори, функция источника сигнала не известна, т.е. для неё не известен тип модели, определяемой по (1).

В линейной теории электромагнитных волн принята аддитивная модель исходного ряда наблюдений ЭМИ на основе принципа суперпозиции. Если временной ряд представляется в виде суммы соответствующих компонент, то полученная модель носит название аддитивной и имеет вид (без учета тренда и сезонной компоненты):

, (2)

где - уровни временного ряда.

В данной работе представлены результаты имитационного моделирования разделения полей ЭМИ на основе статистического анализа временного ряда наблюдений, отражающих реальное состояние геофизической среды.

На рис. 1,2 показаны результаты наблюдений сигналов ЭМИ в периоды слабо возмущенного (рис. 1) и возмущенного (рис. 2) состояния геофизической среды. Качественно выделить фоновую составляющую в возмущенный день весьма проблематично.

Для отработки технологии разделения полей ЭМИ на фоновую и импульсную составляющие в модели (2) был создан имитационный файл в среде электронных таблиц Excel. Совокупный ряд исходных данных (2) был составлен из суммы рядов пиковых значений , количество импульсов которых можно задавать произвольно и фоновой компоненты ряда в виде суммы периодической синусоидальной и случайной компонент ряда (рис.3). Суммарный ряд подвергался алгоритму выделения импульсов по методу Ирвина (метод пиков), который используется в практике статистического анализа временных рядов с целью выделения аномальных уровней ряда.

Рис. 1. Исходный ряд значений амплитуд сигналов ЭМИ в слабо возмущенный день 04.01.2013.

Рис. 2. Исходный ряд значений амплитуд сигналов ЭМИ в сильно возмущенный день 13.01.2013.

Рис. 3. Компоненты модельного ряда для имитации сигналов ЭМИ

Пусть имеется временной ряд . Метод Ирвина предполагает использование соотношения

где - стандартное отклонение, - среднее значение амплитуд, для оценки аномального приращения амплитуды последующего члена ряда в предположении, что предыдущий член ряда относится к фоновой составляющей сигнала . Расчетные значения сравниваются с табличными значениями критерия Ирвина ; если какое-либо из них оказывается больше табличного , то соответствующее значение уровня ряда считается аномальным. Значения критерия Ирвина для уровня значимости приведены в таблице 1.

Таблица 1

Значения критических значений для уровня значимости

Для практических расчетов при известной длине реализации можно использовать аналитическое выражение для определения критических значений , для которой погрешность аппроксимации меньше 1%:

, (4)

Численные эксперименты показали следующее: во-первых, для одиночного пика (аномального уровня) относительно фонового уровня следующий член ряда также интерпретируется как аномальный, хотя амплитуда его импульса сравнима с фоновым значением. Во-вторых, эта же погрешность будет присутствовать при наличии в исходном ряде нескольких аномальных уровней , , …. В данном случае, за аномальный уровень рада будет принят первый аномальный и следующий за серией аномалий фоновый уровень . Все промежуточные аномалии , …, будут отнесены к фоновой составляющей ряда. Это приведет к искажению (завышению) огибающей фоновой компоненты (рис. 4).

При интерактивном способе разделения уровней ряда фиктивные аномальные уровни отбраковываются оператором. В задачах автоматизированной обработки данных ряды пиков осложняются пропорциональным количеством значений фоновых компонент.

Для тех случаев, когда количество пиков превышает 50% от общего количества значений ряда и тем более для подряд стоящих пиков сформированный ряд фоновых данных осложняется пиковой компонентой (рис.5). Видимо эти погрешности до сих пор не позволили методу Ирвина найти достаточно широкое применение в практике статистических исследований временных рядов.

Рис. 4. Иллюстрация осложнения фоновой компоненты ряда аномальными уровнями при использовании метода Ирвина

Рис. 5. Осложнение фоновой составляющей имитационного ряда при 50% соотношении пиковых и фоновых компонент

В результате численного моделирования различных соотношений «сигнал - помеха» была разработана методика в виде модифицированного метода Ирвина для адекватного разделения аномальных (пиковых) и фоновых уровней ряда. Данная задача, как было указано выше, актуальна для систем электромагнитного мониторинга грозовых разрядов и поиска различных источников электромагнитного излучения тектонической природы.

Для исключения указанных погрешностей метода Ирвина было разработано три варианта расчетов для разделения уровней рада, применение которых обосновано сложностью соотношений «сигнал-помеха» в реальных экспериментальных данных, например, как это показано на рис. 1, 2.

В простейшем случае, для выделения одиночных пиков положительно определенного ряда к условию Ирвина (3) добавляется условие не отрицательности разности , т.е. . Все аномальные уровни в фоновой компоненте ряда заменяются значениями по формуле параболического интерполирования:

, (5)

где члены ряда фоновой компоненты, предшествующие аномальному уровню . Так как первый член ряда может быть с аномальной амплитудой, то в начале ряда проставляются три дополнительных члена ряда с минимальной амплитудой. Результаты численного моделирования по данному алгоритму показаны на рис. 6.

Рис. 6. Выделение фоновой составляющей имитационного ряда при наличии одиночных пиковых компонент с дополнительным условием не отрицательности разности сравниваемых амплитуд последовательных членов ряда

Сравнение с результатами расчетов с применением простого алгоритма Ирвина (рис. 4) наглядно показывает необходимость введения в алгоритм дополнительного условия не отрицательности разности .

При увеличении количества аномальных уровней до 50% замена пиковых значений по формуле (5) приводит к осложнению фоновой компоненты усредненными значениями амплитуд аномальных уровней (рис. 5). В данном случае применяется алгоритм последовательного исключения аномальных уровней.

Амплитуды сигнала аномальных уровней в фоновой компоненте заменяются по формуле (5) с возвратом на начало цикла расчетов. При этом значение стандартного отклонения рассчитывается для первоначального ряда и при повторных расчетах принимается за константу.

Данный алгоритм позволяет адекватно разделять фоновую и импульсную компоненты, однако требует большего времени для расчетов, так как в массиве данных за сутки накапливается до 80000 импульсов и более, что приведет к задержке отображения результатов в реальном времени в системах автоматизированного мониторинга.

Для случаев возмущенного состояния геофизической среды (см. рис. 2) разработан алгоритм с построением вариационного ряда с возрастающими амплитудами сигнала. Для = (20-40)% от общего количества членов вариационного ряда рассчитывается стандартное отклонение и применяется метод Ирвина до появления первого аномального уровня . Максимальное значение из первых (k-1) уровней вариационного ряда принимается за граничное значение фоновой компоненты, по которому производится разделение компонент исходного ряда.

Численное моделирование с использованием данных натурного эксперимента показало, что, если в исходном ряде присутствует только две компоненты, то фоновая компонента выделяется из исходного ряда без искажений. При наличии нескольких источников ЭМИ метод чувствителен к выбору количества членов вариационного ряда для расчета . Это может привести к пропуску аномальных источников сигнала либо к выделению мнимых источников (ошибки первого и второго родов). Для исключения данных погрешностей в системе автоматического мониторинга предполагается производить расчеты с использованием различных процентных выборок из вариационного ряда для расчета и применения метода Ирвина. Адекватность модели во всех случаях проверяется по статистическим характеристикам остаточного ряда . Проведенные расчеты для двух дней с различным состоянием возмущенности геофизической среды (рис.1, 2) показали сходимость моделей фоновых компонент, выделенных по методам исключения пиков и построения вариационного ряда при = (35 - 45)%.

Рецензенты:

Омельяненко А.В., д.т.н., профессор, главный научный сотрудник лаборатории инженерной геокриологии Института мерзлотоведения им. П.И.Мельникова СО РАН, г. Якутск;

Имаев В.С., д.г.-м.н., профессор, гл. научный сотрудник Института земной коры СО РАН, г.Иркутск.

Библиографическая ссылка

Трофименко С.В., Трофименко С.В., Маршалов А.Я., Гриб Н.Н., Колодезников И.И. МОДИФИКАЦИЯ МЕТОДА ИРВИНА ДЛЯ ВЫЯВЛЕНИЯ АНОМАЛЬНЫХ УРОВНЕЙ ВРЕМЕННЫХ РЯДОВ: МЕТОДИКА И ЧИСЛЕННЫЕ ЭКСПЕРИМЕНТЫ // Современные проблемы науки и образования. – 2014. – № 5.;
URL: http://science-education.ru/ru/article/view?id=15130 (дата обращения: 18.03.2019). Предлагаем вашему вниманию журналы, издающиеся в издательстве «Академия Естествознания»

Метод Ирвина используется для выявления аномальных значений уровней временного ряда. Под аномальным уровнем понимается отдельное значение уровней временного ряда, которое не отвечает потенциальным возможностям исследуемой экономической системы и которое, оставаясь в качестве уровня ряда, оказывает существенное влияние на значение основных характеристик временного ряда.

Причинами аномальных явлений могут быть ошибки технического порядка, или ошибки первого рода, они подлежат выявлению и устранению.

Кроме того, аномальные уровни во временных рядах могут возникать из-за воздействия факторов, имеющих объективный характер, но проявляющихся эпизодически. Их относят к ошибкам второго рода, которые не подлежат устранению.

Для выявления аномальных наблюдений может быть использован метод Ирвина. В этом случае вычисляется коэффициент λ t , равный:

,
,
.

Расчетные значения λ 2 , λ 3 ,... сравниваются с табличными значениями критерия Ирвина λ α . Если оказывается, что расчетное значение λ t больше табличного λ α , то соответствующее значение y t уровня ряда считается аномальным.

После выявления аномальных значений уровней ряда обязательно определение причин их возникновения. Если точно установлено, что они вызваны ошибками первого рода, то они устраняются обычно заменой средней арифметической двух соседних уровней ряда, либо заменой значением соответствующей трендовой кривой.

При проверке наличия аномальных колебаний с использованием метода Ирвина, получили следующие расчетные значения коэффициента λ t:

Таблица №13

Сравнивая найденные значения коэффициента λ t с табличным значением λ α , равным 1,3 для уровня значимости α = 0,05 и при n = 20 (число уровней временного ряда), получаем, что отдельные значения уровней ряда превосходят значение λ α , следовательно делаем вывод о том, что в данной модели присутствуют аномальные колебания, вызванные ошибками второго рода, которые устранению не подлежат.

Глава 8. Определение оптимального вида линии тренда. Прогноз показателей

Под трендом понимается изменение, определяющее общее направление развития, основную тенденцию временного ряда.

Для выбора линии тренда, наилучшим образом отражающей общее направление процесса развития ставки рефинансирования Центрального Банка, уровня безработицы и инфляции, необходимо построить несколько линий тренда и выбрать ту из них, которая лучше отражает динамику развития того или иного процесса.

Для построения линий тренда необходимо использовать возможности ТР Excel, применив команду "Диаграмма" - "Добавить линию тренда". В диалоговом окне "Линия тренда" на вкладке "Тип" необходимо выбрать требуемый тип линии тренда и указать степень полинома. На вкладке "Параметры" необходимо установить переключатель "Показывать уравнение на диаграмме", "Поместить на диаграмму величину достоверности аппроксимации".

После построения линий тренда, следует выбрать ту, которая наилучшим образом отражает динамику изменения того или иного процесса во времени.

Затем следует сделать прогноз значений на 3 периода вперед, используя выбранный тренд. Тренд, по которому необходимо сделать прогноз выбирается исходя из величины достоверности аппроксимации.

Для того чтобы сделать прогноз также необходимо воспользоваться возможностями ТР Excel. В данном случае необходимо в диалоговом окне "Линия тренда" на вкладке "Параметры" указать, на сколько периодов вперед необходимо сделать прогноз.

Данный прогноз позволяет определить, как через определенный промежуток времени изменится изучаемый показатель при неизменности остальных показателей.

После построения линии тренда для показателя ставки рефинансирования Центрального Банка, в качестве оптимальной линии тренда была выбрана линия тренда 2, которой соответствует уравнение:

Y = -0.0089х 3 +0ю3152х 2 -3.5642х+37.014; R 2 = 0.8048

Для показателя уровня безработицы в качестве оптимальной линии тренда была выбрана линия тренда 1, которой соответствует уравнение:

Y = -6E-06x 4 +0.0003x 3 -0.0038x 2 +0.0187x+0.0291; R 2 = 0.8771

Для показателя уровня инфляции в качестве оптимальной линии тренда была выбрана линия тренда 2, которой соответствует уравнение:

Y = -0.0064x 3 +0.2186x 2 -2.3701x+14.603; R 2 = 0.7703

Прогнозы, сделанные по выбранным линиям тренда дают наиболее точную характеристику повеления показателей в будущем.

z 1 прогнозное

z 2 прогнозное

y прогнозное

t прогнозное

Подставляя полученные прогнозные значения в ранее рассчитанное уравнение регрессии,

получаем у = 13,12990776.