Метод фостера стюарта в excel
Проверка разности средних не является единственным способом проверки гипотез о наличии тренда средней динамического ряда. Рассмотрим метод разработанный Ф. Фостером и А. Стюартом который дает более надежные результаты, чем остальные. Этот метод позволяет также обнаружить тренд в значении дисперсии уровней, что, как будет показано далее, немаловажно для прогностического анализа. Ф. Фостер и А. Стюарт предложили по данным исследуемого ряда определять величины ut и lt. Значения ut и lt находятся путем последовательного сравнения уровней. Если какой-либо уровень ряда превышает по своей величине каждый из предыдущих уровней, то величине ut присваивается значение 1, в остальных случаях она равна 0. Таким образом,
Если же уровень меньше всех предыдущих, то lt присваивается значение 1. Таким образом,
После того как ut и lt найдены, определяются две характеристики S и d:
Суммирование в формулах (6) и (7) производится по всем членам ряда.
Нетрудно найти, что St принимает значения 0 и 1: St = 0 в случае, если yt не является ни наибольшим, ни наименьшим уровнем среди всех предшествующих уровней, в противном случае St = 1. Легко определить, что S может находиться в пределах 0 ≤ S ≤ n – 1. (Здесь, как и выше, п означает число членов ряда.) Если все уровни равны (нулевая дисперсия), то S = 0, если же они монотонно растут, или падают, или колебания их чередуются, систематически увеличиваясь или падая, то S = п – 1 .
В свою очередь величина dt принимает значения 0; 1 и –1. Найдем теперь пределы для d: нижний предел равен – (п – 1), верхний составляет п – 1. Нижний предел соответствует монотонно убывающему, а верхний – монотонно растущему ряду. Авторы данных характеристик не рассматривают условий, когда значение d равно 0. Между тем именно здесь кроется известная слабость рассматриваемого метода. В самом деле, если все уровни равны, то ∑ut = 0, ∑lt = 0 и d = 0. Кроме того, d = 0 и тогда, когда ∑ut = ∑lt. Что касается первой ситуации, то она соответствует полному отсутствию тренда. Вторая же может наблюдаться и тогда, когда ряд охватывает два периода с противоположными тенденциями. Кроме того, d = 0 и в случае, когда подъемы и падения уровней чередуются. Если уровни симметрично располагаются вокруг горизонтальной линии, то величина d = 0 действительно соответствует отсутствию тренда в средней. Однако при определении d не принимаются во внимание величины отклонений от горизонтальной линии. Поэтому мыслима такая ситуация, при которой отклонения с одним знаком будут систематически выше отклонений с другим знаком. В этом случае тенденция средней к росту (падению) не отразится на величине d.
Показатели S и d асимптотически нормальны и имеют независимые распределения. Они существенно зависят от порядка расположения уровней во времени. Показатель S применяется для обнаруживания тенденций изменения дисперсии, d − для обнаруживания тенденций в средней. После того как для исследуемого ряда найдены фактические значения d и S, проверяется гипотеза о том, можно ли считать случайными разности d – 0 и S – . Гипотезы можно проверить, применяя t -критерий Стьюдента, т. е.
где – математическое ожидание величины S, определенное для случайного расположения уровней во времени; – средняя квадратическая ошибка величины S; – средняя квадратическая ошибка величины d.
Необходимые для такой проверки значения , и табулированы авторами метода (таблица 1).
Присутствие тренда не всегда четко прослеживается во временном ряду. В этих случаях прежде, чем перейти к определению тенденции и выделению тренда, нужно выяснить, существует ли вообще тенденция в исследуемом процессе.
Основные подходы к решению этой задачи основаны на статистической проверке гипотез. Критерии выявления компонент ряда основаны на проверке гипотезы о случайности ряда.
Наиболее часто используемые на практике критерии проверки наличия-отсутствия тренда: критерий серий, основанный на медиане выборки и метод Фостера-Стюарта.
Инструкция . Укажите количество данных (количество строк). Полученное решение сохраняется в файле Word .
Алгоритм метода
- 1) Из исходного ряда yt длиной n образуется ранжированный (вариационный) ряд yt
- Определяется медиана этого вариационного ряда Me . В случае нечетного значения n (n=2m+1) Me=ym+1, в противном случае Me=(ym+ym+1)/2.
- Образуется последовательность δi из плюсов и минусов по следующему правилу:
Если значение yt равно медиане, то это значение пропускается. - Подсчитывается v(n) - число серий в совокупности δi, где под серией понимается последовательность подряд идущих плюсов или минусов. Один плюс или один минус тоже будет считаться серией. Определяется t(n) - протяженность самой длинной серии.
- Проверка гипотезы основывается на том, что при условии случайности ряда (при отсутствии систематической составляющей) протяженность самой длинной серии не должна быть слишком большой, а общее число серий - слишком маленьким. Поэтому для того, чтобы не была отвергнута гипотеза о случайности исходного ряда (об отсутствии систематической составляющей) должны выполняться следующие неравенства (для 5% уровня значимости uкр = 1.96):
Если хотя бы одно из неравенств нарушается, то гипотеза об отсутствии тренда отвергается.
Квадратные скобки в правой части неравенства означают целую часть числа.
Данный метод основан на анализе двух величин S и d, которые определяются следующим образом:
Значения и определятся при последовательном сравнении уровней динамического ряда.
Из формул расчета и следует, что величина S может принимать значения на отрезке [0; n-1], где n – количество элементов ряда, тогда величина d будет принимать свои значения на отрезке [-(n-1); n-1].
Показатели S и d асимптотически распределены нормально и независимы друг от друга. Величина S применяется для выявления изменений стандартного отклонения. Величина d – для обнаружения изменения средней.
После расчета фактических значений S и d проверяется нулевая гипотеза:
Где m - стандартное отклонение ряда;
- вычисляются по формулам:
Далее находится табличное значение t-критерия Стьюдента. И если выполняется условие, когда tрасч>tтабл, то это значит, что тенденции существует.
После того, как было выявлено существование тенденции, необходимо проанализировать ее характер.
Одной из простейших характеристик тенденции является средний темп роста, который можно рассчитать как геометрическое среднее из ряда последовательных или цепных темпов роста. Цепной темп роста характеризует отношение уровня временного ряда к предыдущему уровню и выражается в процентах или в долях единицы измерения. Цепные темпы роста tt определяются по формуле:
На основе этих коэффициентов можно рассчитать цепные темпы прироста: . Цепные темпы роста позволяют анализировать тенденцию с производственным характером. Но если закономерности развития допускают определения характеристики на основе постоянной величины, то в качестве темпа роста принимается средний темп роста за соответствующий период времени:
К числу недостатков среднего темпа роста относят:
1) средний темп полностью определяется только двумя крайними значениями ряда;
2) предполагается, что траектория развития приближается к экспоненциальной кривой;
3) средний темп роста скрывает динамику процесса.
При своих недостатках средний темп роста в связи с легкостью его получения и отсутствием других обобщенных характеристик развития широко применяется для анализа динамики, особенно в межстрановых сопоставлениях.
Наиболее простым и в то же время наиболее информативным для анализа тенденции является метод скользящих средних. Данный метод используется при сглаживании временного ряда. При использовании этого метода фактические уровни ряда заменяются расчетными значениями, которые обладают меньшей колеблемостью, что позволяет проявить тенденцию. В большинстве случаев используется обычный метод скользящих средних.
Распространенным способом моделирования тенденции временного ряда является построение аналитической функции, характеризующей зависимость уровней ряда от времени, или тренда. Этот способ называют Аналитическим выравниванием временного ряда. Процедура выравнивания включает в себя два этапа:
1. Выбор типа кривой.
2. Определение параметров кривой.
Поскольку зависимость от времени может принимать разные формы, для ее формализации можно использовать различные виды функций. Для построения трендов чаще всего применяются следующие функции:
Экспоненциальный тренд: (или );
Полиномы различных степеней: .
Параметры каждого из перечисленных выше трендов можно определить обычным МНК, используя в качестве независимой переменной время , а в качестве зависимой переменной – фактические уровни временного ряда . Для нелинейных трендов предварительно проводят стандартную процедуру их линеаризации.
Существует несколько способов определения типа тенденции. К числу наиболее распространенных способов относятся качественный анализ изучаемого процесса, построение и визуальный анализ графика зависимости уровней ряда от времени. В этих же целях можно использовать и коэффициенты автокорреляции уровней ряда.
При наличии во временном ряде тенденции и циклических колебаний значения каждого последующего уровня ряда зависят от предыдущих. Корреляционную зависимость между последовательными уровнями временного ряда называют автокорреляцией уровней ряда.
Количественно ее можно измерить с помощью линейного коэффициента корреляции между уровнями исходного временного ряда и уровнями этого ряда, сдвинутыми на несколько шагов во времени.
Формула для расчета коэффициента автокорреляции имеет вид:
Эту величину называют коэффициентом автокорреляции уровней ряда первого порядка, так как он измеряет зависимость между соседними уровнями ряда и .
Аналогично можно определить коэффициенты автокорреляции второго и более высоких порядков. Так, коэффициент автокорреляции второго порядка характеризует тесноту связи между уровнями и и определяется по формуле:
Число периодов, по которым рассчитывается коэффициент автокорреляции, называют Лагом. С увеличением лага число пар значений, по которым рассчитывается коэффициент автокорреляции, уменьшается. Считается целесообразным для обеспечения статистической достоверности коэффициентов автокорреляции использовать правило – максимальный лаг должен быть не больше .
Свойства коэффициента автокорреляции.
1. Он строится по аналогии с линейным коэффициентом корреляции и таким образом характеризует тесноту только линейной связи текущего и предыдущего уровней ряда. Поэтому по коэффициенту автокорреляции можно судить о наличии линейной (или близкой к линейной) тенденции. Для некоторых временных рядов, имеющих сильную нелинейную тенденцию (например, параболу второго порядка или экспоненту), коэффициент автокорреляции уровней исходного ряда может приближаться к нулю.
2. По знаку коэффициента автокорреляции нельзя делать вывод о возрастающей или убывающей тенденции в уровнях ряда. Большинство временных рядов экономических данных содержат положительную автокорреляцию уровней, однако при этом могут иметь убывающую тенденцию.
Последовательность коэффициентов автокорреляции уровней первого, второго и т. д. порядков называют Автокорреляционной функцией временного ряда. График зависимости ее значений от величины лага (порядка коэффициента автокорреляции) называется Коррелограммой.
Анализ автокорреляционной функции и коррелограммы позволяет определить лаг, при котором автокорреляция наиболее высокая, а следовательно, и лаг, при котором связь между текущим и предыдущими уровнями ряда наиболее тесная, т. е. при помощи анализа автокорреляционной функции и коррелограммы можно выявить структуру ряда.
Если наиболее высоким оказался коэффициент автокорреляции первого порядка, исследуемый ряд содержит только тенденцию. Если наиболее высоким оказался коэффициент автокорреляции порядка , то ряд содержит циклические колебания с периодичностью в моментов времени. Если ни один из коэффициентов автокорреляции не является значимым, можно сделать одно из двух предположений относительно структуры этого ряда: либо ряд не содержит тенденции и циклических колебаний, либо ряд содержит сильную нелинейную тенденцию, для выявления которой нужно провести дополнительный анализ. Поэтому коэффициент автокорреляции уровней и автокорреляционную функцию целесообразно использовать для выявления во временном ряде наличия или отсутствия трендовой компоненты и циклической (сезонной) компоненты.
Тип тенденции можно определить путем сравнения коэффициентов автокорреляции первого порядка, рассчитанных по исходным и преобразованным уровням ряда. Если временной ряд имеет линейную тенденцию, то его соседние уровни и тесно коррелируют. В этом случае коэффициент автокорреляции первого порядка уровней исходного ряда должен быть высоким. Если временной ряд содержит нелинейную тенденцию, например, в форме экспоненты, то коэффициент автокорреляции первого порядка по логарифмам уровней исходного ряда будет выше, чем соответствующий коэффициент, рассчитанный по уровням ряда. Чем сильнее выражена нелинейная тенденция в изучаемом временном ряде, тем в большей степени будут различаться значения указанных коэффициентов.
Выбор наилучшего уравнения в случае, когда ряд содержит нелинейную тенденцию, можно осуществить путем перебора основных форм тренда, расчета по каждому уравнению скорректированного коэффициента детерминации и средней ошибки аппроксимации. Этот метод легко реализуется при компьютерной обработке данных.
Модель можно использовать для целей прогнозирования, если она адекватна изучаемому процессу и описывает его достаточно точно. Модель тренда считается адекватной, если она действительно отражает тенденцию изменения уровней ряда. Это требование эквивалентно тому, что отклонения фактических уровней ряда от рассчитанных по модели тренда et имеют случайный характер, то есть изменение остатков не связано с изменением времени.
Подсчитывают протяженность самой длинной серии Кmax(Т) и общее число серий V(Т). Для того, чтобы отклонения от тренда можно было считать случайными, протяженность самой длинной серии не должна быть слишком большой, а общее число серий – слишком маленьким. Отклонения можно считать случайными, если выполняются следующие условия (для 5% уровня значимости):
В выражениях 2.6 и 2.7 квадратные скобки означают целую часть числа. Если хотя бы одно из этих неравенств нарушается, то гипотеза о случайном характере отклонений уровней временного ряда от тренда отвергается.
Точность модели характеризует близость фактических уровней ряда уt и рассчитанных по модели . Оценивать точность имеет смысл только для адекватных моделей. В качестве показателей точности модели тренда применяют следующие:
1) остаточное среднее квадратическое отклонение:
2) средняя относительная ошибка аппроксимации:
3) коэффициент детерминации:
Где Т – число уровней ряда;
G – количество параметров модели;
Уt – фактические уровни ряда;
- уровни ряда, рассчитанные по модели;
- среднее арифметическое значение уровней ряда.
При использовании регрессионных моделей для прогнозирования важна проверка коррелированности остатков, то есть оценка автокорреляции. Высокая автокорреляция остатков свидетельствует о неправильной спецификации модели, и тогда нельзя всерьез принимать оценки доверительных интервалов.
Автокорреляция в остатках может быть вызвана несколькими причинами, имеющими различную природу.
1. Она может быть связана с исходными данными и вызвана наличием ошибок измерения в значениях результативного признака.
2. В ряде случаев автокорреляция может быть следствием неправильной спецификации модели. Модель может не включать фактор, который оказывает существенное воздействие на результат и влияние которого отражается в остатках, вследствие чего последние могут оказаться автокоррелированными. Очень часто этим фактором является фактор времени .
От истинной автокорреляции остатков следует отличать ситуации, когда причина автокорреляции заключается в неправильной спецификации функциональной формы модели. В этом случае следует изменить форму модели, а не использовать специальные методы расчета параметров уравнения регрессии при наличии автокорреляции в остатках.
Один из более распространенных методов определения автокорреляции в остатках – это расчет критерия Дарбина-Уотсона:
То есть величина есть отношение суммы квадратов разностей последовательных значений остатков к остаточной сумме квадратов по модели регрессии.
Можно показать, что при больших значениях существует следующее соотношение между критерием Дарбина-Уотсона и коэффициентом автокорреляции остатков первого порядка :
Таким образом, если в остатках существует полная положительная автокорреляция и , то . Если в остатках полная отрицательная автокорреляция, то и, следовательно, . Если автокорреляция остатков отсутствует, то и . Т. е. .
Алгоритм выявления автокорреляции остатков на основе критерия Дарбина-Уотсона следующий. Выдвигается гипотеза об отсутствии автокорреляции остатков. Альтернативные гипотезы и состоят, соответственно, в наличии положительной или отрицательной автокорреляции в остатках. Далее по специальным таблицам определяются критические значения критерия Дарбина-Уотсона и для заданного числа наблюдений , числа независимых переменных модели и уровня значимости . По этим значениям числовой промежуток разбивают на пять отрезков. Принятие или отклонение каждой из гипотез с вероятностью осуществляется следующим образом:
– есть положительная автокорреляция остатков, отклоняется, с вероятностью принимается ;
– нет оснований отклонять , т. е. автокорреляция остатков отсутствует;
– есть отрицательная автокорреляция остатков, отклоняется, с вероятностью принимается .
Если фактическое значение критерия Дарбина-Уотсона попадает в зону неопределенности, то на практике предполагают существование автокорреляции остатков и отклоняют гипотезу.
Чтобы по модели тренда получить точечный прогноз, необходимо в полученное уравнение тренда вместо переменной t подставить t=T+l. недостаточность точечного прогноза и необходимость расчета интервального прогноза определяется следующими моментами:
1. Выбор модели тренда носит субъективный характер.
2. Оценивание параметров уравнения тренда производится на основе ограниченного числа наблюдений, каждое из которых содержит случайную компоненту, поэтому параметрам уравнения тренда и его положению в пространстве свойственна некоторая неопределенность.
3. Тренд характеризует тенденцию изменения показателя. Фактические же уровни ряда отклоняются от уровней ряда, рассчитанных по уравнению тренда. Эти отклонения будут наблюдаться и в периоде упреждения. прогноза.
Погрешность, связанная со вторым и третьим условием, может быть отражена в виде доверительного интервала:
- левая (нижняя) граница – ;
- правая (верхняя) граница – ;
Где D - доверительный полуинтервал: .
Среднеквадратическая ошибка прогнозирования Sпр должна учитывать ошибку, допущенную при оценке параметров тренда, и отклонения от самого тренда:
Где Sост – среднеквадратическая ошибка отклонений фактических уровней ряда yt от уровней ряда, рассчитанных по уравнению тренда .
Коэффициент К рассчитывают с учетом соотношения между длинной периода предыстории Т и периодом упреждения прогноза L.
. (2.12)
Суммирование производится по всем членам ряда. Значения Ut и lt определяются путем сравнения уровней исходного ряда динамики со всеми предыдущими.
Если значение уровня ряда превышает по своей величине каждый из предыдущих уровней, то величине Ut присваивается значение 1, в остальных случаях она равна 0. Таким образом:
Наоборот, если значение уровня ряда меньше всех предыдущих, то lt присваивается значение 1.
Показатели S и d асимптотически нормальные и имеют независимые распределения, но на них влияет порядок расположения уровней во времени. Показатель S применяется для обнаружения тенденции изменения в дисперсиях, d – для обнаружения тенденции в средней. После того, как для исследуемого ряда найдены фактические значения d и S, проверяется гипотеза о том, можно ли считать случайными разности (d – 0) и (S – ). Гипотезы проверяются на основе t-критерий Стьюдента, то есть:
– математическое ожидание величины S, определенное для случайного расположения уровней во времени;
1 – средняя квадратическая ошибка величины S;
2 – средняя квадратическая ошибка величины d.
Если td > tкр (; = n – 1), то гипотеза об отсутствии тенденции в средней отвергается, следовательно в исходном временном ряду существует тренд.
Отразим в таблице .
Гипотезу об отсутствии тенденции в средней
Гипотезу об отсутствии тенденции в дисперсиях
По таблице значений средней и стандартных ошибок при n=10 находим .
Фазочастотный критерий знаков разностей Валлиса и Мура. По данному критерию предполагается расчет разностей уровней временного ряда (yt+1 – yt). Нулевая гипотеза состоит в утверждении, что знаки этих разностей образуют случайную последовательность. Последовательность одинаковых знаков разностей называется фазой и рассчитывается число фаз h (без первой и последней фазы). Если знаки образуют случайную последовательность, то фактическое значение критерия запишется формулой (2.17).
, (2.17)
При больших выборах (n>30) поправка на непрерывность может быть опущена и формула расчета будет следующая:
n – число уровней временного ряда, распределенных нормально;
tф – фазочастотный критерий разностей;
Если tф > 3, следовательно, данная последовательность случайна.
Пример. Для иллюстрации данного метода рассмотрим данные строительной фирмы о производстве продукции по дням месяца (табл. 2.6).
Таблица 2.6
Уровни и фазы временного ряда
В таблице 2.6 находим знаки отклонений (yt+1–yt) и проставляем нумерацию фаз. Получаем h=7, n=22. По таблице значений вероятности t (приложения 1) для фазочастотного критерия находим, что при вероятности 95%, то есть для 5%-ного уровня значимости t=1,96. Фактическое значение tф =2,55. Значит tф>t , то есть 2,55>1,96 нулевая гипотеза отвергается.
Уровни ряда производства продукции строительной фирмы не образуют случайную последовательность, следовательно, имеют тенденцию развития.
Критерий Кокса-Стюарта заключается в следующем, исходный временной ряд делится на три группы уровней. Численность первой и третьей групп должны быть равны между собой и составлять n/3 уровней каждая (при n, не делящемся на три, средняя треть уменьшается на одно и два значения). При этом осуществляется фиксация знаков отклонения каждого уровня третьей группы от соответствующего уровня первой группы. Из полученной суммы (S) положительных или отрицательных знаков (при возрастающем или убывающем тренде, соответственно) вычисляется ожидаемое значение n/6. Считается, что вычисленная разность распределена нормально со стандартным отклонением: , то есть:
или при малых объемах (n Z гипотеза о наличие (возрастающего или убывающего) тренда принимается.
Пример. Воспользуемся данными предыдущего примера. Так как 22 не делится на 3, образуем обе трети, как если бы n было равно 24 (ni=24). Получаем уровни групп представленные в таблице 2.7.
Уровни групп
Значения последней трети | 5 | 6 | 7 | 6 | 4 | 3 | 7 | 6 |
Значения первой трети | 12 | 10 | 9 | 8 | 7 | 5 | 9 | 5 |
Знаки разностей | - | - | - | - | - | - | - | + |
Мы получили семь отрицательных знаков из восьми. Проверка на убывающий тренд показала, что в зависимости от критерия (односторонний или двусторонний) критические значения равны: Z = 1,64 и Z = 1,96 для = 5%; Z = 2,33
и Z = 2,58 для = 1%. Значению Zф = 2,10 при двустороннем критерии соответствует вероятность Р 0,0357 (приложение 7). Убывающий тренд на 5%-ом уровне подтвержден.
Таким образом, рассмотренные выше критерии основаны на определении знаков разностей последовательных уровней временных рядов или разностей определенных групп уровней ряда, то есть с их помощью предполагается определение наличия возрастающей или убывающей тенденции. Данные критерии дают удовлетворительные результаты, как правило, только для временных рядов не характеризующихся резкими колебаниями. При наличие ярко выражающихся колебаний в развитии социально-экономических явлений эти критерии могут давать противоречивые результаты.
После того, как установлено наличие тенденции во временном ряду необходимо ее описать, то есть определить тип протекания процесса, имеющего место в данном явлении, направление роста и изменение, проходящие в нем.
Можно выделить следующие типы процессов:
монотонно-возрастающие;
монотонно-убывающие;
комбинированные.
имеющие пределы насыщения;
не имеющие пределов насыщения.
процессы, имеющие экстремальные значения;
процессы, имеющие переходы от возрастания к убыванию или наоборот.
– сглаживание или механическое выравнивание отдельных уровней ряда динамики с использованием фактических значений соседних уровней;
– выравнивание с применением кривой, приведенной между конкретными уровнями таким образом, чтобы она отображала тенденцию, присущую ряду, и одновременно освободила его от незначительных колебаний.
Выбор метода выявления основной тенденции развития зависит от технических возможностей счета и от умения применять соответствующие методы, а также от задач, стоящих перед исследованием. Если надо дать общую картину развития, его грубую модель, основанную на механическом повторении одних и тех же действий по увеличению интервала времени, то можно ограничиться методом скользящей средней. Если же исследование требует подробного аналитического выражения движения во времени, то метод скользящей средней будет недостаточным. Надо использовать метод конечных разностей или метод наименьших квадратов.
Все методы выявления основной тенденции развития определяются на основе изучения фактического развития динамики. Они не отрываются от наблюдаемого статистикой эмпирического материала.
Методы выявления основной тенденции развития имеют разное логическое содержание и поэтому применяются ко временным рядам для разных целей. Основная их цель, как уже говорилось, заключается в том, чтобы вскрывать общие закономерности развития, затушеванные отдельными, иногда случайными обстоятельствами. Однако каждый из них имеет свои особенности.
Метод скользящих средних используется в том случае, когда необходимо представить общую картину развития, основанную на механическом повторении одних и тех же действий по увеличению интервала времени.
Метод скользящих средних дает оценку среднего уровня за некоторый период времени: чем больше интервал времени, к которому относится средняя, тем более плавным будет сглаживаемый уровень, но тем менее точно будет описана тенденция исходного ряда динамики.
Сглаживание ряда динамики с помощью скользящей средней заключается в том, что вычисляется средний уровень из определенного числа первых по порядку уровней ряда, затем – средний уровень из такого же числа уровней, начиная со второго, далее – начиная с третьего и т.д. Таким образом, при расчетах среднего уровня как бы «скользят» по ряду динамики от его начала к концу, каждый раз отбрасывая один уровень в начале и добавляя следующий. Отсюда название – скользящая средняя.
Каждая скользящая средняя – это средний уровень за соответствующий период, который относится к середине выбранного периода.
Определение скользящей средней по четному числу членов ряда осложняется тем, что средняя может быть отнесена только к середине между двумя датами, находящимися в середине интервала сглаживания.
Если число членов скользящей средней обозначить через 2к, то срединным будет уровень, относящийся к «к+1/2» члену ряда, т.е. имеет место сдвиг периода, к которому относится уровень. Например, средняя, найденная для четырех членов, относится к середине между вторым и третьим периодами, следующая средняя – к середине между третьим и четвертым, и т.д. Для устранения этого используют процедуру центрирования, которая заключается в нахождении средней из двух смежных скользящих средних для отнесения полученного уровня к определенной дате.
Метод простой скользящей средней приемлем, если графическое изображение ряда динамики напоминает прямую линию. В этом случае не искажается динамика исследуемого явления.
Покажем расчет 3-х и 4-членных скользящих средних на примере данных об объеме платных услуг населению одного из регионов РФ за период января-декабря 2009 г. (таблица 2.8).
Таблица 2.8
Взвешенная скользящая средняя отличается от простой скользящей средней тем, что уровни, входящие в интервал усреднения, суммируются с различными весами. Это связано с тем, что аппроксимация сглаживаемого ряда динамики в пределах интервала сглаживания осуществляется с использованием уровней, рассчитанных по полиному /i – порядковый номер уровня в интервале сглаживания/. Полином первого порядка – есть уравнение прямой, следовательно, метод простой скользящей средней является частным случаем метода взвешенной скользящей средней. Коэффициенты находятся методом наименьших квадратов.
На первом этапе сглаживания определяются интервал сглаживания и порядок аппроксимирующего полинома. Принято считать, что при использовании полиномов высоких степеней и при меньших размерах интервалов сглаживание ряда динамики будет более гибким.
Центральная ордината параболы, например, принимается за сглаженное значение соответствующего фактическим данным уровня. Поскольку отсчет времени в пределах интервала сглаживания производится от его середины, то сглаженное значение уровня равно параметру а подобранной параболы и является соответствующей скользящей средней. Поэтому для сглаживания нет необходимости прибегать к процедуре подбора системы парабол, так как величину а можно получить как взвешенную среднюю из «к» уровней.
Например, если в интервал сглаживания входят пять последовательных уровней ряда со сдвигом во времени на один шаг, а выравнивание проводится по полиному второго порядка, то коэффициенты полинома находятся из условия:
Учитывая, что для нечетных , получаем систему:
Для определения необходимо найти значения и .
Так как интервал сглаживания равен к=5, то и .
Нормальное уравнение, определяющее и , в этом случае записывается следующим образом:
Решение этой системы относительно может быть представлено следующим образом:
Аналогичным путем получают выражения и для других интервалов сглаживания по параболе второго и третьего порядка.
)
Согласно приведенным формулам, веса симметричны относительно центрального уровня и их сумма с учетом общего множителя, вынесенного за скобки, равна единице.
По данным рассмотренного выше примера об объеме платных услуг населению одного из регионов РФ за период январь – декабрь 2009 г. произведем расчет 7 – ми членных скользящих средних и проанализируем на их основе характер тенденции исходного временного ряда (таблица 2.9).
В качестве аппроксимирующего полинома примем параболу второго порядка, параметры которой могут быть определены на основе решения следующей системы нормальных уравнений методом наименьших квадратов:
Отсчет времени в пределах интервала сглаживания произведем от его середины, то система уравнений упростится до следующего вида:
Анализ данных табл. 2.9 показал, что взвешенная скользящая средняя (гр. 18) на протяжении всего периода возрастает, т.е. за период с января по декабрь 2009 г. наблюдается рост объема платных услуг населения одного из регионов РФ.
Расчетная таблица для определения взвешенных скользящих средних объема
платных услуг населению одного из регионов РФ за период январь-декабрь 2009 г.
Метод плавного уровня по величине среднего абсолютного прироста придает изменению во времени характер изменения по прямой линии, а по величине среднего темпа роста – по показательной кривой. И тот и другой методы не покажут, как происходило развитие, так как их плавный уровень целиком зависит от начального и конечного уровней динамики.
Метод Лагранжа является формальным методом, позволяющим установить математическую зависимость между уровнем временного ряда и временем, к которому он относится.
Обобщением этой типизации и является моделирование (нахождение аналитической функции, выражающей развитие явления за рассматриваемый период времени).
выбор вида уравнения, отображающего тип развития;
в) определение методов преобразования исходных данных с целью сведения сложных уравнений к более простым;
г) выявление степени близости теоретических и фактических данных.
Найденная модель позволяет получить выровненные или, другими словами, теоретические значения уровней.
Пример. Определим основную тенденцию ряда динамики объема платных услуг населению одного из регионов РФ за январь – декабрь 2009 г.
Рассмотрим определение тенденции на основе полинома первой и второй степени, то есть прямой и параболы второго порядка, промежуточные расчеты параметров которых приведены в таблице 2.10.
Таблица 2.10
Динамика объема платных услуг населению одного из регионов РФ
за период январь-декабрь 2009 г. и определение параметров уравнения
тренда методом наименьших квадратов
Для уравнения прямой параметры определяются путем решения следующей системы нормальных уравнений методом наименьших квадратов:
Для уравнения параболы второго порядка параметры могут быть определены на основе решения следующей системы нормальных уравнений методом наименьших квадратов:
2.4. Выбор формы тренда
Остановимся подробнее на проблеме выбора математической функции для описания основной тенденции развития, то есть выбора подобной реальной динамике формы уравнения.
Для отображения основной тенденции развития явлений во времени или модели этого процесса применяются полиномы разной степени, экспоненты, логистические кривые и другие функции.
Полиномы имеют следующий вид:
полином первой степени ,
полином второй степени , (2.26)
полином n-й степени .
Наиболее простым путем решения проблемы выбора формы трендовой модели можно назвать графический, на базе общей конфигурации графика фактических уровней ряда. Однако при этом подходе риск ошибочного выбора кривой очень велик. Разные специалисты, исходя из одного и того же графика, могут прийти к разным заключениям по поводу формы уравнения. Правильность выбора уравнения в некоторой мере зависит от масштаба графика. Однако в несложных случаях подход графического выбора может дать вполне приемлемые результаты.
Подбор класса выравнивающих кривых для временного ряда производится на основе качественного анализа представленного им процесса, а также если известны:
1 , 2 , 3 ……. i – первые, вторые, третьи и т.д. разности или абсолютные ускорения;
Tp – темпы роста первых абсолютных приростов уровней;
lgyi – первые абсолютные приросты логарифмов уровней;
В этих случаях критерии выбора типа кривой следующие (табл. 2.11).
Таблица 2.11
Эти гипотезы проверяются с помощью t-критерия Стьюдента.
По таблице значений средней и стандартных ошибокприn=10 находим .
Фазочастотный критерий знаков разностей Валлиса и Мура.
Нулевая гипотеза состоит в утверждении, что знаки разностей каждого следующего значения уровня временного ряда от предыдущего образуют случайную последовательность.
Последовательность одинаковых знаков разностей называется фазой и рассчитывается число фаз h (без первой и последней фазы).
Если знаки образуют случайную последовательность, то фактическое значение критерия запишется формулой (2.17).
, (2.17)
При больших выборах (n>30) поправка на непрерывность может быть опущена и формула расчета будет следующая:
, (2.18)
n – число уровней временного ряда, распределенных нормально;
tф – фазочастотный критерий разностей;
Если tф > 3, следовательно, данная последовательность случайна.
Пример. Для иллюстрации данного метода рассмотрим данные строительной фирмы о производстве продукции по дням месяца (табл. 2.6).
Уровни и фазы временного ряда
yt , млн.. руб.
отклонений (yt+1–yt)
В таблице 2.6 находим знаки отклонений (yt+1–yt) и проставляем нумерацию фаз. Получаем h=7, n=22.
По таблице значений вероятности t (приложения 1) для фазочастотного критерия находим, что на уровне значимости 0,05 t=1,96. Фактическое значение tф =2,55. tф>t , то есть 2,55>1,96 нулевая гипотеза отвергается.
Уровни ряда производства продукции строительной фирмы не образуют случайную последовательность, следовательно, имеют тенденцию развития.
Критерий Кокса-Стюарта.
Позволяет решить задачу определения типа тенденции и реализуется в следующей последовательности: исходный временной ряд делится на три группы уровней. Численность первой и третьей групп должны быть равны между собой и составлять n/3 уровней каждая (при n, не делящемся на три, средняя треть уменьшается на одно и два значения).
При этом осуществляется фиксация знаков отклонения каждого уровня третьей группы от соответствующего уровня первой группы.
Из полученной суммы (S) положительных или отрицательных знаков (при возрастающем или убывающем тренде, соответственно) вычисляется ожидаемое значение n/6.
Считается, что вычисленная разность распределена нормально со стандартным отклонением: , то есть:
, (2.19)
, (2.20)
Для проверки расчетного значения Zф сравнивают его с табличным Z. При Zф >Z гипотеза о наличие (возрастающего или убывающего) тренда принимается.
Пример. Воспользуемся данными предыдущего примера. Так как 22 не делится на 3, образуем обе трети, как если бы n было равно 24 (ni=24). Получаем уровни групп представленные в таблице 2.7.
Читайте также: