TEST Z-flt
Отсюда: Сглаженный алгоритм z-показателя
Алгоритм принимает 3 входа:
lag = the lag of the moving window
Определяет, насколько данные будут сглажены и насколько адаптивен алгоритм к изменениям долгосрочного среднего значения.
Чем более постоянны данные, тем больше задержек вы должны включить (это должно повысить надежность алгоритма). Если данные содержат
изменяющиеся во времени тренды, вы должны подумать о том, как быстро вы хотите, чтобы алгоритм адаптировался к этим тенденциям.
Т.е., если вы установите lag в 10, потребуется 10 "периодов", прежде чем порог алгоритма будет скорректирован на любые систематические изменения в
долгосрочной средней.
threshold = the z-score at which the algorithm signals
Пороговый параметр - число стандартных отклонений от скользящего среднего, выше которого алгоритм будет классифицировать новый пункт данных как сигнал.
Например, если новая точка данных на 4,0 стандартных отклонения выше скользящего среднего, а пороговый параметр установлен на 3,5, алгоритм идентифицирует ее как сигнал.
Этот параметр должен быть установлен исходя из ожидаемого количества сигналов.
Например, если ваши данные нормально распределены, пороговое значение (или: z-оценка), равное 3,5, соответствует вероятности сигнализации 0,00047
(из этой таблицы), что означает, что вы ожидаете сигнал один раз каждые 2128 точек данных (1/0,00047).
Таким образом, пороговое значение напрямую влияет на то, насколько чувствителен алгоритм.
influence = the influence (between 0 and 1) of new signals on the mean and standard deviation.
Этот параметр определяет влияние сигналов на порог обнаружения алгоритма. Если задано значение 0, сигналы не влияют на порог,
так что будущие сигналы обнаруживаются на основе порога, который рассчитывается со средним и стандартным отклонением, на которое не влияют предыдущие сигналы.
Установите 0 если временной ряд всегда возвращается к одному и тому же среднему значению в долгосрочной перспективе.
ИНаче выберите параметр между 0 и 1 в зависимости от степени, в которой сигналы могут влиять на изменяющийся во времени тренд данных.
Например, если сигналы приводят к структурному разрыву долгосрочного среднего значения временного ряда, параметр влияния должен быть высоким (близким к 1),
чтобы порог мог быстро адаптироваться к этим изменениям.
Например, lag в 5 будет использовать последние 5 наблюдений для сглаживания данных. threshold 3,5 будет сигнализировать, если точка данных находится в 3,5 стандартных отклонениях от скользящего среднего. И influence 0,5 дает сигналы половину влияния, которое имеют нормальные точки данных. Аналогично, influence 0 полностью игнорирует сигналы для пересчета нового порога. Поэтому влияние 0 является наиболее надежным вариантом (но предполагает стационарность); установка варианта влияния на 1 наименее устойчива. Поэтому для нестационарных данных параметр влияния должен находиться где-то между 0 и 1.