Colección de citas famosas - Frases motivadoras - Explicación detallada de la detección de tiempo

Explicación detallada de la detección de tiempo

/BigData_Mining/article/details/81092750

1. Descripción general

1. Estacionariedad de las series de tiempo

Estas series de tiempo se denominan una serie de tiempo estacionaria. También se puede considerar que si una serie de tiempo no tiene una tendencia obvia hacia arriba o hacia abajo, y cada valor de observación fluctúa alrededor de su media, que es una constante en relación con el tiempo, entonces la serie de tiempo es una serie estacionaria (estacionariedad débil).

De hecho, existen dos definiciones de estacionariedad, y también existe un proceso de estacionariedad fuerte:

Estacionariedad fuerte (estacionariedad estricta): para todos los n posibles, todos los t1 posibles, t2 ,…,tnt1,t2,…,tn, si la distribución conjunta de todos los posibles Zt1,Zt2,…,ZtnZt1,Zt2,…,Ztn con Zt1?k,Zt2?k,…,Ztn?kZt1?k, Cuando Zt2 ?k,...,Ztn?k son iguales, se llama estacionario fuerte.

No existe relación entre los dos procesos estacionarios. La estacionariedad débil no es necesariamente una estacionariedad fuerte, y la estacionariedad fuerte no es necesariamente una estacionariedad débil. La estacionariedad fuerte es la estacionariedad de facto, mientras que la estacionariedad débil es la estacionariedad de las estadísticas en el sentido observacional (media, varianza).

La idea básica de la estacionariedad es que el comportamiento de una serie temporal no cambia con el tiempo. La estacionariedad describe la invariancia de las propiedades estadísticas de una serie temporal con respecto a la traducción temporal. Un punto de partida importante para nuestro estudio de series de tiempo es obtener algunas predicciones del futuro a través de los datos históricos de la serie de tiempo. En otras palabras, esperamos que algunas propiedades de la serie de tiempo sobre los datos históricos permanezcan sin cambios en el futuro. Ésta es la función de la traducción del tiempo. Por el contrario, si la serie temporal no es estacionaria, las propiedades estadísticas obtenidas de los datos históricos no tienen sentido para las predicciones futuras.

2. Composición de las series temporales

Los componentes principales de cada serie temporal:

Existen dos métodos para eliminar el ruido en la detección de series temporales, la media móvil método (MA) y suavizado exponencial, ARIMA utiliza la media móvil MA

1. Método de media móvil

Su principio básico: para cualquier número impar de puntos consecutivos, divide su valor por la mitad de un punto se reemplaza por el valor promedio de otros puntos. Supongamos que {xixi} representa un punto de datos y el valor suave de la posición i es sisi, entonces existe:

si=12k 1∑ j=? kkxi j

si=12k 1∑ j=?kkxi j

Este método simple tiene serios problemas. Es similar al filtrado medio en el procesamiento de imágenes (pero aquí es uno). dimensional), el uso de un proceso de suavizado tan simple y aproximado hará que los datos se vuelvan "borrosos". Cuando un pico ingresa a la ventana de suavizado, el pico distorsionará repentinamente los datos actuales hasta que los valores atípicos abandonen la ventana de suavizado. Es decir, los datos originales pierden detalles debido a datos ruidosos. En el procesamiento de imágenes, utilizamos el filtrado gaussiano para resolver este problema. Cuanto más cerca de los datos centrales, mayor será el peso, y cuanto más cerca del borde de la ventana de suavizado, menor será el peso. Aquí aplica lo mismo, utilizamos el método de media móvil ponderada, la fórmula es la siguiente:

si=∑j=?kkwjxi j, donde ∑j=?kkwj=1

si=∑j =?kkwjxi j, donde ∑j=?kkwj=1

Aquí wjwj es el factor de peso. La fórmula para usar la función gaussiana para generar el factor de peso es la siguiente:

f(x,σ)=12πσ2√exp(?12(xσ)2)

f( x,σ)=12πσ2exp (?12(xσ)2)

El parámetro σσ determina el ancho de la curva. Cuando x es mayor que 3,5σσ, el valor de la función es 0.

Por lo tanto, f (x, 1) se puede utilizar para generar un factor de peso de 9 puntos, siempre que se tomen los valores de función de estas posiciones en f (x, 1). Establecer σσ en 2 nos da un factor de ponderación de 15 puntos, que es el valor cuando x es un número entero entre -7 y 7, y así sucesivamente.

Hay muchos problemas con el método de media móvil:

Supongamos p=1, q=2, y después de la diferencia de primer orden, la secuencia es estacionaria, entonces:

X^t?Xt?1=?1(Xt?1?Xt?2) θ1εt?1 θ2εt?2

2) θ1εt?1 θ2εt?2

Es decir:

X^t=Xt?1 ?1(Xt?1?Xt?2) θ1εt?1 θ2εt?2

X^t=Xt?1 ? 1(Xt?1?Xt?2) θ1εt?1 θ2εt?2

Entre ellos, X tX t es el valor predicho. El modelo ARIMA (p, d, q) se puede definir como:

(1?∑i=1p?iLi)(1?L)dXt=(1 ∑i=1qθiLi)εt

(1?∑i=1p?iLi)(1?L)dXt=(1 ∑i=1qθiLi)εt

Donde L es el operador de retraso (Lag operator), d∈Z , dígito ;0. ∈Z,dgt;0.

Existe un proceso relativamente general para utilizar el modelo ARIMA, como se muestra a continuación:

1. Identificar la estacionariedad de la serie temporal en función de su diagrama de dispersión, función de autocorrelación y autocorrelación parcial. función trama sexo.

2. Suavizar datos de series temporales no estacionarias. Hasta que los valores de la función de autocorrelación procesada y la función de autocorrelación parcial no sean significativos y distintos de cero.

3. Establecer un modelo de serie temporal correspondiente en función de las características identificadas. Después del suavizado, si la función de autocorrelación parcial está censurada y la función de autocorrelación tiene cola, entonces se establece el modelo AR; si la función de autocorrelación parcial tiene cola y la función de autocorrelación está censurada, entonces se establece el modelo AR; la función de autocorrelación parcial y la función de autocorrelación están siguiendo, la secuencia es adecuada para el modelo ARMA.

4. Estimación de parámetros y comprobación de si son estadísticamente significativos.

5. Prueba de hipótesis para determinar (diagnosticar) si la secuencia residual es una secuencia de ruido blanco.

6. Utilice el modelo probado para hacer predicciones.

Cuatro: Juicio de estacionariedad

/bi_hu_man_wu/article/details/64918870

Cinco: Estabilización de secuencias no estacionarias

( 1) Eliminar la tendencia (para tendencias determinadas)

Idea: yt=Tt xtyt=Tt xt donde TtTt es la tendencia xtxt es estable Principalmente encontramos la tendencia y la eliminamos. Generalmente usamos el ajuste de tendencia para obtener la expresión de la tendencia. Si aún no es estable después de eliminarla, es un error de ajuste. (Para la parte de búsqueda de tendencias, consulte el análisis de tendencias: ajuste y suavizado a continuación)

(2) Diferencia

Diferencia de un paso Δy=yt?yt?1=( I?B) ytΔy=yt?yt?1=(I?B)yt

diferencia de pasos Δsy=(I?Bs)ytΔsy=(I?Bs)yt

Por ejemplo, datos semanales. Puede elegir s=7. Si obtiene ruido blanco después de una diferencia, no tiene sentido. En este caso, puede elegir una diferencia fraccionaria. Pero la diferencia aumentará la varianza.

(3) Transformación

Para secuencias con varianzas cambiantes, puede elegir la transformación log() para eliminar la tendencia exponencial.

En general se puede considerar la transformación box-cox.

Seis: Caso

/Fredric_2014/article/details/85699116

/Fredric_2014/article/details/85340339

/weixin_41988628/ artículo/detalles/83149849

Siete. Discusión y análisis

Debido a sus buenas propiedades estadísticas, el modelo ARIMA es el modelo de series de tiempo más utilizado y se pueden implementar varios modelos de suavizado exponencial utilizando el modelo ARIMA. Es decir, el modelo establecido mediante Holter-winter también se puede obtener utilizando ARIMA. Aunque ARIMA es muy flexible y puede construir varios modelos de series de tiempo (AR, MA, ARMA), ARIMA también tiene limitaciones. La principal limitación es que ARIMA solo puede construir modelos lineales, y los modelos lineales puros a menudo no son satisfactorios en el mundo real.