ANÁLISIS EN EL DOMINIO DEL TIEMPO.

AUTOCOVARIANZA.

AUTOCORRELACIÓN

AUTOCORRELACIÓN Y FUNCION DE DENSIDAD ESPECTRAL



El procedimiento para estudiar las señales en el dominio del tiempo, sobre todo en el caso de procesos puntuales, se basa en el estudio de las funciones de autocovarianza (facv) y de autocorrelación (facr). Aunque no siempre lo indicaremos explícitamente, se ha de entender que al disponer de datos procedentes de una muestra las funciones que calculemos serán funciones muestrales es decir estimadores de los verdaderos valores poblacionales cuyo nivel de significación debemos valorar críticamente. Una vez que disponemos de la fac podemos plantearnos el tipo de proceso que genera nuestros datos, existen en la literatura (y en Internet) diversos modelos (AR, ARIMA, ruido blanco, paseo o senda aleatoria, etc) con los que comparar nuestros resultados y obtener conclusiones según los paradigmas vigentes para la señal particular objeto de nuestro estudio. En el caso particular de las señales con componentes cíclicos o estacionales es útil calcular los coeficientes de autocorrelación muestrales que miden la correlación entre los datos a distintos intervalos y pueden proporcionar información sobre los ciclos en el modelo hipotético que genera los datos.



AUTOCOVARIANZA.



Si consideramos la serie temporal (que podría ser la de los intervalos entre impulsos en una descarga de potenciales de acción):



x1, x2, ….x n-1, xn



podemos obtener, a partir de ella dos series con n-1 observaciones si disponemos los datos de la forma:



X(t+0)= x1, x2, ….x n-1

X(t+1)= x2, x3, ….x n



como ya sabemos la varianza muestral de cada una de estas series vendrá dada por:





y





Por ejemplo con nuestra serie:

3,0,1,-1,0,2 ….., 7,8

crearíamos dos nuevas que serían

3,0,1,-1,0,2 ….., 7 y

0,1,-1,0,2 ….., 7,8





Serie original

Serie con retardo 0

Serie con retardo 1


3

3

0


0

0

1


1

1

-1


-1

-1

..


..

..

7


7

7

7


7

7

8


8




3,34

3,19

3,35

media

7,54

7,06

7,78

varianza







Cuando lo que calculamos en el sumatorio no es el producto de la diferencia de cada valor respecto de su media por si mismo sino que multiplicamos por la diferencia respecto de su media de su pareja en la otra serie tendremos el valor de la autocovarianza de orden 1. Nos queda:





Con nuestro ejemplo tendríamos: ACV1 =4,8 y por supuesto, ACV0=SSX=7,54 ya que para desfase cero las dos series son la misma.



AUTOCORRELACIÓN.



El coeficiente de correlación entre X(t) y X(t+1) se estima como la razón entre la covarianza de X(t) y X(t+1) y el producto de las desviaciones estándar de X(t) y X(t+1)



ACR1=ACV1/√SSXt*SSXt+1





en nuestro caso tendremos ACR1=4,8/√7,06*7,78 = 0,648

El coeficiente de correlación es una manera de “normalizar” la covarianza ya que su recorrido se extiende entre -1 y +1

Si el número de datos es razonablemente grande el producto de las desviaciones estándar de X(t) y X(t+1) es, aproximadamente igual a la varianza de la señal original por lo que el coeficiente de autocorrelación quedará definido como la razón entre la covarianza de las dos series respecto de la varianza de la serie original.

Se puede razonar de forma semejante para el coeficiente de autocorrelación de orden dos generando las series;



X(t+0)= x1, x2, ….x n-2

X(t+2)= x3, x4, ….x n



y obtener el correspondiente coeficiente de autocorrelación de forma semejante como la razón entre la covarianza de las dos series y el producto de las desviaciones estándar de ambas, o simplificando y perdiendo exactitud como la razón entre la covarianza de las dos series y la varianza de la serie original.

Generalizando se puede obtener el coeficiente de autocorrelación de orden k generando las series:

X(t+0) = x1, x2, ….x n-k

X(t+k) = xk+1, xk+2, ….x n



La fórmula genérica para el coeficiente de autocorrelación de orden k quedaría, por lo tanto de la forma:

ACRk = ACV X(t) X(t+k)/ S X(t) * S X(t+k)

dónde.


ACV X(t) X(t+k)=



que es la forma genérica para la autocovarianza, y

y


S X(t) =



y



S X(t+k) =



que son las desviaciones de las serie X(t) y X(t+k) respectivamente.

Teniendo en cuenta que xi se refiere al elemento genérico de la serie original X y que xi (t)y Xi (t+k)serían los elementos genéricos de las nuevas series X(t) y X(t+k) generadas desplazando los valores originales k intervalos.



Cuando tenemos datos estacionarios y por lo tanto los momentos de segundo orden no dependen del tiempo tendremos:





lo cual simplifica mucho el cálculo porque ahora el coeficiente de correlación de orden k se calcula como la relación entre la covarianza de las series de orden k dividido por la varianza muestral o autocovarianza de orden cero .

Es evidente que esto solamente será válido si se cumple que el número de casos es suficientemente grande respecto del orden del coeficiente como para que 1/2N y 1/(2N-k) sean prácticamente iguales.

Siguiendo con nuestro ejemplo tendremos:

para ACR(1) = 4,8/7,54 = 0,637

para ACR(0) = 7,54/7,54 =1

El primer valor está cerca del calculado antes, el segundo siempre es la unidad y puede emplearse para comprobar los errores de cálculo que se hayan podido cometer.



A partir de los coeficientes de autocorrelación se obtiene el correlograma representando el valor de estos en el eje de ordenadas, frente a su correspondiente intervalo en el eje de abscisas. Para cada coeficiente de autocorrelación , se obtendrá un valor comprendido entre -1 y +1. El coeficiente de orden cero es, por definición 1. La inspección del correlograma, puede proporcionar información acerca del proceso que genera los datos y que será analizado, con mas detalle al introducir la función de autocorrelación

El correlograma de una serie temporal en que no se ha eliminado la tendencia, tiende a tomar valores distintos de cero, aunque el número de datos sea grande y el orden del coeficiente también. Por el contrario en una serie temporal estacionaria el correlograma tiende a cero, cuando se incrementa el orden y si la serie es aleatoria los coeficientes de autocorrelación se distribuyen en forma normal, con media cero y desviación uno

Si una serie temporal incluye términos cíclicos, el correlograma mostrará una oscilación de la misma frecuencia, esto permite detectar fácilmente la presencia de ciclos y su frecuencia y por lo tanto su eliminación de la serie. Para ello se resta de cada observación la media de los datos obtenidos en cada periodo detectado por el correlograma. Los coeficientes de correlación de orden k positivos se interpretan como indicación de que los datos con valor superior a la media tienden a ir seguidos, con un intervalo k, por datos con valor mayor que la media o bien que los datos con valor inferior a la media son seguidos, tras un intervalo k, por datos con valor menor que la media. Los coeficientes de orden k negativos implican que datos con valor superior o inferior a la media, son seguidos con intervalo k por datos con valor inferior o superior, respectivamente, a la media. Un coeficiente de orden k, con valor nulo implica que los datos, en ese intervalo, no están relacionados, por ello el correlograma de una señal aleatoria tiende a cero.



En las siguientes figuras se presentan los resultados para la autocorrelación sobre una serie de señales normalizadas para que en todos los casos la media sea la misma (0) y la desviación estándar también (1). El número de casos es 100 y n todos los casos se han calculado los coeficientes de autocorrelación hasta el orden 20.

En el primer caso los valores corresponden a un conjunto de puntos generados al azar y distribuidos de manera uniforme en el recorrido de la señal.

En el segundo caso se añade a los valores al azar una tendencia definida por la linea de pendiente 0,01

En el tercer caso lo que se añade al conjunto al azar es una función periódica en forma de pulso cuadrado.

En el cuarto caso a los valores al azar se añade una función periódica del tipo coseno.



La representación gráfica de los valores obtenidos es:




y los 21 primeros coeficientes de autocorrelación de cada serie:






En las series lo único que se detecta con facilidad es la tendencia lineal creciente. Sin embargo el correlograma detecta con facilidad la presencia de elementos periódicos en las dos últimas, lo que no es, inmediatamente, aparente a la simple inspección de la representación gráfica de la señal.



Recapitulando, en la práctica el análisis en el dominio del tiempo se basa en la obtención de las funciones de autocovarianza y autocorrelación . Conviene transformar la serie a media cero y desviación típica 1. Suponiendo que se cumple la condición de estacionariedad y que el número de muestras es suficientemente grande utilizaremos:





que coincidirá con la autocorrelación al ser las desviaciones de las series la unidad.





El error estándar normalizado para el estimador de la función de autocorrelación de orden k de una muestra de duración T, con media 0 y una banda de frecuencias en X(t) de B ciclos por segundo (hz) es



para k=0 es evidente que e = (1/BT)1/2. Se debe tener en cuenta que:





El error aumenta con el desfase por lo tanto se debe reducir el orden del máximo coeficiente de correlación a calcular. Una regla conservadora sería reducirlo entra 1/5 y 1/10 de los valores que tiene la muestra.



Por otra parte se debe escoger un intervalo de muestreo h tal que h = 1/4Fm, en lugar del valor teórico de 1/2Fm, lo que mejora los resultados para los casos en que la función de autocovarianza tiene frecuencias cercanas a Fc.



Ejemplo.



Si tenemos una señal de la que sabemos que no existen (o si existen han sido filtradas) frecuencias por encima de los 1000 hz deberemos tomar muestras con un intervalo:

h=1/4Fm = 1/4000 = 0,00025 s = 0,25 ms.

Si estamos interesados en estudiar desfases con incrementos de 10 ms entre 0 y 100 ms (10 retardos) y admitimos un error en la estimación de 0,05 tendremos:

e=0.05 ,, e2= 0,0025 por lo tanto 2N=10/0,0025= 4000 puntos

Con muestras cada 0,25 ms y 4000 muestras la duración de la señal será T=2Nh= 1 segundo



Si tenemos en cuenta que nos conviene que el número de muestras sea potencia entera de dos (se comprenderá mejor al estudiar la transformada rápida de Fourier) entonces tomaríamos 4096 muestras (212) que a una frecuencia de 4000 hz (0,25 ms) hará que el tiempo de registro de la señal sea de 1,024 segundos

En el análisis de Fourier podremos calcular hasta 1024 armónicos, desde la frecuencia fundamental 1/1,024= 0,977 hz hasta 0,977 *1024= 1000 hz


FUNCIÓN DE AUTOCORRELACIÓN Y FUNCIÓN DE DENSIDAD ESPECTRAL.


En los años 30 Wiener y Khintchin manifestaron que la función de autocorrelación y la función de densidad espectral de potencia eran un par de transformadas de Fourier. La función de autocorrelación es pues la transformada inversa de Fourier de la densidad espectral. Para el caso continuo en una función x(t) donde F(ω) es la función de densidad espectral y ACR(τ ) es la función de autocorrelación de x(t):


y


En la estimación de la función de densidad espectral, a partir de la función de autocorrelación se ha de tener en cuenta que la resolución con la que se obtendrá el estimador vendrá limitado por el número m de desfases utilizados al calcular esta en la forma B=1/mh =2Fm/m. Por lo tanto, cuanta mayor resolución se desee en la estimación de la densidad espectral mayor debe ser m. En el ejemplo anterior con m=10 y Fm =1000. tendremos B=2000/10 =200 hz. El problema es que cuanto mayor sea m, para un mismo error estándar normalizado, mayor es el número de puntos a analizar y por lo tanto el tiempo de computación.

El estimador de la FDE que se obtiene es sesgado, por lo que conviene proceder a su alisamiento utilizando, por ejemplo, una ventana del tipo de Hanning . Para ello el estimador de orden k se recalcula empleando:


FDEk = 0,25 FDEk-1 + 0,5 FDEk +0,25 FDEk+1

 

Se acaba de ver como es posible, obtener la función de densidad espectral a partir de la de autocorrelación , sin embargo en la actualidad, el sistema que se utiliza es precisamente el opuesto. La razón es que la introducción del algoritmo de la Transformada Rápida de Fourier (Fast Fourier Transform) permite mejorar el tiempo de computación procediendo en orden inverso. De hecho el tiempo de computación clásico está relacionado con el número de puntos y supone un número de operaciones del orden de (2N)2, mientras que el algoritmo de FFT emplea 2N*LOG22N. Para 4096 puntos tendríamos casi 17 millones de operaciones en el primer caso y 50.000 en el segundo.

La estimación de la FDE a partir de la autocorrelación se mantiene en los casos en que la función x(t) que nos interesa no tenga transformada de Fourier por no ser “cuadrado” integrable como ocurre con algunos tipos de señales estocásticas.

La obtención de la serie de Fourier a partir de los datos es de lo que trata el tema siguiente.

 

 

 

Para regresar utilice el botón atrás de su navegador.

última revisión lunes, 29 agosto 2011 por miguel de córdoba