[MÚSICA] [MÚSICA] [MÚSICA] Bienvenidos. En este video vamos a ver cómo se calcula una media móvil ponderada, que luego vamos a utilizar para mejorar nuestro algoritmo de descenso de gradiente. Supongamos que tenemos una serie temporal con la temperaturas diarias para una determinada ciudad a lo largo de todo un año. Si graficamos dicha serie temporal, vamos a ver que existe una tendencia clara en los datos y que sin embargo entre observación y observación, existen una gran cantidad de ruidos que nos complicarían el análisis. Podemos suavizar esta serie, aplicando una media móvil. Para lo cual lo que podremos hacer es que para cada punto dado, tomar n observaciones hacia atrás y calcularles el promedio, que son mucho más que una móvil lineal. Nosotros vamos a utilizar algo similar para ayudar a optimizar nuestro descenso de gradiente, utilizando lo que se llama una media móvil ponderada. Para ello vamos a partir de V que sea igual a 0 y a partir del momento dos, vamos a empezar a calcular un coeficiente que lo vamos a generalizar, en este caso es 0,9 que multiplicamos por el V0 del estado anterior, sumado a el coeficiente 0,1 por la observación en el momento 1. Luego el siguiente momento V2 vamos a usar el V siguiente, multiplicando 0,9 por el estado anterior y sumándolo 0,1 por el estado actual de temperatura. Esto lo podemos generalizar de tal manera que tengamos nuestro Vt en cada momento de tiempo que sea 0,9 por Vt menos 1, sumado al 0,1 multiplicado por la temperatura en el día que estoy parado el texto. [MÚSICA] Ahora le tenemos nuestra fórmula para calcular la media móvil ponderada. Podemos generalizar nuestro coeficiente de 0,9 y 0,1 llamándolos V al primero de ellos y 1 menos V al segundo, dado que la suma de estos dos coeficientes, tiene que dar igual a uno. Además podemos calcular empíricamente, que la cantidad de días promedios que va a calcular nuestra media móvil ponderada, va a ser similar a 1 dividido 1 menos V, esto no es exactamente así, dado que en realidad nuestra media móvil ponderada toma todos los días de la serie en consideración, pero a partir de esta cantidad de días, los días anteriores pasan a ser tan poco relevantes, que podemos excluirlos. Esto significa que si tenemos un coeficiente de B de 0,9, estamos hablando aproximadamente de 10 días de promedio ponderado en nuestra media. En una serie de [INAUDIBLE] podría hacerse de esta manera. A medida que hacemos crecer ese valor, por ejemplo llevándolo a 0,8 ohms, lo que tenemos es que tenemos un promedio aproximadamente de 50 días. Y en este caso la serie se va a ver de una forma mucho más avanzada, con lo cual va a tener menos ruido incorporado, pero va a generar un alfetazo en el seguimiento de la tendencia, es decir va a tardar más en continuar la tendencia de nuestra serie. Si por otro lado llevamos a un V muy pequeño, por ejemplo a 0,50, que seria un equivalente a dos días de mega móvil, esto va a generar una serie tan parecida como la serie original, es decir con mucho ruido y muchas subidas y bajadas, pero que acompaña muy seguidas la tendencia de nuestra serie completa. Vamos a intentar ahora de construir ahora esta ecuación, para entender que sucede en cada momento. Dijimos que tenemos nuestros V1, V2, V3, V4 hasta Vn en cada momento del tiempo, donde cada una de estas ecuaciones toma el V en el tiempo anterior como parte de su cálculo. Comencemos ahora invirtiendo el orden de los dos factores de la suma, es decir 0,1 por la observación número cuatro, más 0,9 por V3 que calculamos en el paso anterior. Este V3 lo podemos reemplazar justamente usando la fórmula de la línea anterior, lo que llevaría a decir que V4 es igual a 0,1 por las temperaturas en el momento 4 más 0,9 por 0,1 en el momento de la observación 3, más 0,9 al cuadrado de V2, que nuevamente podemos reconstruirlo usando la fórmula de la línea anterior a esa y así hasta llegar al principio de nuestra serie, que si nos fijamos lo que significa es que empezamos a tener el último término siempre con una exponencialidad a un grado mayor. ¿Esto qué significa? Que si lo graficamos a estos coeficientes, tenemos un exponencial negativa de cada día anterior al mundo en donde estamos llegando, que obviamente va a ser mayor a medida que tengamos un valor de coeficiente más pequeño, es decir que el segundo término sea mayor. La suma de estos coeficiente si nos fijamos, tiene que ser igual a 1 y va a ser decreciente dependiendo de cuanto tiempo veamos, por eso decimos que en realidad, cuando 0,9 es equivalente a 10 días, eso es cierto por la representatividad que tienen esos coeficientes, pero en la práctica estamos usando todos los demás coeficientes, solo que en valores muy pequeñitos, ellos pasan a ser irrelevantes. Un último punto que vale la pena mencionar, es la corrección al sesgo que debemos realizar a nuestra media móvil ponderada. Si tenemos nuestra ejemplo nuevamente, nuestra serie temporal con estas observaciones y queremos calcular una media móvil ponderada sobre esta serie, similar a esta serie verde que vemos en pantalla, lo que vamos a tener si aplicamos esta fórmula que hablamos hasta ahora, es una línea más bien parecida a esta línea violeta. ¿Y porqué será eso? Porque básicamente nosotros estamos arrancando con un V0 igual a 0. Y luego en todos los primeros V1, V2, la mayor ponderación de nuestra media móvil ponderada, sigue estando en este valor que arrastra ese 0. Recién a partir de una cantidad significativa de observaciones, empezamos a tener una verdadera media móvil ponderada, que es donde la línea verde se solapa con la línea violeta. Para evitar esa separación y poder corregir ese sesgo que tenemos inicial, lo que vamos hacer va ser es a cada momento de Vt dividirlo por 1 menos V elevado a la t. Eso va a ser el cálculo que al principio haya una corrección grande, que lo que hace es que se uniría la línea verde con la violeta y a partir de que pasa más el tiempo, esto entonces se va a volver más pequeño, con lo cual va dejar de tener importancia, con lo cual la series van a continuar en conjunto. Esto no es sumamente importante aplicar en la práctica, porque si siempre vamos a tener muchas observaciones y vamos a tomar en un punto futuro del tiempo, pero vale la pena saber que sí es verdadero el cálculo corregido de esta serie. En este video vimos entonces cómo calcular nuestra media móvil ponderada y cómo hacer la corrección inicial del sesgo, para evitar esa separación tendiente a 0. Aunque cómo dijimos, no es siempre necesario hacerlo en la práctica. Ahora bien, vamos a utilizar esta media móvil ponderada que aprendimos a calcular, para mejorar la optimización que utilizamos por descenso de gradiente en los próximos videos. Muchas gracias.