En este vídeo vamos a presentar y discutir los conceptos de población, muestra aleatoria de una población y estadísticas en el contexto de la estadística inferencial. En términos generales, la estadística inferencial se ocupa de realizar inferencias acerca de las características de una población con base en una muestra aleatoria de dicha población. Las características de las poblaciones se representan por medio de variables de tipo cuantitativo. La motivación principal radica en que en la mayoría de los casos reales de interés práctico no es posible conocer el valor de los parámetros, de las distribuciones de probabilidad, de las variables aleatorias asociadas a características de interés de una población dada. Por ejemplo, no es posible ni observar ni conocer con total precisión cuál es el valor de la proporción "p" de habitantes adultos de Ciudad de México que tienen diabetes, así como tampoco es posible conocer el verdadero valor de la media "mu" del salario anual en dólares de los trabajadores del sector automotriz en Brasil. En general, el valor de los parámetros poblacionales, como la media "mu" y la varianza "sigma" cuadrado, entre otros, no son observables de manera directa. Así que tenemos que recurrir a variables y estadísticas cuyos valores sean observables para poder estimar el valor de dichos parámetros. Dada una población de interés (personas, objetos, entes abstractos) la estadística inferencial se ocupa, entre otros temas, de desarrollar procedimientos estadísticos formales para estimar el valor de un parámetro "tetha" de la distribución de probabilidad "f" sub "x" de "x", parámetro "theta" de una variable aleatoria "x" que representa una característica relevante de dicha población con base en una muestra aleatoria de la población. Se sabe por ejemplo, que la duración en horas de uso de la batería de un teléfono móvil se puede representar de manera apropiada por medio de una variable aleatoria "x" con distribución exponencial de parámetro "lambda" la cual, como sabemos, tiene función de densidad de probabilidad "f" sub "x" de "x" igual a "lambda" por "e" a la menos "lambda" "x", para "x" mayor que cero. El valor del parámetro "lambda" no es directamente observable. Si se trata por ejemplo, de la población conformada por todos los teléfonos móviles de una marca específica y de una referencia particular, tendríamos que tomar una muestra aleatoria representativa de dicha población y para cada uno de los elementos de la muestra aleatoria, observar la variable aleatoria "x" definida como: "la duración en horas de uso de la batería desde el momento en que su carga está completa". Como para cada elemento de la muestra, la duración de la batería es una variable aleatoria entonces obtenemos la representación de la muestra como un vector compuesto por variables aleatorias "x1", "x2" hasta "n", cada una de las cuales representa la duración de la batería para el elemento "i". Una vez observada la muestra, obtenemos resultados específicos para cada uno de los elementos de la muestra de la forma "x1, x2,..., xn" que son números reales, en este caso positivos. Utilizando los valores del resultado de la muestra aleatoria, podemos estimar el parámetro "lambda". En efecto, como veremos más adelante en este curso, un buen estimador para estimar el parámetro "lambda" de una distribución exponencial de parámetro "lambda", está dado por "lambda sombrero igual a uno sobre x barra" donde, como sabemos, "x barra" es la media muestral que está definida como la sumatoria de "xi" de "i" igual uno hasta "n" sobre "n" que es el tamaño de la muestra. Conceptualmente, una muestra aleatoria de tamaño "n" de una población es un subconjunto de "N" elementos de la población seleccionados de acuerdo con un procedimiento aleatorio que garantice su representatividad. Formalmente, una muestra aleatoria de una población con relación a una variable aleatoria de interés "x" consiste en un conjunto "x1, x2,..., xn" de "n" variables aleatorias independientes entre sí, que tienen la misma distribución de probabilidad que la variable aleatoria "x". Por ejemplo, si una variable aleatoria "x" tiene una distribución normal de media mu sub cero y varianza sigma sub cero al cuadrado, cada una de las variables aleatorias que conforman la muestra debe tener distribución de probabilidad normal de media mu sub cero y varianza sigma sub cero al cuadrado. A continuación aparece una ilustración que representa de manera esquemática algunos de los conceptos que acabamos de discutir. Como observamos en el gráfico, se parte de una población dada y de una variable aleatoria de interés "x". Se lleva a cabo un proceso de muestreo para obtener una muestra aleatoria de la variable aleatoria "x". Con base en la muestra aleatoria obtenemos estadísticas que se van a utilizar para estimar los valores de los parámetros poblacionales como la media "mu" y la varianza "sigma" cuadrado, entre otros. A continuación vamos a presentar un ejemplo sencillo en el que se ilustran los conceptos de población variable aleatoria de interés, muestra aleatoria de la población, resultado de la muestra aleatoria y finalmente valor estimado de un parámetro de interés. En este ejemplo vamos a ilustrar cada uno de los conceptos que hasta el momento hemos presentado en el vídeo. La población está conformada por "todos los teléfonos móviles de una marca específica y de una referencia particular". La variable aleatoria de interés "x" está definida como "duración en horas de uso de la batería de un teléfono móvil desde el momento en que su carga está completa". Para este caso, es razonable suponer que esta variable aleatoria "x" tiene una distribución exponencial de parámetro "lambda", la cual, como sabemos, tiene una función de densidad de probabilidad "f sub x de x igual a lambda por e a la menos lambda x", para x mayor que cero, lambda mayor que cero parámetro con valor desconocido. La muestra aleatoria estaría conformada por 100 elementos (teléfonos móviles) de la población de interés. Para cada elemento "i" de la muestra aleatoria se quiere observar la duración de la batería en horas de uso, que es una variable aleatoria "xi". Dicha muestra se representa por el vector "x1", "x2", hasta "x100". Partiendo de la muestra aleatoria, ahora se registra el resultado que produjo cada uno de los elementos de la muestra aleatoria de la variable aleatoria "x". Para efectos ilustrativos, supongamos que se produjeron los resultados que se presentan en la tabla que aparece a continuación. En la tabla observamos que para cada elemento de la muestra, representada por "n", aparece la duración en horas de uso de la batería de ese elemento. A partir de los valores que ha producido la muestra aleatoria que presentamos en la tabla, podemos estimar el valor del parámetro "lambda". En efecto, como ya lo presentamos en este video, un estimador apropiado para el parámetro "lambda" de una distribución exponencial de parámetro "lambda" es igual a "lambda sombrero igual a uno sobre x barra" en donde "x barra", como ya sabemos, corresponde a la media muestral, es decir, la sumatoria de "xi" sobre "n". En el caso que nos ocupa "x barra" sería igual a 1.818,23 que es la sumatoria de los "Xi" dividido por "n" que es igual a 100, así que "x barra" es igual a 18,18, por tanto, el valor estimado para el parámetro "lambda" es uno dividido 18,18, que es aproximadamente igual a 0,055. De esta manera podemos obtener la distribución estimada de la variable aleatoria exponencial que hemos presentado como ejemplo en este caso. En efecto, la función de densidad estimada de esta variable aleatoria estaría dada por "f" de "x" parámetro "lambda" igual a 0,055. Estaría dada exactamente por 0.055 por "e" a la menos 0,055 por "x". Esta sería la distribución de densidad de probabilidad estimada para la variable aleatoria "X" que hemos discutido en este ejemplo. Con este ejemplo hemos ilustrado, por medio de un caso concreto, los conceptos de población, variable aleatoria de interés, muestra aleatoria de la población, resultado de la muestra aleatoria y finalmente, valor estimado de un parámetro de interés de la población.