IID Significado e Interpretación para Principiantes

Significado e Interpretación de IID para Principiantes

Independiente e Independientemente Distribuido

Foto de Yu Kato en Unsplash

En estadística, análisis de datos y temas de aprendizaje automático, el concepto de IID aparece con frecuencia como una suposición o condición fundamental. Significa “independiente e independientemente distribuido”. Una variable o secuencia IID es un componente importante de modelos estadísticos o de máquina, y también desempeña un papel en el análisis de series temporales.

En esta publicación, de manera intuitiva, explico el concepto de IID en tres contextos diferentes: muestreo, modelado y previsibilidad. Se presenta una aplicación con código R en el contexto del análisis de series temporales y la previsibilidad.

IID en el Muestreo

La notación X ~ IID(μ,σ²) representa el muestreo de (X1, …, Xn) de manera puramente aleatoria de la población con media μ y varianza σ². Es decir,

  • cada realización sucesiva de X es independiente, sin mostrar ninguna asociación con la anterior o con la siguiente; y
  • cada realización sucesiva de X se obtiene de la misma distribución con media y varianza idénticas.

Ejemplos

Supongamos que se recopila una muestra (X1, …, Xn) de la distribución de los ingresos anuales de los individuos de un país.

  1. Un investigador ha seleccionado el ingreso de un hombre para X1, una mujer para X2, un hombre para X3, luego una mujer para X4, y este patrón se mantiene hasta Xn. Este no es un muestreo IID, porque un patrón predecible o sistemático en el muestreo no es aleatorio, violando la condición de independencia.
  2. Un investigador ha seleccionado (X1, …, X500) del grupo más pobre de individuos y luego (X501, …, X1000) del grupo más rico. Este no es un muestreo IID, porque los dos grupos tienen diferentes distribuciones de ingresos con diferentes medias y varianzas, violando la condición de identidad.

IID en el Modelado

Supongamos que Y es la variable de interés que desea modelar o explicar. Entonces, se puede descomponer en dos partes: a saber,

Y = Componente Sistemático + Componente No Sistemático.

El componente sistemático es la parte de Y impulsada por la relación fundamental con otros factores. Es el…

We will continue to update Zepes; if you have any questions or suggestions, please contact us!

Share:

Was this article helpful?

93 out of 132 found this helpful

Discover more

Aprendizaje Automático

Rompiendo barreras en el diseño de proteínas con un nuevo modelo de IA que comprende interacciones con cualquier tipo de molécula.

Después de la revolución iniciada por AlphaFold de Deepmind en biología estructural, el campo estrechamente relaciona...

Inteligencia Artificial

Escala el entrenamiento y la inferencia de miles de modelos de aprendizaje automático con Amazon SageMaker

Entrenar y servir miles de modelos requiere una infraestructura robusta y escalable, y ahí es donde Amazon SageMaker ...

Inteligencia Artificial

Nueva investigación de IA de KAIST presenta FLASK un marco de evaluación de granularidad fina para modelos de lenguaje basado en conjuntos de habilidades

Increíblemente, los LLM han demostrado estar en sintonía con los valores humanos, brindando respuestas útiles, honest...