Ley normal multidimensional

Distribución normal multidimensional
configuraciones media ( vector real) matriz de varianza-covarianza ( matriz real positiva definida )
Apoyo
Densidad de probabilidad
Esperanza
Mediana
Moda
Diferencia
Asimetría 0
Entropía
Función generadora de momentos
Función característica

Llamamos a la ley normal multidimensional , o normal multivariante o ley multinormal o la ley de Gauss con varias variables , una ley de probabilidad que es la generalización multidimensional de la ley normal .

Mientras que la ley normal clásica está parametrizada por un escalar μ correspondiente a su media y un segundo escalar σ 2 correspondiente a su varianza, la ley multinormal está parametrizada por un vector que representa su centro y una matriz semidefinida positiva que es su matriz de varianza. -covarianza . Lo definimos por su función característica , para un vector ,

En el caso no degenerado donde Σ es positivo definido , por lo tanto invertible , la ley normal multidimensional admite la siguiente densidad de probabilidad :

señalando | X | el determinante de X ,

Esta ley generalmente se observa por analogía con la ley normal unidimensional.

Ley no degenerada

Esta sección se enfoca en la construcción de la distribución normal multidimensional en el caso no degenerado donde la matriz de varianza-covarianza Σ es definida positiva.

Recordatorio sobre la ley normal unidimensional

El teorema del límite central muestra una variable gaussiana centrada reducida U (media cero, varianza unitaria):

Pasamos a la variable gaussiana general cambiando la variable

lo que lleva a

La densidad de esta ley se caracteriza por un exponencial que incluye un exponente de segundo grado.

Ley unitaria con varias variables

Dadas N variables aleatorias independientes con la misma ley de Gauss de centro reducido, su densidad de probabilidad conjunta se escribe:

Es la ley que está en la base de la ley de χ² .

Se puede sintetizar en fórmulas matriciales. Primero definimos el vector aleatorio U que tiene las N variables como componentes y el vector de estado u que tiene sus valores digitales como componentes.

Podemos asociar con el vector de estado el vector de media que tiene como componentes las medias de las componentes, es decir, en este caso, el vector cero:

La matriz de covarianza tiene elementos diagonales (las varianzas) que son iguales a 1 mientras que los elementos no diagonales (las covarianzas en sentido estricto) son cero: es la matriz unitaria. Se puede escribir usando la transposición:

Finalmente, la densidad de probabilidad se escribe:

Ley general con varias variables

Se obtiene de un cambio de variable afín

El problema se limita al caso de que una matriz sea cuadrada (mismo número de variables de salida) y regular. Siendo lineal el operador de expectativa vectorial, obtenemos el vector medio

y la matriz de covarianza

La densidad de probabilidad está escrita

Observaciones varias

el t jk siendo los coeficientes de la inversa de la matriz de covarianza.

Distribuciones condicionales

Si , y están particionados como se describe a continuación

con las dimensiones donde con dimensiones

y

entonces la distribución de condicionalmente a es una distribución normal multidimensional donde

y la matriz de varianza-covarianza se escribe

Esta matriz es el complemento de Schur de en .

Tenga en cuenta que saber que a es igual a cambia la varianza de y que, sorprendentemente, la media también se modifica. Esto hay que compararlo con la situación en la que no conocemos a , en cuyo caso se dispone de distribución . ¡Esto resulta de la condición que no es trivial!

La matriz se llama matriz de coeficientes de regresión .

Propiedades

Simulación

Para simular una ley multinormal cuyos parámetros son conocidos o estimado, es decir, y , buscamos generar una artificiales muestra de vectores independientes de .

Si C no es diagonal , no es posible producir sucesivamente las n variables X i , porque este método no respetaría las covarianzas.

Más bien, el enfoque consiste en expresar el vector X como una combinación lineal de variables escalares independientes de la forma

donde B es una matriz cuadrada que satisface la restricción

Una propiedad de la covarianza muestra en efecto que esto asegura que la restricción de covarianza es x respetados .

Después de determinar B , simplemente generar simulaciones de Y i para (utilizando la relación anterior) versiones independientes del vector X .

Hay varias posibilidades para elegir B  :

donde O es una matriz ortogonal cuyas columnas son vectores propios de C , y D es una matriz diagonal formada por los valores propios de C , todos positivos o cero. Solo tienes que elegir .

Notas:

  1. Aunque estos enfoques son equivalentes en teoría, el segundo es numéricamente preferible porque exhibe una mejor estabilidad cuando la condición de la matriz de covarianza es "mala".
  2. Muy a menudo, un generador de números pseudoaleatorios repite los valores de una serie limitada (encontramos los mismos resultados después de llegar al final de la serie). Cuidado con este aspecto a la hora de generar un gran número de simulaciones de un vector multinormal de gran tamaño n : la independencia ya no estará garantizada tras el agotamiento de la serie.

Aplicaciones

La ley normal multidimensional se utiliza en particular en el procesamiento de imágenes médicas. Por tanto, se utiliza con frecuencia, por ejemplo, en la formación de imágenes del tensor de difusión . De hecho, estas imágenes modelan la distribución de las principales direcciones de difusión del agua mediante una ley normal multidimensional con media cero. Así, el tensor en cada punto de la imagen no es más que la matriz de covarianza de la ley normal multidimensional.

Una segunda aplicación de la distribución normal multivariada es la determinación, a partir de las intensidades en la RM del cerebro de un paciente, las diferentes clases de tejidos ( sustancia gris , sustancia blanca , líquido cefalorraquídeo ) que lo componen. Esta técnica se basa en el uso de un algoritmo de maximización de expectativas en el que cada una de las clases es modelada por una ley normal multidimensional cuya dimensión es igual al número de modalidades utilizadas para la clasificación.

Notas y referencias

  1. (in) DV Gokhale, NA Ahmed, BC Res, NJ Piscataway, "  Estimadores de entropía para expresiones y sus distribuciones multivariantes  " , IEEE Transactions on Information Theory , vol.  35, n o  3,Mayo de 1989, p.  688–692
  2. Véase, por ejemplo (en) Michael Bensimhoun , "  función acumulativa N-dimensional y otros datos útiles acerca de gaussianas y Normal Densidades  " [PDF] ,2006

Artículos relacionados

<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">