Convergencia de variables aleatorias

En la teoría de la probabilidad , existen diferentes nociones de convergencia de variables aleatorias . La convergencia (en uno de los sentidos que se describen a continuación) de secuencias de variables aleatorias es un concepto importante de la teoría de la probabilidad que se utiliza en particular en estadística y en el estudio de procesos estocásticos . Por ejemplo, la media de n variables aleatorias independientes e idénticamente distribuidas casi seguramente converge a la expectativa común de estas variables aleatorias (si existe). Este resultado se conoce como la ley fuerte de los grandes números .

En este artículo, asumimos que ( X n ) es una secuencia de variables aleatorias reales , que X es una variable aleatoria real y que todas estas variables están definidas en el mismo espacio de probabilidad .

Convergencia jurídica

Dejar que F 1 , F 2 , ... el resultado de las funciones de distribución asociadas a variables aleatorias X 1 , X 2 , ... , y F la función de distribución de la verdadera variable aleatoria X . En otras palabras, F n se define por F n ( x ) = P ( X n ≤ x ) y F por F ( x ) = P ( X ≤ x ) .

La secuencia X n converge a X en la ley , o en la distribución , si

para todo real a donde F es continuo .

Dado que F ( a ) = P ( X ≤ a ) , esto significa que la probabilidad de que X pertenezca a un cierto intervalo es muy cercana a la probabilidad de que X n esté en este intervalo para n suficientemente grande. A menudo se observa convergencia en la ley

o

La convergencia en derecho es la forma más débil en el sentido de que, en general, no implica las otras formas de convergencia que se definen a continuación, mientras que estas otras formas de convergencia implican convergencia en derecho. Este es el tipo de convergencia que se utiliza en el teorema del límite central .

De manera equivalente, la secuencia ( X n ) converge en ley a X si y solo si para cualquier función acotada continua

Teorema de continuidad Levy  -  Let φ n ( t ) la función característica de X n y φ ( t ) que el de X . Entonces

.

En otras palabras, ( X n ) converge en distribución a X si y sólo si la función característica de la verdadera variable aleatoria X n converge simplemente a la función característica de la verdadera variable aleatoria X .

Ejemplo: teorema del límite central:

La media de una serie de variables aleatorias cuadradas integrables y centradas, independientes y de la misma ley, una vez renormalizadas por n converge en ley hacia la ley normal

Ejemplo: convergencia de la ley de Student:

El parámetro de distribución de Student k converge, cuando k tiende a + ∞ , a la ley de Gauss  :

En este caso, también podemos utilizar el lema de Scheffé , que es un criterio de convergencia de una serie de variables aleatorias de densidad hacia una variable aleatoria de densidad .

Ejemplo: ley degenerada:

La secuencia converge en derecho hacia una variable aleatoria X 0 denominada degenerada, que toma un solo valor (0) con probabilidad 1 (a veces hablamos de masa de Dirac en 0, anotado δ 0 ):

Convergencia en probabilidad

Definición  -  Sea ( X n ) n una serie de variables aleatorias reales definidas en el mismo espacio de probabilidad . Decimos que X n converge a X en probabilidad si

A veces notamos

o

Lema  :  si tenemos las siguientes convergencias, respectivamente en ( E , d ) y en

entonces tenemos

en el espacio E × E provisto de la distancia infinita.

Demostración

Deje F un cerrado E × E . Para todo ε > 0 denotamos

Entonces

Pasar el limsup se obtiene utilizando los dos supuestos y el perchero del teorema de 3  puntos e

luego, al hacer que ε tiende hacia 0, ya que F está cerrado

Llegamos a la conclusión utilizando de nuevo el 3 er  punto del teorema de perchero.

Propiedad  :  si X n converge a X en probabilidad, entonces X n converge a X en ley .

Demostración

Es una consecuencia del lema anterior al tomar X n = X y al observar que la convergencia en la ley

en es la convergencia en probabilidad

en ( E , d ) .

De lo contrario, puede proceder de la siguiente manera. Comencemos por enunciar un lema.

Lema  -  Sean X , Y variables aleatorias reales, c a real y ε > 0 . Entonces

De hecho, basta con notar que:

La desigualdad sigue naturalmente.

Para todo ε > 0 , debido a este lema, tenemos:

Entonces tenemos

O bien es un punto de continuidad de F X . Fijamos un ε ' > 0 real . Por continuidad de F X en a , existe un ε > 0 real tal que

.

La convergencia de ( X n ) n en probabilidad a X , se puede deducir la existencia de un número entero N tal que: si nN .

Donde: .

Teorema de Slutsky  :  si X n converge en la ley a X , y si Y n converge en la probabilidad a una constante c , entonces el par ( X n , Y n ) converge en la ley al par ( X , c ) .

Convergencia casi segura

Definición  :  decimos que X n casi seguramente converge a X si

o de manera equivalente, si existe un - subconjunto insignificante N ⊂ Ω tal que

También hablamos de convergencia en casi todas partes o con probabilidad 1 o alta , y escribimos

o, en inglés ( casi seguro )

La convergencia casi segura se reescribe como:

o

o

Teorema  :  si X n converge a X casi con seguridad, entonces X n converge a X en probabilidad .

Demostración

Según el lema de Fatou , tenemos para todo ε > 0  :

La convergencia casi segura se usa en la ley fuerte de los grandes números .

Convergencia promedio de orden r

Definición  -  Sea r > 0 y ( X n ) n una serie de variables aleatorias reales definidas en el mismo espacio de probabilidad . Decimos que X n converge a X como un promedio de orden r o como una norma L r si para todos n y si

A veces nos damos cuenta .

Para r = 1, simplemente hablamos de convergencia promedio y para r = 2 de convergencia cuadrática media .

Propiedad  -  Para r > s ≥ 1, la convergencia de la norma implica la convergencia de la norma .

Demostración

Es una aplicación simple de la desigualdad de Jensen con la función convexa

Para r = 2, tenemos el siguiente resultado:

Propiedad  -  Sea c una constante real. Entonces tenemos

si y solo si

Demostración

Esto sigue la siguiente identidad:

Propiedad  :  si X n converge a X en la norma L r , entonces X n converge a X en probabilidad .

Demostración

Es una aplicación directa de la desigualdad de Markov para variables aleatorias reales que admiten un momento de orden r  :

Ejemplo:

La ley débil de los grandes números es una consecuencia directa de estas dos últimas propiedades.

Convergencia de una función de una variable aleatoria

Un teorema muy práctico, generalmente referido en inglés como el teorema de mapeo  (en) , establece que una función continua g aplicada a una variable que converge a X convergerá ag ( X ) para todos los modos de convergencia:

Teorema  -  ( Teorema de mapeo ) Sea una función continua en cualquier punto de un conjunto C tal que  :

Ejemplo:

En estadística , un estimador convergente de la varianza σ 2 viene dado por:

.

Entonces sabemos por el teorema de mapeo continuo que el estimador de la desviación estándar σ = σ 2 es convergente, porque la función raíz es una función continua.

Implicaciones recíprocas

En resumen, tenemos la cadena de implicaciones entre las diferentes nociones de convergencia de variables aleatorias:

La convergencia en probabilidad no implica convergencia ni convergencia casi segura, como muestra el siguiente ejemplo:

Ejemplo:

Sea r > 0 . Consideramos ( X n ) n ≥ 1 una secuencia de variables aleatorias independientes tales que

La secuencia ( X n ) n converge en probabilidad a 0 porque

Por otro lado, no converge porque

Demostremos que tampoco es casi seguro que converja. Si este fuera el caso, su límite casi seguro sería necesariamente su límite de probabilidad, a saber 0. Sin embargo, dado que las variables aleatorias X n son independientes, tenemos por la ley de Borel de cero-uno  :

es decir, es casi seguro que X n = n 1 / r para un infinito de n . Por tanto, es casi seguro que A fortiori X n no converja casi con seguridad en 0.

Ejemplo:

En el ejemplo anterior, para evitar recurrir a la ley cero-uno de Borel, podemos definir explícitamente la secuencia X n de la siguiente manera. Elegimos Ω = [0; 1] provisto de su tribu Boreliana y la medida de Lebesgue . Posamos , para , entonces

Finalmente definimos

Las X n así definidas no son independientes pero verifican como en el ejemplo anterior

Con algunas excepciones, estas implicaciones no son recíprocas, estrictamente hablando. Sin embargo, aquí hay algunas propiedades útiles que podrían describirse como "apariencia de recíproco":

entonces X n converge casi seguramente a X . En otras palabras, si X n converge en probabilidad a X suficientemente rápidamente ( i . E . Los anteriores serie converge para todo ε > 0 ), entonces X n converge casi seguramente como X . Esto resulta de una aplicación directa del teorema de Borel-Cantelli .

. Entonces, la convergencia casi segura de la secuencia ( S n ) n ≥ 1 es equivalente a su convergencia en probabilidad; en otras palabras, la convergencia casi segura de la serie del término general X n es equivalente a su convergencia en probabilidad.

Notas y referencias

  1. Para obtener más información sobre este ejemplo, consulte Davidson y McKinnon 1993 , cap. 4.
  2. Vaart 1998 , p.  7.

Bibliografía

enlaces externos