Gráfico aleatorio

En matemáticas , un gráfico aleatorio es un gráfico que se genera mediante un proceso aleatorio . El primer modelo de gráficos aleatorios fue popularizado por Paul Erdős y Alfréd Rényi en una serie de artículos publicados entre 1959 y 1968.

Los dos modelos básicos de Erdős y Rényi

El modelo de Erdős y Rényi, de hecho, reúne dos modelos, formalmente diferentes, pero estrechamente relacionados. En ambos modelos,

El gráfico aleatorio binomial

En este modelo, a menudo cada uno de los n ( n –1) / 2 bordes está presente con probabilidad p , ausente con probabilidad 1- p , independientemente del estado de los otros bordes. El caso p = 0,5 fue estudiado por Erdős ya en 1947. El número N p de aristas sigue la distribución binomial de los parámetros n ( n –1) / 2 y p .

El gráfico aleatorio uniforme

En este modelo, mencionado a menudo, elegimos uniformemente un subconjunto de M aristas entre las n ( n –1) / 2 aristas posibles. Cuando una gráfica G con n vértices tiene M aristas, la probabilidad de G viene dada por

Este es el modelo que se estudia principalmente en la serie de artículos seminales publicados por Erdős y Rényi entre 1959 y 1968.

Los dos procesos aleatorios con valores gráficos

Obtenemos así una familia creciente, de gráficas aleatorias, que forma un proceso de tiempo continuo, con valores en el conjunto de gráficas. Esta familia está aumentando en el sentido de la inclusión del conjunto de aristas: una arista e presente en también está presente en ya que Cada término de la familia de grafos es un grafo aleatorio binomial definido previamente.

Metáfora. Podemos imaginar los vértices del gráfico como n islas en un lago, que se comunican con la ayuda de pasarelas (bordes e ), sumergidas a las respectivas profundidades T e debajo de la superficie del agua. Si el lago se vacía gradualmente de agua, veremos que los puentes emergen gradualmente y se forman componentes relacionados que unen más y más islas.

Vínculos entre los dos modelos

En virtud del Teorema del límite central , o la desigualdad de Hoeffding , la ley del binomio está muy concentrada en torno a su expectativa. Más precisamente, el número de aristas N p de un gráfico de ley aleatoria es, por tanto, muy cercano, especialmente si esta última cantidad es grande delante de n  :

Además, la distribución condicional de saber que N p = M es precisamente Por esta razón, si M está cerca o, de manera equivalente, si

En general se acepta (y a menudo demostrado) que los dos modelos y tienen propiedades muy similares.

Yendo más allá, denote por T ( k ) el k -ésimo valor de la secuencia una vez que esta última secuencia está dispuesta en orden ascendente: la secuencia se llama secuencia de orden estadístico de la secuencia Cuando p toma el valor aleatorio T ( M ) , Entonces es exactamente Para corroborar las observaciones anteriores, tenga en cuenta que T ( M ) está muy cerca en el sentido de que, como consecuencia de los famosos resultados de Donsker y Kolmogorov , la probabilidad

satisfecho

la 1 st y 4 th  términos siendo las colas de la distribución de los Rayleigh y Kolmogorov leyes , respectivamente: en resumen, el supremo (cuando M varía) de los errores es del orden de 1 / n .

Orden y crecimiento

Un gráfico puede verse como una parte del conjunto J de bordes, por lo que el espacio de probabilidad es aquí omega todas las partes de J , que a veces pueden identificar {0,1} J . Esta identificación es particularmente útil cuando queremos aplicar la desigualdad de Harris .

De manera equivalente, se dice que una parte A de Ω aumenta si su función indicadora aumenta. Ejemplos:

Entre las propiedades y parámetros de un gráfico,

Tenemos la siguiente desigualdad:

Desigualdad de Harris  :  en el marco del gráfico aleatorio binomial ,

Notas:

Conectividad

El umbral de conectividad

Teorema (Erdős, Rényi, 1960)  -  Sea a n = np ( n ) - ln n , o nuevamente:

Decimos que ln ( n ) / n es un umbral estrecho para la propiedad de conectividad, la estrechez se refiere al hecho de que la propiedad se satisface incluso si tiende al infinito estrictamente menos rápido que

Demostración

Nos damos un gráfico aleatorio G n con ley y un gráfico aleatorio con ley. El teorema se deriva del teorema doble exponencial , que a su vez se deriva de la enumeración de puntos aislados realizada en la siguiente sección. La conectividad es una propiedad creciente , por lo tanto, tan pronto como n sea ​​lo suficientemente grande como para

también tenemos

De hecho, incluso si eso significa construir y usar las mismas variables uniformes iid , en el mismo espacio de probabilidad Ω, como se indica en la sección “Los dos procesos aleatorios con valores gráficos” , tenemos, para todo ω de Ω,

Entonces

y

Si se sigue que, para cualquier número real c ,

o incluso

Por otro lado, si entonces, para n suficientemente grande, tendremos, para todo ω , y

Por lo tanto, para cualquier número real c ,

Enumeración de puntos aislados

Es más fácil (más probable) tener éxito en cortar las n - 1 conexiones entre un punto y su complemento, que las k ( n - k ) conexiones entre un grupo de k puntos y su complemento, porque la función f ( k ) = k ( n - k ) aumenta muy rápidamente alrededor de 1, por lo tanto, a medida que k aumenta, hay muchos más bordes para cortar y una probabilidad mucho menor de cortarlos todos con éxito. Como corolario, con la elección del parámetro p realizada anteriormente, el gráfico G ( n , p ) estará desconectado “casi solo” si tiene puntos aislados, en el sentido de que la probabilidad de estar conectado es muy cercana a la probabilidad de no tener puntos aislados, que es aproximadamente igual a e –e - c De hecho, tenemos el siguiente resultado:

Puntos aislados (Erdős, Rényi, 1960).  -  Supongamos que

Entonces, el número X n de puntos aislados del gráfico converge en derecho hacia una distribución de Poisson del parámetro e - c .

Demostración

En lo que sigue, se abrevia en y nos planteamos

Sea X n el número de puntos aislados de Sabemos que

o

Usemos el método de los momentos factoriales. Sea I n , A el conjunto de inyecciones de en Para todos

Los términos de la suma anterior aparecen de hecho en la expansión de pero, aparte de estos términos, esta expansión trae muchos otros términos que aparentemente chocan. De hecho, ya sea

Entonces

Entonces

Además, por simetría,

donde r ( n -1) es el número de aristas que potencialmente resultan de un vértice de E , y donde r ( r -1) / 2 es el número de aristas entre dos vértices de E , es decir. los que se cuentan por duplicado en el total r ( n -1) . Entonces

Por lo tanto, por el método de momentos, X n converge en ley a una distribución de Poisson con parámetro μ , y

Este teorema es una ilustración sorprendente del paradigma de Fish , que, cuando presenta muchas oportunidades para observar un evento raro ( es decir, improbable), entonces el número total de eventos raros observados sigue una ley de Poisson .

El teorema de la doble exponencial

Erdős y Rényi deducen un resultado más preciso que la propiedad de umbral estrecho:

Teorema de doble exponencial (Erdős, Rényi, 1960)  -  Suponga que

Entonces Demostración Si no tiene un punto aislado, entonces hay pocas posibilidades de que sea ​​algo más que conectado (cf. Spencer, 10 conferencias sobre gráficos aleatorios ). De hecho, sea B parte y sea k su cardinal. Denotemos el evento "  B es un componente conectado de  ". El evento puede verse como la unión (no disjunta) de k k -2 subconjuntos de probabilidades

lo que conduce al siguiente aumento:

Aquí denota el número de árboles de expansión posibles para un gráfico conectado cuyos vértices serían los elementos de B , o incluso, de manera equivalente, el número de opciones posibles de una familia de k -1 aristas que hace que el conjunto B esté relacionado. Además, ¿ es la probabilidad de que las aristas k -1 del árbol de expansión considerado estén realmente presentes, y es la probabilidad de que no exista ninguna arista que conecte un vértice de B con un vértice de B c , de modo que B es decir, no solo esté conectado , pero también máxima entre las partes conectadas del gráfico.

El evento

comprobado

De hecho, bajo la hipótesis D n , tiene varios componentes conectados, por lo tanto, el más pequeño de ellos (en el sentido del número de vértices) tiene como máximo n / 2 vértices, pero este componente conectado más pequeño tiene al menos dos vértices, ya que X n = 0 . Entonces

Sin embargo, para α > 0 ,

desde que

Así como un componente conectado de tamaño superior a 2 es mucho menos probable que un componente conectado de tamaño 1, un componente conectado de tamaño superior a 3 es mucho menos probable que un componente conectado de tamaño 2, lo que da como resultado un

Propiedad  :  cuando n tiende a infinito

Algunos cálculos algo dolorosos, sin ser francamente difíciles, conducen a este resultado.

Demostración

El límite dado arriba para u 2 ( n ) no es solo un límite superior, sino que de hecho da el orden de magnitud de u 2 ( n ) . En cuanto al resto de la suma, tenemos que cortarlo en dos antes de aumentar cada una de las dos piezas:

o

Por y

desde que

Por lo tanto, para n lo suficientemente grande, disminuye más rápido que una secuencia exponencial de razón cuando y

Además, porque podemos encontrar c y ρ positivos, de modo que, para todos

Por y

tan pronto como n sea ​​lo suficientemente grande. Por lo tanto, para y lo suficientemente cerca de 0.5, lo suficientemente cerca de 1,

y

En consecuencia

Denotemos por T n el primer instante t donde se conecta la gráfica :

de manera que

Entonces podemos ver el teorema de la doble exponencial como resultado de la expansión asintótica de T n  : si Z n está definido por la siguiente relación:

entonces el teorema de la doble exponencial establece que Z n converge en derecho hacia la distribución de Gumbel , lo que podría traducirse, en una versión probabilística de la notación de Landau , por:

El gráfico aleatorio infinito

Erdős y Rényi generalizaron el modelo binomial al caso de un gráfico infinito contable , mostrando que entonces obtuvimos ( casi seguramente ) un gráfico que tiene propiedades de universalidad (que contiene en particular cualquier gráfico finito o contable como un subgráfico ); este gráfico se ha redescubierto varias veces y se conoce con mayor frecuencia como el gráfico de Rado .

Ver también

Notas

  1. El primer artículo, publicado en 1959 , es "On Random Graphs I", Publ. Matemáticas. Debrecen 6, 290.
  2. (en) P. Erdős , "  Algunas observaciones sobre la teoría de los gráficos  " , Bull. Amargo. Matemáticas. Soc. , vol.  53, n o  4,1947, p.  292-294 ( leer en línea ). A menudo se considera que este artículo marca el nacimiento del "método probabilístico" para el estudio de gráficos no aleatorios, en particular para la teoría de Ramsey .
  3. Para antecedentes, consulte (en) el Sr. Karoński Ruciński y A., "Los orígenes de la teoría de gráficos aleatorios" , en The Mathematics of Paul Erdős , Berlín, Springer al.  “Algoritmos Combin. "( N o  13),1997, p.  311-336.
  4. Para obtener más detalles, consulte Janson, Łuczak y Ruciński 2000 , cap. 2, "Probabilidades exponencialmente pequeñas".
  5. Ver Janson, Łuczak y Ruciński 2000 , sección 1.4, “Equivalencia asintótica”, p. 14.
  6. Ver (en) Galen R. Shorack y Jon A. Wellner , Procesos empíricos con aplicaciones a la estadística , SIAM ,septiembre de 2009, 998  p. ( ISBN  978-0-89871-684-9 , leer en línea ), sección 3.8, “Limitación de distribuciones bajo la hipótesis nula”, pág. 142 y cap. 18, “El proceso cuantílico estandarizado”, pág. 637.
  7. Janson, Łuczak y Ruciński 2000 , Th. 6.7, p. 144.
  8. Véase el artículo “  biyección de Joyal  ”, o Martin Aigner y Günter M. Ziegler, divina razonamientos , 2 ª  edición, 2006, p. 195-201, fórmula de Cayley para el número de árboles .

Bibliografía

Artículo relacionado

Introducción de probabilidades en la teoría de grafos

Enlace externo

Laurent Massoulié, Redes: control distribuido y fenómenos emergentes , 2015

<img src="https://fr.wikipedia.org/wiki/Special:CentralAutoLogin/start?type=1x1" alt="" title="" width="1" height="1" style="border: none; position: absolute;">