Puede acortarlo resumiendo el contenido de ciertas secciones y moviendo su contenido original a artículos detallados o discutiéndolos .
En el campo de la geoestadística , una variable regionalizada ( RV ) es cualquier función matemática determinista para modelar un fenómeno que tiene una estructura más o menos pronunciada en el espacio y / o el tiempo: fenómeno físico o abstracto (financiero, por ejemplo).
Históricamente, los primeros usos del vocabulario y del concepto de “ variable regionalizada ” se referían casi exclusivamente a la distribución de leyes mineralizadas en un depósito minero ; pero esta herramienta encontró posteriormente aplicaciones en campos tan variados como la meteorología y la silvicultura , la batimetría y topografía ( DEM ), el medio ambiente , la agricultura de precisión , la pesca , la epidemiología , la ingeniería civil , cualquier cartografía cuantitativa en general, etc.
Bajo un vocabulario diferente, una variable regionalizada es estrictamente equivalente a la noción física de campo , y más precisamente de campo determinista .
Además de la introducción
En este artículo, y de acuerdo con los hábitos de vocabulario de la comunidad geoestadística francófona, se utilizará el nombre genérico de regionalización para designar la organización espacial (y / o temporal) de los fenómenos estudiados; por extensión y cuando no hay ambigüedad posible, esta palabra a veces designa el fenómeno en sí. Entonces, en general, podemos entender la geoestadística como el estudio de regionalizaciones, en otras palabras, el tratamiento de variables regionalizadas, entendiendo más precisamente aquí por "tratamiento" una sucesión de cuatro etapas:
El punto de vista " Estudio de regionalizaciones " tiene la ventaja de no privilegiar ni un campo de aplicación (a diferencia de " geo- "), ni un método (a diferencia de " -estadísticas "), y por tanto se corresponde mejor con la realidad de las geoestadísticas actuales. En este sentido, y aunque históricamente aceptable, la definición propuesta por Le Petit Larousse parece ser singularmente restrictiva: “ Estimación de depósitos por métodos estadísticos ”.
En Estimate and Choose , Matheron presenta la geoestadística como la práctica de "modelos topo-probabilísticos" : una definición neutral, que también tiene la ventaja de presentar la geoestadística como una disciplina en la unión entre la teoría y la práctica. Pero esta fórmula, aunque rigurosamente descriptiva, puede haber parecido insistir demasiado en el componente teórico y confundir a los profesionales. Y además, propuesto tarde, finalmente no fue retenido por el uso; por el contrario, los usuarios se han acostumbrado a designar simplemente su especialidad con el nombre coloquial de “geotat”.
En su implementación actual, la geoestadística es una cuestión de matemática aplicada : si bien se basa en teorías matemáticas puras ( álgebra lineal , espacios de Hilbert , probabilidades posteriores y procesos estocásticos ), se orienta principalmente hacia aplicaciones concretas, por lo que se enfrenta a la realidad física : datos imprecisos o incompletos, posibles limitaciones técnicas o económicas, problemas a veces mal planteados . Por eso, aún en Estimate and Choose , Matheron no duda desde el principio en describirlo como " un conjunto de modelos, métodos y" trucos ", a menudo poco ortodoxos ". Esta dualidad entre teoría y práctica, entre rigor y pragmatismo, es una constante en el enfoque geoestadístico aplicado.
Finalmente, aunque a veces podemos encontrar la palabra “geoestadística” en la literatura, históricamente es una palabra singular: citemos por ejemplo los tres volúmenes del Tratado de Geoestadística Aplicada de Georges Matheron (ver bibliografía), inicios de la literatura geoestadística. Por otro lado, al mismo tiempo y por el mismo autor, la palabra consagrada en inglés es efectivamente “ geoestadística ” (cf. Georges Matheron, Principles of geostatistics , Economic Geology vol. 58, 1963).
En definitiva, no quedaría excluido tratar como VR, por ejemplo, valores numéricos asignados a puntos de un plano factorial : en este caso, el objeto estudiado ya no sería un fenómeno, sino un artefacto puro y simple . palabra que, además, no tiene aquí una connotación peyorativa a priori . Nada lo prohíbe matemáticamente; pero la pregunta sería, naturalmente, saber qué significado atribuir a tal enfoque y, excepto para hacer una investigación pura, esta pregunta es obviamente primordial. En el campo de la geoestadística aplicada, este tipo de operación especulativa, que es cierto que en ocasiones puede resultar muy fructífera, requiere una extrema cautela metodológica y un altísimo sentido crítico. Por extensión, y cuando no hay miedo a la confusión, este término puede referirse al fenómeno en sí. En el primer sentido, una RV es, por tanto, un objeto matemático , susceptible como tal de manipulaciones teóricas; en el segundo, es un fenómeno o un evento físico , medible y existente independientemente del observador: esta dualidad es sugerida por las dos imágenes opuestas, que representan el mismo territorio según los dos puntos de vista.
La implementación de la realidad virtual se justifica principalmente para tener en cuenta fenómenos que son tanto estructurados como muy irregulares: tales son, por ejemplo, la mayoría de las veces fenómenos naturales (mineralógicos, geofísicos, meteorológicos, ambientales, etc.), incluido el comportamiento de 'juntos revelan un organización en el espacio y / o el tiempo, pero cuya variabilidad local prohíbe cualquier modelado mediante simples expresiones matemáticas. Por otro lado, incluso si nada teóricamente impide recurrir al formalismo de la RV de forma sistemática, la información completamente desestructurada podría procesarse más ventajosamente con herramientas estadísticas ; y, por el contrario, los fenómenos muy regulares podrían describirse mediante funciones simples o ecuaciones de evolución .
Posteriormente, esta herramienta encontró aplicaciones en campos tan variados como la meteorología y la silvicultura , la batimetría y topografía ( DEM ), el medio ambiente , la agricultura de precisión , la pesca , la epidemiología , la ingeniería civil , cualquier cartografía cuantitativa en general, etc. Así, bajo un vocabulario diferente, una variable regionalizada es estrictamente equivalente a la noción física de campo , y más precisamente de campo determinista.
Además, una variable regionalizada es fundamentalmente una variable cuantitativa : atribuye a cualquier punto del espacio un valor numérico en sentido amplio ( es decir, posiblemente vectorial o complejo ). Así, una variable regionalizada es también un campo en el sentido matemático : campo escalar , vectorial o tensorial : como tal, es probable que sea estudiado por las herramientas de análisis , en particular el cálculo diferencial y el cálculo integral , así como como por herramientas estadísticas .
En pocas palabras ... ↑ ↓ | |
Una variable regionalizada es una función numérica que, en un dominio geográfico dado, tiene el propósito de representar un determinado fenómeno físico. El trabajo del geoestadístico consiste en intentar asociar las propiedades matemáticas de esta función con las características estructurales de este fenómeno, para dar respuesta a los problemas concretos que se plantean al respecto (interpolación, estimación, simulaciones numéricas ...). |
La definición completa de una variable regionalizada, considerada abstractamente como una función de un conjunto en otro, requiere con todo rigor especificar la estructura del conjunto inicial, la estructura del conjunto final y las propiedades analíticas de la función. Pero en realidad, en la mayoría de los casos, un RV será simplemente una función de un espacio métrico dentro de otro.
Espacio de salidaEn la medida en que el primer objetivo de la variable regionalizada es dar cuenta de una estructura espacial, el espacio de trabajo, es decir, el espacio de inicio de la función VR, debe poder estar equipado, al menos localmente , de una función de distancia . Así, en la mayoría de los casos, el objeto matemático "espacio inicial" será una representación abstracta de la noción intuitiva de espacio geográfico . En general, esto no presentará ninguna dificultad particular: por lo tanto, es fácil medir distancias en un depósito, en tierras contaminadas, en un bosque, o medir intervalos de tiempo durante el transcurso de un determinado proceso. Sin embargo, se pueden imaginar situaciones más complejas; entonces,
Sin embargo, en la práctica, el espacio inicial suele ser simplemente un espacio euclidiano . De hecho, es más exacto hablar de un subconjunto de dicho espacio: en la práctica, de hecho, siempre trabajamos en un dominio acotado , cuya frontera depende fundamentalmente de los datos disponibles y del problema planteado. En estas condiciones, lo más simple y común es considerar matemáticamente este dominio de trabajo como un subconjunto acotado de , donde denota la dimensión (espacial y / o temporal) del espacio de trabajo.
Si bien el campo de trabajo y la dimensión del espacio vienen impuestos por la naturaleza del problema a resolver, la elección de la distancia es en principio libre, dentro de los límites a menudo amplios impuestos por las matemáticas. Sin embargo, en casi todos los casos, naturalmente preferiremos la distancia euclidiana , si es posible , por un lado porque es esta la que permite los desarrollos teóricos más simples, y por otro lado porque corresponde a la distancia habitual medida en el campo por profesionales, al menos cuando solo se van a utilizar coordenadas espaciales. Por otro lado, para estudios de naturaleza espacio-temporal, no es seguro que una respuesta puramente matemática sea satisfactoria: siempre podemos construir una distancia mezclando las coordenadas espaciales y temporales, pero es dudoso que esta construcción por otra parte teóricamente correcto tiene un significado concreto.
Área de llegadaLos objetos en el espacio de llegada son los valores tomados por el VR en cualquier punto del espacio de salida.
Caso de un campo escalarSi estamos trabajando en un campo escalar, estos objetos serán números, la mayoría de las veces reales, de modo que el espacio final simplemente será . En este caso de una RV escalar , la situación es sencilla de organizar: los valores tomados por la RV son números que se expresan en las unidades de la variable estudiada. Serán, por ejemplo, metros (o pies ...) si el VR representa altitudes topográficas, metros (o brazas ...) si representa profundidades batimétricas, porcentajes (o g / T ...) si representa ley de mineral, etc. Y dado que el objeto de la geoestadística es esencialmente caracterizar las estructuras espaciales de los objetos estudiados, es necesario poder dotar al espacio de llegada de una herramienta teórica que permita cuantificar el parecido (o disimilitud) entre dos valores tomados por la RV en dos puntos cualesquiera del espacio de trabajo.
Estas herramientas existen en el marco de las estadísticas habituales; la más sencilla es la función de autocorrelación , que permite, entre otras cosas, cuantificar la noción intuitiva de “zona de influencia”. Esta función tiene dos puntos cualesquiera en el espacio geográfico como argumentos y los asocia con un número adimensional entre -1 y +1 que representa el coeficiente de correlación entre los valores de la variable considerada en estos dos puntos. Así, en particular, cuando en dos puntos geográficamente distintos corresponde un valor cero de esta función, esto significa que no existe un vínculo estadístico mutuo entre las mediciones realizadas en estos dos puntos, o incluso que el conocimiento del valor tomado por el VR en un punto no proporciona (estadísticamente) ninguna información adicional sobre el valor tomado por la RV en el otro punto. Por tanto, esta función es de gran importancia en primer lugar para comprender y modelar la organización espacial de la variable de interés, y luego para la construcción de un estimador , y más particularmente para la interpolación en cartografía ; y de hecho, se puede utilizar en geoestadística, por ejemplo, para kriging simple .
Sin embargo, la existencia teórica de la función de autocorrelación requiere fuertes supuestos de estacionariedad que no siempre se satisfacen; esta es la razón por la que la geoestadística tuvo que recurrir a otra herramienta desde el principio. Inicialmente, esta herramienta es simplemente la diferencia cuadrática entre los valores tomados por la variable regionalizada en dos puntos del espacio geográfico. Es función de dos variables, de forma general:
o
En estas condiciones, la función aparece como una medida del contraste existente entre los valores observados en dos puntos. Se trata de una primera herramienta para cuantificar la estructura (espacial y / o temporal) de la variable regionalizada, función estructural que, por tanto, va más allá de la simple información puramente estadística ya que tiene en cuenta no solo los valores tomados por la RV, sino también también la implantación de los valores observados.
Sin embargo, considerada como dependiente de dos variables independientes y , esta función no puede ser una herramienta operativa, por al menos dos razones:
De esta manera, es fundamental introducir hipótesis de trabajo, en la medida de lo posible controlable experimentalmente, que permitan modelar la función estructural respetando dos restricciones antagónicas: dar cuenta de la mejor manera de la estructuración de la RV y constituir fácilmente un objeto. .matemáticamente manipulable. Este enfoque (mencionado parcialmente a continuación) constituye la esencia de lo que los geoestadísticos comúnmente llaman variografía .
Caso de un campo vectorial o multivariableEl caso en el que el conjunto de llegadas es multidimensional pone de relieve un problema común en geoestadística. Matemáticamente, de hecho, esto no cambia casi nada en el caso escalar: la RV sigue siendo una función en sentido estricto; en ningún caso es una función multiforme , lo que también significa que en cualquier punto del espacio geográfico asocia un único valor en el espacio de llegada, aunque este sería un vector, un tensor o más generalmente un multiplete de valores escalares. En todos los casos, la imagen de realidad virtual de cualquier punto en el espacio de salida es un solo elemento (un singleton ) en el espacio de llegada.
Un ejemplo trivial demuestra, además, que la frontera teórica entre el caso escalar y el caso multivariable es a veces muy delgada. Si el espacio de llegada es el plano complejo, se puede igualmente considerar que la RV toma valores escalares en el campo de los complejos, o toma sus valores en un espacio bidimensional en el campo de los números reales. . En estas condiciones, y aún permaneciendo en el nivel teórico, es muy fácil definir una métrica en el espacio de llegada: esta vez la definiremos como función estructural
donde el símbolo designa el módulo del número complejo .
Por extensión, si el espacio de llegada es un espacio vectorial, concretamente si los objetos del espacio de llegada son múltiplos de valores expresados en las mismas unidades , naturalmente podemos adoptar como función estructural el cuadrado del módulo. Por ejemplo, si el VR tiene tres componentes , y , estableceremos
donde el símbolo denota el módulo del vector .
Por otro lado, la fórmula anterior ya no es utilizable si los diferentes componentes que constituyen el objeto VR no se expresan en las mismas unidades: la suma de los cuadrados de diferencia mezclaría cantidades heterogéneas, y por lo tanto ya no tendría ningún significado físico. . Por tanto, es necesario definir una función estructural ad hoc , que generalmente abre la puerta a una arbitrariedad inevitable. Es una situación que surge casi inevitablemente cuando se trabaja en un marco multivariable: en realidad, no hay ninguna dificultad teórica nueva y los desarrollos matemáticos podrían llevarse a cabo sin obstáculos técnicos; pero la necesidad de imponer al modelo que contabilice en buenas condiciones de realidad por el contrario da lugar a complicaciones muchas veces considerables a nivel de implementación y, en estas condiciones, la experiencia y el sentido de responsabilidad tienen mucha más importancia que la matemática. rigor para realizar un estudio aplicado.
Como estos factores no pueden incluirse en el contenido de un texto de presentación general, solo discutiremos brevemente las especificidades del caso multivariable más adelante, aunque en la práctica esto concierne a la gran mayoría de estudios. Pero no debemos perder de vista que en la práctica, el esfuerzo de análisis crítico y el diálogo constante con el “cliente” ocupan considerablemente más tiempo del geoestadístico que el dominio de las herramientas teóricas que se mencionan en este artículo, y que la elección de una métrica relevante en el espacio de llegada constituye uno de los primeros y más importantes pasos de este trabajo crítico.
Propiedades analíticas de la aplicación.Considerada como una función (por tanto, un ser matemático), la variable regionalizada puede ser objeto de estudio por todas las herramientas del análisis. Por tanto, podemos preguntarnos por su comportamiento asintótico , su análisis armónico , las posibles PDE que satisface, su integrabilidad , etc. Naturalmente, excepto en el caso de una investigación puramente teórica, este trabajo debe poder asociarse con interpretaciones físicas, por lo que los modelos demasiado ricos corren un riesgo significativo de sobreinterpretación : normalmente estamos en el contexto de aplicación del principio de parsimonia . Además, incluso si el modelo y las hipótesis matemáticas están corroboradas por observaciones de campo, debe tenerse en cuenta que "la correlación no implica causalidad ", es decir, que la modelización estructural no reclama ningún valor explicativo. y aún más precisamente, la realidad virtual como objeto matemático se limita a una descripción de la realidad virtual como fenómeno físico. Cualquier búsqueda de una interpretación, o incluso una explicación, es responsabilidad exclusiva del usuario.
En este sentido, las características de diferenciabilidad de la RV constituyen un ejemplo importante, que conviene detallar. Para evitar dificultades técnicas (utilizando derivadas parciales o direccionales , problemas estereológicos (in) ), se limitará al caso elemental las áreas de salida y llegada con las que se identifican : VR es entonces simplemente una función real una variable real.
Una ilustración esencial: la noción de "regularidad"Para una función real definida en (o en un subconjunto previamente especificado de ), el concepto de “regularidad” está perfectamente definido y está asociado con el grado de diferenciabilidad de la función. Además, en su caso, este grado de regularidad solo se puede verificar de forma fragmentada . El conjunto de funciones que satisfacen un determinado criterio de regularidad tiene la estructura de un espacio vectorial , y los distintos espacios vectoriales así determinados satisfacen estrictas relaciones de inclusión que permiten definir rigurosamente una jerarquía de caracteres de regularidad. Así, al limitarse por simplicidad a las funciones definidas en todo entero,
y tenemos las siguientes inclusiones:
que refleja una regularidad creciente (en el sentido matemático).
En pocas palabras ... ↑ ↓ | |
La práctica de la geoestadística aplicada tropieza con la dificultad real de hacer coincidir conceptos matemáticos precisos con nociones empíricas que a veces están formuladas de forma incompleta. La dialéctica se acentúa más cuando las propiedades matemáticas son más exigentes; y está más oculto (y por lo tanto más peligroso) cuando las nociones empíricas en cuestión parecen bien dominadas o dadas por sentado. Los desarrollos puramente teóricos que apuntan solo a la precisión matemática corren el riesgo de perder el contacto con la realidad y conducir a un formalismo puro, correcto pero inutilizable. Los desarrollos basados únicamente en el pragmatismo corren el riesgo de escapar a las posibilidades de un control teóricamente riguroso. > La misión del geoestadístico aplicado es lograr un equilibrio, una síntesis aceptable entre estos dos enfoques que, tomados por separado, son coherentes pero incompletos, y que a veces son difíciles de conciliar. |
Para el geoestadístico especializado, es fundamental poder interpretar estas propiedades en términos físicos. La situación parece simple cuando se trata de continuidad o continuidad por partes: la ausencia de discontinuidad, o la restricción de tener solo un número finito de discontinuidades, parecen ser propiedades que son efectivamente observables en el campo, accesibles experimentalmente. Y, sin embargo, ya estamos ante una forma discreta de “ ruptura epistemológica ”. Porque, a diferencia de su versión matemática, la continuidad en realidad no está claramente definida de acuerdo con el sentido común . Para ilustrar esta afirmación, podemos pensar en un ejemplo muy simple de realidad virtual: la topografía. Decir que en un territorio la altitud es continua, eso significaría que no hay discontinuidad en ningún lugar, que no hay punto de salto brusco de altitud. Pero esta afirmación ¿es sensata si los datos observados están separados por unos pocos centímetros, y mucho menos si descendemos a escalas microscópicas? de hecho, experimentalmente, ¿el concepto mismo de "continuidad" conserva algún significado? incluso, llegando a la paradoja, ¿puede haber continuidad a escala atómica? además, ¿sigue siendo relevante hablar únicamente de "altitud" por debajo de determinadas dimensiones de la observación?
El origen de este hiato está claramente identificado: el concepto matemático de continuidad, riguroso, es una noción infinitesimal y, además, la RV es una “variable puntual”. Por otro lado, "continuidad" según el sentido común, y a fortiori "regularidad", son nociones vagas que siempre se basan (aunque implícitamente) en una escala de observación y trabajo. Sin embargo, este factor de escala está esencialmente ausente del formalismo matemático. El papel fundamental del geoestadístico (y de cualquier modelista ) es, entonces, reunir los dos puntos de vista: especificar nociones demasiado vagas desde un punto de vista naturalista, para poder expresarlas en términos rigurosos; y al mismo tiempo aligerar lo más posible los supuestos matemáticos requeridos, para permitirles describir la realidad "en buenas condiciones", entendiéndose que el grado de adecuación del modelo a la realidad es un parámetro ajustable, que procede generalmente a diálogo entre el geoestadístico y su cliente.
En este sentido, la ambivalencia de la expresión “variable regionalizada” es perjudicial aquí. De hecho (teniendo en cuenta, a modo de ilustración, el ejemplo de la topografía),
Resumen: realidad y modelos ↑ ↓ | |
Existe una sola realidad (física); sin embargo, existen tantos modelos (matemáticos) como desee el usuario. La realidad se impone al usuario; sujeto a la precisión matemática, el usuario es a priori maestro de sus modelos. Un modelo no es "correcto" o "incorrecto": es eficaz o no, útil o no, juicioso o no. Y esto es cierto incluso para los modelos más básicos, como la variable regionalizada. En estas condiciones, no existe un "modelo real": el trabajo del modelador, y del geoestadístico en particular, no es encontrar una verdad que se escondería detrás de los datos brutos, sino construir bajo su responsabilidad un objeto matemático que ser tanto un intérprete respetuoso de la realidad (" restricción aguas arriba ") como una herramienta eficaz para responder a las preguntas formuladas (" restricción aguas abajo "). |
En estudio, las características estructurales no son atributos inequívocos de la realidad virtual física, sino solo propiedades del modelo adoptado aquí y ahora ; pero nada impide proponer diferentes modelos para un mismo fenómeno. Si bien la realidad se nos impone, al mismo tiempo somos los únicos dueños (por supuesto, dentro de los límites del sentido común y el rigor matemático) de nuestras elecciones intelectuales para modelarla. Un tema de meditación ...
Naturalmente, estas dificultades metodológicas aumentan cuando el concepto matemático en cuestión se vuelve más exigente. Las observaciones quizás inesperadas que se acaban de hacer sobre la realidad virtual (topografía, en el ejemplo) serían, por ejemplo, más cruciales si analizáramos la derivada de la realidad virtual. Por tanto, una función matemática es o no diferenciable en un dominio; pero, ¿qué significado dar a la "derivada" - una noción irremediablemente infinitesimal - de un fenómeno físico, además, la mayoría de las veces se reconoce sólo en un muestreo finito? En cuanto al concepto de "regularidad", es aún más peligroso de manipular, ya que en materia de función matemática significa "infinitamente diferenciable", mientras que a pesar de su apariencia intuitiva simplemente no tiene una definición unívoca. Nivel de fenómeno físico: ¿Tiene un río que hace muchos meandros un curso regular como lo afirmará un pescador desde su barca en medio del agua, o por el contrario casi caótico como lo afirmará un cosmonauta al sobrevolar unos cientos de kilómetros? ... No existe una respuesta universal.
“ El modelo nunca es idéntico a la realidad. Innumerables aspectos de la realidad siempre se le escapan y, a la inversa, el modelo siempre contiene innumerables proposiciones parasitarias, sin contraparte en la realidad. "
Ahora bien, en su sentido matemático de función, " la variable regionalizada no es idéntica a la realidad, pero ya constituye un modelo primario ". Esencial para el desarrollo posterior de un estudio geoestadístico, la definición de este primer modelo es ciertamente poco problemática en general, pero permite una implementación rigurosa del marco teórico, y posiblemente llama la atención sobre las dificultades involucradas. A modo de ilustración, los siguientes ejemplos presentan algunas preguntas que pueden surgir de este primer paso.
TopografíaUna primera ilustración ya mencionada, muy sencilla, la puede dar la topografía de un determinado territorio geográfico . En cualquier punto de coordenadas de este territorio, el valor de la altitud se puede considerar como el resultado de una aplicación del dominio geográfico en el conjunto de reales.
Aunque parezca natural, el hecho mismo de representar la topografía mediante un VR (por tanto: una función ) implica un supuesto: que el relieve no presenta ménsula. En este caso, esta no es una restricción muy importante, pero esta observación muestra que el paso de modelado más inofensivo ya puede incluir suposiciones. En la medida en que el desarrollo de un modelo no es un fin en sí mismo, sino que solo constituye la instalación de una herramienta destinada a dar respuesta a preguntas concretas, es bueno no perder nunca de vista esta propiedad esencial, para que los desarrollos teóricos posteriores no se desvíen subrepticiamente. de la realidad. En este caso específico, sería difícil trazar curvas de nivel (por ejemplo, para un mapa de personal) si hubiera áreas del dominio mapeado donde la variable de topografía puede presentar dos valores distintos en el mismo punto.: Una situación ciertamente muy raro, pero no del todo imposible en determinados relieves particulares (determinadas montañas, acantilados, cañones ...).
Si la topografía realmente puede ser modelada por un VR, la propiedad de continuidad del modelo se escribirá :, ya que esta vez el espacio geográfico es , subconjunto de . Esta propiedad se asocia intuitivamente con la idea de un mapa cuyas curvas de nivel no muestran ninguna anomalía (sin discontinuidad y sin zona de acumulación). Quizás de significado físico más claro, la propiedad de la continuidad por partes, que se escribirá :, significa que solo hay un número finito de acantilados verticales en el dominio. Y de la misma manera, la diferenciabilidad por tramos - - podría interpretarse como la presencia de un número finito de aristas vivas (roturas en pendiente: crestas o surcos) en el dominio.
Pero, naturalmente, estas diferentes características intuitivas (sin discontinuidades, sin acantilados, sin ruptura en la pendiente , o solo en un número finito) solo tienen un significado práctico cuando se asocian con una cierta escala de observación, y este factor de escala está ausente del formalismo matemático. : el VR “no conoce” las condiciones bajo las cuales se adquirieron los valores numéricos de los datos. Depende del usuario y solo de él integrar esta información adicional en la interpretación de los resultados producidos por un algoritmo que no fue capaz de tenerlos en cuenta.
MeteorologíaEn el mismo territorio que anteriormente, también nos pueden interesar los parámetros meteorológicos medidos a una distancia fija del suelo. Por tanto, un punto del dominio estudiado se identifica esta vez mediante tres coordenadas (por ejemplo, latitud, longitud y altitud), de modo que el espacio de partida es tridimensional. Nótese que la altitud , que era la variable de interés en el ejemplo anterior (por lo tanto, pertenecía al espacio de llegada), esta vez tiene el estado de una coordenada. Supongamos entonces que nos interesan todos los puntos con los respectivos valores de la temperatura (escalar) y de la componente horizontal del viento (vector bidimensional). La RV (destacada para la ocasión) será, por tanto, una aplicación:
Este ejemplo requiere algunas observaciones:
Con motivo de este ejemplo meteorológico, podemos evocar otro problema. Supongamos que el primer componente del dominio de llegada mide la altura geopotencial para un valor de la presión atmosférica, y que el dominio horizontal de estudio se ubica en un área geográfica que permite la aproximación geostrófica . El dominio de definición de esta nueva realidad virtual es, por tanto, la forma . Los tres componentes de :
están, en virtud de esta aproximación, relacionados (a fijo) por un sistema PDE :
donde es una constante ( fija) si el dominio no es demasiado grande.
Así, matemáticamente, el viento geostrófico se caracteriza por el geopotencial, o nuevamente: los dos últimos componentes de la RV se caracterizan por el primero. Esto es solo una simplificación, pero este ejemplo ilustra que puede haber no solo vínculos estadísticos, sino incluso vínculos funcionales entre los componentes de un VR. Esta es la oportunidad de subrayar una vez más la diferencia entre los puntos de vista matemático y físico.
En pocas palabras ... ↑ ↓ | |
Los resultados de operaciones infinitesimales, como la derivación, no pueden por naturaleza medirse , en ningún caso, sobre la base de un conjunto finito de datos sobre los que actúan estas operaciones. Solo podemos obtener valores estimados , por lo tanto producidos a través de construcciones intelectuales en función de elecciones metodológicas arbitrarias. Es fundamental no confundir nunca
|
De hecho, se podría creer que la aproximación geostrófica puede prescindir de realizar mediciones de viento. También se podría pensar que estas ecuaciones permiten, con las únicas medidas del viento, verificar la hipótesis geostrófica ya que se debe tener en virtud del teorema de Schwarz :
.Sin embargo, en la práctica, no lo es. Dado que los datos están necesariamente en número finito, no es estrictamente posible medir las componentes del viento derivando en las dos direcciones principales los valores del geopotencial, como tampoco es posible medir las derivadas parciales de las componentes de el viento - nuevamente porque la derivación es una operación esencialmente infinitesimal, que es fundamentalmente impráctica con un conjunto finito de valores.
A lo sumo, se podrían proponer algoritmos de estimación , por ejemplo, del viento del geopotencial, utilizando las ecuaciones teóricas proporcionadas por la física. También podemos realizar otras manipulaciones basadas en los tres componentes de la RV y teniendo en cuenta la ecuación teórica que conecta estos tres componentes: este enfoque es uno de los fundamentos de la geoestadística multivariable (cf. bibliografía: H. Wackernagel, 2003). Pero por interesantes que sean los resultados así obtenidos, es fundamental tener en cuenta que se trata de artefactos , productos resultantes de un algoritmo y no datos brutos. Son imágenes de la realidad, no medidas de la realidad.
ContaminaciónImaginemos como último ejemplo que el fenómeno a estudiar es la contaminación de un río por un determinado contaminante . Teniendo en cuenta la variable estudiada, parece juicioso no utilizar la distancia euclidiana, especialmente si el río hace muchos meandros: es muy preferible contar las distancias siguiendo el curso del río, ya que es el curso que sigue el contaminante. . Para simplificar el ejemplo, no tomaremos en cuenta las variaciones de contaminación a lo largo del ancho del río, y asumiremos que la sección estudiada no incluye afluentes: en estas condiciones, es natural ubicar espacialmente una medida solo que no su La abscisa curvilínea sigue siendo, más concretamente, la distancia a un punto de referencia siguiendo el curso del río. En estas condiciones, y asumiendo que la medida de contaminación es un escalar, la RV es una aplicación simple de en :
No hay ninguna dificultad con respecto a la ubicación geográfica y, de hecho, el espacio de partida se puede proporcionar con una métrica. Sin embargo, la naturaleza de la variable estudiada no puede satisfacerse con una sola información de distancia; al comparar dos puntos, la medición de la diferencia entre ellos es una información bastante pobre: en particular, no es irrelevante saber cuál de los dos puntos está aguas arriba y cuál aguas abajo. Esta información no puede ser tomada en cuenta por una distancia, que es por naturaleza una función simétrica de los dos puntos a los que se aplica.
Anticipando los métodos de geoestadística multivariable, podemos sugerir agregar la abscisa curvilínea como variable adicional, y considerar estudiar las variables de manera conjunta y con las herramientas adecuadas para el trabajo multidimensional: por ejemplo, estudiar la nube de correlación entre y tratar de resaltar una deriva ( tendencia). Además, es muy probable que la estructura local de la contaminación también dependa de la velocidad de la corriente: por tanto, también podemos añadir este dato o mejor dicho, lo que sin duda será más sencillo, la altitud que probablemente constituirá una buena variable explicativa. . En estas condiciones, la realidad virtual aparecerá como una aplicación:
También podemos, si los datos lo permiten, elegir otro ángulo de ataque e involucrar el factor tiempo y la velocidad de propagación del contaminante a lo largo del río, por lo tanto el caudal ...
Esta reflexión sumaria subraya el interés que puede haber en solicitar variables auxiliares que, sin presentar un interés real en sí mismas, puedan ayudar a afinar el conocimiento estructural de la variable de interés al tiempo que permiten seguir beneficiando las herramientas geoestadísticas generales. Naturalmente, la adición de nuevas variables introduce el problema, ya encontrado, de la elección de una métrica en el espacio de llegada ... Una vez más, la responsabilidad del geoestadístico es determinante para la relevancia y la eficiencia de los desarrollos del modelo.
Un recordatorio de mayúsculas: ↑ ↓ | |
El enfoque del geoestadístico aplicado está constantemente guiado - lo que significa: restricción, pero también garantizado - por el respeto al principio ya encontrado y así establecido por Matheron: “ El modelo nunca es idéntico a la realidad. Innumerables aspectos de la realidad siempre se le escapan y, a la inversa, el modelo siempre contiene innumerables proposiciones parasitarias, sin contraparte en la realidad. " |
Los comentarios que hasta ahora han marcado el establecimiento del concepto de RV, así como los pocos ejemplos elementales propuestos, constituyen una ilustración del aforismo de Alfred Korzybski : " un mapa no es el territorio ". La " ruptura epistemológica " es de hecho ya en el trabajo, y se debe tener en cuenta si, como es común, la variable de regionalizado vocabulario se utiliza para designar tanto el fenómeno y la función matemática que está implicado el. Modelos : VR-función es no el fenómeno VR.
Al examinarla, esta salvedad parece ser de sentido común. Volviendo al viento geostrófico, por ejemplo, las ecuaciones expresan que el vector (objeto matemático) es el gradiente (operación matemática) de la altura geopotencial (objeto matemático) bajo el supuesto de equilibrio geostrófico. Pero, ¿qué significado tendría que declarar: "equilibrio geostrófico es cuando el viento (fenómeno físico) es el gradiente (noción física indefinida) de la altura geopotencial (datos físicos)"? La formulación correcta, que daría cuenta rigurosamente de la relación entre fenómeno y modelo, sería: "diremos (por definición) que hay equilibrio geostrófico cuando el vector adoptado para modelar el viento puede considerarse como el gradiente de la función adoptada para modelar la altura geopotencial ”. Y dicho sea de paso, esta formulación también tiene el mérito de enfatizar que el “equilibrio geostrófico” es una propiedad del modelo, y no un fenómeno físico observable independiente del observador; de hecho, esta formulación constituye muy exactamente una definición , rigurosamente expresada, del concepto matemático de "equilibrio geostrófico".
Por supuesto, una declaración tan purista es muy pesada y nunca se encuentra en publicaciones; los riesgos de accidentes metodológicos son, de hecho, bastante limitados. De modo que, por ejemplo, en el uso geoestadístico, la expresión de variable regionalizada se utiliza , según el contexto, en uno u otro de sus significados.
Pero para evitar posibles malentendidos, el lector debe tener presente la frase de Korzybski. Esta es también la ocasión para señalar que este aforismo plantea implícitamente tres puntos importantes:
Mapa y territorio: más allá del juicio de valorPor supuesto, el mapa no es el territorio, pero esta distinción no debe fomentar una clasificación, un juicio de valor o una jerarquía. Sería un error querer afirmar una "superioridad" del mapa sobre el territorio (o al revés). Científicamente, no tiene sentido expresar una “preferencia” entre realidad y modelo: estos dos objetos son esencialmente de naturaleza diferente y, como tales, no pueden clasificarse. Sus estados epistemológicos son diferentes, sus roles en el curso de un estudio son diferentes: la realidad existe independientemente de nuestras elecciones personales y se nos impone; el modelo es nuestra creación y debemos dominarlo.
Pero al mismo tiempo, en cuanto nos dedicamos a la geoestadística aplicada , el desarrollo de un modelo no es un fin en sí mismo, sino que pretende dar cuenta de la realidad. Por eso es importante asociar a cada modelo un criterio que permita evaluar, si es posible cuantitativamente, la adecuación de este modelo a la realidad. Y esta noción de adecuación, que debe definirse a priori , es claramente contingente y dependiente del problema a resolver: en igualdad de condiciones (campo estudiado, datos disponibles, restricciones computacionales, etc.), un modelo dado no tendrá no la misma relevancia dependiendo de la pregunta planteada: por lo tanto, sería completamente ilusorio esperar lograr una herramienta universal para evaluar modelos. Por el contrario, un criterio es necesariamente convencional , y su caracterización está estrechamente relacionada con la elección ya encontrada al definir una métrica: una elección que, por lo tanto, incluye una parte importante e inevitable de la arbitrariedad, palabra que una vez más no tiene connotaciones negativas. En teoría, por lo tanto, existe una gran libertad en la elección de criterios, aunque razones muy diversas (culturales, consideraciones de facilidad de implementación, o incluso moda actual en la comunidad científica, etc.) pueden limitar estas opciones; También es prudente ceñirse al principio de parsimonia .
En pocas palabras ... ↑ ↓ | |
La realidad (el territorio) existe independientemente del observador y solo puede entenderse intelectualmente a través de una conceptualización. La variable regionalizada, el modelo primario , es el primer paso en esta conceptualización, y por construcción constituye la mejor representación numérica posible de la realidad. Pero, por un lado, su complejidad no permite un procesamiento matemático simple; y, por otro lado, solo es accesible en un número finito de elementos de datos. Por tanto, sólo puede servir como base para modelos más abstractos, menos fieles a la realidad, pero elegidos para ser manipulados por herramientas matemáticas. Estos nuevos modelos podrían, en particular, en comparación con el VR ahora tomado como referencia, ser objeto de una evaluación siempre que se haya definido previamente un criterio de calidad. Dado que no puede haber una medida universal de la calidad de un modelo, el usuario tiene un margen de maniobra muy grande para ponerse de acuerdo sobre tal criterio: por lo tanto, debe ser particularmente realista y eficiente. |
Es importante señalar a este respecto que la VR (función) generalmente no obedece a este principio. De hecho, teniendo vocación en cada punto de tomar un valor que sería exactamente lo que se podría medir en el terreno, la RV es de una complejidad increíble, y no puede explicarse con una expresión matemática simple y utilizable. Ciertamente podríamos considerar que la función VR describe el fenómeno VR de una manera óptima o incluso perfecta, pero esta perfección es estéril, porque no opera: estamos condenados a manipulaciones puramente tautológicas . Así, de manera esencial, el modelo primario resulta la mayor parte del tiempo inoperante como tal, por lo que la geoestadística se ha orientado hacia modelos más elaborados, de carácter probabilístico (ver apartado 3 de este artículo). Así, volviendo al aforismo de Korzybski, podemos enriquecerlo insistiendo: "ningún mapa es el territorio " y, además, el único que podría pretender dar cuenta de la realidad, exactamente y punto a punto, es en general impracticable.
Dicho esto, para cualquier tratamiento numérico de un fenómeno dado, la variable regionalizada constituye la información cuantitativa irreductible más fundamental, la base sobre la que pueden desarrollarse todos los modelos posteriores, la referencia suprema a la que debemos volver en caso de dificultad metodológica. Este papel básico llevó a Matheron a introducir la importantísima noción de magnitud regional: " Llamamos magnitud regional, o simplemente regional , a cualquier funcional de la variable regionalizada definida en , es decir, cualquier magnitud cuyo valor esté determinado por los datos de todos los valores numéricos cuando se repite . »En consecuencia, para evitar cualquier riesgo de una brecha entre los desarrollos teóricos y el problema real que se supone que resuelven, es necesario asegurar que los enunciados de los resultados se puedan formular en términos de magnitudes regionales para dejar, al menos en teoría, una posibilidad de control a posteriori .
También es necesario ser consciente de que estas limitaciones metodológicas son virtuales , y no pueden ser actuales si el campo de trabajo es un continuo , ya que no es posible realizar una infinidad de mediciones incontables. A lo sumo, se puede (imaginar) realizar las mediciones en un conjunto finito de puntos no especificados designados en el espacio. La dificultad aquí no es conceptual, sino sólo técnica, y es similar a un problema clásico que se encuentra, por ejemplo, en el muestreo ; por tanto, una cantidad regional, si no se limita a una combinación finita de valores puntuales de la RV, nunca podrá medirse en sentido estricto, pero siempre podemos proponer una aproximación : solo será una cuestión de recopilación de información.
Comparación de diferentes modelosUna vez acordado un criterio de evaluación, nada impide comparar diferentes modelos entre sí para expresar preferencias. Puede ser una simple dicotomía: modelos aceptables vs. modelos para ser rechazados. Pero si se trata de un criterio numérico, podemos ir más allá y clasificar los modelos probados: generalmente consideraremos que un modelo es tanto mejor cuanto menor sea su distancia al VR. Así, si bien no tenía sentido establecer un juicio de valor comparativo entre modelo y realidad, por el contrario es posible - y deseable - buscar establecer una jerarquía entre modelos. Pero esta jerarquía, por supuesto, depende fundamentalmente del criterio adoptado y, por lo tanto, tiene un grado significativo de arbitrariedad.
Por ejemplo, si tomamos como criterio una función de la única distancia del modelo al VR, el mejor modelo posible será mediante la construcción del VR (función) en sí; pero esta respuesta obviamente no será satisfactoria, ya que es un objeto matemático imposible de explicar y manejar. Por otro lado, nada impide, por ejemplo, modelar la totalidad de un fenómeno en un determinado dominio mediante la media aritmética de los datos de la RV medidos en este dominio: difícilmente se puede imaginar más simple, pero se pierde toda la información estructural. sobre el fenómeno resumiendo toda su complejidad en un solo número ...
En esta búsqueda de un criterio de calidad confluyen dos puntos de vista opuestos y complementarios, en función de la prioridad que nos demos:
Una vez más, no existe una opción "verdadera" o "falsa" cuando se trata de elegir entre restricciones ascendentes y descendentes. Hay elecciones juiciosas o no, efectivas o no, según las cuestiones que queramos resolver, los medios disponibles, las limitaciones económicas, etc. Y el rigor metodológico exige no reajustar, de manera ad hoc y a posteriori , un criterio de calidad según la conclusión que se quiera promover.
Área de validez del modeloPara mantenerlo simple y colorido ... ↑ ↓ | |
Por naturaleza, un modelo siempre busca vivir una vida matemática autónoma y, siendo una construcción intelectual, producir resultados que son esencialmente artefactos puros . Mientras no haga nada más que liberarse del control del usuario, esto no es necesariamente dañino e incluso puede resultar fructífero. Dejar el modelo un poco apretado en el cuello a veces abre interesantes vías de investigación, para ser exploradas de forma natural con cautela, mente analítica y sentido crítico. Por otro lado, cuando el modelo se libera por completo de la referencia a la realidad, dejamos el campo de las ciencias aplicadas y nos encontramos (en el mejor de los casos) en un marco puramente académico: por lo tanto, dar por sentado los enunciados de un modelo. que se haya independizado constituiría el error metodológico más grave, una transgresión del umbral del realismo . |
Aún para permanecer en la terminología de Korzybski, la pregunta es finalmente saber qué sucede con el mapa más allá del territorio. En otras palabras, esto plantea el problema de la extrapolación . De hecho, el territorio estudiado (físicamente) está necesariamente delimitado, mientras que los modelos (matemáticos) utilizados muy a menudo tienen un dominio de validez ilimitado. Ahora bien, sin siquiera ir tan lejos como para hablar de comportamientos asintóticos , ¿qué significado podemos atribuir entonces a un enunciado del modelo relativo a porciones de espacio alejadas de los datos disponibles? O de nuevo: ¿qué confianza podemos depositar en "qué nos dirá" un modelo fuera del dominio en el que se ha ajustado? La pregunta no es académica: por ejemplo, los pronósticos meteorológicos o económicos son esencialmente interesantes para el futuro, es decir, para un intervalo de tiempo en el que por naturaleza no hay información disponible para corroborar o confirmar. ' Revertir el modelo ...
Esto es ineludible: cuando el modelo se solicita en áreas del espacio o del tiempo donde no podría ser controlado, o cuando invoca propiedades matemáticas que no podrían asociarse con particularidades físicas, corremos inevitablemente el riesgo de que desarrollos teóricos, en lo sucesivo privados de la El control de los datos medidos en campo, ofrecen resultados desprovistos de toda probabilidad, incluso absurdos. La razón de este peligro es fácil de entender: la adopción de un modelo, de hecho, siempre constituye una hipótesis anticipatoria ya que, según una cita ya encontrada, " ... el modelo siempre contiene innumerables proposiciones parasitarias, sin contraparte. Ninguna en realidad. ". La aparente paradoja es que la introducción de tal hipótesis anticipatoria, aunque fuente de peligros e incertidumbres, es al mismo tiempo esencial: es esto lo que permite salir de manipulaciones tautológicas sobre acumulaciones de valores. resultados inteligibles y operativos.
En resumen, dos riesgos de superar el " umbral del realismo ", surgen dos tipos de extrapolaciones :
Estos dos tipos de extrapolación no son condenables en sí mismos y, a veces, incluso son esenciales. Pero aumentan el riesgo de que los desarrollos metodológicos y sus conclusiones se desvíen inaceptablemente de la realidad, el riesgo de cometer un error radical . Un riesgo inevitable, muchas veces fructífero e inherente a cualquier proceso de representación teórica de la realidad; Depende del practicante hacer el mejor uso de su sentido crítico y su experiencia para minimizar este riesgo, bajo su responsabilidad.
Una ilustración sobre un caso sencilloPara ilustrar el enfoque crítico expuesto anteriormente, proponemos aquí un ejemplo unidimensional simplificado, construido para la ocasión. Se podría pensar, por ejemplo, en un perfil topográfico que describa un relieve en el borde del mar (los valores de altitud son negativos en uno de los bordes del dominio: podrían interpretarse como profundidades batimétricas). Para fijar ideas, podemos asumir que las unidades en los dos ejes son hectómetros.
Se trata de una construcción académica, ya que la totalidad de la variable regionalizada aquí se construyó mediante un algoritmo matemático, por lo que se pudo conocer efectivamente. Está representado en el lado opuesto por el perfil celeste.
Esta situación es, estrictamente hablando, completamente irreal cuando se trabaja en medidas físicas experimentales, ya que no es posible acceder al conocimiento efectivo de un continuo de valores estrictamente puntuales . Sin embargo, con una aproximación que puede considerarse aceptable, este conocimiento exhaustivo de la RV podría considerarse alcanzado en determinados casos particulares, por ejemplo en la teledetección : así es posible admitir que una imagen de satélite proporciona información exhaustiva de un entorno físico. fenómeno.
Sin embargo, en la gran mayoría de los casos, la realidad solo se mide numéricamente mediante un número finito de datos puntuales, que además suele ser pequeño. Esta situación plantea el importante problema del muestreo y, en particular, la cuestión de la representatividad de las muestras: el valor de un conjunto de datos no depende sólo de la cantidad de información disponible, sino también de su calidad, es decir. para decir en particular de la organización geográfica de su establecimiento.
En el ejemplo examinado aquí, se supone que hay solo ocho elementos de datos distribuidos irregularmente, representados por puntos amarillos. Por lo tanto, si nos atenemos solo a datos numéricos, los ocho valores de altitud (y las ocho coordenadas correspondientes) asociados con estos ocho puntos constituyen la única información disponible.
Metodológicamente, la implementación de este ejemplo académico es evidente: nos ubicamos en el entorno de un estudio real, es decir, solo nos permitimos utilizar las ocho medidas puntuales designadas; pero podemos comparar a posteriori las construcciones realizadas y la realidad de la curva azul. Esta situación extremadamente privilegiada obviamente no es posible en la realidad, donde la realidad virtual solo es accesible en la práctica a través de un conjunto finito de medidas. En campo, el único control posible consiste en ir a realizar mediciones adicionales en puntos donde inicialmente no se disponía de datos, y comparar su valor con lo que proponen los algoritmos desarrollados a partir de los datos iniciales.
Mapa y territorio: más allá del juicio de valorEl siguiente panel tiene como objetivo únicamente hacer visible la diferencia fundamental de naturaleza que separa el “mapa” y el “territorio”, e ilustrar la frase ya mencionada: “ El modelo nunca es idéntico a la realidad. Innumerables aspectos de la realidad siempre se le escapan y, a la inversa, el modelo siempre contiene innumerables proposiciones parasitarias, sin contraparte en la realidad. "
Esterel, junto al mar.
Hawke's Bay, Nueva Zelanda.
Watch Hill, Rhode Island.
Foz do rio Sado.
Isla Marion, Sudáfrica.
Bahía Erebus, Antártida.
Èze, Alpes Marítimos.
Los diferentes paisajes que se ofrecen son todos, al posible coste de un cambio de coordenadas, compatibles con el perfil de la RV, y a fortiori con los ocho datos disponibles. Su variedad resalta todo lo que pierde la etapa de modelado a nivel del conocimiento crudo de un fenómeno, y esto desde el nivel del modelo primario . Pero a la inversa, la función matemática de la RV permite construcciones intelectuales que permitirán ir más allá de la simple acumulación de datos digitales, y proponer síntesis que ayuden a enriquecer esta fase de conocimiento crudo y proponer esquemas de comprensión del fenómeno. Por lo tanto, fenómeno y modelo tienen roles esencialmente complementarios, y la tarea del geoestadístico es asegurar esta complementariedad a lo largo de un estudio.
Sin embargo, en el contexto de un estudio aplicado , huelga decir que en caso de desacuerdo entre los desarrollos del modelo y las observaciones de control a posteriori , es el modelo el que debe corregirse: el modelo está destinado a representar el modelo real. , mientras que este último no tiene que cumplir con nuestras representaciones intelectuales. Es esta asimetría lo que hace toda la eficacia del enfoque científico, y es el dominio operativo de esta asimetría lo que caracteriza el valor de un practicante.
Comparación de diferentes modelosAdemás del perfil de realidad virtual y los ocho puntos de datos, la animación de enfrente muestra seis posibles modelos para representar el fenómeno.
Se eligió aquí para ofrecer solo modelos que respeten los datos, es decir, que restauren exactamente el valor de los datos en los puntos donde se tomaron las mediciones: así, la RV como los seis modelos pasan exactamente por los ocho puntos de datos. Esta restricción parece de sentido común, pero de ninguna manera es obligatoria: uno podría, por ejemplo, imaginar que las mediciones están teñidas de error y que, en consecuencia, no es juicioso intentar con todas las fuerzas restaurar con el modelo el valor mostrado por el modelo. dispositivo de medición. Además, los dispositivos de medición suelen ir acompañados de especificaciones técnicas que proporcionan, en particular, su grado de precisión, y esta información crucial es un elemento importante para orientar al usuario en la definición de un criterio de calidad para sus modelos.
Por tanto, parece intuitivo que, si optamos por respetar los datos, las diferentes representaciones posibles de la realidad serán tanto más parecidas cuanto que habrá muchos datos, ya que todas estas curvas se verán obligadas a pasar por los mismos puntos: esto es un efecto tradicionalmente llamado> condicionamiento en geoestadística, y el condicionamiento por datos constituye una especie de fuerza de recuerdo que obliga a los modelos a no alejarse demasiado de la realidad.
Sin embargo, esta intuición debe considerarse con cautela; Imaginemos que la VR de este ejemplo fuera reconocida por 201 puntos: su modelado por un polinomio de grado 200 habría sido de enorme inestabilidad numérica según las coordenadas de estos puntos, lejos del aspecto general de la VR a pesar de un condicionamiento muy fuerte . En cuanto al condicionamiento por ocho puntos, por el contrario es muy flojo, y a priori se pueden esperar modelos no solo diferentes en sus texturas (características morfológicas de detalle), sino incluso en sus ritmos generales.
Podemos esperar de un modelo, que se supone que refleja la realidad, al menos tres tipos de propiedades:
En pocas palabras ... ↑ ↓ | |
Podemos legítimamente pedir a un modelo que sea bello, o preciso, o que se parezca a la realidad, con la única condición de haber definido con precisión el significado que se da a estos tres conceptos. Por otro lado, sería ilusorio esperar que un modelo satisfaga simultáneamente estas tres restricciones. Una vez más, es el profesional quien debe resolverlo y encontrar el equilibrio adecuado entre lo que es posible y lo que es deseable: su objetivo no es encontrar un "modelo real" hipotético, sino elegir el modelo que mejor cumplir con sus expectativas. |
Cada uno de estos requisitos tiene su legitimidad y su grado de conveniencia. Pero, por supuesto, el practicante debe elegir, y no puede esperar de un solo modelo que estas tres restricciones se satisfagan simultáneamente de manera óptima: por ejemplo, "parecerse a la realidad" y simultáneamente "ser regular" no podría satisfacerse. eran de hecho regulares, lo que no tiene nada de general sobre las variables naturales; o de nuevo, la "precisión" de un modelo no implica en modo alguno que deba "parecerse" a la realidad. La figura anterior ilustra brevemente estas reflexiones:
Estos ejemplos podrían multiplicarse ad infinitum: depende del practicante, y solo de él, resolverlo, porque los datos por sí solos no permiten hacer una elección inequívoca. Es más, debe recordarse que casi siempre, la realidad virtual solo se reconoce muy parcialmente mediante un muestreo necesariamente limitado, de modo que las "restricciones aguas arriba" no solo no pueden satisfacerse, sino que solo pueden definirse por referencia no a la realidad virtual en sí, sino a la idea que tiene el practicante. Esto es particularmente cierto para la textura de la realidad virtual, es decir, su comportamiento de detalle, que por naturaleza es inaccesible experimentalmente; c'est pourquoi l'effort de modélisation doit être aidé par un dialogue permanent avec les naturalistes (selon les cas, géologues, géophysiciens, météorologues, économistes, etc.), qui seuls peuvent apporter ce complément d'information absent des données et pourtant indispensable. Una de las peculiaridades del enfoque geoestadístico es sacar inmediatamente a la luz este problema que, de hecho, afecta a toda la matemática aplicada.
Área de validez del modeloEsta rápida animación ilustra cómo se ejerce el efecto condicionante sobre las distintas representaciones que podemos tener de la realidad. Como era previsible, los valores del “mapa” son los más fuertemente restringidos cerca de un dato y, a la inversa , los modelos pueden proponer valores extremadamente diferentes cuando uno se aleja de cualquier punto de medición: esto es muy claro sobre la extrapolación, aquí por ejemplo para valores de abscisas inferiores a 30 o superiores a 470 hm . Pero se puede notar que estas fluctuaciones numéricas muy importantes pueden aparecer incluso en la interpolación, según la densidad de los datos de condicionamiento o sus disposiciones relativas: esto es lo que sucede por ejemplo hacia la abscisa 430 hm , que sin embargo podría parecer lo suficientemente cercana a un punto de datos. Por otro lado, la agregación de tres datos entre las abscisas 320 y 360 hm provoca un condicionamiento muy fuerte, de manera que todas las cartas sean cuales sean, presenten valores muy similares en este intervalo.
El propósito de los "fotogramas congelados" es enfatizar que este efecto condicionante tiene lugar cualesquiera que sean los modelos adoptados para dibujar el perfil, es decir, en particular, cualquiera que sea el aspecto general y la textura de los mapas. Sin embargo, podemos observar en este ejemplo un fenómeno a menudo observado empíricamente: son los modelos matemáticamente más regulares (indefinidamente diferenciables, en este caso) los que provocan las fluctuaciones numéricas más considerables y, se puede suponer, los menos realistas. En otras palabras, y en términos antropocéntricos, un modelo muy regular se ve constreñido menos fácilmente por la realidad y busca con más fuerza imponerse al usuario.
Como primera conclusión, por lo tanto, hemos subrayado los riesgos involucrados en lo que se ha llamado “extrapolación física”, y resaltado que este riesgo puede ocurrir incluso dentro del dominio muestreado, dependiendo de la configuración geométrica de los datos.
Pero este ejemplo muy simple también ayuda a ilustrar los peligros de la “extrapolación metodológica”.
Por lo tanto, dado que los modelos propuestos aquí son todos al menos diferenciables, uno puede preguntarse sobre el significado que podría tomar su derivada. Incluso si no tiene un significado claramente definido para hablar de derivada de un fenómeno, se podría suponer que la derivada del modelo (que por hipótesis existe matemáticamente) da una visión plausible de una pendiente promedio de la VR, en un significado que debe aclararse. La figura de enfrente muestra cuán arriesgada es esta hipótesis. Se trata de un zoom realizado alrededor del último punto de datos de la figura anterior, y que muestra que pueden existir diferencias considerables a nivel de las pendientes de los distintos "mapas", incluso si uno está ubicado exactamente en un punto de datos . De hecho, al querer interpretar la derivada del mapa, invocamos una propiedad analítica del modelo que va mucho más allá del marco en el que se ajustó realmente el modelo.
Naturalmente, los riesgos de transgredir el umbral del realismo se incrementarán si pedimos una propiedad aún más exigente: si es poco probable que la derivada del modelo corresponda a una pendiente a nivel del fenómeno físico, es incluso más improbable que la segunda derivada.puede asociarse con una noción de curvatura, a pesar de lo que expresa la matemática pura ... El progreso de un estudio geoestadístico requiere, una vez más, satisfacer una búsqueda de equilibrio: por un lado, es legítimo intentar utilizar el modelo para expresar propiedades de los fenómenos que no podrían demostrarse con una simple manipulación de los datos brutos; pero por otro lado, es fundamental darse los medios para controlar las conclusiones del modelo volviendo a lo que es la base de todo el proceso, a saber, la propia RV.
Cuando esto no genere ninguna ambigüedad, a continuación respetaremos los hábitos de notación en uso en la literatura geoestadística francófona:
representa el valor medio de la RV en el dominio , sin prejuzgar el tamaño del espacio inicial. En cuanto a la notación , representa la medida (en el sentido matemático) del dominio : longitud, área o volumen, dependiendo de si el espacio de partida es de una, dos o tres dimensiones.
Una realidad virtual no puede limitarse a una colección de valores digitales ubicados en puntos del espacio de trabajo, porque “los valores digitales no son la realidad, sino una primera imagen (analíticamente muy rica, estructuralmente muy pobre) de ella. Ci”: solo una primera imagen. Por supuesto, nada impediría el desarrollo de algoritmos geoestadísticos basados únicamente en este aspecto puramente cuantitativo, y apoyándose exclusivamente en la precisión matemática de las operaciones; sin embargo, está claro que al hacerlo, nos estaríamos privando de información importante, ausente de los datos y sin embargo esencial para asegurar la relevancia del futuro procesamiento de estos datos. Además, incluso si el conjunto de datos brutos constituye la única información indiscutible y el último recurso en caso de duda metodológica, “el resto, las ideas que podemos formarnos sobre la génesis y la estructura del fenómeno y, de manera más general, el nuestra intuición física, sin embargo, sigue desempeñando un papel muy importante entre bastidores. En general, es en este tesoro arquetípico donde tendremos la oportunidad de encontrar los esquemas o los principios impulsores de modelos verdaderamente adaptados. "
Esta información, la mayoría de las veces cualitativa, que agrega significado a los datos procesados, solo puede adquirirse mediante el diálogo entre el geoestadístico por un lado y el naturalista por otro, o más generalmente el profesional que presentó el problema. Esta fase del diálogo es aún más crucial ya que, si se descuida, generalmente no habrá salvaguardas que proteger en desarrollos posteriores contra tratamientos desprovistos de importancia física, por lo que uno corre el riesgo de cruzar el " umbral del realismo " sin siquiera ser consciente de ello. . La dificultad es que el geoestadístico, especialmente si se acerca a un campo de aplicación nuevo para él, no necesariamente sabrá de qué preocuparse con el naturalista; ya la inversa, el naturalista que no esté familiarizado con las teorías implementadas no necesariamente sabrá en qué punto sensible debe enfatizar.
Sin embargo, existen constantes, características de la RV que el geoestadístico debe conocer cualquiera que sea el estudio que realice, bajo pena de perder inmediatamente todo contacto con el significado físico de sus operaciones. Así, en todos los casos podemos distinguir tres atributos (naturaleza, dominio y escala de trabajo, soporte) y una propiedad (aditividad), de los cuales el geoestadístico debe ser consciente y mantener el control.
La naturaleza de la RV no parece plantear un problema en general: se trata simplemente de notificar primero de qué variable de interés estamos hablando y de especificar la unidad utilizada para medir los datos (o las diferentes unidades en el caso de un RV multivariable).
Por supuesto, es importante que en un conjunto de datos, todas las muestras sean de la misma naturaleza y se expresen en las mismas unidades:
Es cierto que el formalismo de procesamiento multivariable es más pesado y, a veces, más difícil de manejar que el estudio de una sola variable escalar. Entonces podríamos tener la tentación de convertir a priori datos inicialmente dispares en una sola unidad y luego abordar el problema desde una perspectiva monovariable. Esta técnica no es recomendable: oculta la heterogeneidad del material que se manipulará posteriormente, y por tanto elimina información posiblemente importante. De hecho, se recomienda tener cuidado de distinguir muestras que, sin embargo, son estrictamente de la misma naturaleza, pero tomadas con equipo y / o en momentos muy diferentes. Por ejemplo, no sería prudente emprender un estudio de cartografía submarina mezclando datos de la década de 1960 (antes del posicionamiento por GPS, los errores de ubicación podían ser varios hectómetros en mar abierto) y datos actuales o, más exactamente, es deseable "hacer entender "para el procesamiento futuro que los datos son de diferentes calidades.
Este último ejemplo llama la atención sobre un punto que a menudo se pasa por alto, pero que es importante para un trabajo geoestadístico cuidadoso. Idealmente, sería deseable que cualquier variable estuviera asociada a un indicador de su calidad. Después de todo, la mayoría de los fabricantes brindan información sobre la precisión de sus instrumentos a los profesionales, y sería una pena no utilizar ese conocimiento. En los casos más básicos, esto es simplemente un margen de error, un único intervalo de confianza para todas las mediciones. Pero la situación puede ser mucho más compleja: así, para las mediciones de batimetría realizadas por un barco a lo largo de perfiles paralelos, es probable que los errores de localización a lo largo de un mismo perfil estén fuertemente correlacionados, mientras que quizás sean independientes entre dos perfiles. . Esta es una información muy importante, que en ningún caso puede estar contenida en los únicos valores de la batimetría medidos. Por tanto, sería muy rentable, en la medida de lo posible, asociar con la RV de interés una segunda RV que cuantificara la precisión de la primera, es decir, trabajar en una RV bidimensional (valor, precisión): este enfoque , que ciertamente agrega peso a los cálculos, no se realiza con frecuencia, pero es importante saber que es accesible a herramientas geoestadísticas.
Último punto sobre la naturaleza de la realidad virtual: contrariamente a lo que sería un enfoque puramente matemático que solo se centraría en valores numéricos independientemente de sus interpretaciones y sus unidades, el enfoque del geoestadístico se guía por el significado y la naturaleza de los datos que examina. . Incluso si la curva es la misma (con posibles cambios cercanos a las unidades en los dos ejes), el médico no reaccionará de la misma manera al gráfico de una serie de tiempo dependiendo de si describe la temperatura de un paciente, el mercado de valores precio, la posición de una partícula o una secuencia de precipitaciones en una cuenca ... Porque cualquier campo de trabajo tiene sus especificidades, así como los especialistas en cada campo tienen sus propias experiencias, y sería lamentable, incluso desastroso, privarse de este conocimiento adicional. Teniendo en cuenta la naturaleza de la RV constituye una seguridad, una protección contra el riesgo de superar el umbral del realismo: en igualdad de condiciones, probablemente seremos capaces de aceptar valores modelados negativos en el caso de las altitudes (es simplemente profundidades submarinas); esto será motivo de preocupación, aunque teóricamente aceptable, si se trata de beneficios empresariales; y eso será perfectamente absurdo si se trata de presiones atmosféricas. Más aún: es probable que ante un perfil que represente altitudes y graficado sin especificar las unidades, el practicante no reaccione de la misma forma si piensa que se trata de un perfil de extensión kilométrica o que es el perfil de todo un continente: un mapa sin unidades podría satisfacer al matemático puro, pero es casi inútil para el practicante, al menos desde el punto de vista de la geoestadística.
A diferencia del dominio (matemático) de validez de un modelo, el dominio de la realidad virtual, considerado esta vez como un objeto físico, es una noción ambivalente.
Punto de vista "aguas arriba"Esta es, en primer lugar, la porción de espacio y / o tiempo en la que están disponibles los datos. Por supuesto, dado que los datos siempre se componen de un conjunto finito de valores numéricos, el dominio debería entenderse más bien como una envoltura de puntos de datos, generalmente dilatados (en el sentido morfológico ). Se trata, por tanto, de una definición que deja espacio a un elemento de arbitrariedad, y que está íntimamente asociada a la noción intuitiva, muy común pero imprecisa, de “zona de influencia” de los datos; en otras palabras, el dominio (de definición) de la realidad virtual es la porción de espacio dentro de la cual uno puede creer que los datos disponibles brindan información significativa. Por difusa y en última instancia insatisfactoria que pueda ser, esta formulación es de innegable interés: enfatiza que la extensión del dominio donde la RV puede ser considerada "razonablemente" conocida no solo depende de la geometría de la información, sino también de la estructura intrínseca de la variable estudiada: de hecho está claro, por ejemplo, que para un esquema de muestreo dado, el dominio de una variable muy errática debe considerarse menos extenso que el de una variable altamente estructurada con poca fluctuación; es decir, en un punto alejado de los puntos de medición, los datos disponibles proporcionan menos información si la RV es errática que si fluctúa poco.
Esta observación llama la atención sobre un punto metodológico muy importante. Expresa de hecho que la delimitación del dominio de un VR no debe depender solo de la información ya disponible (la geometría del muestreo), sino también de la estructura del VR, que es una característica que precisamente estamos buscando. para ser resaltado por procesamiento geoestadístico. De hecho, se trata de una "restricción aguas arriba", ya que existe antes del inicio del estudio e independientemente de las elecciones del geoestadístico; pero sólo constituye información futura que se irá revelando paulatinamente y que hay que saber anticipar. En otras palabras, al inicio de un estudio, no sabemos a priori con precisión cuál es el dominio de validez de las operaciones que vamos a realizar, al menos en base a los únicos valores numéricos disponibles: una noción que uno habría pensado que lo básico (el dominio de definición de la realidad virtual) depende en parte de lo que destacará el estudio posterior. Por eso es normal, de hecho necesario y fructífero, que un estudio aplicado no se realice de forma lineal, sino que proceda por retrocesos y reajustes de los modelos según el avance del trabajo.
La comparación del campo con la geometría de la información disponible constituye un primer acercamiento a la muy importante noción de escala de trabajo. Por ejemplo, si el dominio reconocido es el territorio metropolitano francés, es obvio que lo conoceremos mejor con 551.000 datos distribuidos en una cuadrícula de 1 km de lado que con, por ejemplo, 95 datos implantados a razón de uno por Departamento. A grandes rasgos, como sugiere este ejemplo simplista, en primer lugar podemos acercar la noción de escala de trabajo a la de densidad de información. Sin embargo, esta aproximación deja de ser válida una vez que el muestreo se distribuye de forma heterogénea: así, durante una campaña de batimetría realizada en perfiles de navegación paralelos y muy espaciados, perfiles ellos mismos muestreados muy densamente, es muy difícil definir una escala de trabajo globalmente significativa. ; Claramente, tendremos una escala muy fina en las inmediaciones de los perfiles, y suelta al estar lejos de cualquier perfil. Este problema se aclara en geoestadística por el importante concepto de varianza de estimación , una herramienta cuantitativa muy asociada a la escala de trabajo, y que constituye un primer indicador fundamental para medir la calidad y confiabilidad de la modelación realizada.
Punto de vista "aguas abajo"Pero el campo de la RV también depende del problema planteado, y unimos aquí la reflexión sobre el campo de la definición (matemática) del modelo. Es cierto que la porción de espacio en la que nos preguntamos es a menudo muy similar al dominio en el que tenemos los datos: este es en particular el caso cuando se realizan interpolaciones . Así, por ejemplo, la extensión de un depósito mineral que se busca estimar estará muy cerca del sobre de los datos disponibles; del mismo modo, no produciremos un mapa topográfico de los Alpes con datos medidos en Beauce ...
Sin embargo, este requisito de sentido común no siempre se puede cumplir. A veces es la propia naturaleza del problema lo que requiere que el dominio estudiado supere el dominio reconocido por los datos: este es el caso en particular cuando se trata de hacer pronósticos. Pensaremos en ejemplos inmediatos en economía, epidemiología, meteorología y climatología, cuando el espacio de trabajo es el tiempo. Pero hay circunstancias más ocultas. Por ejemplo, al intentar estimar las reservas de un yacimiento, el área en la que deseamos realizar el inventario de la sustancia a explotar corresponde obviamente a la geometría del yacimiento, salvo que esta información no está disponible: el límite del yacimiento no es conocido. Lo único que se puede decir es si un pozo determinado está o no en el campo. Además, la información disponible es generalmente toda interna del depósito, por la sencilla razón de que a los fabricantes no les gusta financiar perforaciones o análisis realizados en roca estéril : en otras palabras, el límite del dominio solo puede evaluarse mediante extrapolación., Que es generalmente una fuente de inestabilidades digitales. Desde el punto de vista metodológico, el peligro es aún mayor, ya que la propia definición del campo se basa generalmente en un umbral de contenido; sin embargo, esta variable, el contenido, es precisamente el objeto de estudio: en el mejor de los casos, estamos expuestos a efectos secundarios , muchas veces impredecibles y que en ocasiones enmascaran por completo la información útil. Pero más profundamente, vemos que se coloca un obstáculo teórico similar al argumento circular , es decir, apenas caricaturizado: " necesitamos la solución (los contenidos en todos los puntos) para plantear correctamente el problema (delimitar el volumen sobre el que estimaremos el depósito) ”; si nos atenemos únicamente a datos numéricos y si no queremos cometer una falta metodológica grave, estamos en un callejón sin salida. Por lo tanto, el refuerzo de la información externa a los datos digitales es absolutamente esencial aquí.
Además, aunque permanezca en un campo de estudio muy similar al campo reconocido, es posible que desee cambiar la escala del trabajo. Así, en el ejemplo propuesto al lado, si se desea realizar una cartografía de los valores geoquímicos en una malla cuadrada de 5 m de lado , esto significa que se desea un resultado a una escala aproximadamente 15 veces más fina que la escala del información inicial, ya que la distribución de los datos equivale en promedio a una cuadrícula de 75 m . Hay un punto crucial a señalar aquí: absolutamente nada, al inicio del estudio y sobre la base de solo 412 datos, permite saber si el proyecto de refinar en un factor de 15 la escala inicial es legítimo o no. . Es evidente que la justificación de esta operación dependerá estrechamente de la estructura de la variable estudiada, y que una operación aceptable para una variable muy fuertemente estructurada se volverá poco realista para una variable muy errática; el problema es que esta estructura sólo puede entenderse a partir de los datos disponibles, es decir, en la escala más holgada: aquí nos encontramos ante un problema muy similar metodológicamente al que se encuentra en la señal teórica . Una vez más, el practicante debe invocar su experiencia y saber cómo mostrar anticipación, antes de que las manipulaciones críticas le permitan, pero solo a posteriori , juzgar la relevancia de sus elecciones.
Ilustración resumidaCon base en los datos antes mencionados (geoquímica en la isla de Vulcano), las siguientes imágenes ilustran algunos problemas relacionados con la representación de un RV y sus atributos:
Esta figura simplista ilustra uno de los primeros propósitos del trabajo geoestadístico elemental: “llenar los vacíos de información”. De hecho, además de los límites del dominio que se imponen aquí, lo único que realmente se conoce es el conjunto de 412 datos, que se ve en la primera miniatura: pero esta información objetiva no se puede mapear en la totalidad del dominio, ya que esto constituye un continuo . Esta primera imagen es muy difícil de leer e interpretar estructuralmente.
La segunda viñeta ofrece una primera pista de visualización: una partitura de Voronoï , con una codificación de colores que permite hacerse una idea de la estructuración espacial de la realidad virtual. Mais il va de soi qu'il s'agit d'une représentation très grossière, et que personne n'imaginera que la réalité (telle qu'on pourrait l'observer si on effectuait des mesures supplémentaires) puisse ressembler effectivement à ce que montre esta imagen. Este es un primer modelado, una primera interpolación, por otra parte extremadamente cuestionable. En efecto, tiene propiedades matemáticas (es constante por piezas) que en este caso no tienen posibilidad de corresponder a una realidad física.
Las dos últimas miniaturas representan exactamente el mismo conjunto de valores, que es una interpolación construida sobre la base de los datos 412. Solo las escalas de representación difieren, respectivamente 75 my 5 m . Se eligió el primero de estos valores porque equivale a lo que sería una distribución regular de los datos 412: así, existe el mismo número de valores de la VR representados en las miniaturas 2 y 3. Observamos que estos Los parámetros “Downstream”, arbitrarios, tienen un impacto significativo en la apariencia de las tarjetas. Podemos imaginar que el aspecto accidentado de la tercera viñeta es un artefacto puro ; pero hay que ver que un efecto bastante similar aparecería en la cuarta viñeta si lo observáramos con más detalle ... Estos efectos, consecuencias claramente visibles del modo de funcionamiento aquí, son estrictamente inevitables, y es importante no darles un significado físico que no podrían tener.
La noción de escala, un concepto esencial de la geoestadística: elementos de reflexión
No tiene ningún sentido hablar de una "gran escala" o una "gran" distancia. Il est bien sûr légitime de comparer des échelles et dire que l'une est plus fine que l'autre, et a fortiori de comparer des longueurs, mais cet aspect relatif ne rend compte que très imparfaitement de la complexité de la notion et de ses apuestas.
La escala de trabajo depende de al menos tres factores, que no son todos accesibles al mismo tiempo de un estudio y que a veces plantean requisitos contradictorios:
Un gran problema metodológico es que este último y más importante factor no se conoce al inicio del estudio, y solo sale a la luz de forma paulatina. Mucho más: su conocimiento depende de la densidad de la información, en el peor de los casos la posibilidad de ocultar las propiedades del fenómeno por las propiedades del sistema de muestreo (fuerte analogía con el teorema de Shannon y el aliasing ). Pero sin llegar a casos extremos, está claro que las mejores características estructurales no se pueden resaltar con una malla de reconocimiento suelta. Nuevamente, debemos buscar un equilibrio entre lo deseable (un conocimiento detallado del fenómeno, pero ¿quizás una información demasiado detallada sea superflua para el problema planteado?) Y lo que es posible (la recopilación de información tiene un costo, e incluso a veces es destructiva. ).
Este equilibrio es crucial porque, a diferencia de lo que generalmente ocurre desde una perspectiva puramente matemática, la percepción que tenemos de las propiedades de una RV depende esencialmente de la escala a la que cuestionemos esta RV considerada como un objeto físico. Así, un mismo objeto, por ejemplo una cadena montañosa de 100 km , no tendrá las mismas propiedades para un fotógrafo que capte su perfil panorámico general para la intención de una revisión geográfica (escala de trabajo aproximada: unos diez kilómetros), y para un alpinista quién sube los picos principales de esta misma cadena (escala de trabajo aproximada: menos de un decámetro); misma RV, mismo dominio, pero escalas de trabajo muy diferentes: los modelos matemáticos relevantes sin duda serán también muy diferentes.
Suele ser superfluo, al concluir un estudio, recordar los parámetros estructurales de la variable estudiada (punto 3 anterior), aunque estos parámetros fueron los más importantes para la realización de la modelación que permitió el estudio: el operador minero quiere ante todo un evaluación de su depósito, no una imagen teórica de este depósito. Por otro lado, es importante que los parámetros que describen el muestreo inicial (punto 1) no vuelvan a aparecer como elementos perturbadores del resultado final: un mapa de batimetría debe representar el relieve submarino, no el rumbo del barco que realizó las mediciones. . Finalmente, así como cualquier figura debe tener una leyenda y cualquier mapa de ejes graduados, es fundamental que el marco del estudio (punto 2) sea recordado en detalle en la conclusión del trabajo, ya que de ella depende el significado. de los resultados: es una garantía contra el riesgo de “ extrapolación metodológica ”.En pocas palabras ... ↑ ↓ | |
Sin importancia si nos atenemos a un formalismo matemático puro, los conceptos de naturaleza y dominio de una RV, así como la noción de escala de trabajo, son fundamentales para la comprensión del fenómeno estudiado y el realismo de los estudios. Tener en cuenta la naturaleza de la RV permite situar el estudio en su contexto físico, evitar un posible uso excesivo de modelos matemáticos y beneficiarse de la experiencia de los profesionales. La delimitación del dominio , ya sea impuesta por consideraciones externas o que resulte de las propiedades de la propia RV, es decisiva para detectar los posibles efectos secundarios y controlarlos o al menos cuantificarlos. Finalmente, la escala de trabajo es un elemento complejo, dependiendo tanto de parámetros contingentes (aguas arriba: el esquema de muestreo; aguas abajo: el marco del problema planteado) como de factores inherentes a la física de la RV. El usuario tiene sólo una libertad parcial para establecer su escala de trabajo y, al mismo tiempo, debe tener en cuenta que la respuesta a un problema geoestadístico aparentemente único depende esencialmente de la escala que se haya adoptado. |
Matemáticamente, un VR será una función en el espacio inicial, por lo tanto, tomará un valor en cualquier punto de este espacio. En estas condiciones, "conocer" ciertos valores de la VR significaría que la medición se ha realizado realmente en un número (necesariamente finito) de puntos. Sin embargo, nunca se puede realizar tal medición: incluso para variables tan simples como dimensiones topográficas, temperaturas o presiones, los valores comunicados por el aparato nunca son estrictamente puntuales, aunque solo sea por el tamaño del dispositivo de medición; y del mismo modo, una medida de tiempo nunca es estrictamente instantánea, presentando ningún dispositivo un efecto de histéresis más o menos pronunciado. Por supuesto, podemos considerar que en los primeros ejemplos que acabamos de citar, no hay peligro de considerar los datos como apreciablemente puntuales, pero hay situaciones en las que esta aproximación ya no es aceptable. Así, en geoestadística minera, siempre se realiza un análisis mineralógico sobre una muestra de un determinado volumen (un núcleo , por ejemplo), y el valor de la ley que se obtiene es de hecho, en este caso, el promedio de las leyes. .presente ocasional en esta zanahoria. Por tanto, el valor que se mide depende de la variable de interés (el contenido), pero también de parámetros contingentes como el tamaño y la forma del núcleo. Lo mismo ocurre con la meteorología, donde la precipitación medida no es una cantidad de agua que cae instantáneamente, sino la acumulación de la que cae durante un período arbitrariamente fijado. Como último ejemplo más complejo, podemos citar finalmente la medida de la elevación del océano , actualmente conocida con precisión centimétrica: tal precisión, referida a un fenómeno espacio-temporal que en un punto de coordenadas fijas puede experimentar fluctuaciones de algunas decenas. de metros, solo tiene sentido si la variable de interés se define como un promedio calculado sobre un medio geográfico e intervalo de tiempo bien especificados; y la solidez de esta media dependerá claramente por completo de este soporte y este intervalo.
También puede haber situaciones en las que la propia naturaleza de la realidad virtual hace imposible considerar medidas únicas, incluso aproximadas. Por ejemplo, en la prospección de uranio, el valor de radiactividad medido en un punto no depende solo de la actividad de la fuente de radio ubicada en ese punto, sino de todo el entorno, y esto siguiendo una ley de ponderación perfectamente conocida por los físicos. Lo mismo ocurre con la geofísica (gravimetría o magnetismo): los valores observados en un punto son indicativos de todo un entorno, entendiéndose que las regiones más distantes tienen una influencia más débil que la proximidad inmediata del punto donde se realiza la medición. Medido.
De esta forma, cualquier medida es en realidad una regularización ( suavizado ) más o menos acentuada de los valores puntuales del VR (en el sentido matemático). Este efecto de regularización es siempre inherente al proceso de realizar mediciones y, a veces, además de la naturaleza del fenómeno que se mide. Se puede modelar fácilmente: una medida instrumental siempre aparece matemáticamente como el producto de la convolución del VR (teóricamente punto) por un determinado operador en función del dispositivo de medida y / o la física del fenómeno. Sin embargo, dos comentarios:
Resumiendo ... ↑ ↓ | |
Aunque con frecuencia se considera como único, en aras de la simplicidad, el soporte de VR proporciona una imagen del dominio espacial que, en las proximidades de cada punto de medición, contribuye al valor asignado a la VR en ese punto. Las características de este soporte dependen del equipo y las condiciones de medición, y en ocasiones de la física del fenómeno. Matemáticamente, un soporte no puntual interviene en el formalismo geoestadístico como operador de convolución; en la práctica, esto equivale esquemáticamente a tomar un promedio móvil (posiblemente ponderado). |
Por lo tanto, tener en cuenta un apoyo a la regularización introduce un nuevo factor de escala. Este nuevo factor interviene de forma más discreta que los demás a la hora de definir las condiciones de procesamiento de datos, por ejemplo durante estimaciones o simulaciones numéricas: la elección de los puntos de datos que se utilizarán para realizar una interpolación depende mucho más de la estructura de el fenómeno y la densidad de la información que en el medio; por otro lado, el soporte tiene una importancia considerable en las estadísticas realizadas sobre los datos, y particularmente en lo que respecta a la variabilidad . Así, una de las primeras contribuciones históricas notables de la geoestadística, en el campo minero, consistió en explicar y modelar el hecho de que las leyes medidas en secciones delgadas eran más fluctuantes y menos estructuradas que las leyes (del mismo mineral, en la misma mina). .) medido en zanahorias.
Último comentario: el fenómeno de la regularización tiene un impacto directo en la estructura de las herramientas de investigación estructural, en particular el variograma , y este impacto característico es muy fácil de modelar. Asimismo, a la inversa, las herramientas geoestadísticas pueden, en determinados casos, permitir diagnosticar que las mediciones que se creían cuasipuntuales están en realidad regularizadas.
Se dirá que una RV es "aditiva" si el valor total que adquiere en un conjunto de dominios geográficos disjuntos es igual a la suma de los valores tomados en cada uno de estos dominios. Por ejemplo, en una mina a cielo abierto, el tonelaje de metal contenido en un paso es de hecho igual a la suma de los tonelajes en cada uno de los distintos bloques que componen este paso: la cantidad de metal es una variable aditiva; aún más simple en este ejemplo, es lo mismo para el volumen. Asimismo, cantidades de calor o electricidad, masas, volúmenes producidos por un pozo de petróleo (en función del tiempo), etc. son variables aditivas. Esta propiedad es particularmente interesante, porque hace que los mecanismos de cambio de escala sean muy fáciles mientras mantiene un sentido físico de las operaciones.
Sin ser aditivas, hay variables que también se benefician de buenas propiedades, porque podemos reducirnos al caso anterior mediante una simple transformación. Este es el caso, por ejemplo, de los contenidos: el contenido global de un conjunto de varios bloques no es igual a la suma de los contenidos de cada uno de ellos; pero si multiplicamos cada uno de los contenidos por el volumen del bloque correspondiente, obtenemos una masa que es una variable aditiva, y la suma de las masas dividida por la suma de los volúmenes da el contenido total. Esta vez, el resultado final se obtiene como ya no es una suma, sino un promedio ponderado; tenga en cuenta además que si todos los bloques fueran del mismo volumen, sería una media aritmética simple. Esta situación se encuentra, por ejemplo, en hidrogeología con una variable como la porosidad , en agricultura con rendimientos por hectárea, en epidemiología con número de pacientes por municipio o por departamento, en medio ambiente con tasas de contaminación. En este último caso, también podemos volver al caso temporalmente aditivo si se trata de una sustancia que no se degrada, como un metal pesado , etc. Observamos en todos los casos que para volver a una cantidad aditiva, es necesario utilizar una variable auxiliar, a menudo de naturaleza geométrica, como el área o el volumen, la duración o la masa: también es naturalmente necesario que esta La variable auxiliar se ha muestreado correctamente, y este es un caso en el que el geoestadístico puede ser un buen consejo para su cliente de la campaña de medición.
El interés metodológico de una variable aditiva es considerable. En efecto, al realizar acumulaciones de esta variable en dominios lo más variados posible, siempre se obtienen valores que tienen un significado físico claro y que además pueden ser - al menos por el pensamiento - objeto de controles experimentales. Además, las herramientas más sencillas de la geoestadística lineal permiten formalizar teóricamente estas transformaciones (acumulaciones o promedios ponderados) y hacerlas operativas. El único límite contingente a esta fase de control es la cantidad de información disponible.
En pocas palabras ... ↑ ↓ | |
Una variable aditiva mantiene el mismo significado físico en todos los soportes: su valor en el conjunto (geográfico) es igual a la suma de sus valores en las partes. Por extensión, podemos mantener cuidadosamente la misma palabra para calificar variables que pueden reducirse al caso aditivo estricto a costa de una transformación simple. En estas condiciones, una variable aditiva tiene la particularidad de no provocar un efecto de emergencia . Sin ser estrictamente imprescindible para el trabajo geoestadístico, la propiedad de aditividad facilita considerablemente los desarrollos teóricos, especialmente si es necesario realizar cambios de apoyos o escalas. Por el contrario, las variables no aditivas requieren mucha precaución en su manipulación y hacen que la fase de reconstrucción operativa sea mucho más crucial y mucho más difícil. |
Para acercarnos a una noción común, podemos decir que las VR aditivas o las que pueden reducirse a un comportamiento aditivo tienen la particularidad de no provocar un fenómeno de emergencia .
Desafortunadamente, muchas variables no son aditivas. Por ejemplo, una temperatura no solo no es aditiva en sentido estricto, sino que no es seguro que un promedio de temperaturas tenga un significado físico indiscutible, ya sea este promedio espacial o temporal. Esto no significa, por supuesto, que este promedio sea inútil: uno puede imaginar que ocupa un lugar legítimo en (por ejemplo) ecuaciones de evolución; incluso se puede (al menos mediante el pensamiento) controlarlo "sobre el terreno" y, por lo tanto, tiene un significado objetivo; pero es imposible imaginar un fenómeno físico que, en un lugar dado y en una fecha dada, tome el valor indicado por esta media espacio-temporal: este valor es, por tanto, ni más ni menos que el resultado de un proceso de Cálculo.
Otro ejemplo de RV no aditivo, mucho más complejo de tratar, lo proporciona la hidrogeología con permeabilidad variable . No existen relaciones simples entre las diferentes permeabilidades medidas a diferentes escalas (microscópicas y macroscópicas); no existe una expresión simple que permita relacionar la permeabilidad en dos unidades de volumen y la permeabilidad resultante en la unión de estos dos volúmenes, e incluso las expresiones disponibles dependen de la dimensión del espacio. En estas condiciones, está claro que una suma (posiblemente ponderada) de dos permeabilidades no tiene significado físico y, incluso si no se realiza ningún cambio de escala, una simple interpolación ya puede ser problemática: en este caso, no es el matemático herramientas que muestran debilidades, pero es un fenómeno físico que revela su extrema complejidad. En estas condiciones, y más generalmente para vehículos recreativos no aditivos, no hace falta decir que el trabajo geoestadístico debe realizarse con la máxima precaución.
Desde los inicios de la geoestadística, los límites inherentes a un trabajo basado exclusivamente en el modelo primario aparecieron tanto a nivel teórico como a nivel de implementación. Los formalismos desarrollados, y que constituyen el tema de la geoestadística transitiva , se expresan esencialmente para información disponible en una malla regular (posiblemente con huecos), que puede ser adecuada para ciertos problemas (análisis de imágenes, por ejemplo, o estimaciones de superficie o volumen) pero no es adecuado para muestreo irregular como se encuentra en la mayoría de los estudios: esta dificultad se encontró desde los primeros trabajos aplicados, que se referían a estimaciones mineras. Sin embargo, podría haber sido interesante buscar la solución de este problema puramente técnico dentro del marco del modelo primario, ya que este modelo parece satisfactorio: en efecto, no requiere ningún supuesto particular relativo a la estructura de la RV estudiada, y la Las herramientas de geoestadística transitiva están esencialmente adaptadas para trabajar en un campo delimitado, que corresponde exactamente al marco de un estudio real.
Guiño antropocéntrico ... ↑ ↓ | |
Debemos evitar pedirle a un modelo que se juzgue a sí mismo. En el mejor de los casos, no podrá hacerlo; en el peor de los casos, será moralista. El modelo primario y la geoestadística transitiva no son una excepción a esta regla. Se necesitan herramientas y suposiciones adicionales para romper el estancamiento, y la elección de geoestadísticas intrínsecas es recurrir a un formalismo probabilístico. |
Sin embargo, aparece un obstáculo básico tan pronto como se desea evaluar la calidad de los resultados propuestos. De hecho, ya se trate de interpolación, estimación o cualquier otra operación algorítmica realizada en un conjunto de datos, está claro que no es posible estar satisfecho con la producción de un solo número (o una sola tarjeta); También es necesario que tengamos una medida al menos indicativa de la fiabilidad de este resultado. Sin embargo, aquí aparece un resultado profundo, que marca los límites del método transitivo: “ Teóricamente es imposible deducir de los mismos datos experimentales tanto una estimación como la precisión de esta estimación. "Quedarse con un uso exclusivo de la realidad virtual no tiene salida: si" aceptamos decir que un modelo es estrictamente objetivo si sus criterios de especificación solo involucran parámetros objetivos (identificables con cantidades regionales) y parámetros metodológicos (impuestos inequívocamente por el problema a ser resuelto y el método elegido) con exclusión de cualquier otro tipo de parámetros convencionales ”, entonces“ es claro que un modelo estrictamente objetivo -y precisamente porque es estrictamente objetivo- no puede ser solo tautológico : solo representa de otra forma la misma información, la que está contenida en los datos del VR ”.
Desde un punto de vista teórico, existe un círculo vicioso. " En la práctica, sin embargo, la introducción de ciertas hipótesis razonables de aproximación o simplificación permite romper el círculo ": estas son las hipótesis anticipatorias, " con su fecundidad y la vulnerabilidad que implica ". Históricamente, para los datos dispuestos en los nodos de una cuadrícula regular, la geoestadística ha utilizado un subterfugio: considerar que el origen de la cuadrícula se ha elegido al azar de manera uniforme, lo que ipso facto otorga a las cantidades regionales un estado aleatorio y, por lo tanto, abre la puerta. a posibles cálculos de varianza , es decir, herramientas de medición de la calidad. Este enfoque parece tanto más satisfactorio cuanto que no implica ninguna hipótesis a priori sobre las propiedades (estadísticas, estructurales) de la propia RV. A primera vista, el problema está resuelto, incluso si la respuesta depende en gran medida de la regularidad de la malla de muestreo: obviamente, hay muchas situaciones en las que asumir datos distribuidos regularmente no será una aproximación aceptable. Pero hay un resultado más profundo que destaca el enfoque teórico: en igualdad de condiciones, la varianza teórica de un estimador puede presentar fluctuaciones numéricas considerables e incontrolables para pequeñas variaciones de la dimensión de la malla. Inesperadamente, nos encontramos en lo que Matheron llama una " situación prerrequisito ": "La" idea de azar ", es decir, en realidad, el uso de modelos probabilísticos, se introduce en la física" cuando las condiciones iniciales inseparables experimentalmente son posteriormente seguido de una evidente separación de los fenómenos observados ". »Y luego, cuando optamos por representar la función estructural - que es una cantidad regional - mediante un modelo más simple, podemos interpretar este modelo« como una transición a la expectativa matemática ». En cierto modo, el marco probabilístico se impone.
La geoestadística intrínseca optó por dar el paso y colocar deliberadamente como parte de un modelo probabilístico, y esta elección ha tenido lugar desde el comienzo de la geoestadística. Desarrollos posteriores han demostrado que, aunque se basa en una teoría mucho más abstracta que la geoestadística transitiva, este formalismo es perfectamente operativo y abre más perspectivas. El formalismo transitivo puede considerarse como el origen de la morfología matemática y presenta un interés educativo innegable; pero en el marco de la geoestadística ya casi no se utiliza salvo para tratar problemas de naturaleza geométrica.
Estado epistemológicoLa elección de geoestadísticas intrínsecas es asociar con cualquier VR una función aleatoria (FA), de la cual la VR se considerará como una realización .
Esta elección , debido a que es una decisión perfectamente arbitraria, está dictada solo por consideraciones operativas. Se inspiró en las reflexiones sobre el estado de la realidad virtual y, posteriormente, se reforzó con la práctica y los desarrollos de la geoestadística. Pero no significa que la realidad que estamos estudiando proceda realmente de un fenómeno aleatorio. Además, afirmar que lo real es la emanación de alguna forma de azar es una proposición que no es verificable ni refutable y que, en consecuencia, queda fuera del alcance del discurso científico. Lo que puede ser objeto de trabajo científico, en cambio, es el estudio de la adecuación de un modelo aleatorio a la realidad estudiada. Así, con un grado de aproximación fijo, podemos comprobar si un modelo probabilístico permite dar cuenta de la información disponible, y esto es exactamente lo que se propone hacer la geoestadística; pero la respuesta no es exclusiva, y es perfectamente posible que modelos fundamentalmente contradictorios den cuenta simultáneamente del mismo fenómeno con la misma calidad.
A fortiori , sería inútil buscar dar un significado objetivo al espacio probabilizado en el que se define el AF: ¿qué realidad tangible podríamos otorgar al universo en el que se suponía que se hubiera tomado la RV estudiada? y sobre todo, ¿cómo podríamos acceder a la ley de probabilidad de esta muestra, sabiendo que solo tenemos un resultado (la VR) de dicha muestra? Dicho esto, incluso rechazando las especulaciones metafísicas sobre el espacio probabilístico, no podemos evitar la pregunta metodológica que subyace a todo el proceso de geoestadística intrínseca: ¿cómo podemos justificar el uso de modelos probabilísticos para dar cuenta de un fenómeno único? La respuesta se da paulatinamente, en las sucesivas etapas del establecimiento del formalismo intrínseco; También se puede notar que esta pregunta es implícitamente el tema principal de Estimate and Choose , que examina todos sus aspectos e implicaciones.
En cualquier caso, es evidente que el uso de modelos probabilísticos desarrolla herramientas más abstractas que el tratamiento directo de la RV, y que en consecuencia se incrementan considerablemente los riesgos de perder el contacto con la realidad y superar el umbral del realismo . Esta asunción de riesgos solo se justifica por la efectividad de este nuevo nivel de abstracción, la efectividad que se observa en todos los estudios y todos los desarrollos realizados desde los inicios de la geoestadística aplicada. Básicamente, las precauciones metodológicas a tomar son exactamente las mencionadas en relación con el modelo primario y por lo tanto, aunque aquí son más cruciales, no es necesario repetirlas. Paradójicamente, si bien todavía existía un riesgo real de confusión a nivel del modelo primario, ya que la realidad virtual podría confundirse fácilmente con el fenómeno, el peligro de confusión aquí es mínimo: nadie ha observado nunca un espacio probabilizado, nadie ha nunca tocó una ley de probabilidades. Estos seres matemáticos, de los que mucho se espera a nivel de construcciones teóricas, no son en modo alguno magnitudes regionales : son puros artefactos , productos de nuestro intelecto. Por lo tanto, es claro que los elementos del espacio probabilizado deben ser excluidos imperativamente del resultado final si éste pretende poder asociarse con una propiedad física, controlable "en el campo": la fase de reconstrucción operativa es aquí crucial si lo único que queremos es que las conclusiones de un estudio tengan un significado concreto.
Convenciones de escrituraUn espacio probabilizado suele estar representado por un triplete
o :
Si, como en los ejemplos anteriores, designamos el espacio inicial (“geográfico”) por , una función aleatoria se definirá como una familia de variables aleatorias definidas en el espacio de probabilidad y con valores en el espacio de llegada, esta familia siendo indexado por . Por tanto, una posible notación es
Recuerde: ↑ ↓ | |
Es común en las publicaciones geoestadísticas representar convencionalmente las cantidades regionales (deterministas) con letras minúsculas y las cantidades aleatorias asociadas con letras mayúsculas. Además, la mayoría de las veces, las funciones aleatorias se presentan como una función únicamente del espacio geográfico, omitiendo la referencia al espacio de probabilidad en el que se definen. |
Sin embargo, este escrito no destaca suficientemente el hecho de que el conjunto debe ser un espacio métrico, y que estamos interesados principalmente en las propiedades estructurales de considerado como una función de . Entonces, la geoestadística prefiere señalar una función aleatoria como una función de dos variables, una que abarca el espacio probabilístico y la otra el espacio "geográfico". De modo que el uso será, por ejemplo, para representar un AF real en la forma
.Esta presentación en forma de función de dos variables muestra que:
De hecho, por un lado porque el espacio de eventos no tiene realidad física (por lo tanto, tampoco), por otro lado porque es principalmente la estructuración en el espacio de partida lo que interesa al geoestadístico, generalmente escribimos el FA en función de una sola variable :, acentuando así el paralelismo con la VR asociada . La aleatoriedad se revela convencionalmente mediante el uso de una letra mayúscula.
Así, cuando se asocia un AF con un VR , automáticamente será posible asociar a cualquier cantidad regional una versión probabilística que se obtendrá reemplazando en su expresión el VR por el AF; y, a nivel de escritura, simplemente equivaldrá a cambiar de minúscula a mayúscula. Así, manteniendo las convenciones de escritura definidas anteriormente, tenemos la tabla de correspondencias:
Versión de realidad virtual | Versión FA | ||
---|---|---|---|
Estado | Clasificación | Clasificación | Estado |
Número | Variable aleatoria | ||
Función | Función aleatoria | ||
Número | Variable aleatoria | ||
Número | Variable aleatoria | ||
Función | Función aleatoria | ||
Función | Función aleatoria |
Queda ahora por aclarar el mecanismo intelectual que regula la asociación entre un VR y un AF, luego por describir cómo este mecanismo interviene en un estudio geoestadístico.
Desde un punto de vista puramente matemático, escribir un AF como una función de dos variables en un conjunto abstracto :
muestra cómo una función aleatoria genera variables regionalizadas: para cada evento fijo (elemento) de la tribu , la aplicación parcial
Para hacerlo muy simple ... ↑ | |
Así como la realización de un experimento aleatorio puede considerarse como el sorteo aleatorio, según una determinada ley de probabilidades, de un valor numérico entre todos los valores posibles que puede tomar una variable aleatoria. Asimismo, la realización de una función aleatoria equivale a dibujar aleatoriamente, según una determinada ley de probabilidades, una determinada función entre todas las funciones posibles propuestas por el AF. En el primer caso, el resultado de la realización es un número (o un multiplete de números); en el enfoque geoestadístico, el resultado de un logro es una función del espacio “geográfico”, es decir una variable regionalizada. |
de hecho, se convierte en una función de una sola variable definida en el conjunto geográfico único . Ahora se descarta cualquier referencia a un contexto probabilístico, por lo que, de acuerdo con las convenciones de escritura, es legítimo representar esta función con una letra minúscula. Y esta función tiene exactamente el significado de una variable regionalizada. Entonces, cuando tiene un AF , puede construir tantos VR como pueda elegir de la Tribu de eventos subyacente.
Esta construcción es por el momento puramente algebraica y solo pone en juego el espacio de probabilidad . L'aspect aléatoire intervient dans la manière de choisir , et ce choix sera tributaire de la loi de probabilité , de sorte qu'intuitivement, toutes les VR possibles associées à une même FA n'auront en général pas la même chance d'être tirées al azar. El mecanismo completo que consiste primero en dibujar un evento al azar y luego en asociarlo con el correspondiente VR se denomina realización del proceso (sinónimo: del AF) y por extensión, diremos en definitiva que "el VR es una realización de el AF ".
Esta última formulación elude tanto a la tribu como a la ley de la probabilidad : esto no es en modo alguno incómodo en la medida en que estos dos conceptos matemáticos no tienen estrictamente ninguna existencia objetiva, por lo que sólo deben intervenir de la manera más discreta posible en los desarrollos algorítmicos ( principio de parsimonia ). , y no debe estar presente en la declaración del resultado final de un estudio aplicado.
Por otro lado, debe enfatizarse que la RV es solo una - y solo una - realización, entre muchas otras posibles dentro del marco del modelo probabilístico subyacente. En otras palabras, el modelo FA es mucho más rico y complejo que el modelo VR, y también mucho más abstracto en el sentido de que depende de muchos factores (tribu de eventos, ley de probabilidad) que no tienen un significado objetivo y, por lo tanto, no pueden ser el sujeto de control experimental. A nivel práctico, debemos ser conscientes de que recurrir a un modelo probabilístico aumenta considerablemente los riesgos de traspasar el umbral del realismo ; y en el plano epistemológico, debemos cuestionar el significado de querer representar un fenómeno único (VR, para decirlo simplemente) mediante un modelo aleatorio: este problema, verdaderamente fundamental y esencial, constituye el tema del trabajo de Georges Matheron Estimer et elegir . En cuanto a la justificación para recurrir a un método indudablemente más difícil de implementar que el modelo primario , es de carácter empírico: el desarrollo del trabajo y las herramientas geoestadísticas desde mediados de la década de 1950 ha establecido claramente el valor de estas herramientas. términos de eficacia, y justificó las complicaciones metodológicas que introducen.
Cuando un practicante se acerca a un nuevo estudio, tiene un conjunto de valores numéricos que constituyen una muestra del modelo primario, es decir, de una variable regionalizada. Si desea trabajar en el marco de la geoestadística intrínseca, debe asociar esta VR con una función aleatoria, sobre la cual las herramientas teóricas permitirán establecer resultados beneficiándose de toda la eficiencia de los modelos aleatorios. Esta operación se llama "aleatorización" o, más raramente, inmersión probabilística.
Aunque es más común, la palabra "aleatorización" no parece apropiada, principalmente porque puede resultar confusa. A veces describe la acción de tomar muestras aleatorias de un conjunto de datos, y eso claramente no es lo que es cuando pasamos de VR a AF.
Sin embargo, en su sentido más preciso, aleatorizar una variable aleatoria en función de un parámetro significa que le damos a este parámetro un estado aleatorio: la variable aleatorizada se vuelve, en cierto modo, "doblemente aleatoria" ... Este punto de vue es, esta vez , transponible a geoestadísticas intrínsecas: consiste en considerar que una VR dada es en realidad una función (determinista) indexada por un determinado parámetro , luego en reemplazar este parámetro por una variable aleatoria de un espacio probabilizado . Entonces, decidimos posar, con notaciones algo híbridas:
y definimos el AF asociado a la RV por la relación:
.La elección, habitual en las publicaciones geoestadísticas, de no incluir la segunda variable ( ) no es una simple simplificación de la notación. Esto evita llamar la atención sobre un parámetro que no tiene realidad física y sobre el cual el practicante no tiene medios de acción. Por lo tanto, generalmente escribimos un FA , la aleatoriedad (en el modelo) de esta función se designa convencionalmente solo mediante el uso de una letra mayúscula.
Al examinar el mecanismo metodológico que pasa aux , vemos que de hecho se trata de sumergir una clase ya muy rica de objetos matemáticos (los VR) en un todo infinitamente mayor (el FA): la expresión "inmersión probabilística", aunque se utiliza con poca frecuencia, por lo que parece prudente y se mantendrá en el resto del artículo.
Finalmente, esta creciente abstracción conduce naturalmente a mayores riesgos de superar el umbral del realismo, y el geoestadístico debe estar particularmente atento. Pero a cambio, se beneficiará de todo el arsenal de herramientas y teoremas de la teoría de la probabilidad y los procesos estocásticos; y si, al posible coste de las transformaciones, se limita a manipular FA de varianza finita , podrá dotar a su espacio (de FA) de llegada de una estructura espacial de Hilbert que le garantizará por teorema la corrección de sus principales resultados (interpolación, estimación, filtrado, etc.): la ganancia teórica es inmensa, y justifica plenamente los rigurosos esfuerzos que deben realizarse.
La siguiente animación recuerda alegóricamente los tres niveles de un estudio geoestadístico. La imagen de fondo representa un sitio de lavado de oro industrial, como un recordatorio de que un estudio de geoestadística aplicada tiene como objetivo responder preguntas concretas, con desafíos no solo metodológicos, sino también técnicos y económicos.
La primera columna se refiere a la realidad física, al mundo en el que se ha planteado el problema a resolver. Las apuestas de un estudio pueden ser considerables: implícitamente, en la ilustración propuesta, se trata de explotar un yacimiento mineral. La última sanción en este caso será la rentabilidad de la empresa: una sanción generalmente inequívoca, pero que solo llega al final del trabajo. Así, la misión encomendada al geoestadístico es, en esencia, anticipar lo que más tarde será una simple observación, si al menos la operación se emprende y completa realmente: se trata, por tanto, de ir más allá de lo que dicen los datos hic et nunc , que sólo se puede hacer a costa de un ejercicio intelectual de modelado .
La segunda columna recuerda que el primer nivel de modelación consiste en considerar lo real como una función, como un ser matemático: es la introducción del concepto de variable regionalizada . Simbólicamente, el fondo de la figura aquí se difumina parcialmente, para recordarnos que el ejercicio de modelado nos aleja parcialmente de la realidad, tanto al no tener en cuenta toda la complejidad de lo real, como al introducir al mismo tiempo propiedades matemáticas. que quizás no tengan contrapartida en la realidad. Este marco del modelo primario ya permite un procesamiento específico (estadísticas) y constituye el tema de la geoestadística transitiva.
El paso a la tercera columna constituye la característica de la geoestadística intrínseca: consiste, a partir de la única variable regionalizada a nuestra disposición, en invocar una función aleatoria de la cual la RV sería una realización entre una infinidad de otras. Este es el proceso fundamental de inmersión probabilística que, simbólicamente, equivale a reemplazar por . Estamos aquí en un nivel de abstracción mucho más alto, por lo que simbólicamente el fondo es apenas perceptible; por eso también aumenta considerablemente el riesgo de emprender desarrollos teóricos que en realidad no corresponden a nada. Pero al mismo tiempo, nos beneficiamos de toda la riqueza de herramientas probabilísticas que permiten formalizar el problema inicial en términos teóricos y proponer una solución.
El estudio no debe detenerse ahí. Ahora conviene expresar la respuesta teórica en términos concretos. Por lo tanto, primero es necesario asegurarse de que esta respuesta no dependa de ningún parámetro convencional y solo pueda expresarse en términos de magnitudes regionales . Entonces, en la expresión de la solución teórica, es necesario reemplazar la función aleatoria por la variable regionalizada (reemplazar por ): es la fase de realización , que está en la base de la reconstrucción operativa . El resultado que se proporciona a continuación debe compararse con la realidad.
Para concluir la interpretación de esta figura, cabe señalar que el usuario no tiene grado de libertad en la columna de la izquierda, ya que la realidad se impone a todos independientemente de las opciones metodológicas y las preferencias subjetivas; ya la inversa, cuanto más avanzamos en la abstracción, más posibilidades tenemos de tomar decisiones arbitrarias y subjetivas. Además, si sucede que al final de un trabajo los resultados propuestos resultan incompatibles con las medidas de control, es por supuesto a nivel de los modelos donde es necesario hacer correcciones. Entonces se debe emprender un nuevo ciclo: posiblemente un nuevo modelo primario, ciertamente una nueva inmersión probabilística, rehaciendo los algoritmos y rehaciendo la reconstrucción operativa; lo principal es tener en cuenta que, en caso de conflicto entre la realidad y el modelo, es el modelo el que debe alinearse con la realidad ...
que es un punto de función .
Lo que queremos expresar al hablar de "VR no puntual" es que lo que se puede medir efectivamente en el punto no es el valor puntual , sino un valor obtenido al regularizar por una determinada función ponderación ; bien, en notaciones rigurosas,
o :
En el caso en que la función de ponderación construya un promedio (posiblemente ponderado), es decir en el caso en que las variables y sean de la misma naturaleza, la función es adimensional , y la elegiremos con una integral igual a 1, por lo que eso y se expresan en las mismas unidades. Por ejemplo, si la regularización es la media aritmética realizada sobre un cierto dominio deslizante , la función será simplemente, hasta un factor multiplicativo, la función indicadora de .
Pero puede suceder que la regularización también describa un cambio en la naturaleza, en cuyo caso la función se expresará en unidades físicas. Así, el campo gravitacional en un punto se obtiene por convolución del campo de masas, en virtud de la ley de gravitación : en este caso, la función es una función isotrópica en el espacio tridimensional. En este caso, es una función que nunca se cancela, por lo tanto, cuyo soporte (en el sentido matemático) es todo el espacio .
Estos dos últimos ejemplos trazan un posible vínculo entre los dos significados de la palabra "soporte": finalmente, lo que la geoestadística llama "soporte de la RV" está en realidad conectado al soporte (matemático) de la función de ponderación que hizo posible pasar desde la realidad virtual ocasional , experimentalmente inaccesible, hasta la función que - ella - puede ser objeto de medidas reales. Esta ambivalencia de terminología es ciertamente lamentable, pero es dudoso que pueda provocar errores graves. En cualquier caso, cabe señalar que la costumbre ha perpetuado esta licencia de vocabulario de la comunidad geoestadística francófona.
Se trata de una lista, necesariamente incompleta, limitada a trabajos resumidos (cursos o manuales) y clasificada en orden cronológico de publicaciones.
Autor | Título | Editor | Año. | |
---|---|---|---|---|
Georges matheron | Tratado de geoestadística aplicada , volúmenes 1 y 2 | (Fr) | Technip Publishing, París | 1962 |
Georges matheron | Tratado de geoestadística aplicada , volumen 3 | (Fr) | Ediciones BRGM, París | 1962 |
Georges matheron | Principios de geoestadística | (en) | Geología económica vol. 58 | 1963 |
Georges matheron | Variables regionalizadas y su estimación | (Fr) | Masson, París | 1965 |
Jean Serra | Muestreo y estimación local de fenómenos de transición minera | (Fr) | Tesis de doctorado, Universidad de Nancy | 1967 |
Georges matheron | Osnovy prikladnoy geostatistiki | (ru) | Ediciones Mir, Moscú | 1968 |
Daniel F. Merriam | Geoestadística | (en) | Plenum Press, Nueva York | 1970 |
Pierre Laffitte (ed.) | Tratado de Computación Geológica | (Fr) | Masson, París | 1972 |
Georges matheron | Las funciones aleatorias intrínsecas y sus aplicaciones | (en) | Avances en probabilidad aplicada vol. 5 | 1973 |
Michel david | Estimación geoestadística de reservas minerales | (en) | Elsevier Scientific Publishing Company, Ámsterdam | 1977 |
André Journel y Charles Huijbregts | Geoestadística minera | (en) | Academic Press Inc., Londres | 1978 |
Isobel clark | Geoestadística práctica | (en) | Editores de ciencia aplicada, Londres | 1979 |
Bertil Matérn | Variaciones espaciales | (en) | Springer, Berlín | 1986 |
Georges matheron | Estimando y eligiendo | (en) | Springer, Berlín | 1989 |
Georges matheron | Estimar y elegir | (Fr) | Les Cahiers du Centre of Mathematical Morphology n o 7, Ecole des Mines de Paris | 1978 |
Rudolf Dutter | Mathematische Methoden in der Technik, Bd.2: Geostatistik | (de) | BG Teubner Verlag, Stuttgart | 1985 |
Noel Cressie | Estadísticas para datos espaciales | (en) | Wiley Interscience, Nueva York | 1993 |
Jean-Paul Chiles y Pierre Delfiner | Geoestadística: modelización de la incertidumbre espacial | (en) | John Wiley & Sons, Nueva York | 1999 |
Christian Lantuejoul | Simulación geoestadística: modelos y algoritmos | (en) | Springer-Verlag, Berlín | 2002 |
Hans Wackernagel | Geoestadística multivariante | (en) | Springer-Verlag, Berlín | 2003 |
Pierre Chauvet | Hoja de trucos de geoestadística lineal | (Fr) | Mines ParisTech Les Presses, París | 2008 |
Véanse también las actas del foro internacional en memoria de Michel David, Montreal, 1993: