Semántica

La semántica es una rama de la lingüística que estudia el significado , de qué hablamos, de qué queremos transmitir un enunciado . El soporte de la semántica, la sintaxis , concierne por su parte al significante , su forma, su lenguaje, su ortografía , su gramática ,  etc.  ; es la forma de la declaración.

En particular, la semántica tiene varios objetos de estudio:

El término semántica se usa en oposición al de sintaxis en el estudio de los lenguajes de computadora , para lo cual ha sido desarrollado formalmente (ver semántica de los lenguajes de programación ). Existe la misma relación entre semántica y sintaxis que entre contenido y forma.

Etimología

La palabra semántica se deriva del griego σημαντικός ( sêmantikos ), "significado", formado a sí mismo de σημαίνω ( sêmainô ), "significar, indicar" o σῆμα ( sêma ), "signo, marca". Fue tomada en el final del XIX °  siglo por el lingüista francés Michel Bréal , autor de los primeros tratados de la semántica, la prueba semántica apareció en 1897.

Diferencia entre análisis semántico y análisis sintáctico

El propósito del análisis sintáctico , así como del análisis semántico en lingüística, es caracterizar el enunciado como un todo, principalmente determinando las estructuras del enunciado. En ambos casos, la determinación de estructuras se basa en una caracterización de sus elementos básicos, las palabras, y sus propios constituyentes, pero de forma diferente según estos dos enfoques.

El análisis sintáctico se ocupa de frases , en relación con una oración. No es posible realizar un análisis sintáctico de la palabra "pequeño" por ejemplo si no está incluida en una oración, en relación con otras palabras complementos o líderes de grupo.

Por tanto, el análisis puede identificarse como un análisis de estructuras funcionales que se pueden obtener mediante el ejercicio de reglas gramaticales.

El análisis semántico, por su parte, se interesa por estas estructuras observando los mecanismos propios de la construcción de sentido. Una semilla es la unidad más pequeña de significado.

La semántica se puede ocupar palabra por palabra.

Ejemplo:

Analizaremos la palabra "pequeño" de la siguiente manera:

PETIT (Adj. ⇒ que no es grande) + E (marca femenina) + S (marca plural) [PETIT - la base o el radical de la palabra (signo léxico), E + S - son signos gramaticales].

Por lo tanto, para la palabra "pequeño" hay tres semestres.

A partir de esta misma palabra, son posibles otros análisis sin necesariamente sacar a la luz un enunciado completo (cf. introducción).

La distinción entre análisis sintáctico y análisis semántico que aquí se establece corresponde al enfoque más extendido en la lingüística contemporánea, el que hereda del estructuralismo introducido por Ferdinand de Saussure . Conoceremos los términos análisis estructural o análisis de componentes utilizados como equivalente para significar más directamente el enfoque utilizado para realizar el análisis semántico según esta teoría. La estructura se percibe como subyacente directamente a la oración , siendo esta última una estructura evidenciada por la sintaxis o la gramática, y se considera que la palabra está asociada con sus características semánticas . Otros enfoques, como principalmente la gramática de dependencia de Lucien Tesnière , anterior al estructuralismo , reservan sintácticamente la estructura de calificación. Para Tesnière, el nivel sintáctico se denomina plano estructural, mientras que el plano semántico se considera relacionado con la psicología y también con la lógica .

Aplicaciones de minería de datos

Los métodos de exploración de datos permiten dar sentido a un conjunto de datos que parecen ser dispares a priori (ver también inteligencia artificial ) y, por lo tanto, crean semántica. La semántica liberada generalmente toma tres formas (traducción por significantes formales) resultantes de la inteligencia artificial:

Son significantes, en el sentido de que representan conocimiento. Luego, dichas estructuras se anotan en los datos iniciales, cada dato lleva la marca de su pertenencia a una rama del árbol, una caja de la mesa, etc. Luego, el análisis se reanuda en un nivel de comprensión más complejo.

Descubrimiento de conocimiento en bases de datos

Sin embargo, dado que la máquina solo manipula significantes, es imperativo que el proceso de minería de datos involucre a un humano experto en el campo. Esto restaurará la semántica extraída y le dará significado y valor. A tal efecto, se exponen tres criterios:

Lo ideal es tener un triplete NO / SI / SI .

Dicho proyecto se denomina "descubrimiento de conocimientos en bases de datos", en inglés KDD, Knowledge Discovery in Databases .

Finalmente, la semántica extraída juega el papel de mapeo de información, permite que la información se ubique en relación entre sí. Este rol “cartográfico” permite almacenar información, organizarla y luego encontrarla. Cualquier modelo, conjunto de categorías, topografía freudiana es entonces de facto una cartografía de información, es decir, un contexto formalizado.

En realidad, son datos sobre datos, metadatos . Arquitecturas específicas para gestionar los metadatos , se denomina cliente o servidor de metadatos . Un sistema conocido es la Dublin Core Metadata Initiative (DCMI).

La Web Semántica es un proyecto del mismo tipo que DCMI, cuyo objetivo es crear, gestionar y explotar metadatos sistemáticos para cada página web . Así, explicado el contenido de cada página web a los significantes, la máquina podría razonar sobre la relevancia del contenido y no sobre las estadísticas léxicas. Esto puede tener consecuencias dramáticas para las tecnologías de recuperación de información , así como para el aspecto y la función de los motores de búsqueda .

Caso especial de excavación textual

La minería textual consiste en transformar un objeto de “texto” en un objeto de “tabla”, “árbol” o “gráfico” mediante procesamiento semántico o sintáctico y luego aplicar técnicas de minería textual a este objeto formalizado. Los resultados esperados son generalmente:

El enfoque semántico tiene una literatura más fértil que el enfoque sintáctico: incluso si este último tiene resultados superiores, los recursos computacionales requeridos a menudo inclinan la balanza a favor del análisis semántico.

El análisis semántico transforma un conjunto de textos en una matriz léxica  :

Caso especial de ontologías

El término "  ontología  " tiene un significado filosófico, pero en la gestión del conocimiento representa posiblemente la forma más evolucionada de representación semántica del conocimiento.
Es una especie de "superthesaurus" destinado a indexar todas las producciones documentales, almacenadas, entrantes o salientes en un determinado grupo social, típicamente una empresa. Así, un correo electrónico, un libro de referencia, un documento de trabajo que comparta los mismos temas se vinculará automáticamente, por lo tanto se pondrá en contexto, liberando así conocimiento semántico.
La estructuración de una ontología es prácticamente una profesión en sí misma, como el diseño y mantenimiento de tesauros de bibliotecas. La construcción es siempre colectiva y por aglomeración de áreas de competencia.

La articulación básica de una ontología es la siguiente:

Ejemplo: BIRD> AIGLE {aigle royal}. Entonces, la máquina puede inferir que el águila real es un pájaro.

En la práctica, podríamos así traducir automáticamente un libro de texto de historia a ontología, considerando cinco tipos de conceptos (fecha, lugar, evento, persona física, persona jurídica) y alrededor de treinta categorías de enlaces verbales.

Para la máquina, razonar sobre el conocimiento así representado equivale a "caminar" en la red de conceptos, a la manera de una red de carreteras. Existen algoritmos específicos, por ejemplo , buscadores de caminos (Pathfinder) , que buscan el camino más corto de un concepto a otro respetando un criterio de economía: "menor número de conceptos", "mayor número de idiomas", "mayor número de sinónimos ”, y así sucesivamente. Los resultados pueden ser espectaculares, especialmente si se tiene en cuenta que el punto de partida y el punto final no son conceptos, sino URI de índice (documentos de la empresa).

Ver también

Bibliografía

Documento utilizado para redactar el artículo. : documento utilizado como fuente para este artículo.

Artículos relacionados

Liza

enlaces externos

Notas y referencias

  1. Dominique Maingueneau y Ruth Amossy , “  9 | 2012 El análisis del discurso entre la crítica y la argumentación  ” , en journals.openedition.org (consultado el 28 de mayo de 2020 ).
  2. Grossmann , 2008 , p.  222.
  3. Bréal 1897 .
  4. Clive Perdue y José Deulofeu , “  La estructuración del enunciado: estudio longitudinal  ”, Idiomas , vol.  21, n o  84,1986, p.  43–63 ( DOI  10.3406 / lgge.1986.1519 , leído en línea , consultado el 28 de mayo de 2020 )
  5. http://www.unil.ch/webdav/site/ling/shared/IntroductionLing/Serra/Intr.a_la_ling.Cours_n_8.pdf .
  6. M. Arrivé, Los elementos de la sintaxis estructural de Lucien Tesnière , lengua francesa , 1969, p. 36-40.