Habla a | https://books.google.com/ngrams |
---|---|
Descripción | Servicio de análisis estadístico |
Comercial | sí |
Publicidad | No |
Lengua | Plurilingüe |
La oficina central |
Mountain View Estados Unidos |
Dueño | |
Creado por | |
Lanzamiento | Junio de 2010 |
Estado actual | En actividad |
Ngram Viewer es una aplicación de lenguaje ofrecida porGoogle, que permite observar la evolución de la frecuencia de una o más palabras o grupos de palabras a lo largo del tiempo en fuentes impresas. La herramienta entró en servicio en 2010. La última actualización fue en febrero de 2020.
El término ngram designa en este contexto una serie de "n" palabras, que es un caso particular de la noción de n-gram .
La herramienta Ngram de Google se basa en la base de datos de texto de Google Books . Los textos de Google Books se clasifican por la frecuencia de las secuencias de palabras (llamadas ngrams ) por año de publicación, a cada secuencia de palabras se le asigna un "peso".
Cuando el usuario solicita una comparación de varias secuencias de palabras , la herramienta dibuja curvas que permiten comparar su frecuencia de uso a lo largo del tiempo.
El interés de Ngram es fundamentalmente realizar estudios histórico- lingüísticos o socioculturales, conocidos como culturistas .
La herramienta contiene los siguientes límites (especialmente para el francés ). Antes de 1790, las "s" en medio de las palabras todavía se escribían "ſ" (dichas largas ), las "ay" imperfectas se escribían "oit", y estas pocas pequeñas especificidades, así como una tipografía irregular comprometen la relevancia. OCR en las obras de la XVI ª siglo XVIII ª siglo. Así, el equipo del proyecto de OCRización de la Biblioteca Nacional de Francia considera que, sin la intervención humana en el proceso de digitalización, no se puede realizar una investigación de texto completo confiable en obras que datan de antes de 1800. Sin embargo, este análisis ha sido revisado desde entonces: falso los positivos o falsos negativos suelen representar un porcentaje bajo en comparación con todos los datos. Además, Google Ngram se utiliza para delinear tendencias en el uso de un término y no para dar cifras de uso absolutas y precisas.
Otro defecto radica en el hecho de que un pequeño trabajo editado estará tan representado como un trabajo ampliamente distribuido. Además, la frecuencia de uso de una palabra en el mismo texto puede volver a dar demasiado peso a esta palabra, en particular si es rara.