YaCy

YaCy Descripción de la imagen YaCy logo.png. Descripción de esta imagen, también comentada a continuación Página de búsqueda de YaCy Información
Desarrollado por Michael Peter Christen y los colaboradores del proyecto
Primera versión 2004
Última versión 1,92 (26 de diciembre de 2016)
Depositar github.com/yacy/yacy_search_server
Estado del proyecto En desarrollo
Escrito en Java
Medio ambiente Multiplataforma
Idiomas Plurilingüe
Tipo Motor de búsqueda de Internet peer to peer gratis y gratis
Política de distribución Libre
Licencia Licencia gratuita
( GNU GPL v2)
Sitio web yacy.net/en

YaCy (para Yet Another Cyberspace , homófono en inglés de ya see (ya ves)) es un motor de búsqueda gratuito que funciona según el principio de una red peer-to-peer . Este software está desarrollado en Java y se instaló, a finales de 2006, en cientos de ordenadores denominados YaCy-peers o YaCy- station (600 activos diarios enjunio de 2014). YaCy es utilizado, por ejemplo, por la Universidad Johannes Gutenberg en Mainz .

Una red YaCy se caracteriza por una arquitectura distribuida (no centralizada). Todos los nodos de YaCy ( pares ) son equivalentes y no hay un servidor principal.

En cada estación de trabajo, YaCy se ejecuta en modo rastreador o en modo proxy . Cada estación de YaCy lanza robots de indexación que analizan las páginas encontradas. Los resultados se almacenan en una base de datos distribuida (índice).

El acceso al motor de búsqueda se realiza a través de un servidor web local que presenta un campo para introducir palabras clave y proporciona los resultados en forma de una página web normal.

El proyecto YaCy fue fundado en 2003 por Michael Christen. El software se publica bajo la licencia GNU GPL gratuita .

El programa

El corazón del motor de búsqueda YaCy no es, como otros motores de búsqueda, un servidor central, sino un software que se ejecuta en casi todos los sistemas operativos . La búsqueda se realiza en una página web local, entregada por el software instalado. La visualización de los resultados también se realiza en forma de página web .

Un servidor proxy está acoplado al sistema P2P: se puede utilizar como opción e indica automáticamente las páginas visitadas. Esta información no es almacenada por los sitios visitados, que pueden recuperar información adicional a través de GET o POST o que utilizan cookies o identificación HTTP (por ejemplo, para páginas protegidas con contraseña). De esta manera, se garantiza que solo se indiquen los datos que sean de libre acceso para todos.

Características avanzadas

Arquitectura

El motor de búsqueda de YaCy se basa en cuatro elementos:

Arrastrándose Un robot de búsqueda que navega de una página web a otra analizando su contenido. Índice Crea un índice de palabras inverso (RWI). Cada palabra del índice tiene su lista de URL relevantes e información sobre su clasificación. Las palabras se procesan antes de almacenarse. Interfaz de investigación y administración Diseñado como una interfaz web proporcionada por un servlet HTTP local con un contenedor de servlets. Almacenamiento de datos Almacenamiento de la base de datos del índice de palabras inversas mediante una tabla hash distribuida .

Características técnicas

El programa se basa en un servidor web que funciona como un proxy - caché . La interfaz de usuario es accesible a través del servidor web; puede investigarlo o administrar su puesto. El proxy transmite su código al rastreador, lo que significa que todas las páginas visitadas no personalizadas se agregan automáticamente al índice. YaCy ha estado usando Apache Solr desde la versión 1.04.9097. Además, la red YaCy ofrece algunos dominios accesibles a través del proxy.

Distribución de índices

A diferencia del intercambio de datos, los resultados de un motor de búsqueda P2P deben estar disponibles de inmediato. Para garantizar esto, YaCy utiliza una tabla hash distribuida . Esto significa que todas las palabras y URL almacenadas se envían a publicaciones cuyo valor hash va con el valor hash correspondiente de la palabra o URL. Durante una búsqueda, va al revés: solo buscamos entre las estaciones que pueden, según la URL, conocer su valor hash para esta palabra. Así, solo una fracción de los puestos son contactados durante la búsqueda, con el fin de obtener resultados satisfactorios a pesar de todo.

Tipos de puestos

YaCy diferencia entre cuatro tipos de estaciones de trabajo:

Virgen Una estación Virgin no tiene contacto de ningún tipo con la red y, por lo tanto, no es identificable. Somos, por tanto, los únicos que podemos saber que su posición es Virgen. Júnior La estación está detrás de un cortafuegos . Otros pueden verlo como un puesto de Junior o como un compañero potencial. Sin embargo, solo pueden saber la hora de su última conexión y no tienen forma de saber si todavía está en línea. Mayor Se puede acceder a un puesto senior desde el exterior y es un miembro de pleno derecho de la red YaCy. Principal Es una publicación de alto nivel que también envía una "lista de semillas" que otras publicaciones pueden usar para propósitos de semillas .

El protocolo YaCy consta de servlets de texto que el servidor web incorporado pone a disposición en /yacy/servletname.html. Las otras estaciones le transmiten datos a través de los parámetros GET: reciben como respuesta un texto simple, cuyo formato exacto difiere según los servlets.

Cebado

Al arrancar, YaCy intenta encontrar otras estaciones en la red. Para hacer esto, primero busca en el archivo superseed.txt una lista de semillas para descargar: las URL de las listas de semillas cargadas por otras publicaciones están allí. Luego obtiene las referencias a otras estaciones a través del archivo seeds.txt, y así se puede hacer el contacto de la red YaCy. En la próxima puesta en marcha, YaCy se puede arrancar a partir de semillas conocidas. Por lo tanto, las listas de semillas solo son útiles cuando muchas referencias ya no son correctas.

Ventajas y desventajas

Ventajas

Desventajas

Notas y referencias

(fr) Este artículo está tomado parcial o totalmente del artículo de Wikipedia en inglés titulado YaCy  " ( ver la lista de autores ) . (de) Este artículo está tomado parcial o totalmente del artículo de Wikipedia en alemán titulado “  YaCy  ” ( ver lista de autores ) .
  1. (cs) [video] Vizualizace vzniku spontánního řádu - visualización de evolución de orden espontánea en YouTube
  2. Korben , "  Yacy - El motor de búsqueda sin censura  " , Korben.info ,4 de febrero de 2011(consultado el 6 de mayo de 2013 )
  3. (en) Michael Muchmore , "  YaCy  " , PCMag.com ,6 de diciembre de 2011(consultado el 6 de mayo de 2013 )
  4. (en) FSFE Free Software Foundation Europe , "  Búsqueda web por la gente, para la gente: YaCy 1.0  " , fsfe ,28 de noviembre de 2011(consultado el 6 de mayo de 2013 )
  5. (en) Katherine Noyes , "  YaCy: Se trata de libertad, no de vencer a Google  " , PCWorld ,2 de diciembre de 2011(consultado el 6 de mayo de 2013 )
  6. Simon Robic , "  Alternativa a Google n. ° 2: YaCy  " , Numerama.com ,4 de abril de, 2012(consultado el 6 de mayo de 2013 )
  7. (de) "  Tipps für den Umgang mit Suchmaschinen  " , Welt Online ,11 de abril de 2013( leído en línea , consultado el 6 de mayo de 2013 )
  8. "  Búsqueda web por la gente, para la gente - Descentralización  " (consultado el 13 de junio de 2014 )
  9. http://www.fsz.uni-mainz.de/48.php "Copia archivada" (versión del 23 de julio de 2018 en Internet Archive )
  10. (en) "  Heise Online  " en heise online (consultado el 7 de agosto de 2020 ) .
  11. http://www.yacy-websearch.net/wiki/index.php/De:Privacy
  12. (in) "  YaCy Technology Architecture  " , YaCy.net (consultado el 14 de febrero de 2012 )

Ver también

Artículos relacionados

Motores de búsqueda p2p Otro

enlaces externos