Taladro Apache

Taladro Apache

Información
Desarrollado por Fundación de software Apache
Primera versión 4 de enero de 2015
Última versión 1.18.0 (5 de septiembre de 2020)
Depositar github.com/apache/drill y git: //git.apache.org/drill.git
Estado del proyecto Desarrollo
Escrito en Java
Licencia Licencia de Apache
Sitio web drill.apache.org

Apache Drill es un marco de software de código abierto que admite aplicaciones distribuidas en tiempo real para el análisis interactivo de conjuntos de datos a gran escala. Drill es la versión de código abierto del sistema Dremel de Google que está disponible como un servicio de infraestructura llamado Google BigQuery. Un objetivo de diseño establece explícitamente que Drill es capaz de escalar a 10,000 o más servidores y poder procesar petabytes de datos y miles de millones de registros en segundos. Drill es un proyecto de nivel superior para Apache.

Drill admite muchas bases de datos NoSQL y muchos sistemas de archivos como HBase , MongoDB , MapR-DB, HDFS , MapR-FS, Amazon S3 , Azure Blob Storage, Google Cloud Storage, Swift, NAS y archivos locales. Una sola consulta puede unir datos de almacenes de datos independientes. Por ejemplo, puede adjuntar el perfil de usuario presente en una colección en MongoDB con los registros de Hadoop .

Drill Optimizer reestructura automáticamente un plan de ejecución de consultas para aprovechar las capacidades de procesamiento de los almacenes de datos internos. Además, Drill admite la localidad de datos, por lo que es interesante ubicar Drill y un almacén de datos en varios nodos.

Características

Apoyo

Drill se centra principalmente en almacenes de datos no relacionales, como Hadoop, NoSQL y almacenamiento en la nube. Actualmente se admiten los siguientes almacenes de datos:

Se pueden desarrollar nuevos almacenes de datos en forma de complementos. Drill utiliza un único modelo de datos JSON que le permite consultar almacenes de datos in situ no relacionales (muchos de estos sistemas de almacenamiento son complejos o no tienen esquema).

Ver también

Referencias

  1. "  Https://projects.apache.org/json/projects/drill.json  " (Consultado el 8 de abril de 2020 )
  2. Versión 1.18.0  " ,5 de septiembre de 2020(consultado el 6 de septiembre de 2020 )
  3. "La Apache Software Foundation anuncia Apache ™ Drill ™ como un proyecto de nivel superior .
  4. "Apache Drill - SQL sin esquema para Hadoop, NoSQL y Cloud Storage . Drill.apache.org.
  5. "Preguntas frecuentes - Apache Drill" . drill.apache.org .

Publicaciones

Alguna publicación influyó en el nacimiento y la concepción. Aquí está una lista parcial:

enlaces externos