Apache Impala

Apache Impala

Información
Desarrollado por Fundación de software Cloudera y Apache
Última versión 3.4.0 (22 de abril de 2020)
Depositar github.com/apache/impala
Estado del proyecto en desarrollo
Escrito en C ++ , Java y Python
Sistema de explotación Multiplataforma
Medio ambiente Máquina virtual de Java
Licencia Licencia de Apache
Sitio web impala.apache.org

Apache Impala es el motor de consulta SQL ( MPP ) de código abierto de Cloudera para datos almacenados en grupos de computadoras que ejecutan Apache Hadoop .

Descripción

Cloudera Impala es un motor de consultas que se ejecuta en Apache Hadoop.

Impala ofrece tecnología de base de datos Hadoop escalable y paralela, lo que permite a los usuarios emitir consultas SQL de baja latencia a los datos almacenados en HDFS y Apache HBase sin requerir movimiento o transformación de datos. Impala está integrado con Hadoop para utilizar los mismos archivos y formatos de datos, así como los marcos de seguridad y gestión de recursos utilizados por MapReduce , Apache Hive , Apache Pig y otro software de Hadoop.

Impala es el favorito de los analistas y científicos de datos para realizar análisis de los datos almacenados en Hadoop a través de herramientas SQL o herramientas de inteligencia empresarial. El resultado es un procesamiento masivo de datos y consultas interactivas que se pueden realizar en el mismo sistema utilizando los mismos datos y metadatos, evitando migrar el conjunto de datos a sistemas especializados o formatos propietarios, simplemente para realizar análisis.

Características:

A principios de 2013, se anunció un formato de archivo en columnas llamado Parquet para arquitecturas como Impala. Endiciembre 2013, Amazon Web Services anunció soporte para Impala. A principios de 2014, MapR agregó soporte para Impala. En 2015, se anunció otro formato llamado Kudu, que Cloudera ofreció donar a la Apache Software Foundation junto con Impala. Enoctubre de 2016, Impala se convierte en un proyecto de Apache Incubator.

Histórico

El proyecto fue anunciado en Octubre 2012, en la prueba beta pública y estuvo disponible de manera efectiva en Mayo 2013.

En noviembre 2015, Cloudera anuncia que quiere donar Impala a la Apache Software Foundation .

Ver también

Referencias

  1. Versión 3.4.0  " ,22 de abril de 2020(consultado el 23 de abril de 2020 )
  2. "  Cloudera Impala  " (consultado el 14 de marzo de 2014 )
  3. (en) Timothy Prickett Morgan, "  Cloudera Impala SQL acelera para Hadoop  " , The Register ,30 de abril de 2013(consultado el 26 de enero de 2016 )
  4. Yves Grandmontagne, "  Big Data: Impala de Cloudera cuestiona a Hadoop en tiempo real  " , Silicon.fr,31 de octubre de 2012(consultado el 26 de enero de 2016 )
  5. (en) Andrew Brust, "  Impala, Kudu, y el binge Big Data de cuatro meses de Apache Incubator  " , ZDNet ,1 st 12 2015(consultado el 26 de enero de 2016 )

enlaces externos