Was ist Apache Hive?

Apache Hive ist eine Open-Source-Data-Warehouse-Infrastruktur, die Tools für die Zusammenfassung, Abfrage und Analyse von Daten bereitstellt. Sie wurde speziell für die Untersuchung großer Datensätze entwickelt, die in Hadoop-Dateien und kompatiblen Dateisystemen wie Amazon S3 abgelegt sind. Hive wurde ursprünglich 2008 von Facebook entwickelt, wird heute aber von vielen Unternehmen verwendet.