Eine neue Version der Big-Data-Umgebung wurde veröffentlicht.
Ab sofort ist Version 3.0 des Big-Data-Clusters Hadoop verfügbar. Herausragendes Feature ist die Verwendung von Erasure Coding beim Hadoop-Filesystem HDFS. Damit reduziert sich der verwendete Speicherbedarf deutlich. Der YARN Timeline Service v.2 soll die Skalierbarkeit und Verfügbarkeit des Timeline-Diensts verbessern. Derzeit ist es allerdings noch eine Preview. Ein Federation-Feature für YARN und HDFS ermöglicht die bessere Skalierung eins Hadoop-Clusters über zehntausende von Nodes.
Apache Hadoop hat sich als frei verfügbare Lösung für die analytische Verarbeitung großer Datenmengen im Stil von Googles Map/Reduce etabliert. In den letzten Jahren hat es zugunsten von Apache Spark und anderen Frameworks aber an Popularität eingebüßt.
Nach sechs Jahren Entwicklungszeit erreicht die Cluster-Software Hadoop Version 1.0.0.