Wat is Apache Hadoop?

Apache Hadoop is de naam voor een set big data-algoritmen, gedistribueerde opslag en gedistribueerde verwerkingssoftware die is gemaakt door de Apache Software Foundation. Het is ontworpen om toepassingen met grote volumes voor datadiensten te ondersteunen; automatisch omgaan met hardwarestoringen zonder service te verliezen.

Hadoop maakt gebruik van een gedistribueerd bestandssysteem dat bekend staat als HDFS en software voor het verwerken van grote gegevenssets die MapReduce wordt genoemd. Extreem grote bestanden worden in stukken verdeeld, meestal 64 of 128 MB elk. De software is meestal geschreven in Java, met een lagere code geschreven in C.

Apache-server, Big data, Service, Softwarevoorwaarden