9
Apache Spark ™ to szybki i ogólny silnik do przetwarzania danych na dużą skalę.Szybkość Uruchamiaj programy do 100 razy szybciej niż Hadoop MapReduce w pamięci lub 10 razy szybciej na dysku.Spark ma zaawansowany mechanizm wykonywania DAG, który obsługuje cykliczny przepływ danych i przetwarzanie w pamięci.
Stronie internetowej:
http://spark.apache.orgKategorie
Alternatywy dla Apache Spark dla Linux
18
Apache Hadoop
Apache Hadoop to platforma oprogramowania typu open source, która obsługuje rozproszone aplikacje wymagające dużej ilości danych, licencjonowane na licencji Apache v2.
1
Disco MapReduce
Disco to lekka platforma typu open source do przetwarzania rozproszonego, oparta na paradygmacie MapReduce i napisana w języku Python.