123
Apache Spark

Apache Spark

Apache Spark ™ to szybki i ogólny silnik do przetwarzania danych na dużą skalę. Programy SpeedRun do 100 razy szybsze niż Hadoop MapReduce w pamięci lub 10 razy szybsze na dysku.
Apache Spark ™ to szybki i ogólny silnik do przetwarzania danych na dużą skalę.Szybkość Uruchamiaj programy do 100 razy szybciej niż Hadoop MapReduce w pamięci lub 10 razy szybciej na dysku.Spark ma zaawansowany mechanizm wykonywania DAG, który obsługuje cykliczny przepływ danych i przetwarzanie w pamięci.

Stronie internetowej:

Alternatywy dla Apache Spark dla Linux

Apache Hadoop

Apache Hadoop

Apache Hadoop to platforma oprogramowania typu open source, która obsługuje rozproszone aplikacje wymagające dużej ilości danych, licencjonowane na licencji Apache v2.
Disco MapReduce

Disco MapReduce

Disco to lekka platforma typu open source do przetwarzania rozproszonego, oparta na paradygmacie MapReduce i napisana w języku Python.