123
Disco MapReduce

Disco MapReduce

Disco to lekka platforma typu open source do przetwarzania rozproszonego, oparta na paradygmacie MapReduce i napisana w języku Python.
Disco to implementacja mapreduce do przetwarzania rozproszonego.Dyskoteka obsługuje obliczenia równoległe dla dużych zestawów danych, przechowywanych na niewiarygodnym klastrze komputerów, tak jak w oryginalnych ramach stworzonych przez Google.To sprawia, że ​​jest to idealne narzędzie do analizy i przetwarzania dużych zbiorów danych, bez konieczności martwienia się o trudne kwestie techniczne związane z dystrybucją, takie jak protokoły komunikacyjne, równoważenie obciążenia, blokowanie, planowanie zadań i tolerancja błędów, którymi zajmuje się Disco.

Stronie internetowej:

Kategorie

Alternatywy dla Disco MapReduce'a dla wszystkich platform z dowolną licencją

Apache Hadoop

Apache Hadoop

Apache Hadoop to platforma oprogramowania typu open source, która obsługuje rozproszone aplikacje wymagające dużej ilości danych, licencjonowane na licencji Apache v2.
Apache Spark

Apache Spark

Apache Spark ™ to szybki i ogólny silnik do przetwarzania danych na dużą skalę. Programy SpeedRun do 100 razy szybsze niż Hadoop MapReduce w pamięci lub 10 razy szybsze na dysku.
Amazon Kinesis

Amazon Kinesis

Usługi Amazon Kinesis ułatwiają pracę z danymi przesyłanymi strumieniowo w czasie rzeczywistym w chmurze AWS.
dispy

dispy

dispy to framework Pythona do równoległego wykonywania obliczeń poprzez dystrybucję ich na wiele procesorów na jednym komputerze (SMP), na wielu komputerach w klastrze lub ...