1
Disco to implementacja mapreduce do przetwarzania rozproszonego.Dyskoteka obsługuje obliczenia równoległe dla dużych zestawów danych, przechowywanych na niewiarygodnym klastrze komputerów, tak jak w oryginalnych ramach stworzonych przez Google.To sprawia, że jest to idealne narzędzie do analizy i przetwarzania dużych zbiorów danych, bez konieczności martwienia się o trudne kwestie techniczne związane z dystrybucją, takie jak protokoły komunikacyjne, równoważenie obciążenia, blokowanie, planowanie zadań i tolerancja błędów, którymi zajmuje się Disco.
disco-mapreduce
Stronie internetowej:
http://discoproject.org/cechy
Kategorie
Alternatywy dla Disco MapReduce dla Windows
18
Apache Hadoop
Apache Hadoop to platforma oprogramowania typu open source, która obsługuje rozproszone aplikacje wymagające dużej ilości danych, licencjonowane na licencji Apache v2.
9
Apache Spark
Apache Spark ™ to szybki i ogólny silnik do przetwarzania danych na dużą skalę. Programy SpeedRun do 100 razy szybsze niż Hadoop MapReduce w pamięci lub 10 razy szybsze na dysku.