1
Disco to implementacja mapreduce do przetwarzania rozproszonego.Dyskoteka obsługuje obliczenia równoległe dla dużych zestawów danych, przechowywanych na niewiarygodnym klastrze komputerów, tak jak w oryginalnych ramach stworzonych przez Google.To sprawia, że jest to idealne narzędzie do analizy i przetwarzania dużych zbiorów danych, bez konieczności martwienia się o trudne kwestie techniczne związane z dystrybucją, takie jak protokoły komunikacyjne, równoważenie obciążenia, blokowanie, planowanie zadań i tolerancja błędów, którymi zajmuje się Disco.
Stronie internetowej:
http://discoproject.org/cechy
Kategorie
Alternatywy dla Disco MapReduce'a dla wszystkich platform z dowolną licencją
18
Apache Hadoop
Apache Hadoop to platforma oprogramowania typu open source, która obsługuje rozproszone aplikacje wymagające dużej ilości danych, licencjonowane na licencji Apache v2.
9
Apache Spark
Apache Spark ™ to szybki i ogólny silnik do przetwarzania danych na dużą skalę. Programy SpeedRun do 100 razy szybsze niż Hadoop MapReduce w pamięci lub 10 razy szybsze na dysku.
1
Amazon Kinesis
Usługi Amazon Kinesis ułatwiają pracę z danymi przesyłanymi strumieniowo w czasie rzeczywistym w chmurze AWS.
- Płatna
- Web