Common Crawl

Common Crawl

Wspólne indeksowanie tworzy i utrzymuje otwarte repozytorium danych indeksowania internetowego, do którego każdy może uzyskać dostęp i je analizować
Wspólne indeksowanie tworzy i utrzymuje otwarte repozytorium danych indeksowania internetowego, do których każdy może uzyskać dostęp i je analizować
common-crawl

Stronie internetowej:

cechy

Alternatywy dla Common Crawl dla Self-Hosted

searx

searx

Searx to silnik metasearch, agregujący wyniki innych wyszukiwarek, nie przechowujący informacji o swoich użytkownikach.Dlaczego warto korzystać z Searx?
Gigablast

Gigablast

Gigablast to potężna, otwarta wyszukiwarka, nowa wyszukiwarka, która wykonuje indeksowanie w czasie rzeczywistym! Funkcje Skalowalne do tysięcy serwerów.
Elite Proxies API

Elite Proxies API

Elitarne serwery proxy o krótkim okresie życia aktualizowane co 1 minutę. Każde żądanie tworzy prywatną nazwę hosta, która wygasa po 5 minutach.