Gigablast

Gigablast

Gigablast to potężna, otwarta wyszukiwarka, nowa wyszukiwarka, która wykonuje indeksowanie w czasie rzeczywistym! Funkcje Skalowalne do tysięcy serwerów.
Gigablast to potężna, otwarta wyszukiwarka, nowa wyszukiwarka, która indeksuje w czasie rzeczywistym!Funkcje Skalowalne do tysięcy serwerów.Skalował się do ponad 12 miliardów stron internetowych na ponad 200 serwerach.Podwójny czterordzeniowy rdzeń z 32 GB pamięci RAM i dwoma 160 GB dyskami SSD Intel, obsługującymi 8 instancji Gigablast, może wykonać około 8 qps (zapytań na sekundę) przy indeksie 10 milionów stron.Dyski będą zbliżone do maksymalnej pojemności.Podwojenie wielkości indeksu zwiększy mniej więcej o połowę współczynnik qps.(Wskaźniki wydajności można wykonać około dziesięć razy szybciej, ale jeszcze się tym nie zajmowałem. Wykorzystanie miejsca na dysku prawdopodobnie pozostanie takie samo, ponieważ jest już dość wydajne.) 1 milion stron internetowych wymaga 28,6 GB miejsca na dysku.Obejmuje indeks, meta informacje i skompresowany kod HTML wszystkich stron internetowych.Szybkość pająka wynosi około 1 strony na sekundę na rdzeń.Tak więc podwójny czterordzeniowy rdzeń może przetwarzać i indeksować 8 stron na sekundę, czyli 691 200 stron dziennie.Wymagane 4 GB pamięci RAM na instancję Gigablast.(instancja = proces) Wersja demonstracyjna na żywo napisana w C / C ++ dla optymalnej wydajności.Ponad 500 000 linii C / C ++.100% niestandardowy.Pojedynczy plik binarny.Serwer WWW, baza danych i wszystko inne jest zawarte w tym kodzie źródłowym w bardzo wydajny sposób.Ułatwia administrowanie i rozwiązywanie problemów.Niezawodny.Od 2002 roku jest testowany w produkcji na żywo na miliardach zapytań w indeksie ponad 12 miliardów unikalnych stron internetowych, 24 miliardów dublowanych.Super szybki i wydajny.Jedna z niewielu wyszukiwarek, które osiągnęły tak dużą liczbę.Jedyna wyszukiwarka open source, która ma.Obsługuje wszystkie języki.Może dać wyniki w określonych językach w porównaniu do innych w czasie zapytania.Wykorzystuje wewnętrznie reprezentację UTF-8.Historia osiągnięć.Był używany przez wielu klientów.Z powodzeniem stosowany w rozproszonym oprogramowaniu dla przedsiębiorstw.Buforowane strony internetowe z wyróżnieniem terminu zapytania ....

Stronie internetowej:

Kategorie

Alternatywy dla Gigablast dla Self-Hosted

searx

searx

Searx to silnik metasearch, agregujący wyniki innych wyszukiwarek, nie przechowujący informacji o swoich użytkownikach.Dlaczego warto korzystać z Searx?
Seeks

Seeks

Seeks to darmowy i otwarty projekt P2P oraz aplikacja umożliwiająca wyszukiwanie w sieciach społecznościowych.
Sphider

Sphider

Sphider to lekki pająk internetowy i wyszukiwarka napisana w języku PHP, wykorzystująca MySQL jako bazę danych zaplecza.
Inout Search Engine

Inout Search Engine

Podobnie jak Google lub Yahoo pobierają wyniki, ty również możesz zbudować prywatną wyszukiwarkę ze sklonowanym skryptem.
SSEP - Site Search Engine PHP-Ajax

SSEP - Site Search Engine PHP-Ajax

Jest to skrypt wyszukiwarki witryny, który używa MySQL do przechowywania indeksowanych stron witryny, aby dodać funkcjonalność wyszukiwania do witryny.