
0
Newspaper
Gazeta to ekstrakcja metadanych wiadomości, pełnotekstów i artykułów zbudowana w Pythonie 3. CECHY - Działa w ponad 10 językach (angielski, chiński, niemiecki, arabski, ...) - Wielowątkowe ramy pobierania artykułów - Identyfikacja adresu URL wiadomości -Ekstrakcja tekstu z html - Ekstrakcja górnego obrazu z html - Ekstrakcja całego obrazu z html - Ekstrakcja słowa kluczowego z tekstu - Ekstrakcja streszczenia z tekstu - Ekstrakcja autora z tekstu - Ekstrakcja popularnych trendów Google
Stronie internetowej:
http://newspaper.readthedocs.io/Kategorie
Alternatywy dla Newspaper'a dla wszystkich platform z dowolną licencją

13
ScrapeHero
Usługa skrobania stron internetowych w celu gromadzenia danych ze stron internetowych, bez żadnych programów ani narzędzi do majsterkowania..
- Płatna
- Web

0
artoo.js
artoo.js to fragment kodu JavaScript, który ma być uruchamiany w konsoli przeglądarki w celu zapewnienia narzędzi do zgarniania.
- Darmowa
- Chrome
- JavaScript
- Node.JS
- Web
- Self-Hosted