ArchiveBox

ArchiveBox

Self Samoobsługowe archiwum internetowe typu open source.Pobiera historię przeglądarki / zakładek / Pocket / Pinboard / itp., Zapisuje HTML, JS, pliki PDF, multimedia i więcej.
  • Darmowa
Ponieważ współczesne strony internetowe są skomplikowane i często opierają się na treści dynamicznej, ArchiveBox archiwizuje strony w kilku różnych formatach wykraczających poza to, co są w stanie zapisać publiczne usługi archiwizacji, takie jak Archive.org i Archive.is.ArchiveBox importuje listę adresów URL ze standardowego, zdalnego adresu URL lub pliku, a następnie dodaje strony do lokalnego folderu archiwum za pomocą wget, aby utworzyć możliwy do przeglądania klon html, youtube-dl do wyodrębnienia multimediów oraz pełną instancję przeglądarki Chrome bez pliku PDF,Zrzuty ekranu, zrzuty DOM i wiele innych ... Używanie wielu metod i dominującej na rynku przeglądarki do wykonywania JS gwarantuje, że możemy zapisać nawet najbardziej skomplikowane, wybredne strony internetowe w co najmniej kilku wysokiej jakości, długoterminowych formatach danych.### Może importować linki z: - Pocket, Pinboard, Instapaper - RSS, XML, JSON lub list zwykłego tekstu - Historia przeglądarki lub zakładek (Chrome, Firefox, Safari, IE, Opera i więcej) - Shaarli, Delicious, RedditZapisane posty, Wallabag, Unmark.it i każdy inny tekst z linkami!### Można zapisać te rzeczy dla każdej witryny: - favicon.ico` favicon witryny - `example.com / page-name.html` wget klon strony, z dołączonym .html, jeśli nie jest obecny - wyjście.pdf` Wydrukowano plik PDF strony przy użyciu bezgłowego chromu - `screenshot.png` 1440x900 zrzut ekranu strony przy użyciu bezgłowego chromu -` output.html` DOM Zrzut HTML po renderowaniu przy użyciu bezgłowego chromu - `archive.org.txt` Link do stronystrona zapisana na archive.org - `warc /` dla pliku html + gzipped warc.gz - `media /` any mp4, mp3, napisy i metadane znalezione przy użyciu youtube-dl - `git /` klon dowolnego repozytorium dla github, bitbucket lub gitlab links - `index.html` i` index.json`Pliki indeksu HTML i JSON zawierające metadane i szczegóły Archiwizacja jest addytywna, więc możesz zaplanować regularne uruchamianie `. / Archive` i pobieranie nowych linków do indeksu.Cała zapisana zawartość jest statyczna i indeksowana za pomocą plików JSON, dzięki czemu żyje wiecznie i jest łatwa do analizy, nie wymaga zawsze działającego backendu.
archivebox

Kategorie

Alternatywy dla ArchiveBox dla Linux

Wget

Wget

GNU Wget to darmowy pakiet oprogramowania do pobierania plików za pomocą HTTP (S) i FTP, najczęściej używanych protokołów internetowych.
HTTrack

HTTrack

Usługa kopiowania stron internetowych, która pobiera całe witryny i buduje je rekurencyjnie lokalnie.
wallabag

wallabag

wallabag to aplikacja hostująca open source do zapisywania stron internetowych. ## Wygodne czytanie
Stash.ai

Stash.ai

Stash to inteligentna aplikacja do zakładek na wielu urządzeniach, wspierana sztuczną inteligencją.Zapisuj artykuły, filmy i cokolwiek innego.Są one automatycznie klasyfikowane dla Ciebie.
PageArchiver

PageArchiver

PageArchiver (wcześniej nazywany „Scrapbook for SingleFile”) to rozszerzenie Chrome, które pomaga archiwizować strony internetowe do czytania offline. Główne funkcje to:
Fossilo

Fossilo

Fossilo.com stale archiwizuje kompletne strony internetowe w formacie pdf i wielu innych formatach, aby można je było łatwo otwierać i przeglądać bez żadnych zależności w przyszłości.Możesz poruszać się po archiwach w obrębie platformy lub pobrać ją jako niezależny pakiet.
WebArchives

WebArchives

Przeglądarka archiwów internetowych oferująca możliwość przeglądania w trybie offline milionów artykułów z dużych projektów społecznościowych, takich jak Wikipedia lub Wikisource.