ArchiveBox

ArchiveBox

Self Samoobsługowe archiwum internetowe typu open source.Pobiera historię przeglądarki / zakładek / Pocket / Pinboard / itp., Zapisuje HTML, JS, pliki PDF, multimedia i więcej.
  • Darmowa
Ponieważ współczesne strony internetowe są skomplikowane i często opierają się na treści dynamicznej, ArchiveBox archiwizuje strony w kilku różnych formatach wykraczających poza to, co są w stanie zapisać publiczne usługi archiwizacji, takie jak Archive.org i Archive.is.ArchiveBox importuje listę adresów URL ze standardowego, zdalnego adresu URL lub pliku, a następnie dodaje strony do lokalnego folderu archiwum za pomocą wget, aby utworzyć możliwy do przeglądania klon html, youtube-dl do wyodrębnienia multimediów oraz pełną instancję przeglądarki Chrome bez pliku PDF,Zrzuty ekranu, zrzuty DOM i wiele innych ... Używanie wielu metod i dominującej na rynku przeglądarki do wykonywania JS gwarantuje, że możemy zapisać nawet najbardziej skomplikowane, wybredne strony internetowe w co najmniej kilku wysokiej jakości, długoterminowych formatach danych.### Może importować linki z: - Pocket, Pinboard, Instapaper - RSS, XML, JSON lub list zwykłego tekstu - Historia przeglądarki lub zakładek (Chrome, Firefox, Safari, IE, Opera i więcej) - Shaarli, Delicious, RedditZapisane posty, Wallabag, Unmark.it i każdy inny tekst z linkami!### Można zapisać te rzeczy dla każdej witryny: - favicon.ico` favicon witryny - `example.com / page-name.html` wget klon strony, z dołączonym .html, jeśli nie jest obecny - wyjście.pdf` Wydrukowano plik PDF strony przy użyciu bezgłowego chromu - `screenshot.png` 1440x900 zrzut ekranu strony przy użyciu bezgłowego chromu -` output.html` DOM Zrzut HTML po renderowaniu przy użyciu bezgłowego chromu - `archive.org.txt` Link do stronystrona zapisana na archive.org - `warc /` dla pliku html + gzipped warc.gz - `media /` any mp4, mp3, napisy i metadane znalezione przy użyciu youtube-dl - `git /` klon dowolnego repozytorium dla github, bitbucket lub gitlab links - `index.html` i` index.json`Pliki indeksu HTML i JSON zawierające metadane i szczegóły Archiwizacja jest addytywna, więc możesz zaplanować regularne uruchamianie `. / Archive` i pobieranie nowych linków do indeksu.Cała zapisana zawartość jest statyczna i indeksowana za pomocą plików JSON, dzięki czemu żyje wiecznie i jest łatwa do analizy, nie wymaga zawsze działającego backendu.
archivebox

Kategorie

Alternatywy dla ArchiveBox dla Mac

Pocket

Pocket

Zapisz strony internetowe, aby przeczytać je później, i wyeliminuj bałagan zakładek w witrynach, które są tylko jednorazowe.
Wget

Wget

GNU Wget to darmowy pakiet oprogramowania do pobierania plików za pomocą HTTP (S) i FTP, najczęściej używanych protokołów internetowych.
HTTrack

HTTrack

Usługa kopiowania stron internetowych, która pobiera całe witryny i buduje je rekurencyjnie lokalnie.
Stash.ai

Stash.ai

Stash to inteligentna aplikacja do zakładek na wielu urządzeniach, wspierana sztuczną inteligencją.Zapisuj artykuły, filmy i cokolwiek innego.Są one automatycznie klasyfikowane dla Ciebie.
SiteSucker

SiteSucker

Aplikacja macOS, która automatycznie pobiera strony internetowe z Internetu.Robi to poprzez asynchroniczne kopiowanie stron internetowych, obrazów, plików PDF, arkuszy stylów i innych plików na lokalny dysk twardy, powielając strukturę katalogów witryny.
PageArchiver

PageArchiver

PageArchiver (wcześniej nazywany „Scrapbook for SingleFile”) to rozszerzenie Chrome, które pomaga archiwizować strony internetowe do czytania offline. Główne funkcje to:
Fossilo

Fossilo

Fossilo.com stale archiwizuje kompletne strony internetowe w formacie pdf i wielu innych formatach, aby można je było łatwo otwierać i przeglądać bez żadnych zależności w przyszłości.Możesz poruszać się po archiwach w obrębie platformy lub pobrać ją jako niezależny pakiet.
Web Dumper

Web Dumper

Pobierz całe witryny internetowe z Internetu i zapisz je na dysku twardym ...