4
Autosub
Narzędzie wiersza polecenia do automatycznego generowania napisów dla dowolnego pliku wideo. Bierze plik wideo lub plik audio jako wejście, wykonuje wykrywanie aktywności głosowej, aby znaleźć regiony mowy, wysyła równoległe żądania do Google Web Speech API w celu wygenerowania transkrypcji.
Autosub to narzędzie do automatycznego rozpoznawania mowy i generowania napisów.Na wejściu pobiera plik wideo lub audio, wykrywa aktywność głosu, aby znaleźć regiony mowy, wysyła równoległe żądania do Google Web Speech API w celu wygenerowania transkrypcji dla tych regionów, (opcjonalnie) tłumaczy je na inny język, a na koniec zapisuje wynikowynapisy na dysk.Obsługuje różne języki wejściowe i wyjściowe (aby zobaczyć, uruchom narzędzie z argumentem --list-languages) i może obecnie tworzyć napisy w formacie SRT lub prostym JSON ....
autosub