Algorytmy sztucznej inteligencji ułatwiają wiele zadań w niewiarygodny sposób.
Przykładem świetnego narzędzia, które możemy mieć zainstalowane na swoim
komputerze i działające offline, jest whisper. Jest to narzędzie OpenAI, które
pozwala automatycznie wygenerować napisy do dźwięku. Pozwala nie tylko
zrobić transkrypcję, ale też od razu przetłumaczyć na angielski. Whisper całkiem
dobrze radzi sobie z transkrypcją wielu języków i potrafi automatycznie
wykryć język.

 

Instalacja


Po pierwsze będziemy potrzebować Pythona3 i jego manager pakietów pip.
W przypadku Linuksa lub WSL, prawdopodobnie są już zainstalowane, ale
warto sprawdzić (w wersji Debian/Ubuntu):

```
$ sudo apt install python3 python3-pip
```

Następnie możemy zainstalować whispera:

```
$ pip install openai-whisper
```

Instalacja trwa dłuższą chwilę, bo wymaga ściągnięcia kilku gigabajtów
zależności. Po zakończeniu, whisper powinien być gotowy do użycia.

 

Użycie


Whisper jest narzędziem działającym w trybie tekstowym, potrzebujemy
więc w terminalu wejść do katalogu z plikiem do wykonania transkrypcji.
W najprostszej formie, wystarczy:

```
$ whisper film.mp4
```

W takim wypadku, whisper automatycznie spróbuje wykryć język na podstawie
krótkiego fragmentu na początku, a następnie wykona transkrypcję, wypisze
na ekranie i zapisze w formatach txt,srt,vtt i json (w tym przypadku film.txt,
film.srt, itd.). Jest to mało praktyczne, więc zawsze uruchamiam (mam
ustawiony alias) z parametrem:

```
$ whisper --output_format srt film.mp4
```

Dla oszczędności czasu, można od razu podać język:

```
$ whisper --language Polish film.mp4
```

Żeby wykonać tłumaczenie, należy dodać parametr, parametr
`--language` oznacza język źródłowy. Tłumaczenie jest
dostępne tylko na angielski:

```
$ whisper --task translate --language Polish film.mp4
```

Żeby przejrzeć pełną listę parametrów i dostępnych językach, wystarczy
wywołać program bez parametrów:

```
$ whisper
```

Podsumowując


Whisper to świetne narzędzie, które możemy mieć zainstalowane na swoim
komputerze/serwerze i łatwo używać w skryptach i aplikacjach internetowych.
Opcję transkrypcji docenią nie tylko twórcy treści, ale też uczący się języków,
bo w kilka chwil możemy wygenerować napisy do dowolnego materiału. Wystarczy
nauczyć się obsługi powłoki, czego możecie nauczyć się z mojego kursu: