Zbuduj własną aplikację do notatek z wideo w 30 minut. Działa lokalnie, kod pisze Claude Code.

Notatki z wideo to jeden z tych pomysłów, o których myślimy „fajnie by było”, a potem wracamy do przewijania. Bo kto ma czas ręcznie przepisywać to, co ktoś mówi przez 45 minut, skoro można… nie przepisywać i poczuć się winnym do końca tygodnia?

Mam lepszą opcję. W tym filmie pokazuję, jak zbudować prostą aplikację, która robi notatki za Ciebie: wyciąga transkrypt z wideo, generuje czytelną notatkę i eksportuje ją do Worda lub Markdown. Całość działa lokalnie na Twoim komputerze i nie wymaga pisania kodu ręcznie. Serio.


Co robi ta aplikacja?

Trzy rzeczy, po kolei:

Po pierwsze, pobiera transkrypt z pliku wideo lub audio. Można też wkleić własny transkrypt z zewnętrznego narzędzia, np. TurboScribe, i pominąć ten krok, co jest szczególnie przydatne jeśli Twój komputer nie ma karty graficznej i transkrybowanie lokalnie byłoby odliczaniem do emerytury.

Po drugie, przekazuje transkrypt do API Anthropica (Claude), które przekształca surowy, nieustrukturyzowany tekst w notatkę z nagłówkami, ikonkami i kolorowym formatowaniem. Coś, czego surowy transkrypt absolutnie nie przypomina.

Po trzecie, eksportuje notatkę jako plik Word lub Markdown, gotowy do edycji lub udostępnienia.

Interfejs działa w przeglądarce jako lokalny serwer. Wybierasz motyw kolorystyczny (niebieski, zielony, malinowy), klikasz „Utwórz dokument” i pobierasz plik. Jeśli brzmi to jak za proste, to właśnie tak ma działać.


Jak się to buduje?

Używam Claude Code w VS Code. Zamiast pisać kod od zera, kopiuję gotowe prompty z przygotowanej przeze mnie instrukcji na GitHubie i wklejam je kolejno do Claude Code. On sam instaluje biblioteki, tworzy strukturę projektu, pyta o klucz API i buduje poszczególne komponenty, podczas gdy Ty możesz zająć się czymś produktywnym. Albo po prostu patrzeć z rosnącym poczuciem, że jednak nie jesteś programistą, a Claude Code owszem.

Czas budowania: około 20-30 minut. Czas działania po zbudowaniu: wrzucasz film, czekasz na notatkę.

Kilka rzeczy, na które warto zwrócić uwagę:

  • Transkrypcja odbywa się lokalnie, za darmo, z pomocą open-source’owego modelu Whisper. Jeśli masz kartę graficzną NVIDIA, możesz skorzystać z szybszej metody GPU opisanej w osobnej instrukcji na GitHubie, która 7-minutowy film transkrybuje w około 30 sekund zamiast 42 minut. To nie literówka.
  • Generowanie notatki przez Claude API jest płatne, ale przy rozsądnym użyciu to koszt rzędu kilku groszy za film. Mniej niż kawa, więcej niż zero, zdecydowanie mniej niż Twój czas.
  • AI nie jest deterministyczne. Prompty na GitHubie są przetestowane i minimalizują liczbę błędów, ale nie eliminują ich całkowicie. W filmie pokazuję też, jak radzić sobie z typowymi problemami, np. błędem dostępu do API czy nagłówkiem, który postanowił zignorować ustawioną kolorystykę i żyć własnym życiem.

Dla kogo?

Jeśli regularnie uczysz się z wideo, prowadzisz szkolenia, nagrywasz własne kursy albo masz folder „DO OBEJRZENIA” z 47 pozycjami, to narzędzie po prostu oszczędza czas. Nie potrzebujesz doświadczenia programistycznego. Potrzebujesz Claude Code, konta w Anthropic i gotowości do klikania „zatwierdź” kilkanaście razy, dopóki Claude Code nie skończy robić swojego. I cierpliwości przy pierwszym uruchomieniu, kiedy model (~6 GB) postanowi się pobrać akurat wtedy, gdy się spieszysz.


Zasoby

Zostaw komentarz

Twój adres email nie zostanie opublikowany. Wymagane pola są oznaczone *

Przewijanie do góry