Notatki z wideo to jeden z tych pomysłów, o których myślimy „fajnie by było”, a potem wracamy do przewijania. Bo kto ma czas ręcznie przepisywać to, co ktoś mówi przez 45 minut, skoro można… nie przepisywać i poczuć się winnym do końca tygodnia?
Mam lepszą opcję. W tym filmie pokazuję, jak zbudować prostą aplikację, która robi notatki za Ciebie: wyciąga transkrypt z wideo, generuje czytelną notatkę i eksportuje ją do Worda lub Markdown. Całość działa lokalnie na Twoim komputerze i nie wymaga pisania kodu ręcznie. Serio.
Co robi ta aplikacja?
Trzy rzeczy, po kolei:
Po pierwsze, pobiera transkrypt z pliku wideo lub audio. Można też wkleić własny transkrypt z zewnętrznego narzędzia, np. TurboScribe, i pominąć ten krok, co jest szczególnie przydatne jeśli Twój komputer nie ma karty graficznej i transkrybowanie lokalnie byłoby odliczaniem do emerytury.
Po drugie, przekazuje transkrypt do API Anthropica (Claude), które przekształca surowy, nieustrukturyzowany tekst w notatkę z nagłówkami, ikonkami i kolorowym formatowaniem. Coś, czego surowy transkrypt absolutnie nie przypomina.
Po trzecie, eksportuje notatkę jako plik Word lub Markdown, gotowy do edycji lub udostępnienia.
Interfejs działa w przeglądarce jako lokalny serwer. Wybierasz motyw kolorystyczny (niebieski, zielony, malinowy), klikasz „Utwórz dokument” i pobierasz plik. Jeśli brzmi to jak za proste, to właśnie tak ma działać.
Jak się to buduje?
Używam Claude Code w VS Code. Zamiast pisać kod od zera, kopiuję gotowe prompty z przygotowanej przeze mnie instrukcji na GitHubie i wklejam je kolejno do Claude Code. On sam instaluje biblioteki, tworzy strukturę projektu, pyta o klucz API i buduje poszczególne komponenty, podczas gdy Ty możesz zająć się czymś produktywnym. Albo po prostu patrzeć z rosnącym poczuciem, że jednak nie jesteś programistą, a Claude Code owszem.
Czas budowania: około 20-30 minut. Czas działania po zbudowaniu: wrzucasz film, czekasz na notatkę.
Kilka rzeczy, na które warto zwrócić uwagę:
- Transkrypcja odbywa się lokalnie, za darmo, z pomocą open-source’owego modelu Whisper. Jeśli masz kartę graficzną NVIDIA, możesz skorzystać z szybszej metody GPU opisanej w osobnej instrukcji na GitHubie, która 7-minutowy film transkrybuje w około 30 sekund zamiast 42 minut. To nie literówka.
- Generowanie notatki przez Claude API jest płatne, ale przy rozsądnym użyciu to koszt rzędu kilku groszy za film. Mniej niż kawa, więcej niż zero, zdecydowanie mniej niż Twój czas.
- AI nie jest deterministyczne. Prompty na GitHubie są przetestowane i minimalizują liczbę błędów, ale nie eliminują ich całkowicie. W filmie pokazuję też, jak radzić sobie z typowymi problemami, np. błędem dostępu do API czy nagłówkiem, który postanowił zignorować ustawioną kolorystykę i żyć własnym życiem.
Dla kogo?
Jeśli regularnie uczysz się z wideo, prowadzisz szkolenia, nagrywasz własne kursy albo masz folder „DO OBEJRZENIA” z 47 pozycjami, to narzędzie po prostu oszczędza czas. Nie potrzebujesz doświadczenia programistycznego. Potrzebujesz Claude Code, konta w Anthropic i gotowości do klikania „zatwierdź” kilkanaście razy, dopóki Claude Code nie skończy robić swojego. I cierpliwości przy pierwszym uruchomieniu, kiedy model (~6 GB) postanowi się pobrać akurat wtedy, gdy się spieszysz.
Zasoby
- Instrukcja krok po kroku (prompty do Claude Code): GitHub FriendlyAI-PL
- Klucz API Anthropica: console.anthropic.com
