Længe før AI blev brugt til at generere videoer og kodeprogrammer, blev den brugt til at forstå talesprog og handle på det. AI er grunden til, at du kan chatte med Alexa, Siri og Google Assistant og få disse apps til at gøre dit bud.
De samme algoritmer kan hjælpe dig med at oprette digitale transskriptioner fra lydfiler, der indeholder tale, uanset om disse filer er møder, interviews, foredrag eller bare stemmenoter, du har optaget til dig selv. Transskriptioner giver dig en skriftlig optegnelse over, hvad der blev sagt, og kan nemt søges.
Store navne transskriptionstjenester som f.eksRevogGlad skribenttilbyder kun en begrænset mængde transskription gratis, men du kan få arbejdet gjort uden at betale noget venligt af Whisper. Dette er tale-til-tekst-motoren udviklet af OpenAI (af ChatGPT-berømmelse), og der er ingen grænser for at bruge den.
Du har valget mellem at bruge en webversion af den hostede apphos Hugging Face, hvilket er praktisk, men ofte travlt i spidsbelastningsperioder. Du kan også vælge at installere softwaren lokalt på Windows - dette betyder hurtigere transskriptioner, men du skal bruge en anstændig pc til at klare AI-behandlingskravene.
Hvisk på nettet
Gå over tilHvisk på kramme ansigt, og du kan få transskriberet lyd gratis direkte i din browser – du behøver ikke engang at registrere dig for en konto. Du har mulighed for at uploade en lydfil fra din computer, eller du kan optage tale direkte i appen, hvis du har tilsluttet en mikrofon. Husk på, at din lyd kan blive brugt til at videreuddanne fremtidige AI-modeller – som det ofte er tilfældet, er privatlivspolitikkerne for OpenAI og Hugging Face ikke klare på dette.
Sådan uploader og behandler du en lydfil:
- ÅbnLydfilfanen.
- VælgeKlik for at uploade.
- Vælg en lydfil.
- TjekTransskriberboks.
- KlikIndsend.
Efter et par øjeblikke (eller mere), vil du se tekstoutputtet til højre på skærmen. Behandlingstiderne varierer afhængigt af længden af din lydfil, og hvor travlt Hugging Face-serverne er. Da dette er en gratis tjeneste, der er åben for alle, er den også meget populær, så du kan komme til at vente et stykke tid på, at filer kommer igennem køen.
I grænsefladen finder du et par nyttige værktøjer. Klik for eksempel på det lille penikon lige over lydafspilningsbjælken, og du kan trimme starten og slutningen af klippet ned - praktisk, hvis du har brug for at klippe tavsheder eller uvigtige dele af lyden ud.
Anbefalet læsning:10 måder at ordne iPhone-teksttone, der ikke virker fejl
Du kan også skifte tilMikrofonfanen for at optage noget lyd direkte i Whisper-grænsefladen, eller skift tilYouTubefanen og få transskriptioner fra enhver video. Indsæt blot videoens URL, og du er klar til at gå. Det er værd at bemærke, at YouTube allerede automatisk tilføjer transskriptioner til nogle videoer, som kan findes i kommentarsektionerne.
Hvisken på Windows
Whisper bruger en simpel kommandopromptgrænseflade. Skærmbillede: WhisperHvis du oplever mange forsinkelser i Whisper-webappen, eller du bare vil holde din transskriptionsbehandling mere lokal og privat, kan du konfigurere AI-modellen på en Windows-computer. Du skal have et CUDA-kompatibelt grafikkort installeret (se her for en liste), med mindst 4 GB VRAM, til at håndtere behandlingen - hvis du har et ret nyligt Nvidia-kort installeret, vil det sandsynligvis kvalificere sig.
Denne proces er meget mere involveret og giver dig ikke meget i vejen for en brugergrænseflade, så den er ikke for alle. Det har dog de fordele, vi allerede har nævnt, og du kommer ikke til at sidde fast i en kø og vente på, at dine filer bliver håndteret. Det er også et fedt lille projekt, hvis du kan lide at pille rundt med kode og programmer.
Forudsat at din computer opfylder karakteren, skal du have nogle bits installeret på din computer:Pythonfor kodningen (sørg forTilføj python.exe til PATHkontrolleres under installationen),PyTorchtil maskinlæringsbiblioteker,Chokoladeagtigtil styring af softwarepakker, ogFFmpegtil lydbehandling. De kommer alle med installationsvejledning på de relevante hjemmesider, hvis du har brug for dem.
Du er så klar til at installere selve Whisper: Søg efter "cmd" på Start-menuen og åbnKommandoprompt, skriv derefter "pip install -U openai-whisper" og trykIndtast. Når installationen er færdig, kan du transskribere filer som dette:
- Åbn mappen med dine lydfiler i Stifinder.
- Klik på adresselinjen øverst, skriv "cmd", og tryk påIndtast.
- Skriv "hvisker", derefter et mellemrum og derefter navnet på din lydfil.
- HitIndtastigen, og behandlingen starter.
Teksten vises på skærmen og gemmes som en række tekstfiler i samme mappe som lyden. Hvis du har brug for at konvertere flere filer på samme tid, skal du bare liste dem alle efter kommandoen "hvisker", og adskille hver enkelt med et mellemrum.
Selvom du ikke er bekendt med Python eller kommandoprompten, bør du ikke have for store problemer med at få alt op at køre. Der er masser af guider online, der kan hjælpe, hvis du har brug for hjælp.Dette er en af de bedste tutorialsderude, tager dig trin-for-trin gennem hvert trin og forklarer nogle avancerede funktioner, der er tilgængelige for dig (som at skifte til en anden AI-model).
