Lang voordat AI werd gebruikt om video's en codeprogramma's te genereren, werd het gebruikt om gesproken taal te begrijpen en er actie op te ondernemen. AI is de reden dat u met Alexa, Siri en Google Assistant kunt chatten en deze apps kunt laten doen wat u wilt.
Deze zelfde algoritmen kunnen u helpen bij het maken van digitale transcripties van audiobestanden die spraak bevatten, of deze bestanden nu vergaderingen, interviews, lezingen of alleen maar spraaknotities zijn die u voor uzelf hebt opgenomen. Afschriften geven u een schriftelijke weergave van wat er is gezegd en kunnen gemakkelijk worden doorzocht.
Transcriptiediensten van grote namen, zoalsDsEnGelukkig schrijverbiedt slechts een beperkte hoeveelheid gratis transcripties aan, maar u kunt de klus klaren zonder iets te betalen dankzij Whisper. Dit is de spraak-naar-tekst-engine ontwikkeld door OpenAI (bekend van ChatGPT), en er zijn geen beperkingen aan het gebruik ervan.
U heeft de keuze om een webversie van de gehoste app te gebruikenbij Knuffelgezicht, wat handig is maar vaak druk tijdens de spitsuren. Je kunt er ook voor kiezen om de software lokaal op Windows te installeren. Dit betekent snellere transcripties, maar je hebt een fatsoenlijke pc nodig om aan de AI-verwerkingseisen te voldoen.
Fluister op internet
Ga naarFluister op knuffelend gezicht, en u kunt audio gratis rechtstreeks in uw browser laten transcriberen. U hoeft zich niet eens voor een account te registreren. Je hebt de mogelijkheid om een audiobestand vanaf je computer te uploaden, of je kunt spraak rechtstreeks in de app opnemen als je een microfoon hebt aangesloten. Houd er rekening mee dat uw audio kan worden gebruikt om toekomstige AI-modellen verder te trainen. Zoals vaak het geval is, is het privacybeleid van OpenAI en Hugging Face hierover niet duidelijk.
Een audiobestand uploaden en verwerken:
- Open deAudiobestandtabblad.
- KiezenKlik om te uploaden.
- Selecteer een audiobestand.
- Controleer deTranscriberendoos.
- KlikIndienen.
Na enkele ogenblikken (of langer) ziet u de tekstuitvoer aan de rechterkant van het scherm. De verwerkingstijden variëren afhankelijk van de lengte van uw audiobestand en hoe druk de Hugging Face-servers zijn. Omdat dit een gratis service is die voor iedereen toegankelijk is, is deze ook erg populair, dus het kan zijn dat je een tijdje moet wachten totdat bestanden door de wachtrij zijn gekomen.
Binnen de interface vind je een aantal handige tools. Klik bijvoorbeeld op het kleine penpictogram net boven de audioafspeelbalk en u kunt het begin en het einde van de clip inkorten - handig als u stiltes of onbelangrijke delen van de audio wilt verwijderen.
Aanbevolen leesmateriaal:10 manieren om de iPhone-teksttoon te herstellen die niet werkt
U kunt ook overstappen naar deMicrofoontabblad om wat audio rechtstreeks in de Whisper-interface op te nemen, of schakel over naar deYouTubetabblad en ontvang transcripties van elke video. Plak gewoon de video-URL in en u bent klaar om te gaan. Het is vermeldenswaard dat YouTube al automatisch transcripties aan sommige video's toevoegt, die je kunt vinden in de commentaarsecties.
Fluister op Windows
Whisper gebruikt een eenvoudige opdrachtpromptinterface. Schermafbeelding: FluisterAls u veel vertraging ondervindt in de Whisper-webapp, of als u uw transcriptieverwerking meer lokaal en privé wilt houden, kunt u het AI-model op een Windows-computer instellen. U hebt een grafische kaart nodig die geschikt is voor CUDA (zie hier voor een lijst), met minimaal 4 GB VRAM, om de verwerking af te handelen. Als je een redelijk recente Nvidia-kaart hebt geïnstalleerd, komt deze waarschijnlijk in aanmerking.
Dit proces is veel ingewikkelder en biedt niet veel gebruikersinterfaces, dus het is niet voor iedereen geschikt. Het heeft echter wel de voordelen die we al hebben genoemd, en u hoeft niet in de rij te staan wachten tot uw bestanden zijn afgehandeld. Het is ook een leuk klein project als je graag aan code en programma's sleutelt.
Ervan uitgaande dat uw computer aan het cijfer voldoet, moet u een aantal bits op uw computer installeren:Pythonvoor de codering (zorg ervoor datVoeg python.exe toe aan PATHwordt gecontroleerd tijdens de installatie),PyTorchvoor de machine learning-bibliotheken,Chocoladeachtigvoor het beheren van softwarepakketten, enFFmpegvoor audioverwerking. Ze worden allemaal geleverd met installatie-instructies op de relevante websites, als je die nodig hebt.
Je bent dan klaar om Whisper zelf te installeren: Zoek naar “cmd” in het Start-menu en openOpdrachtprompt, typ vervolgens “pip install -U openai-whisper” en druk opBinnenkomen. Wanneer de installatie is voltooid, kunt u de volgende bestanden transcriberen:
- Open de map met uw audiobestanden in Verkenner.
- Klik bovenaan op de adresbalk, typ “cmd” en druk opBinnenkomen.
- Typ 'whisper', vervolgens een spatie en vervolgens de naam van uw audiobestand.
- HitBinnenkomennogmaals, en de verwerking begint.
De tekst wordt op het scherm weergegeven en opgeslagen als een reeks tekstbestanden in dezelfde map als de audio. Als u meerdere bestanden tegelijkertijd wilt converteren, vermeldt u ze allemaal na het commando 'whisper', waarbij u ze allemaal scheidt met een spatie.
Zelfs als u niet bekend bent met Python of de opdrachtprompt, zou u niet al te veel moeite moeten hebben om alles operationeel te krijgen. Er zijn tal van handleidingen online die u kunnen helpen als u hulp nodig heeft.Dit is een van de beste tutorialsdie er zijn, waarbij u stap voor stap door elke fase wordt geleid en enkele geavanceerde functies worden uitgelegd die voor u beschikbaar zijn (zoals het overstappen naar een ander AI-model).
