Come trascrivere il testo gratuitamente utilizzando l'intelligenza artificiale

Molto prima che l’intelligenza artificiale venisse utilizzata per generare video e programmi di codice, veniva utilizzata per comprendere il linguaggio parlato e agire su di esso. L'intelligenza artificiale è la ragione per cui puoi chattare con Alexa, Siri e Google Assistant e fare in modo che queste app eseguano i tuoi ordini.

Questi stessi algoritmi possono aiutarti a creare trascrizioni digitali da file audio contenenti discorsi, siano essi riunioni, interviste, conferenze o semplicemente note vocali che hai registrato per te stesso. Le trascrizioni forniscono una traccia scritta di ciò che è stato detto e possono essere facilmente ricercate.

Servizi di trascrizione di grandi nomi comeRevEFelice Scribaoffri gratuitamente solo una quantità limitata di trascrizioni, ma puoi portare a termine il lavoro senza pagare nulla per gentile concessione di Whisper. Questo è il motore di sintesi vocale sviluppato da OpenAI (famoso per ChatGPT) e non ci sono limiti al suo utilizzo.

Puoi scegliere di utilizzare una versione web dell'app ospitataal Volto che abbraccia, che è comodo ma spesso occupato nelle ore di punta. Puoi anche scegliere di installare il software localmente su Windows: ciò significa trascrizioni più veloci, ma avrai bisogno di un PC decente per far fronte alle richieste di elaborazione dell'intelligenza artificiale.

Sussurro sul web

Whisper on the web è veloce e facile da usare. Schermata: Sussurro

Vai aSussurro sul viso che abbracciae puoi ottenere la trascrizione audio gratuitamente direttamente nel tuo browser: non è nemmeno necessario registrare un account. Hai la possibilità di caricare un file audio dal tuo computer oppure puoi registrare il parlato direttamente nell'app se hai un microfono collegato. Tieni presente che il tuo audio potrebbe essere utilizzato per addestrare ulteriormente futuri modelli di intelligenza artificiale: come spesso accade, le politiche sulla privacy di OpenAI e Hugging Face non sono chiare al riguardo.

Per caricare ed elaborare un file audio:

Apri ilFile audioscheda.
ScegliereFare clic per caricare.
Seleziona un file audio.
Controlla ilTrascriverescatola.
ClicInvia.

Dopo alcuni istanti (o più), vedrai l'output del testo sulla destra dello schermo. I tempi di elaborazione variano a seconda della lunghezza del file audio e di quanto sono occupati i server di Hugging Face. Poiché si tratta di un servizio gratuito aperto a tutti, è anche molto popolare, quindi potresti ritrovarti ad aspettare un bel po' prima che i file passino in coda.

All'interno dell'interfaccia troverai alcuni strumenti utili. Fai clic sulla piccola icona della penna appena sopra la barra di riproduzione audio, ad esempio, e puoi tagliare l'inizio e la fine della clip, utile se devi eliminare silenzi o sezioni non importanti dell'audio.

Lettura consigliata:10 modi per correggere l'errore del tono del testo dell'iPhone che non funziona

Puoi anche passare aMicrofonoscheda per registrare l'audio direttamente nell'interfaccia Whisper o passare aYouTubescheda e ottieni trascrizioni da qualsiasi video. Basta incollare l'URL del video e sei pronto per partire. Vale la pena notare che YouTube aggiunge già automaticamente le trascrizioni ad alcuni video, che possono essere trovate nelle sezioni dei commenti.

Sussurro su Windows

Se riscontri molti ritardi nell'app web Whisper o desideri semplicemente mantenere l'elaborazione della trascrizione più locale e privata, puoi configurare il modello AI su un computer Windows. È necessaria una scheda grafica compatibile con CUDA installata (vedere qui per un elenco), con almeno 4 GB di VRAM, per gestire l'elaborazione: se hai installato una scheda Nvidia abbastanza recente, probabilmente sarà idonea.

Questo processo è molto più complicato e non ti offre molto in termini di interfaccia utente, quindi non è per tutti. Presenta però i vantaggi che abbiamo già menzionato e non rimarrai bloccato in coda in attesa che i tuoi file vengano gestiti. È anche un piccolo progetto interessante se ti piace armeggiare con codice e programmi.

Supponendo che il tuo computer soddisfi il voto, devi installare alcuni bit sul tuo computer:Pitoneper la codifica (assicurateviAggiungi python.exe al PERCORSOviene controllato durante l'installazione),PyTorchper le librerie di machine learning,Cioccolatosoper la gestione dei pacchetti software eFFmpegper l'elaborazione dell'audio. Vengono tutti forniti con le istruzioni di installazione sui siti Web pertinenti, se ne hai bisogno.

Sei quindi pronto per installare Whisper stesso: cerca "cmd" nel menu Start e apriPrompt dei comandi, quindi digita "pip install -U openai-whisper" e premiEntra. Al termine dell'installazione, è possibile trascrivere file come questo:

Apri la cartella con i tuoi file audio in Esplora file.
Fare clic sulla barra degli indirizzi in alto, digitare "cmd" e premereEntra.
Digita "sussurro", quindi uno spazio, quindi il nome del tuo file audio.
ColpoEntranuovamente e l'elaborazione inizia.

Il testo viene visualizzato sullo schermo e salvato come una serie di file di testo nella stessa cartella dell'audio. Se devi convertire più file contemporaneamente, basta elencarli tutti dopo il comando “sussurro”, separandoli ciascuno con uno spazio.

Anche se non hai familiarità con Python o con il prompt dei comandi, non dovresti avere troppi problemi a far funzionare tutto. Ci sono molte guide online che possono aiutarti se hai bisogno di assistenza.Questo è uno dei migliori tutoriallà fuori, guidandoti passo dopo passo attraverso ogni fase e spiegando alcune funzioni avanzate a tua disposizione (come il passaggio a un modello IA diverso).