Radiovermeldingen omzetten in digitale tekst met Whisper: mijn AI-experiment van vrijdag

Door te experimenteren met Whisper, een transcriptietool van OpenAI, zette ik een radiovermelding om in digitale tekst. Dat deed ik allemaal lokaal en eenvoudig via mijn browser.

Vrijdagen zijn perfect om te experimenteren met AI, machine learning en alles wat met technologie te maken heeft. Deze keer besloot ik Whisper uit te proberen, een bibliotheek van OpenAI die audio kan transcriberen en vertalen, en ik wilde het lokaal uitvoeren vanaf mijn browser. Het bleek een verrassend eenvoudige installatie te zijn.

Er gebeurde nog een leuk toeval dat een grappige wending gaf: ik werd genoemd op de Nederlandse radio vanwege een foto van mij die viraal ging en werd besproken door CNN .

Dat betekende dat ik het perfecte audiofragment had om mee te experimenteren!

Whisper instellen

Om te beginnen met Whisper, gebruikte ik een GitHub-bestand dat me door het proces leidde om het op mijn Mac te installeren via de Terminal. Nadat ik de server had ingesteld, opende ik het in mijn browser en daar was het: een eenvoudige interface voor het uploaden van audiobestanden die moesten worden getranscribeerd of vertaald.

Het werkte lokaal op mijn computer, wat ik geweldig vond: alles bleef privé, alleen tussen mij en mijn technologie.

De radio-opname

Toen kwam het volgende deel van mijn experiment. Omdat ik net op de radio was genoemd, wilde ik die opname gebruiken. Ik moet eerlijk zijn: ik heb de audio van de uitzending opgenomen met mijn telefoon vanaf mijn computer.

Niet de meest professionele manier, maar soms ga je gewoon met wat voorhanden is. Toen ik de audio had, heb ik die via mijn browser in Whisper ingevoerd en het begon de uitzending te transcriberen, inclusief mijn woorden.

Ik experimenteerde verder en uploadde de opname naar Fireflies.ai , mijn vertrouwde notitiemaker. Die transcriptie, in de cloud, was perfect. Het herkent zelfs het verschil in de stemmen en splitst ze op in Spreker 1 en Spreker 2, die je indien nodig kunt veranderen in namen.

Het is leuk om te zien hoe deze verschillende tools en formaten met elkaar verweven kunnen raken: van radio-uitzendingen tot een audio-opname op mijn telefoon, tot een AI-transcriptie en uiteindelijk tot een digitaal audiobestand dat online wordt gedeeld. Het draait allemaal om het schakelen tussen verschillende digitale media, en het optimaal benutten van wat beschikbaar is.

Geluid geüpgraded. Podcast van de show gedownload, bijgesneden met Audacity.

Conclusie

Dit experiment van vrijdag werd meer dan alleen spelen met AI. Het was een manier om allerlei digitale media te verbinden in één samenhangende stroom, en eerlijk gezegd was het erg leuk.

Ik denk dat AI echt schittert in deze momenten waarop technologie en het persoonlijke samenkomen.

Over de auteur

Scroll naar boven