AI-stemmen: hoe ver zijn we al – en wat betekent dat voor ons vak?

Geplaatst op

Onlangs plaatste ik een 1-aprilgrap over een nieuwe AI-voice-over service waarmee ik alle stemmen zou kunnen nabootsen. Sommige collega’s dachten dat ik het meende! Als je wil weten waar het over gaat, lees dan eerst even hier! De reacties toonden maar weer eens aan hoe erg het onderwerp AI leeft bij voice overs en stemacteurs. Maar het maakte me ook duidelijk dat er veel misverstanden over zijn en het riep zoveel vragen op dat ik er een driedelige blog aan wijd. In deze eerste blog kijk ik naar wat ai in ons vakgebied al kan en betekent. In de volgende delen ga ik verder in op de juridische kant en deel ik tips over waar aan te denken als je als stem of opdrachtgever van stemmen overweegt met ai te werken. Wil je op de hoogte gehouden worden? Laat dan hieronder je mailadres achter!

De opkomst van AI-stemmen: wat kan er al?

AI-gegenereerde stemmen zijn de afgelopen jaren enorm verbeterd. Waar computerstemmen vroeger echt als een robot klonken, kunnen moderne AI-stemmen nu, doordat ze getraind zijn met grote hoeveelheden stemopnames, verbazingwekkend “echt” klinken. Technisch is er al veel mogelijk: in het Engels kun je op storytel al kiezen voor ai-stemmen met hun “voice switcher” en zo kiezen hoe de stem klinkt die je voorleest. Die stemmen klinken levensecht en de zinnen klinken goed. Tegelijkertijd mis ik de artistieke keuzes die een mens zou maken. Dat valt me pas op als ik langer luister. Het ritme is zo constant dat het me niet volledig mee kan  nemen in het verhaal.

Toch is de techniek ook nog niet perfect. Vooral in talen van kleinere taalgebieden, zoals het Nederlands, hoor je vaak nog allemaal rare klemtonen en artefacten. Het valt ook op dat Nederlandse AI-stemmen die voor veel goedkopere advertenties op sociale media worden ingezet een Amerikaans accent hebben! Die onnatuurlijke klemtonen en gebrek aan emotie verraden dat je naar een AI-stem luistert. In langere teksten zoals audioboeken vallen zulke foutjes extra op, en dat stoort luisteraars. Voice-overcollega Jeroen Kramer maakte het van dichtbij mee: na twaalf boeken ingesproken te hebben, werd hij voor het dertiende deel vervangen door een “Vlaamse robotstem”. Het resultaat? Boze luisteraars en 1-sterrenrecensies . De techniek kán dus veel, maar het is in het Nederlands nog geen volledige vervanging.1

Wat is dan het probleem?

Los van de vraag hoe goed AI al klinkt, speelt er een veel grotere kwestie: mag het allemaal zomaar? Mijn collega’s schrokken van mijn 1-aprilgrap omdat het idee van een stemkloon direct voelt als een bedreiging. Een collega-acteur verwoordde het in een reactie op mijn grap scherp: als je AI-diensten aanbiedt die elke stem kunnen imiteren, “steel je niet alleen iemand anders zijn/haar stem voor je eigen gewin, maar ontneem je iedere acteur (jouw collega’s) zonder hun medeweten hun identiteit, hun artisticiteit en het recht op een eerlijke compensatie. … Dit is je reinste identiteitsdiefstal.”2 En daar draait het precies om: is het gebruik van iemands stem zonder toestemming een vorm van diefstal?

Veel voice-overs vinden van wel. Onze stem is iets persoonlijks, net zo uniek als een vingerafdruk. Als een algoritme daarmee aan de haal gaat zonder dat wij erin toestemmen of ervoor betaald worden, voelt dat als diefstal. Stel je voor: je hoort jezelf iets zeggen in een reclame of videogame, terwijl je het nooit hebt ingesproken. Of erger nog: je hoort jezelf een boodschap inspreken waar je morele bezwaren tegen hebt. Dat scenario is niet denkbeeldig meer. Met een paar minuten geluidsmateriaal kun je bij verschillende aanbieders al iemands stem nabootsen. In theorie zou een bedrijf dus openbare demo’s van stemacteurs kunnen verzamelen en daar nieuwe boodschappen mee laten genereren. Voor creatieve makers is dat beangstigend, omdat je de controle over je eigen stem verliest.

Bovendien gaat het om brood op de plank. In een recente peiling gaf maar liefst 96% van de (stem)acteurs aan bang te zijn werk te verliezen door AI.3 Geen wonder: als opdrachtgevers goedkope AI-alternatieven vinden, vrezen veel collega’s dat er minder klussen voor menselijke stemacteurs overblijven. We zien nu al voorbeelden: Blendle kondigde aan te willen stoppen met menselijke voorlezers en te experimenteren met een AI-stem (volgens interne communicatie ingezien door NOS), en een grote adverteerder als ALDI verving zijn vaste stem (acteur Diederik Ebbinge) door een gegenereerde stem.4 Overigens gebruikt de ALDI voor deze commercials precies de techniek die ik nadeed voor mijn 1-aprilvideo. Er is hier dus nog wel een echte voice over die ze inspreekt, alleen het stemgeluid is daar AI. Deze “negatieve doorbraak” laat hoe dan ook zien dat het geen sciencefiction meer is dat AI menselijke stemmen vervangt.

Wat een AI-stem (nog) niet kan:

Toch is er iets wat een AI-stem (nog) niet kan: originele keuzes maken. Waar een menselijke voice-over intuïtief reageert op de context, opbouw en onderliggende emotie van een tekst, herhaalt AI vooral wat het al kent. Het baseert zich op statistiek en trainingsdata – niet op creatieve intentie. Juist dat verschil is essentieel in ons vak. Als stemacteur kies je soms bewust een andere intonatie dan gevraagd, omdat je benieuwd bent wat het effect dan is  Een klant omschreef het eens zo: “Het is geworden zoals ik toen nog niet wist dat ik het wilde!” Je improviseert of verrast de regisseur met een inval waar hij zelf niet aan had gedacht – en vaak blijkt dat nét de versie te zijn die het wordt. Die spontaniteit komt niet uit een algoritme.

Wat ik ook merk: klanten komen regelmatig bij me terug nadat ze eerst met een AI-stem hebben geprobeerd iets in te spreken. Op papier leek het een snelle en goedkope oplossing, maar in de praktijk zaten ze urenlang te rommelen met verschillende prompts en daarna te editen naar hartelust – zonder het gewenste resultaat. Uiteindelijk vroegen ze me alsnog: “Kun jij dit even inspreken?”.  Ironisch genoeg levert AI me daarmee soms werk op.  Een ervaren voice over is dan zeker sneller en vaak ook goedkoper.

Dubbele standaarden

Ik vind het wel belangrijk het ook te hebben over de houding van ons, voice overs, zelf. Aan de ene kant schreeuwen we moord en brand als AI onze banen bedreigt – terecht, want het gaat om onze creativiteit en inkomen. Maar tegelijkertijd maken velen van ons óók gretig gebruik van AI-tools wanneer het ons uitkomt. Het valt me op dat ik in de marketinguitingen en posts op sociale media van collega’s heel wat door AI gegenereerde afbeeldingen zie. Verdienen tekenaars en fotografen een andere behandeling dan stemacteurs? Bovendien gebruiken we allerlei software om onze audio op te schonen op manieren waar we voorheen een audio-engineer voor nodig zouden hebben gehad. Is dat hypocriet? Misschien deels wel. We omarmen nieuwe technologie vaak pas echt als die onze eigen positie niet direct ondermijnt. En niets menselijks is mij vreemd, ChatGPT helpt mij ook met de opbouw van deze blog!

Hoogleraar intellectueel eigendom Dirk Visser merkt op dat bij elke technologische innovatie de gevestigde orde zich eerst hevig verzet, tot de nieuwkomer uiteindelijk geaccepteerd raakt.5 Toen de filmcamera opkwam, voelden toneelacteurs zich bedreigd; bij de komst van de videorecorder vreesde de filmindustrie voor piraterij. Steeds weer bleek dat de wereld doordraait en makers zich aanpassen – vaak met nieuwe mogelijkheden en banen die ervoor in de plaats komen. Moeten wij als voice-overs AI dan ook gewoon omarmen als een volgende stap?

Ik vind het lastig. Ik denk dat het niet tegen te houden is dat de wereld een bepaalde kant op beweegt. Hoe kan ik nu meegaan in de ontwikkeling, zonder echt iets anders te worden. (Ik ben geen prompt-engineer). Dat de Ikea niet elke meubelmaker heeft vervangen, elektronische muziek niet elke instrumentalist en er nog steeds koetsen en zelfs stoomlocomotieven rijden is enigszins troostrijk.

En dan nog dit: het hoeft niet eens míjn stem te zijn

Wat me de laatste tijd steeds duidelijker wordt: het gaat allang niet meer alleen om het klonen van mijn stem. Zo interessant is dat niet. Ik ben immers geen bekende Nederlander en ook niet de allerbekendste stem. De echte gamechanger is dat AI inmiddels zélf stemmen kan genereren die nergens direct op gebaseerd zijn, maar toch zo goed klinken dat ze het werk overnemen. Geen kopie, geen identiteitsdiefstal, maar gewoon: een overtuigende, synthetische stem die “goed genoeg” is voor de klus.

En dat is misschien nog wel confronterender. Want dan maakt het ineens niet meer uit of je bekend bent, of je je stem goed hebt afgeschermd, of je je rechten hebt vastgelegd. Dan draait het erom of de opdrachtgever voor gemak en kostenbesparing kiest. Dan is de bedreiging niet dat iemand mijn stem steelt, maar ik ben met al mijn talent, opleiding en toewijding, wel overbodig gemaakt.  Niet persoonlijk, niet kwaadaardig, gewoon… omdat het kon.

Tot slot: verlies voor wie?

Ik vind het moeilijk om te zeggen dat het feit dat AI een deel van het werk zal vervangen nu echt onethisch is. Al zolang de mens zich ontwikkelt, verdwijnen er beroepen. Een wekker is allang geen mens meer met een bel in zijn hand. En ook al hecht ik aan de echtheid en originele keuzes van voice-overs en stemacteurs – ik moet toegeven: heel veel teksten die ik inspreek, hebben die authenticiteit eigenlijk helemaal niet nodig.

Als je veel tijd op TikTok doorbrengt, merk je hoe snel je went aan AI-stemmen. En als het publiek het goed genoeg vindt, dan bereikt het zijn doel. Is dat nu echt een groot verlies voor de wereld? Ik denk het niet. Maar het zou wél een groot verlies voor mij zijn. 

Gelukkig denk ik dat het zover nog lang niet is. Tot die tijd blijf ik gewoon doen wat ik het liefste doe: werken met mijn stem, mensen raken met verhalen, en zoek ik juist de authenticiteit die ai nog mist. En mocht ons vakgebied uiteindelijk weer krimpen tot twintig werkende stemmen in plaats van honderden… dan hoop ik stiekem dat ik er één van mag zijn.

Referenties:

1. Van Gool, K. (2023, 10 oktober). AI neemt stemacteur Jeroen Kramer over: “Het klinkt als een Vlaamse robot”. WINMAG Pro. Geraadpleegd op 13-04-2025, van https://www.winmagpro.nl/ai-neemt-stemacteur-jeroen-kramer-over-het-klinkt-als-een-vlaamse-robot

2. reactie van Joep Paddenburg op mijn facebookpost.

3. NOS. (2023). Onrust onder Nederlandse stemacteurs: bedrijven vervangen mensen door AI. NOS Nieuws. Geraadpleegd op 13-04-2025, van nos.nl/artikel/2495616-onrust-onder-nederlandse-stemacteurs-bedrijven-vervangen-mensen-door-ai

4. Koopmanschap, M., & Hilgersom, V. (2024, 12 april). Stemacteurs willen auteursrecht voor stemmen nu bedrijven steeds vaker voor AI-stem kiezen. EenVandaag. Geraadpleegd op 13-04-2025, van eenvandaag.avrotros.nl/item/stemacteurs-willen-auteursrecht-voor-stemmen-nu-bedrijven-steeds-vaker-voor-ai-stem-kiezen/

5. Verhagen, L. (2024, 13 jan). Mediabedrijven en kunstenaars worstelen met AI-datagraaiers: “Dit is de grootste diefstal in de geschiedenis”. de Volkskrant. Geraadpleegd op 13-04-2025, van volkskrant.nl