Dutch Media Week 2022 geopend met Mediarede

De zevende editie van Dutch Media Week werd op maandag 3 oktober geopend door middel van het uitspreken van de Mediarede. Dit jaar werd de Mediarede verzorgd door Victor Wijnen, Directeur HKU Games en Interactie. Lees hier de volledige Mediarede nog eens na:

Mediarede
door Victor Wijnen

Bekijk fragment 1

Zoals jullie net hoorden is het thema van de Dutch Media Week dit jaar ON/OFF. Daarnaast is deze maandag ook nog eens de innovatiedag van de Dutch Media Week en heeft de wethouder net gesproken over het economisch belang van de mediasector. Deze drie onderwerpen heb ik verwerkt in mijn Mediarede en vertaald naar een drieluik aan de hand van drie fragmenten.

Het eerste fragment hebben jullie net gezien. Dit is een fascinerende pastiche geworden van AI-gegenereerde content. Mijns inziens is AI op dit moment het summum van mediale innovatie. Niet omdat dit hyperrealistische deepfakes zijn waardoor Eppo vandaag de main character wordt op Twitter. In tegendeel. Het is flagrant duidelijk dat het hier om een Neppo gaat. En dat is ok. Fake news is zo 2016.

Nee, wat het voor mij persoonlijk echt innovatief maakt, is het gemak waarmee je tegenwoordig dergelijke content in zeer korte tijd met relatief weinig kennis en schaarse middelen in elkaar kan Frankensteinen. De afgelopen periode zijn namelijk diverse AI-tools in public beta gegaan. Waardoor een semi tech n00b als ik, plots content kan genereren die voorheen technisch onmogelijk was. Of dusdanig bewerkelijk dat deze exclusief voorbehouden was aan grote partijen. Dit commercially of the shelf beschikbaar zijn van tools is wat mij betreft een cruciale aanjager voor verdergaande innovatie op dit vlak. AI kan de reputatie hebben dat het ingewikkeld is. Wat het natuurlijk ook is. En dat het werken ermee alleen weggelegd is voor halve programmeurs. Dat is gelukkig steeds minder waar. Daarom ter demystificatie een klein kijkje onder de motorkap. Voor dit specifieke fragment heb ik een eenvoudige doch voedzame pipeline ontworpen waarbij de volgende vier stappen doorlopen zijn:

  1. Aan het GPT-3 model van Open AI heb ik een tekstopdracht gegeven: “Write opening speech for dutch media week”. Dit leverde automagisch de tekst op die Eppo uitsprak in de eerste helft van het fragment;
  2. Met Resemble.ai heb ik een digitale kopie van mijn stem gemaakt. Hiermee heb ik de AI-tekst van stap 1 omgezet naar een audiofile. Fun fact: Resemble heeft de AI-stem van de in 1987 overleden Andy Warhol gegenereerd die vervolgens gebruikt is voor de documentaire ‘The Andy Warhol Diaries’;
  3. Op basis van online beschikbaar beeldmateriaal van Eppo – een foto en kort videofragment – heeft de AI van Deepword twee Eppo talking head video’s gegeneerd;
  4. Deze twee talking heads heb ik vervolgens gevoed met de audiofile en een zelfgetikte tekst voor de tweede helft. Dit is omgezet naar de het getoonde fragment, waarbij met een druk op een knop de taal gewijzigd zou kunnen worden van Vlaams naar Japans, Frans of wat je maar wilt. Schitterend toch?!

En nogmaals: dit is zondermeer gefröbel in de marge. Ik ben geen maker. Ik heb gewerkt met laag resolutiemateriaal. En elke week komen er nieuwere tools beschikbaar die dit makkelijker, beter en meer realistisch doen. De echte takeaway zit er in dat elke Nederlander met een oude computer, wat kleingeld en een internetverbinding dit soort content tegenwoordig laagdrempelig in vijf minuten kan generen.

Bekijk fragment 2

Dit tweede fragment gaat wat mij betreft een slag dieper. Wat jullie hier achtereenvolgens zagen zijn: afbeeldingen, videomateriaal en 3D-assets die allemaal door AI gecreëerd zijn aan de hand van natuurlijke taal. Dat is toch magisch? De snelheid waarmee nieuwe tools aangekondigd worden, is opmerkelijk. Bij het schrijven van deze mediarede heb ik meermaals tekst herschreven. De text-to-video-tool van Meta AI en de text-to-3D-tool van NVIDIA zijn vorige week pas bekendgemaakt. Na aanlevering van mijn fragment was Meta ingehaald door Phenaki. Dit onderzoekscollectief heeft paper en beeldmateriaal ingediend voor de ICLR23. Hierin stelt ze een AI te hebben die aan de hand van 22 zinnen een film van 2 minuten kan genereren. Wunderbar.

De tools van Meta en Nvidia zijn nog niet open voor het publiek. De verwachting is dat ze binnenkort beschikbaar komen. Text-to-image-tools zijn al ruim twee maanden in open bèta. De 3 grote spelers zijn Midjourney, DALL-E 2 en Stable Diffusion. Omdat deze tools reeds openbaar zijn, ga ik hier dieper op in.

De eerste afbeelding van het fragment dat jullie net zagen, is een werk van de Amerikaan Jason Allen. Dit werk ‘Théâtre D’opéra Spatial’ heeft hij gegenereerd met behulp van Midjourney en als zodanig ook open en bloot ingediend bij de Colorado State Fair in de categorie ‘digital art / digitally manipulated photography’. Jason won. Waarna natuurlijk een online Shit Storm aan meningen ontstond. Maar nog even los van alle ethische, esthetische en IP-kwesties, toont dit voorbeeld wat mij betreft dat er een significante sociale kanteling voor de deur staat. Het scheppen van beeldmateriaal was voorheen voorbehouden aan content creators zoals illustratoren, fotografen, filmmakers, en andere grafici. Nu kan iedereen prijswaardig beeldmateriaal scheppen. Ravensburger op steroïden. Het resultaat mag – binnen kaders van licenties en na-ijlende wetgeving – ook nog eens commercieel gebruikt worden. Wat betekent dit voor deze beroepen? Worden die nu overbodig? Of brengen deze tools belangrijke inspiratie als brandstof voor kwalitatief betere maakprocessen? Of juist meer productiviteit waardoor er minder mensen benodigd zijn? Of verandert het beroep substantieel en worden ze prompt-engineers?

Dit zijn vragen die we ons bij HKU ook stellen. Wij leiden talent op voor sectoren waar AI gemeengoed wordt. Daar heb ik soms gevoelens bij. Zeker als je bedenkt dat deze AI getraind wordt met miljarden digitale afbeeldingen die door miljoenen mensen gemaakt zijn. Daarmee staat ze op de schouders van hen die ze nu deels obsoleet dreigt te maken. Dat zou je wrang kunnen noemen, of evolutie of misschien de overtreffende trap van “Good artists borrow, great artists steal” zoals Picasso ooit stelde. Pandora’s box is geopend. AI is ontsnapt. Mijn hoop is dat het nu de kunstenaars zijn die deze techniek volhartig omarmen. Haar temmen om niet getemd te worden. Mensgerichte AI baren. Ik doe mee!

Bekijk fragment 3

Oké. Het laatste fragment. We hebben het gehad over innovatieve nieuwe toepassingen. We hebben het gehad over de impact op beroepsgroepen. Waar we het nog niet over hebben gehad is de invloed van AI op de digitalisering van onze samenleving en de mate waarin dit ons ON/OFF leven beïnvloedt. Overigens zie ik het zelf niet als ON/OFF maar als ON ∞ OFF. Waarbij er geen binair onderscheid meer bestaat tussen on- en offline leven. De twee raken domweg sterker verweven. Waarbij de onderlinge balans wel verschuift.

Naar mijn idee is er al decennialang een analoge exodus gaande. Waarbij met name jongeren in toenemende mate hun presence van offline naar online verhuizen. Dat wil zeggen dat ze een steeds groter gedeelte van schaarse middelen als tijd, aandacht, geld en energie investeren in hun online zijn. Mijn overkoepelende verwachting is dat de opkomst van nieuwe AI deze trend zal versterken. Het is daarbij goed om te beseffen dat ontzettend veel van onze online activiteiten al jarenlang gestuurd worden door AI. Algoritmen bepalen – op basis van wat ze van ons weten – welke content we op onze feeds zien. Welke TikTok content we voorgeschoteld krijgen. Welke zoekresultaten we zien. Welke reclames we mee bestookt worden. En welke we niet. Alles om ons langer en gerichter online te houden. Bij het extrapoleren van de eerder door mij genoemde AI-ontwikkelingen heb ik niet de illusie te weten waar het exact heen gaat. Ik meen wel een aantal contouren te herkennen die ik graag met jullie deel.

  • Contour 1: Met de komst van nieuwe AI is mijn verwachting dat mensen hun online identiteit sterker kunnen manipuleren en beter harmoniseren met hun wensidentiteit.
  • Contour 2: De komst van AI maakt het voor wannabe fotografen, schilders, filmmakers en musici makkelijker om als zodanig door het leven te gaan. Iemand die levenslang geen penseel hanteert, kan digitale schilderijen maken en verkopen. Verbeeldingskracht wordt belangrijker ten koste van ambachtelijke skills.
  • Contour 3: Een aantal aanbieders van AI-tools combineren al verschillende varianten van AI. Mijn verwachting is dat deze mash-up van AI-tools door zal zetten met als mogelijke apotheose “One ring to rule them all”. Eén plek waar alle typen content gegenereerd en gecombineerd kan worden.
  • Contour 4: Last, but zeker not least. De wijze waarop wij AI-content creëren en consumeren gaat een effect hebben op de bedrading van onze hersenen. “The Medium is the message” fluistert McLuhan wederom vanuit het hiernamaals. “First! We shape our AI then our AI shapes us!” vult Churchill hem behulpzaam aan. 

Deze contouren en nog vele anderen gaan een vergaand effect hebben op de digitalisering van onze samenleving. De balans zal verder doorslaan naar ON. Of dat goed of slecht is? De tijd moet het leren.

Tenslotte. Alles wat ik hier gruwelijk heb lopen weten is natuurlijk first en foremost een persoonlijke mening. Geen harde wetenschap. N=1. Daarnaast heb ik niet de illusie dat ik als Homo sapiens het concept van Artificiële Intelligentie volledig begrijp. Garantie tot de deur… Dank voor jullie aandacht!

 

Kijk hier de volledige Mediarede terug.