Internationaal netwerk moet de black box van AI openen
Binnen het Europese staff exchange-project REMODEL gaan wiskundigen de geheimen van machine learning ontrafelen
REMODEL is de naam van het ambitieuze Europese staff exchange-programma dat recent werd gestart. Binnen het consortium van zeven universiteiten, waaronder de TU/e, komen wiskundigen van binnen en buiten Europa bij elkaar om samen de zwarte doos van deep learning te openen. Dit is noodzakelijk om zo meer inzicht te verkrijgen over hoe machine learning precies werkt en wat er exact gebeurt in de kunstmatige neurale netwerken. Cursor sprak met onderzoekers Wil Schilders en Remco Duits die samen met Karen Veroy-Grepl het TU/e-team vormen dat aan het project deelneemt.
Het Marie-Curie staff exchange-project REMODEL (Research Exchanges in the Mathematics of Deep Learning with Applications), dat begin 2024 van start is gegaan voor een periode van drie jaar, bestaat uit een consortium van zeven universiteiten van binnen en buiten Europa, waaronder de TU/e. In het kader van het uitwisselingsprogramma zullen zowel vaste als tijdelijke wetenschappelijke medewerkers periodes van enkele maanden bij een andere instelling binnen het consortium doorbrengen om zo nauwe samenwerkingen met elkaar aan te gaan. Vanuit de TU/e mogen medewerkers – met name promovendi, maar ook hun begeleiders – voor totaal 27 maanden naar een deelnemende universiteit in het buitenland gestuurd worden.
“Omdat het EU-gefinancierde programma een brede internationale samenwerking wil stimuleren, is een van de voorwaardes dat medewerkers van Europese instellingen op uitwisseling naar een instelling buiten de EU moeten gaan”, vertelt Wil Schilders, emeritus hoogleraar van de TU/e-faculteit Mathematics & Computer Science.
Begin 2023 is hij persoonlijk benaderd door de Technisch-natuurwetenschappelijke Universiteit van Noorwegen (NTNU), de coördinerende universiteit van het programma, met de vraag: ‘Doen jullie ook mee?’ Hij werd direct enthousiast en vroeg zijn collega’s Karen Veroy-Grepl en Remco Duits of ze het ook zagen zitten. “Ik ben in feite met pensioen”, zegt hij. Schilders is afgelopen juni met emeritaat gegaan, maar hij blijft betrokken bij allerlei projecten. Zo zal hij de eerste tijd ook de rol van coördinator van het REMODEL-programma voor de TU/e op zich nemen.
De verborgen lagen van neurale netwerken
Het project bestaat uit verschillende werkpakketten, toegespitst op specifieke onderzoeksgebieden op het gebied van machine learning. De betrokken onderzoekers hebben allemaal hun eigen expertise, maar één ding hebben ze met elkaar gemeen: allemaal willen ze de black box van de AI openen om zo meer inzicht te verkrijgen over hoe machine learning precies werkt en wat er exact gebeurt in de kunstmatige neurale netwerken. Dit willen ze bewerkstelligen door middel van wiskundige methodes.
Machine learning (en het aanverwante deep learning) is een belangrijk onderdeel van kunstmatige intelligentie, een onderzoeksgebied waar we tegenwoordig niet meer omheen kunnen. Machine learning is een methode om zelflerende systemen te creëren die opgebouwd zijn uit vele lagen van kunstmatige neuronen die samen zogenaamde neurale netwerken vormen. Deze systemen zijn in staat om zelf te leren op basis van een grote hoeveelheid data die je erin stopt. Een van de toepassingen van deep learning is bijvoorbeeld gezichtsherkenning. Door het netwerk een enorme hoeveelheid foto’s aan te bieden krijg je een systeem dat in staat is gezichten te herkennen. In het REMODEL project gaat het vooral om kunstmatig neurale netwerken om simulaties te versnellen.
“De neurale netwerken beginnen met een inputlaag”, legt Schilders uit. “Vanuit de inputlaag wordt de informatie naar de neuronen in de eerste hidden layer oftewel verborgen laag gestuurd. De neuronen hebben een bepaalde activatiefunctie, dus ze doen iets met deze informatie en sturen deze vervolgens door naar de volgende verborgen laag, waar precies hetzelfde gebeurt. Uiteindelijk wordt de informatie ontvangen door de neuronen in de outputlayer - dat is de uitkomst van het netwerk.” Zo bestaat het netwerk uit invoer van informatie aan het begin en uitvoer aan het einde. “Wat daartussen gebeurt, dat is de black box. We weten niet wat daar precies gebeurt”, aldus Schilders.
Er zijn successen geboekt met deep learning, maar men weet vaak niet waarom het werkt
Meer wiskunde voor meer inzicht
“En dat is nou precies het probleem”, vervolgt hij. “Er zijn successen geboekt met deep learning, maar men weet vaak niet waarom het werkt.” Ook zijn de uitkomsten niet altijd even betrouwbaar, zegt hij. “En als het systeem niet werkt, dan weet men ook niet waarom dat zo is.” Om meer inzicht te verkrijgen over wat er gebeurt in de neurale netwerken moet er meer wiskunde bij betrokken worden, is zijn overtuiging. “Binnen het REMODEL-project gaan we daarom met totaal zeven partners kijken hoe we met wiskunde kunnen bijdragen aan meer begrip van de werking van kunstmatige neurale netwerken. Zo zouden we in de toekomst beter kunnen voorspellen of een methode zal werken of niet en hoe je een netwerk moet ontwerpen, hoeveel verborgen lagen en hoeveel neuronen je bijvoorbeeld precies nodig hebt.”
Samen met hoogleraar Karen Veroy-Grepl maakt Schilders deel uit van het werkpakket genaamd ‘Model order reduction’. Hij laat een plaatje zien met daarop drie verschillende afbeeldingen van hetzelfde konijn (zie afbeelding hieronder), van een heel gedetailleerde afbeelding tot een gesimplificeerd model met strakke geometrische vormen. “Zoals je ziet, heb je niet al die details nodig om te zien dat het een konijn is; je kunt een groot deel van de informatie weglaten”, legt hij uit. Met wiskundige technieken kun je de dominante eigenschappen isoleren waardoor je verschillende wiskundige problemen makkelijker kunt oplossen. “Zo kun je nog steeds hele goede antwoorden krijgen, zonder dat je het hele grote probleem hoeft op te lossen met alle details, omdat je genoeg hebt aan de dominante eigenschappen.”
Ook op het gebied van neurale netwerken kan deze methode veel voordeel opleveren. “Neurale netwerken zijn vaak heel groot, dus zijn we aan het kijken hoe we ze met wiskundige methodes kunnen reduceren, zonder dat je essentiële informatie kwijtraakt en terwijl de black box nog steeds datgene doet wat het moet doen. Het is de kunst om niet te veel informatie weg te gooien, maar precies genoeg om efficiënter te kunnen rekenen met ongeveer dezelfde resultaten”, aldus Schilders.
Echte intelligentie
Om neurale netwerken efficiënter te maken moet je er meer kennis in gaan bouwen, gelooft Schilders. Enkel met data lukt het namelijk niet. “Als je neurale netwerken wilt trainen om bijvoorbeeld het gedrag van planetenstelsels te voorspellen, dan kun je de banen een aantal jaren meten en al die gegevens in het netwerk stoppen”, vertelt hij. “Maar als je dan het systeem vraagt om een voorspelling te doen voor de komende jaren, dan gaat het helemaal mis.”
Je moet niet alles alleen met data willen doen. Wij hebben al die kennis, al die wetten, dus waarom zouden we ze niet gebruiken?
Hoe moet het dan wel? “Je moet natuurkundige wetten in de netwerken stoppen, zoals zwaartekracht en andere natuurkundige eigenschappen”, stelt hij. “Als iets naar beneden valt, dan kun je daar heel veel metingen van maken en al die getallen in een netwerk stoppen. Maar Newton heeft daar de gravitatiewet voor opgesteld. Je kunt veel beter die simpele natuurkundige wet, die altijd geldt, in een neuraal netwerk stoppen dan duizenden getallen. Dat is veel slimmer, efficiënter en je krijgt op die manier betere uitkomsten.” Neurale netwerken die de kennis van de onderliggende fysica bevatten, in plaats van alleen data, worden ook wel physics informed neural networks genoemd. Volgens Schilders is dit de manier om neurale netwerken beter en betrouwbaarder maken.” “Je moet niet alles alleen met data willen doen. Wij hebben al die kennis, al die wetten, dus waarom zouden we ze niet gebruiken?”
Chat GPT is waarschijnlijk het bekendste voorbeeld van een groot neuraal netwerk, met heel veel hidden layers en miljoenen neuronen per laag. “Er zitten data van het hele internet in, en toch is het systeem helemaal niet zo betrouwbaar. Je hebt namelijk menselijke kennis nodig om neurale netwerken te verbeteren.” Schilders haalt zijn inmiddels bekende oneliner aan die hij opgenomen heeft in zijn afscheidsrede en die hij vaak in zijn lezingen gebruikt: “Real intelligence is needed to make artificial intelligence work.”
Computers beter leren kijken
Remco Duits, TU/e-onderzoeker bij de faculteit Mathematics & Computer Science, is binnen REMODEL betrokken bij werkpakket 6, dat zich richt op het oplossen van beeldanalyseproblemen zoals het automatisch identificeren van complexe vaatsystemen in medische foto’s. Dit sluit aan bij zijn project ‘Geometric Learning for Image Analysis’, waarvoor hij in 2021 een vici-beurs van 1,5 miljoen euro ontving.
Veel medische en industriële afbeeldingen worden met computers beoordeeld, maar de huidige methodes voor automatische beeldanalyse schieten tekort, vertelt Duits. Zo zijn er problemen met het identificeren en volgen van langgerekte structuren. In medische afbeeldingen zijn dat bijvoorbeeld bloedvaten en vezels; bij industriële afbeeldingen kun je denken aan scheuren in staal of overlappende componenten in beelden van computerchips. “Deze beelden bevatten vaak ruis, wat de interpretatie bemoeilijkt”, legt hij uit. “Bovendien zijn langgerekte structuren vaak complex en lopen ze op de foto’s over elkaar heen. Computers kunnen dan niet altijd goed bepalen wanneer bijvoorbeeld twee bloedvaten elkaar kruisen en wanneer ze vertakken.”
Verkeerde afslag
Ter demonstratie toont hij een röntgen-afbeelding van kransslagaders (zie hieronder) waarop vaatbomen te zien zijn. In de rode cirkel zie je verschillende bloedvaten over elkaar heen lopen. “Met het blote oog kun je zien waar de bloedvaten elkaar kruisen, maar de AI kan het zo interpreteren dat het bloedvat daar een afslag neemt.” Het juist segmenteren en volgen van bloedvaten in medische beelden is belangrijk bijvoorbeeld bij de vroege diagnose van diabetes. Maar ook wanneer een katheter bij een patiënt moet worden ingebracht moet de arts deze goed door de aders kunnen navigeren aan de hand van de medische beelden. Een verkeerde interpretatie van het beeld, vaak op de kruising, kan ertoe leiden dat de tracker een verkeerde afslag neemt. Het is dus van essentieel belang om een methode te ontwikkelen die de bloedvaten automatisch volgt met correcte output, zonder last te hebben van kruisingen of ruis.
Duits werkt aan het ontwikkelen van betrouwbare AI-methodes voor beeldanalyse waarmee interpretatiefouten voorkomen kunnen worden. “Met deep learning kan een model aan de hand van data getraind worden om de bloedvaten te identificeren. Maar daarvoor heb je heel veel data van goede kwaliteit nodig, die niet altijd voorhanden zijn, en het verwerken van deze data vraagt veel rekenkracht”, legt hij uit. Net als Schilders is Duits ervan overtuigd dat je wiskunde nodig hebt om te begrijpen wat er in de neurale netwerken precies gebeurt. En als je eenmaal begrijpt hoe het werkt, dan kun je met wiskundige methodes betere neurale netwerken ontwerpen die ook breder toepasbaar zijn in zowel de medische als industriële beeldanalyse.
Leentjebuur spelen
“Wat we ons misschien niet altijd goed realiseren is dat wij mensen ongelooflijk goed zijn in het interpreteren van beelden”, vertelt Duits. “Als je naar me kijkt, dan zie je in één oogopslag mijn gezicht, waar mijn shirt zit en waar de tafel begint. Dat komt omdat we slimme filtertjes hebben in ons visuele systeem.” Hij pakt een pen van de tafel en draait hem in de lucht. “Kijk, als ik de pen roteer, zie je nog steeds een pen. Voor ons is het vanzelfsprekend, maar neurale netwerken moeten dat leren. Je kunt dat doen door heel veel data in het netwerk te stoppen, maar dat is heel omslachtig. Met wiskundige methodes kun je een netwerk zo ontwerpen dat die informatie er intrinsiek in zit. Dan hoef je het netwerk daarvoor niet te trainen en heb je dus al die trainingsdata helemaal niet nodig.”
We kijken af van ons eigen visuele systeem om computers beter te leren kijken
Hoe mensen naar beelden kijken – de zogenaamde neurogeometrie – wordt wiskundig uitgedrukt aan de hand van PDE’s (partial differential equations) oftewel differentiaalvergelijkingen. “Met PDE’s kun je neurale netwerken efficiënter maken, zodat je minder trainingsdata nodig hebt en toch betere resultaten kunt krijgen”, zegt hij. Om betere analysemethodes te ontwikkelen, voegt Duits deze geometrische informatie toe aan de neurale netwerken. “Eigenlijk is het niets anders dan leentjebuur spelen. We kijken af van ons eigen visuele systeem om computers beter te leren kijken. We doen dat door louter geometrische betekenisvolle associatievelden (i.p.v. ad-hoc activaties) te trainen.”
Net als Schilders is hij ervan overtuigd dat je de fysica, die uitgedrukt is in wiskundige modellen, in het design van je netwerk moet meenemen. “Zo stop je er eigenlijk intelligentie in. We komen er steeds meer achter dat het slim is om te doen. Het is op een fundamenteel niveau een heel andere benadering en je krijgt op die manier ook netwerken die heel anders werken.”
Er is zo’n revolutie gaande op het gebied van de AI en er zijn ontzettend veel wiskundigen mee bezig. Daarom is het heel belangrijk om met elkaar in connectie te blijven
Stapje verder
Met het REMODEL-project willen we vooral bereiken dat alle wiskundig georiënteerde machine learners van binnen en buiten Europa een goede interactie met elkaar gaan hebben en op die manier hun krachten kunnen bundelen, zo zegt hij. “Zo kunnen we samen neurale netwerken niet alleen beter gaan begrijpen, maar ze ook reduceren, verbeteren en efficiënter maken”, stelt hij. “Er is zo’n revolutie gaande op het gebied van de AI en er zijn ontzettend veel wiskundigen mee bezig. Daarom is het heel belangrijk om met elkaar in connectie te blijven. Je hebt er allemaal baat bij om elkaar te stimuleren en vooruit te helpen.” REMODEL biedt volgens hem ook kansen aan jonge onderzoekers om hun netwerk te vergroten buiten het Europese netwerk. “Zo gaan TU/e-promovendi Nicky van den Berg en Gijs Bellaard op samenwerkingsbezoek naar Emory USA”, aldus Duits.
Hij hoopt dat we met het REMODEL-programma belangrijke inzichten gaan verkrijgen over machinaal leren die ons allemaal een stapje verder gaan brengen. “Je kunt nog zo’n goede resultaten halen met neurale netwerken, maar zolang je niet begrijpt hoe ze werken, ben je niet bezig met waar het echt om gaat. We moeten beter begrijpen wat er gebeurt, en de universele wiskundige taal is het perfecte instrument om die kennis te delen en te verspreiden.”
Discussie