Hoe machine learning HPC-applicaties kan verbeteren

De belangrijkste workloads die op een supercomputer draaien bestaan vooralsnog uit verschillende vormen van nummerieke simulaties, zoals langetermijnweersvoorspellingen en moleculaire dynamica. De afgelopen decennia hebben ontwikkelingen in chipproductietechnologieën ervoor gezorgd dat supercomputers steeds krachtiger werden, waardoor ze grotere en nauwkeurigere berekeningen kunnen uitvoeren. De reductie van de grootte van transistors nadert echter de grenzen van het fysieke. Een toename in computerprestaties is daardoor niet langer een gegeven.

Waar het verbeteren van de efficiëntie aan de hardware-kant zoals gezegd een grote uitdaging is, ontstaan ​​aan de kant van de software nieuwe kansen. De laatste jaren is er veel onderzoek gedaan naar machine learning en deep learning-technologie. Onlangs zijn wetenschappers begonnen met het toepassen van machine learning-technieken om traditionele rekenkundige simulaties, zoals weersvoorspellingen, te verbeteren. De eerste resultaten wijzen uit dat deze modellen, die machine learning en traditionele simulatie combineren, de nauwkeurigheid kunnen verbeteren, de snelheid om tot resultaat te komen versnellen en de kosten aanzienlijk verlagen.

Machine learning

Een substantieel deel van machine learning-technieken, zoals neural networks, richten zich op een bepaalde vorm van voorspelling. Een typisch voorbeeld is objectherkenning in afbeeldingen: is wat op het plaatje staat een een kat of een hond? Op deze manier kunnen met behulp van machine learning simulatieresultaten worden voorspeld, bij benadering of zeer nauwkeurig, in plaats van dat een volledige numerieke simulatie moet worden uitgevoerd. De invoer- en uitvoergegevens van een conventionele simulatie kunnen worden gebruikt om een ​​deep neural netwerk te trainen, dat vervolgens in de deductiemodus wordt gebruikt om het te bestuderen systeem efficiënt te simuleren. Het voordeel is dat waar het trainen van een machine learning-model een rekenintensieve taak is, het uitvoeren van een ‘geleerd’ model in de inferentiemodus dat over het algemeen niet het geval is. Terug naar het voorbeeld van ‘katten en honden’: voor het trainen van een objectherkenningsnetwerk is misschien een super computer nodig, maar in een inferentiemodus kan het worden uitgevoerd op een Raspberry Pi van 40 euro.

HPC Cloud computer met hand die op een knop drukt

De toepassing van machine learning in High Performance Computing (HPC) met het grootste potentieel is misschien wel om productie-numerieke simulatiemodellen te vervangen door benaderingen van machine learning. Deze toepassing heeft alles in zich om de aard van HPC wezenlijk te veranderen. Als wetenschappers deze methode adopteren, heeft dat wel als consequentie dat ze daarmee de codes die ze in de afgelopen tien jaar hebben ontwikkeld achterhaald maken. Aan de andere kant helpt de nieuwe aanpak wetenschappers om zich meer te richten op de onderliggende wetenschap en om uiteenlopende schalen te bestuderen, zoals de planetaire systemen in sterrenhopen. Ze kunnen dus beter en gerichter onderzoek doen.

Wanneer machine learning wordt toegepast voor schattingen kunnen nummerieke simulaties nog steeds van waarde zijn ook al zijn ze dan niet heel efficiënt. Dit heeft te maken met het feit dat numerieke codes dan niet langer worden gebruikt om de applicatie op ware grootte te draaien.

Machine learning enhanced HPC applications project

Binnen het Deep Learning enhanced High Performance Computing Applications-project, dat SURFsara onder de vlag van SURF Open Innovation Lab uitvoert, hebben we 4 use cases geselecteerd in verschillende domeinen waarin de mogelijkheden worden onderzocht om traditionele HPC simulaties te verbeteren met machine learning algoritmen:
 

  • Machine-Learned turbulence in next-generation weather models – Dr. Chiel van Heerwaarden, Meteorology and Air Quality Group, Wageningen Universiteit;
  • Generating physics events without an event generator – Dr. Sacha Caron, Experimental High Energy Physics, Radboud Universiteit;
  • Distinguising biological interfaces from crystal artifacts in biomolecular complexes using deep learning – Prof. Alexandre M.J.J. Bonvin, Computational Structural Biology, Universiteit Utrecht; en
  • Machine learning for accelerating planetary dynamics in stellar clusters – Prof. Simon Portegies Zwart, Computational Astrophysics, Universiteit Leiden.

We gaan deze use cases ondersteunen met funding, technische support, etc. om de machine learning-benadering te valideren, omdat we geloven dat het de potentie heeft om zich tot een mainstream tool te ontwikkelen die in vele wetenschappelijke gebieden kan worden toegepast

Auteur

Reacties

Dit artikel heeft 0 reacties