Vés al contingut (premeu Retorn)

Lectura de Tesi Doctoral Àdel Alsalti Baldellou

Quan
18/12/2023 de 15:00 a 16:00
On
Sala de Conferències edifici TR5 i online
Afegeix un esdeveniment al calendari
iCal

Defensa de tesi doctoral.

Autor: Àdel Alsalti Baldellou
Títol: Development of linear solvers for large-scale CFD simlations on hybrid supercomputers
Director: Francesc Xavier Trias Miquel
Co-director: Assensi Oliva Llena
Data i lloc de defensa: 18 de desembre a les 15h a la Sala de Conferències del TR5

Enllaç al meet:https://meet.google.com/msd-aaqo-jpa

 

Resum de tesi: Les equacions de conservació estan presents en molts fenòmens físics, i sovint condueixen a una equació de Poisson la solució de la qual és una de les parts més costoses dels codis de simulació numèrica. De fet, és el principal coll d'ampolla en les simulacions de dinàmica de fluids computacionals (CFD) incompressibles, i desenvolupar solucionadors de Poisson és una tasca crítica.D'altra banda, el fet que l'amplada de banda de la memòria tendeixi a créixer molt més a poc a poc que el rendiment màxim ha portat a codis fortament memory-bound. A més, els problemes a exaescala tenen requisits de memòria comparables, la qual cosa pot ser problemàtica vist que la memòria en els acceleradors massivament paral·lels és més ràpida, però generalment més limitada. Utilitzar més nodes de càlcul és una manera natural d'evitar aquestes limitacions i abordar problemes més grans. Tanmateix, generalment comporta una pèrdua d'eficiència exacerbada per l'augment de la bretxa entre amplada de banda de memòria i xarxa als fat nodes.En aquest context, aquesta tesi presenta una estratègia per mitigar diversos dels reptes anteriorment. Consisteix a explotar s simetries espacials per augmentar la intensitat aritmètica de les simulacions i reduir els seus requisits de memòria. L'estratègia proposada és idèntica independentment de la connectivitat de la malla (estructurada o no estructurada) i de la complexitat geomètrica del problema, i per tant és aplicable a una àmplia gamma de configuracions acadèmiques i industrials.En primer lloc, demostrant l'existència d'una diagonalització per blocs que transforma l'equació de Poisson en un conjunt de 2^s subsistemes totalment desacoblats, podem accelerar significativament la convergència dels mètodes iteratius. A més, imposant un ordenament adequat de la malla podem reduir la memòria ocupada pels operadors i substituir el producte matriu-vector (SpMV) pel producte de matriu-matriu (SpMM), d'intensitat aritmètica major. Experiments numèrics basats en Algebraic Multigrid (AMG) i mètodes de Krylov explotant un nombre variable de simetries mostren reduccions de fins al 23% i 72% en el nombre d'iteracions, amb acceleracions generals de fins a 1,7x i 5,6x, respectivament.Aquesta estratègia és estesa als precondicionadors donant lloc a LRCFSAI(k), una variant millorada del precondicionador Factored Sparse Approximate Inverse (FSAI). LRCFSAI(k) sorgeix d'introduir un nou nivell d'aproximació aprofitant la similitud dels 2^s subsistemes per aplicar el mateix FSAI a tots ells, substituint així SpMV per SpMM i garantint estalvis notables de memòria i increments en la intensitat aritmètica. És clar que reciclar el mateix precondicionador a tots els subsistemes empitjora la convergència. Tot i ser aquest efecte molt menor de l'esperat, va motivar la introducció de correccions de baix rang molt efectives. Una característica clau d'aquestes correccions és que, gràcies a ser aplicades a cada subsistema per separat, com més simetries s'exploten, més efectives esdevenen, donant lloc a convergències fins a 5,7x més ràpides que el FSAI estàndard. Experiments numèrics en malles de fins a 1.070 milions confirmen la qualitat de LRCFSAI(k), el qual, tot i ser 2,6x més lleuger, accelera el FSAI estàndard fins a 4,4x vegades.Finalment, els avantatges d'aprofitar simetries i substituir SpMV per SpMM s'estenen a tota la simulació. Com a resultat, les multiplicacions per matrius s'acceleren, mentre que el consum de memòria es redueix, fent més assequibles les simulacions massives. Com a exemple d'aplicació pràctica, considerem la simulació numèrica de fluxos incompressibles turbulents mitjançant una discretització poc dissipativa de malles col·locades no estructurades tant en CPU com GPU. Finalment, classificant tots els operadors discrets en tres tipus podem generalitzar els guanys obtinguts, amb acceleracions de fins a 5,0x i estalvis de mem