Radeon Open Compute “ROCm” -pino v3.1, julkaistu RAS: n kanssa Vega 7nm: lle, SLURM-tuki resurssien hallinnan parantamiseksi, mutta Navi puuttuu edelleen

Laitteisto / Radeon Open Compute “ROCm” -pino v3.1, julkaistu RAS: n kanssa Vega 7nm: lle, SLURM-tuki resurssien hallinnan parantamiseksi, mutta Navi puuttuu edelleen 2 minuuttia luettu

AMD Radeon



Radeon Open Compute- tai “ROCm” -pino -versio on nyt saatavilla ladattavaksi. Radeon Open Compute v3.1 tuo mukanaan useita ominaisuuksia, mutta kummallakin tavalla AMD Navin ja GFX10: n tuki puuttuu edelleen.

ROCm, GPU-kiihdytetyn tietojenkäsittelyn yleisimmin hyväksytty yleinen foorumi, on nyt versiossa 3.1. Uusin moduulialustan päivitys, jonka avulla laitevalmistajat voivat rakentaa ROCm-kehystä tukevia ohjaimia, sisältää joitain odotettuja ominaisuuksia, kuten RAS-tuki 7 nm: n Megalle ja SLURM-tuki AMD-näytönohjaimille. ROCm: llä ei kuitenkaan vielä ole tuntemattomista syistä täydellistä tukea seuraavan sukupolven AMD Navi -arkkitehtuurille.

Mitä uutta Radeon ROCm v3.1: ssä:

Suurin ja ilmeisin muutos Radeon ROCm v3.1: n uudessa asennuksessa on ROCm Installation Directory Structure. Uusi ROCm-työkalupaketin asennus asentaa paketit / opt / rocm- kansio. Aikaisemmin ROCm-työkalupaketit asennettiin / opt / rocm kansio.



Uusi ROCm-versio on parantanut Vega 7nm -näytönohjainten luotettavuutta, saatavuutta ja huollettavuutta (RAS). Tämä 7 nm: n Vega-työ on oletettavasti vielä mikroskoopin alla Vega-pohjainen “Arcturus” Laske kiihdytin tulossa tänä vuonna. Tuki sisältää:



  • UMC RAS ​​- HBM ECC (korjaamaton virheinjektio), sivun poistaminen käytöstä, RAS-palautus GPU: n (BACO) nollauksen avulla
  • GFX RAS - GFX, MMHUB ECC (korjaamaton virheinjektio), RAS-palautus GPU: n (BACO) nollauksen avulla
  • PCIE RAS - PCIE_BIF ECC (korjaamaton virheinjektio), RAS-palautus GPU: n (BACO) avulla

Radeon ROCm v3.1 saa myös SLURM-tuen AMD-näytönohjaimille. SLURM tai Simple Linux Utility for Resource Management on yksi erittäin suosituista ja helposti käytetyistä klusterien hallinta- ja työaikataulujärjestelmistä Linux-klustereille. SLURM on suositeltava, koska se on avoimen lähdekoodin, vikasietoinen ja erittäin skaalautuva.

Tämä järjestelmä voi nyt olla hyvin vuorovaikutuksessa AMD-näytönohjainten kanssa. SLURM: n uusin versio 20.02.0 sisältää AMD-laajennukset, joiden avulla SLURM tunnistaa ja määrittää AMD-näytönohjaimet automaattisesti. Se kerää ja raportoi myös grafiikkasirujen energiankulutuksen. SLURM-tuki on hyödyllinen lisäys, kun otetaan huomioon Radeon-näytönohjaimia ja muita suurempia AMD-GPU-klustereita käyttävien supertietokoneiden käyttöönoton lisääntyvä määrä.

Huolimatta useiden ominaisuuksien sisällyttämisestä, ROCm: ssä ei vieläkään ole merkkejä GFX10 / Navi-tuesta. GitHub-sivu ROCm: lle on päivitetty vastaamaan kaikkia muutoksia, asennushuomautuksia ja tunnettuja ongelmia.



Tunnisteet tark