neprihlásený Piatok, 18. septembra 2020, dnes má meniny Eugénia
Nvidia predstavila GPU novej generácie s vysokým AI výkonom

Značky: Nvidiaumelá inteligencia

DSL.sk, 15.5.2020


Spoločnosť Nvidia vo štvrtok predstavila prvý GPU procesor A100 svojej novej architektúry Ampere.

Prvý GPU a zároveň prvý akcelerátor rovnakého mena A100, v ktorom je použitý, je určený pre serverové nasadenie respektíve akceleráciu výpočtov v oblasti neurónových sietí a celkovo strojového učenia.

A100 je vyrábaný 7-nm výrobným procesom TSMC, má až 54.2 miliárd tranzistorov a akcelerátor má 40 GB HBM2 pamäte a TDP 400 Wattov.

Počet CUDA jadier dosahuje 6 912, počet Tensor jadier pre akceleráciu výpočtov v oblasti umelej inteligencie Nvidia neuvádza.

Výkon A100 sa pomerne výrazne zvýšil aj v operáciách s reálnymi číslami používanými pri 3D renderovaní. Oproti Volta V100 je to v prípade výpočtov s tzv. jednoduchou presnosťou, teda 32-bitovými FP32, 19.5 oproti 15.7 teraflopov / s a v prípade čísel s tzv. dvojnásobnou presnosťou 9.7 oproti 7.8 teraflopov / s.


Nvidia A100, kliknite pre zväčšenie (obrázok: Nvidia)



Oveľa výraznejší nárast respektíve vysoký výkon je dosahovaný vo výpočtoch určených pre učenie neurónových sietí a počítanie s natrénovanými neurónovými sieťami. Vo výpočtoch s FP16 formátom sa výkon zvýšil zo 125 na 312 teraflopov / s, výkon s novým formátom TF32 s väčším rozsahom dosahuje 156 teraflopov / s a výkon s INT8 až 624 teraflopov / s. Nová funkčnosť s využitím riedkosti dát umožňuje ďalej zvýšiť výkon maximálne dvojnásobne.

Novou funkciou pre väčšiu flexibilitu využitia je možnosť rozdelenia GPU a jeho výkonu na maximálne sedem častí a fungovanie ako sedem samostatných GPU.


      Zdieľaj na Twitteri



Najnovšie články:

Skylink testuje viac ako desiatku nových kanálov
SpaceX odložila vypustenie ďalších 60 satelitov Starlink
Štát voľne sprístupnil kompletné osobné údaje všetkých testovaných na koronavírus na webe
Apple potvrdila použitie prvého 5-nm CPU
Trailer druhej série The Mandalorian


inzercia



Diskusia:
                               
 

Mňa fas cínuje, že ako sa navrhujú tak neskutočne zložité obvody.
Odpovedať Známka: 10.0 Hodnotiť:
 

V minulosti sa navod publikoval v casopise Mlady technik.
Odpovedať Známka: 8.6 Hodnotiť:
 

Nie, ze by na tom zalezalo, ale ... najlepsie navody boli v casopise vcielka a serii knih Mladi svisti.
Odpovedať Známka: 8.3 Hodnotiť:
 

Ja si este pamatam ako sme na vyske robili navrh obvodov ciselneho zamku, cekom zaujimavy predmet Logicke systemy...
potom sa to programovalo do WHDL...

ak mi napises na skorec1@post.sk poslem ti moje zadanie, dokumentaciu, tam je navrh nejakeho uplne easy obvodu...


Odpovedať Známka: 6.7 Hodnotiť:
 

Najlepsie navody boli v casopise Junij technik
Odpovedať Hodnotiť:
 

Toto ma podobny vykon ako nas Aurel...
Odpovedať Známka: 5.0 Hodnotiť:
 

Taky vykon ma Aurel jedine ked ho pretaktuju a najebu tam RGB podsvietenie.
Odpovedať Známka: 7.5 Hodnotiť:
 

Cena od okolo 10 000 USD za toto monstrum...
A ak toto ma prist do hernych grafik v PC tak zas brutalne zdrazia grafiky. Uvidime herny vykon
Kokosina ako mraky.
A boh vie aka bude spotreba...
Odpovedať Známka: -7.8 Hodnotiť:
 

ty si mongol toto nie je urcene pre bezne graficke karty kde si jozko hra call of duty
Odpovedať Známka: 9.1 Hodnotiť:
 

no dokelu
som jozko a hram call of duty

... asi to nebude pre mna
Odpovedať Známka: 1.8 Hodnotiť:
 

jak by ti jeden s Pieščan povedau: "tomu ver !"

Odpovedať Známka: 10.0 Hodnotiť:
 

Pokial nepotrebujes hrat najnarocnejsie pecky v 4K s AA na +60fps tak ti postaci obycajna karba za dve stovky. Toto su proste novinky a etalony ktore urcuju smerovanie technologie a trhu, to bolo je aj bude drahe jak prasa. Dnesne titany ties zrovna niesu najlacnejsie.
Odpovedať Známka: 6.0 Hodnotiť:
 

To je jak za facku. Uz sa neviem dockat. Konecne mi pojde Supaplex na plne detaily.
Odpovedať Známka: 10.0 Hodnotiť:
 

640x480 nestaci?
Odpovedať Známka: 10.0 Hodnotiť:
 

Tesim sa ako to bude slapat. Aj skoda, ze nedali 64GB ram aby sa dorovnali pamatou TPUckam.
Teraz sa daju extra velke modely trenovat len na gpu s SLI, co zvysuje cenu. Lepsie by bolo mat rovno 64GB na jedne grafike a radsej zvysit pocet pocet gpu a distribuovat vypocty.
Ale na druhej stran 95% zakaznikov fitnu a ostatok sa prisposobi :)
Odpovedať Známka: -2.0 Hodnotiť:
 

Mal by si im napísať. Možno upravia výrobu. Však čo to je do stávajúcej verzie pridať ešte ďalších 30 miliárd tranzistorov ako pre RAMku.
Odpovedať Známka: 6.0 Hodnotiť:
 

x 8-10 násobok tranzistorov samozrejme som myslel...
Odpovedať Hodnotiť:
 

Je úplne jedno koľkonásobok. Pokiaľ raz nepresné výpočty k vývinu AI nevedú, rýchlejšie výpočty s tzv. jednoduchou presnosťou vedú maximálne k priekazne väčšiemu množstvu nesprávnych výsledkov.
Odpovedať Známka: 0.0 Hodnotiť:
 

Jasne nemozne... Vsak Quadro rtx 8000 ma 48GB.

Skor ide o to, ze tam davaju to co drviva vacsina zakaznikov potrebuje, resp. zaplati.

Google si spravil TPU v prvom rade pre vlastne pouzitie v oblasti NLP, kde potrebuje velke modely, cize tam aj nalozil dost RAM. A az potom (z mojho pohladu) v druhom rade na rental na GCP. Vsetok vyvoj je v prvom rade na zaklade poziadaviek (v kazdej oblasti IT), ak 95% zakaznikov Nvidie v oblasti Data Science nepotrebuje 64GB ram tak ju tam nedaju a trochu pridaju oproti V100, ktora mala 32GB. Tolko moje uvahy.
Odpovedať Hodnotiť:
 

Preco to pisem, lebo ja v radsej obetujem vypoctovy vykon GPU a radsej tam budem mat dostatok RAM.
Lebo ak model (parametre modelu - velmi velke matice) nenarves do ramky v GPU tak tam proste trenovat ten model nemozes.

Ekvivalent:
Radsej pojdem na pomalsom aute ako na ferrari, do ktoreho sa kvoli malemu priestoru (a bruchu) nevojdem a mozem ist akurat tak do ...
Odpovedať Známka: 1.4 Hodnotiť:
 

Ty pises, ze do Ferrari sa nezmestis. S tym kazdy suhlasi. Ferrari rozhodne nie je auto pre kazdeho (cenu ignorujem).
Ale aj pises, ze je skoda, ze Ferrari nerobi take modely aby v nich mohol soferovat aj Kamakawiwoʻole. S tym uz nesuhlasime.
Odpovedať Hodnotiť:
 

Chodis na ferari ale motorka ma lepsie zrychlenie a mensiu spotrebu. M+ nie je dost nikdy, ak mas v modeli vacsiu batch.
Odpovedať Hodnotiť:
 

Odbornikovi z dsl nemoze pripojenie dalsich M+ z aliexpresu robit ziadny problem.
Odpovedať Hodnotiť:
 

Neviem ako je to teraz, ale v 2008-2009 v zapojení SLI sa pamäte na kartách nescitavali a frekvencia sa prispôsobovala(ak boli odlišné) nižšej frekvencii, tak aj pamäte.
Odpovedať Hodnotiť:
 

Nvidia + Intel == jediná možnosť pre PC posledných 20 rokov.
Odpovedať Známka: -7.5 Hodnotiť:
 

Pred 25 rokmi aj INTEL + S3 či Trident.
Odpovedať Známka: 7.5 Hodnotiť:
 

PCI zbernica vyšla nejak koncom roku 1992...
Odpovedať Známka: 2.0 Hodnotiť:
 

false
Odpovedať Známka: 8.0 Hodnotiť:
 

"výkon s INT8 až 624 teraflopov/s" je nezmysel, FLOP je operacia s floating point. Pre integery ma 624 teraops :)
Odpovedať Známka: 10.0 Hodnotiť:
 

Prispevok bude zmazany pre nevhodny alebo vulgarny obsah!
Odpovedať Známka: 10.0 Hodnotiť:
 

Riedke data poprosim! Moc huste mi nechutia.
Odpovedať Známka: 10.0 Hodnotiť:

Pridať komentár