neprihlásený Piatok, 27. novembra 2020, dnes má meniny Milan
Nvidia predstavila GPU novej generácie s vysokým AI výkonom

Značky: Nvidiaumelá inteligencia

DSL.sk, 15.5.2020


Spoločnosť Nvidia vo štvrtok predstavila prvý GPU procesor A100 svojej novej architektúry Ampere.

Prvý GPU a zároveň prvý akcelerátor rovnakého mena A100, v ktorom je použitý, je určený pre serverové nasadenie respektíve akceleráciu výpočtov v oblasti neurónových sietí a celkovo strojového učenia.

A100 je vyrábaný 7-nm výrobným procesom TSMC, má až 54.2 miliárd tranzistorov a akcelerátor má 40 GB HBM2 pamäte a TDP 400 Wattov.

Počet CUDA jadier dosahuje 6 912, počet Tensor jadier pre akceleráciu výpočtov v oblasti umelej inteligencie Nvidia neuvádza.

Výkon A100 sa pomerne výrazne zvýšil aj v operáciách s reálnymi číslami používanými pri 3D renderovaní. Oproti Volta V100 je to v prípade výpočtov s tzv. jednoduchou presnosťou, teda 32-bitovými FP32, 19.5 oproti 15.7 teraflopov / s a v prípade čísel s tzv. dvojnásobnou presnosťou 9.7 oproti 7.8 teraflopov / s.


Nvidia A100, kliknite pre zväčšenie (obrázok: Nvidia)



Oveľa výraznejší nárast respektíve vysoký výkon je dosahovaný vo výpočtoch určených pre učenie neurónových sietí a počítanie s natrénovanými neurónovými sieťami. Vo výpočtoch s FP16 formátom sa výkon zvýšil zo 125 na 312 teraflopov / s, výkon s novým formátom TF32 s väčším rozsahom dosahuje 156 teraflopov / s a výkon s INT8 až 624 teraflopov / s. Nová funkčnosť s využitím riedkosti dát umožňuje ďalej zvýšiť výkon maximálne dvojnásobne.

Novou funkciou pre väčšiu flexibilitu využitia je možnosť rozdelenia GPU a jeho výkonu na maximálne sedem častí a fungovanie ako sedem samostatných GPU.


      Zdieľaj na Twitteri



Najnovšie články:

HAMR má umožniť aj lacnejšie menšie disky
Prvá väčšia vzorka z asteroidu sa blíži k Zemi, pristane budúci týždeň
TSMC postavila továreň na 3-nm čipy
Najnovšia verzia Windows 10 má po mesiaci podiel 9%
Všetky Telekom paušály môžu do konca roka získať 15 GB dát navyše
Intel stále najväčším výrobcom čipov, ďalší sa ale približujú
SpaceX vyniesla ďalšie desiatky Starlink satelitov, video
EÚ chce aby produkty vydržali dlhšie, právo na opravu a aktualizácie po celú životnosť
Česko plošne zrýchľuje DSL vďaka bondingu
Podľa Torvaldsa je plná podpora Linuxu na ARM Macoch nepravdepodobná


Diskusia:
                               
 

Mňa fas cínuje, že ako sa navrhujú tak neskutočne zložité obvody.
Odpovedať Známka: 10.0 Hodnotiť:
 

V minulosti sa navod publikoval v casopise Mlady technik.
Odpovedať Známka: 8.6 Hodnotiť:
 

Nie, ze by na tom zalezalo, ale ... najlepsie navody boli v casopise vcielka a serii knih Mladi svisti.
Odpovedať Známka: 8.3 Hodnotiť:
 

Ja si este pamatam ako sme na vyske robili navrh obvodov ciselneho zamku, cekom zaujimavy predmet Logicke systemy...
potom sa to programovalo do WHDL...

ak mi napises na skorec1@post.sk poslem ti moje zadanie, dokumentaciu, tam je navrh nejakeho uplne easy obvodu...


Odpovedať Známka: 6.7 Hodnotiť:
 

Najlepsie navody boli v casopise Junij technik
Odpovedať Hodnotiť:
 

Toto ma podobny vykon ako nas Aurel...
Odpovedať Známka: 5.0 Hodnotiť:
 

Taky vykon ma Aurel jedine ked ho pretaktuju a najebu tam RGB podsvietenie.
Odpovedať Známka: 7.5 Hodnotiť:
 

Cena od okolo 10 000 USD za toto monstrum...
A ak toto ma prist do hernych grafik v PC tak zas brutalne zdrazia grafiky. Uvidime herny vykon
Kokosina ako mraky.
A boh vie aka bude spotreba...
Odpovedať Známka: -7.8 Hodnotiť:
 

ty si mongol toto nie je urcene pre bezne graficke karty kde si jozko hra call of duty
Odpovedať Známka: 9.1 Hodnotiť:
 

no dokelu
som jozko a hram call of duty

... asi to nebude pre mna
Odpovedať Známka: 1.8 Hodnotiť:
 

jak by ti jeden s Pieščan povedau: "tomu ver !"

Odpovedať Známka: 10.0 Hodnotiť:
 

Pokial nepotrebujes hrat najnarocnejsie pecky v 4K s AA na +60fps tak ti postaci obycajna karba za dve stovky. Toto su proste novinky a etalony ktore urcuju smerovanie technologie a trhu, to bolo je aj bude drahe jak prasa. Dnesne titany ties zrovna niesu najlacnejsie.
Odpovedať Známka: 6.0 Hodnotiť:
 

To je jak za facku. Uz sa neviem dockat. Konecne mi pojde Supaplex na plne detaily.
Odpovedať Známka: 10.0 Hodnotiť:
 

640x480 nestaci?
Odpovedať Známka: 10.0 Hodnotiť:
 

Tesim sa ako to bude slapat. Aj skoda, ze nedali 64GB ram aby sa dorovnali pamatou TPUckam.
Teraz sa daju extra velke modely trenovat len na gpu s SLI, co zvysuje cenu. Lepsie by bolo mat rovno 64GB na jedne grafike a radsej zvysit pocet pocet gpu a distribuovat vypocty.
Ale na druhej stran 95% zakaznikov fitnu a ostatok sa prisposobi :)
Odpovedať Známka: -2.0 Hodnotiť:
 

Mal by si im napísať. Možno upravia výrobu. Však čo to je do stávajúcej verzie pridať ešte ďalších 30 miliárd tranzistorov ako pre RAMku.
Odpovedať Známka: 6.0 Hodnotiť:
 

x 8-10 násobok tranzistorov samozrejme som myslel...
Odpovedať Hodnotiť:
 

Je úplne jedno koľkonásobok. Pokiaľ raz nepresné výpočty k vývinu AI nevedú, rýchlejšie výpočty s tzv. jednoduchou presnosťou vedú maximálne k priekazne väčšiemu množstvu nesprávnych výsledkov.
Odpovedať Známka: 0.0 Hodnotiť:
 

Jasne nemozne... Vsak Quadro rtx 8000 ma 48GB.

Skor ide o to, ze tam davaju to co drviva vacsina zakaznikov potrebuje, resp. zaplati.

Google si spravil TPU v prvom rade pre vlastne pouzitie v oblasti NLP, kde potrebuje velke modely, cize tam aj nalozil dost RAM. A az potom (z mojho pohladu) v druhom rade na rental na GCP. Vsetok vyvoj je v prvom rade na zaklade poziadaviek (v kazdej oblasti IT), ak 95% zakaznikov Nvidie v oblasti Data Science nepotrebuje 64GB ram tak ju tam nedaju a trochu pridaju oproti V100, ktora mala 32GB. Tolko moje uvahy.
Odpovedať Hodnotiť:
 

Preco to pisem, lebo ja v radsej obetujem vypoctovy vykon GPU a radsej tam budem mat dostatok RAM.
Lebo ak model (parametre modelu - velmi velke matice) nenarves do ramky v GPU tak tam proste trenovat ten model nemozes.

Ekvivalent:
Radsej pojdem na pomalsom aute ako na ferrari, do ktoreho sa kvoli malemu priestoru (a bruchu) nevojdem a mozem ist akurat tak do ...
Odpovedať Známka: 1.4 Hodnotiť:
 

Ty pises, ze do Ferrari sa nezmestis. S tym kazdy suhlasi. Ferrari rozhodne nie je auto pre kazdeho (cenu ignorujem).
Ale aj pises, ze je skoda, ze Ferrari nerobi take modely aby v nich mohol soferovat aj Kamakawiwoʻole. S tym uz nesuhlasime.
Odpovedať Hodnotiť:
 

Chodis na ferari ale motorka ma lepsie zrychlenie a mensiu spotrebu. M+ nie je dost nikdy, ak mas v modeli vacsiu batch.
Odpovedať Hodnotiť:
 

Odbornikovi z dsl nemoze pripojenie dalsich M+ z aliexpresu robit ziadny problem.
Odpovedať Hodnotiť:
 

Neviem ako je to teraz, ale v 2008-2009 v zapojení SLI sa pamäte na kartách nescitavali a frekvencia sa prispôsobovala(ak boli odlišné) nižšej frekvencii, tak aj pamäte.
Odpovedať Hodnotiť:
 

Nvidia + Intel == jediná možnosť pre PC posledných 20 rokov.
Odpovedať Známka: -7.5 Hodnotiť:
 

Pred 25 rokmi aj INTEL + S3 či Trident.
Odpovedať Známka: 7.5 Hodnotiť:
 

PCI zbernica vyšla nejak koncom roku 1992...
Odpovedať Známka: 2.0 Hodnotiť:
 

false
Odpovedať Známka: 8.0 Hodnotiť:
 

"výkon s INT8 až 624 teraflopov/s" je nezmysel, FLOP je operacia s floating point. Pre integery ma 624 teraops :)
Odpovedať Známka: 10.0 Hodnotiť:
 

Prispevok bude zmazany pre nevhodny alebo vulgarny obsah!
Odpovedať Známka: 10.0 Hodnotiť:
 

Riedke data poprosim! Moc huste mi nechutia.
Odpovedať Známka: 10.0 Hodnotiť:

Pridať komentár