Spoločnosť Nvidia vo štvrtok predstavila prvý GPU procesor A100 svojej novej architektúry Ampere.
Prvý GPU a zároveň prvý akcelerátor rovnakého mena A100, v ktorom je použitý, je určený pre serverové nasadenie respektíve akceleráciu výpočtov v oblasti neurónových sietí a celkovo strojového učenia.
A100 je vyrábaný 7-nm výrobným procesom TSMC, má až 54.2 miliárd tranzistorov a akcelerátor má 40 GB HBM2 pamäte a TDP 400 Wattov.
Počet CUDA jadier dosahuje 6 912, počet Tensor jadier pre akceleráciu výpočtov v oblasti umelej inteligencie Nvidia neuvádza.
Výkon A100 sa pomerne výrazne zvýšil aj v operáciách s reálnymi číslami používanými pri 3D renderovaní. Oproti Volta V100 je to v prípade výpočtov s tzv. jednoduchou presnosťou, teda 32-bitovými FP32, 19.5 oproti 15.7 teraflopov / s a v prípade čísel s tzv. dvojnásobnou presnosťou 9.7 oproti 7.8 teraflopov / s.
Nvidia A100, kliknite pre zväčšenie (obrázok: Nvidia)
Oveľa výraznejší nárast respektíve vysoký výkon je dosahovaný vo výpočtoch určených pre učenie neurónových sietí a počítanie s natrénovanými neurónovými sieťami. Vo výpočtoch s FP16 formátom sa výkon zvýšil zo 125 na 312 teraflopov / s, výkon s novým formátom TF32 s väčším rozsahom dosahuje 156 teraflopov / s a výkon s INT8 až 624 teraflopov / s. Nová funkčnosť s využitím riedkosti dát umožňuje ďalej zvýšiť výkon maximálne dvojnásobne.
Novou funkciou pre väčšiu flexibilitu využitia je možnosť rozdelenia GPU a jeho výkonu na maximálne sedem častí a fungovanie ako sedem samostatných GPU.
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
čudo...
Od: ...-
|
Pridané:
15.5.2020 11:16
Mňa fas cínuje, že ako sa navrhujú tak neskutočne zložité obvody.
|
|
Re: čudo...
Od: ....
|
Pridané:
15.5.2020 11:25
V minulosti sa navod publikoval v casopise Mlady technik.
|
|
Re: čudo...
Od reg.: Buržuj//
|
Pridané:
15.5.2020 11:57
Nie, ze by na tom zalezalo, ale ... najlepsie navody boli v casopise vcielka a serii knih Mladi svisti.
|
|
Re: čudo...
Od: skorec124
|
Pridané:
15.5.2020 16:57
Ja si este pamatam ako sme na vyske robili navrh obvodov ciselneho zamku, cekom zaujimavy predmet Logicke systemy...
potom sa to programovalo do WHDL...
ak mi napises na skorec1@post.sk poslem ti moje zadanie, dokumentaciu, tam je navrh nejakeho uplne easy obvodu...
|
|
Re: čudo...
Od: CCCP
|
Pridané:
18.5.2020 7:59
Najlepsie navody boli v casopise Junij technik
|
|
Re: čudo...
Od: McMurdoc
|
Pridané:
15.5.2020 12:46
Toto ma podobny vykon ako nas Aurel...
|
|
Re: čudo...
Od: martincc
|
Pridané:
15.5.2020 15:01
Taky vykon ma Aurel jedine ked ho pretaktuju a najebu tam RGB podsvietenie.
|
|
Vysoka cena
Od: mmichalll
|
Pridané:
15.5.2020 11:30
Cena od okolo 10 000 USD za toto monstrum...
A ak toto ma prist do hernych grafik v PC tak zas brutalne zdrazia grafiky. Uvidime herny vykon
Kokosina ako mraky.
A boh vie aka bude spotreba...
|
|
Re: Vysoka cena
Od: fzdfz
|
Pridané:
15.5.2020 11:38
ty si mongol toto nie je urcene pre bezne graficke karty kde si jozko hra call of duty
|
|
Re: Vysoka cena
Od: jožo
|
Pridané:
15.5.2020 13:49
no dokelu
som jozko a hram call of duty
... asi to nebude pre mna
|
|
Re: Vysoka cena
Od: ritmaus
|
Pridané:
15.5.2020 16:28
jak by ti jeden s Pieščan povedau: "tomu ver !"
|
|
Re: Vysoka cena
Od: Robo10111
|
Pridané:
15.5.2020 11:56
Pokial nepotrebujes hrat najnarocnejsie pecky v 4K s AA na +60fps tak ti postaci obycajna karba za dve stovky. Toto su proste novinky a etalony ktore urcuju smerovanie technologie a trhu, to bolo je aj bude drahe jak prasa. Dnesne titany ties zrovna niesu najlacnejsie.
|
|
Re: Vysoka cena
Od: šoltés
|
Pridané:
15.5.2020 13:03
To je jak za facku. Uz sa neviem dockat. Konecne mi pojde Supaplex na plne detaily.
|
|
Re: Vysoka cena
Od: martincc
|
Pridané:
15.5.2020 15:01
640x480 nestaci?
|
|
tesime sa
Od reg.: Mam nejake
|
Pridané:
15.5.2020 11:50
Tesim sa ako to bude slapat. Aj skoda, ze nedali 64GB ram aby sa dorovnali pamatou TPUckam.
Teraz sa daju extra velke modely trenovat len na gpu s SLI, co zvysuje cenu. Lepsie by bolo mat rovno 64GB na jedne grafike a radsej zvysit pocet pocet gpu a distribuovat vypocty.
Ale na druhej stran 95% zakaznikov fitnu a ostatok sa prisposobi :)
|
|
Re: tesime sa
Od: ...-
|
Pridané:
15.5.2020 11:58
Mal by si im napísať. Možno upravia výrobu. Však čo to je do stávajúcej verzie pridať ešte ďalších 30 miliárd tranzistorov ako pre RAMku.
|
|
Re: tesime sa
Od: ...-
|
Pridané:
15.5.2020 11:59
x 8-10 násobok tranzistorov samozrejme som myslel...
|
|
ničivý praktik S$(($(od -An -N2</dev/urandom)))E$RANDOM
Od: syntaxterrorXXX, X
|
Pridané:
15.5.2020 12:29
Je úplne jedno koľkonásobok. Pokiaľ raz nepresné výpočty k vývinu AI nevedú, rýchlejšie výpočty s tzv. jednoduchou presnosťou vedú maximálne k priekazne väčšiemu množstvu nesprávnych výsledkov.
|
|
Re: tesime sa
Od reg.: Mam nejake
|
Pridané:
15.5.2020 12:33
Jasne nemozne... Vsak Quadro rtx 8000 ma 48GB.
Skor ide o to, ze tam davaju to co drviva vacsina zakaznikov potrebuje, resp. zaplati.
Google si spravil TPU v prvom rade pre vlastne pouzitie v oblasti NLP, kde potrebuje velke modely, cize tam aj nalozil dost RAM. A az potom (z mojho pohladu) v druhom rade na rental na GCP. Vsetok vyvoj je v prvom rade na zaklade poziadaviek (v kazdej oblasti IT), ak 95% zakaznikov Nvidie v oblasti Data Science nepotrebuje 64GB ram tak ju tam nedaju a trochu pridaju oproti V100, ktora mala 32GB. Tolko moje uvahy.
|
|
Re: tesime sa
Od reg.: Mam nejake
|
Pridané:
15.5.2020 12:37
Preco to pisem, lebo ja v radsej obetujem vypoctovy vykon GPU a radsej tam budem mat dostatok RAM.
Lebo ak model (parametre modelu - velmi velke matice) nenarves do ramky v GPU tak tam proste trenovat ten model nemozes.
Ekvivalent:
Radsej pojdem na pomalsom aute ako na ferrari, do ktoreho sa kvoli malemu priestoru (a bruchu) nevojdem a mozem ist akurat tak do ...
|
|
Re: tesime sa
Od: reg.: Houston
|
Pridané:
17.5.2020 10:28
Ty pises, ze do Ferrari sa nezmestis. S tym kazdy suhlasi. Ferrari rozhodne nie je auto pre kazdeho (cenu ignorujem).
Ale aj pises, ze je skoda, ze Ferrari nerobi take modely aby v nich mohol soferovat aj Kamakawiwoʻole. S tym uz nesuhlasime.
|
|
Re: tesime sa
Od reg.: Macko Pu
|
Pridané:
17.5.2020 14:50
Chodis na ferari ale motorka ma lepsie zrychlenie a mensiu spotrebu. M+ nie je dost nikdy, ak mas v modeli vacsiu batch.
|
|
Re: tesime sa
Od reg.: Macko Pu
|
Pridané:
15.5.2020 14:39
Odbornikovi z dsl nemoze pripojenie dalsich M+ z aliexpresu robit ziadny problem.
|
|
Re: tesime sa
Od: Pepo138
|
Pridané:
16.5.2020 1:16
Neviem ako je to teraz, ale v 2008-2009 v zapojení SLI sa pamäte na kartách nescitavali a frekvencia sa prispôsobovala(ak boli odlišné) nižšej frekvencii, tak aj pamäte.
|
|
Spoluobčania
Od: Buržuj//.
|
Pridané:
15.5.2020 12:13
Nvidia + Intel == jediná možnosť pre PC posledných 20 rokov.
|
|
Re: Spoluobčania
Od: ...-
|
Pridané:
15.5.2020 12:16
Pred 25 rokmi aj INTEL + S3 či Trident.
|
|
Re: Spoluobčania
Od: ...-
|
Pridané:
15.5.2020 12:16
PCI zbernica vyšla nejak koncom roku 1992...
|
|
Re: Spoluobčania
Od: Robo10111
|
Pridané:
15.5.2020 16:15
false
|
|
flop vs op
Od: rouen
|
Pridané:
15.5.2020 13:12
"výkon s INT8 až 624 teraflopov/s" je nezmysel, FLOP je operacia s floating point. Pre integery ma 624 teraops :)
|
|
Re: flop vs op
Od: krupicu_nezerem
|
Pridané:
15.5.2020 17:55
Prispevok bude zmazany pre nevhodny alebo vulgarny obsah!
|
|
poprosim
Od: Echt
|
Pridané:
16.5.2020 18:14
Riedke data poprosim! Moc huste mi nechutia.
|