neprihlásený Štvrtok, 18. apríla 2024, dnes má meniny Valér
Nvidia predstavila 16-nm supervýkonný GPU Pascal

Značky: GPUNvidia

DSL.sk, 6.4.2016


Spoločnosť Nvidia, spolu s AMD jeden z dvojice výrobcov výkonných grafických procesorov, v utorok na svojej konferencii 2016 GPU Technology Conference predstavila novú generáciu svojich GPU, grafických procesorov, Pascal.

Spoločnosť okrem predstavenia základných parametrov architektúry Pascal predstavila prvý model GP100, ktorý je zatiaľ použitý len vo výpočtovom akcelerátore Tesla P100. Grafické karty postavené na GPU novej generácie spoločnosť zatiaľ nepredstavila.

GP100 je zaujímavý pre viacero inovácií.

Kým GPU za posledné štyri roky neinovovali výrobný proces a boli vyrábané 28-nm výrobným procesom, GP100 je vyrábaný 16-nm výrobným procesom. GP100 má so 610 mm2 o niečo väčšiu plochu ako GM200 Maxwell so 601 mm2 a až 15.3 miliárd tranzistorov, vďaka čomu ide podľa Nvidie o najväčší FinFET čip aký bol kedy vyrábaný.

Maximálna TDP spotreba GP100 je až 300 Wattov.

GP100 už nevyužíva externé pamäťové čipy ale pamäť typu HBM, High Bandwidth Memory, 2. U tejto pamäte je na sebe vertikálne umiestnených a priamo prepojených osem pamäťových čipov zároveň prepojených s GPU, čo poskytuje rýchlosť prenosu dát medzi GPU a pamäťou až 720 GB / s. Kapacita pamäte dosahuje 16 GB.


Akcelerátor Nvidia Tesla P100, kliknite pre zväčšenie (foto: Nvidia)



GP100 má výrazne vyšší počet Streaming Multiprocesorov, SM, ako predchádzajúce generácie, 56, a nezanedbateľne viac 32-bitových CUDA jadier, 3584. Zároveň sa ešte viac zlepšil výkon pri výpočtoch so 64-bitovými číslami s pohyblivou rádovou čiarkou a Pascal zavádza nové inštrukcie pre počítanie iba so 16-bitovými číslami, označené ako čísla s tzv. polovičnou presnosťou.

Tieto inštrukcie začala Nvidia podporovať kvôli aplikáciám v umelej inteligencii, konkrétne na implementáciu neurónových sietí. Osem akcelerátorov Tesla P100 použitých v novom predstavenom výpočtovom systéme Nvidia DGX-1 má konkrétne podľa Nvidie rovnaký výkon pri trénovaní neurónových sietí AlexNet ako 250 dvojprocesorových serverov postavených na výkonných Intel Xeonoch.


Parametre GP100 v Tesla P100, kliknite pre zväčšenie (tabuľka: Nvidia)



Celkovo má GP100 maximálny výkon pri 64-bitových výpočtoch na úrovni 5.3 teraflopov / s, pri 32-bitových 10.6 a pri 16-bitových výpočtoch 21.2 teraflopov / s.

Rýchlosť podporovanej technológie NVLink pre prepojenia viacerých GPU dosahuje 120 GB / s.

Dodávky Tesla P100 v podobe výpočtových serverov DGX-1 optimalizovaných pre aplikácie v oblasti umelej inteligencie začnú v júni, samostatné akcelerátory sa začnú dodávať na začiatku budúceho roka.

Špecifikáciu a popis GP100 a tiež nové možnosti pri jeho programovaní je možné nájsť na nvidia.com.


      Zdieľaj na Twitteri



Najnovšie články:

Apple bude mať nový seriál o alternatívnom sovietskom vesmírnom programe, predĺžila For All Mankind
Pôsobivého dvojnohého robota Atlas nahradí úplne nová elektrická verzia
O2 spustilo predaj na diaľku. Namiesto eID sa fotí tvár a občiansky, nedá sa objednať eSIM ani predplatenka
Klon populárnej databázy Redis od Linux Foundation k dispozícii v prvej verzii
Helikoptéra na Marse bude zbierať dáta aj po strate komunikácie so Zemou
Vývoj pôsobivého dvojnohého robota prekvapivo končí
Spustená výrobca QLC flash pamäte s viac ako 200 vrstvami
Batérie vyhodené z vesmírnej ISS neočakávane nezhoreli a poškodili dom v USA
Sprístupnená beta verzia Ubuntu 24.04 LTS
Nový CPU Apple M4 majú dostať všetky Macy, s výnimkou najvyšších najneskôr do jari


Diskusia:
                               
 

a sme v riti :D
Odpovedať Známka: 6.8 Hodnotiť:
 

Pockaj kym tam nalepia prvu cenovku :-)
Odpovedať Známka: 10.0 Hodnotiť:
 

Som nasiel.

Je tam 8x Tesla P100 (kazda s 16GB), 7TB SSD, 3kW zdroj, 2 Xeon procesory a 4x100Gbps + 2x10Gbps lan.
Cele zabera vysku 3U.

"Pouhych" 129.000 $ za DGX-1.
Odpovedať Známka: 6.0 Hodnotiť:
 

Piškvorky by to malo aj pod Windows zvládnuť...
Odpovedať Známka: 6.8 Hodnotiť:
 

4Maniak je dnes optimisticky naladeny :)
Odpovedať Známka: 7.3 Hodnotiť:
 

Keby len dnes, Bobe...
:-)
Odpovedať Známka: 5.4 Hodnotiť:
 

to si ty Juro z Petrzalky? konkretne Belinskeho 16?
Odpovedať Známka: 6.7 Hodnotiť:
 

Lúbiš paštekárov? Nee?
Odpovedať Známka: 7.1 Hodnotiť:
 

ty kokso...to by mi linku vyťažovali iba lietajúce nové a spracované workunity z BOINCu...už som u nejakého I5 neviemčo neviemčo taký cruncher videl...4xK80....výkon jak sviňa
Odpovedať Známka: -3.3 Hodnotiť:
 

len aby sa nerozhodla vyhladiť ľudstvo
Odpovedať Známka: 7.1 Hodnotiť:
 

len aby sa nerozhodla vyhladiť ľudstvo
Odpovedať Známka: 2.0 Hodnotiť:
 

len aby sa nerozhodla vyhladiť ľudstvo
Odpovedať Známka: 2.0 Hodnotiť:
 

len aby sa nerozhodla vyhladiť ľudstvo
Odpovedať Známka: 2.0 Hodnotiť:
 

len aby sa nerozhodla vyhladiť ľudstvo
Odpovedať Známka: 2.0 Hodnotiť:
 

len aby sa nerozhodla vyhladiť ľudstvo
Odpovedať Známka: 2.0 Hodnotiť:
 

sorry slacil som viac krat refresh
Odpovedať Známka: 4.0 Hodnotiť:
 

https://youtu.be/h0sUxkBSp9c
Odpovedať Známka: 10.0 Hodnotiť:
 

129K $, takze u nas by to bolo asi 160-170K €
Odpovedať Známka: 10.0 Hodnotiť:
 

+ nejaké drobné...
No však namiesto ustredného kúrenia si capneš takéto srrandy a vykuruješ. Počítanie je len vedľajší efekt tepla.
Odpovedať Známka: 10.0 Hodnotiť:
 

Pre slovenske superpocitacove centrum ako vitaz verejneho obstaravania s najlepsou ponukou v specialnej zlave 500k €.
Odpovedať Známka: 10.0 Hodnotiť:
 

Tato vecicka je trikrat vykonnejsia ako najvykonnejsi superpocitac sveta roku 2000.
Odpovedať Známka: 6.7 Hodnotiť:
 

tak by si ju mohlo kupit SAV namiesto toho ich aurelu.. aspon by mali na elektriku
Odpovedať Známka: 9.0 Hodnotiť:
 

Toto má z druhej strany dosť tenké vývody, takže sa im nebudú dať pripojiť 240 mm2 káble pre napájanie...
Odpovedať Známka: 10.0 Hodnotiť:
 

to je tazke takto porovnavat, musel by na tom ist rovnaky test.. V hrubych cislach v novembri 2000 mal Asci white 5-12Tflops, v priprave uz ale bol Earth simulator, ktory ma cca 35-40Tflops. Tu je na mieste skor porovnavat vykon s konkurencnym riesenim dnes, co je dvojjadrove AMD fiji firepro s9300. Su to rovnake procesory ako v radeon Fury, v DP maju vykon 1Tflops (5x menej :) ) ale v SP maju 14.
Odpovedať Hodnotiť:
 

To je sice fakt, ale uvedom si ze porovnavas vykon univerzalneho CPU a vypoctoveho GPU. GPU mali ten svoj vykon vzdy mnoho desiatok- ci dokonca stoviek-nasobne vacsi. Ale TFLOP pri CPU ma inu vahu ako TFLOP pri GPU, pretoze nie vsetko co bezi na CPU, pobezi aj na GPU.
Odpovedať Známka: 7.1 Hodnotiť:
 

si predstav, ze by si toto mal v roku 2000, ako UFO..
Odpovedať Známka: 10.0 Hodnotiť:
 

Všetko by tým pokazil.
Všetko má prirodzene svoj čas..
No a aj poučiť sa ľudia musia na vlastnej sprostosti...
Odpovedať Známka: 3.3 Hodnotiť:
 

Presne tak. Napriklad pouzivanim sposobu odovodnovania deklaracie nutnosti nevyhnutnosti matematickou indukciou je pri vsetkom mozne prirodzene ziskat poucenie o vyzname nutnosti primarneho pouzivania bazy.
Odpovedať Známka: -4.3 Hodnotiť:
 

No a potom prisiel JFET / MOSFET a bolo po bazi. :o)
Odpovedať Známka: 3.3 Hodnotiť:
 

Tie majú Gate - hradlo.
Bázu majú bipolárne tranzistory.
Odpovedať Známka: 10.0 Hodnotiť:
 

Lenže k prepnutiu može neprísť aj keď je nemajú, čiže nie musia.
Odpovedať Známka: -3.3 Hodnotiť:
 

Podľa dier je to aj vcelku veľké...
Po bokoch to čierne s axiálnymi vývodmi, to sú čo za súčiastky? To LR21...
Odpovedať Známka: 1.4 Hodnotiť:
 

Kondenzatory na rozbeh, kedze Nvidiacke GPU su parove a pamate HBM.
Odpovedať Známka: -4.3 Hodnotiť:
 

Vodotrysk
Odpovedať Známka: 8.9 Hodnotiť:
 

Maniak vsetko hodnoti podla dier. Ved ak ma kremik cca 600mm2 tak ma nejakych 3x2cm a hned mas predstavu o velkosti, je to velke ako tvoj chuj, myslim len kremik, ne cely plosak, ten moze mat viac ako 10 cm. To na okrajoch je napajacia kaskada, teda mosfety.
Odpovedať Známka: 7.9 Hodnotiť:
 

Skús trošku používať búdku na krku.
Ano, podľa dier som odhadol veľkosť.
A?
Odpovedať Známka: 0.0 Hodnotiť:
 

Maniak, dierka a velkost nie je vsetko
Odpovedať Známka: 4.4 Hodnotiť:
 

???
Napísal som, že podľa dier je to vcelku veľké.
Pánko nevedia čítať?
Odpovedať Známka: 1.8 Hodnotiť:
 

Skutočne? A čo Intel?
Odpovedať Známka: 0.0 Hodnotiť:
 

Ak mas na mysli Intel Phi tak jasne, najvykonnejsi superpocitac je postaveny prave na Intel Phi a nie na Nvidii. AMD v TOP500 ma len nejake dva tri kusky, aj to sponzorske pre univerzity. Ale stale v TOP500 dominuje Nvidia a nie Intel so svojimi Phi, aj ked XEONy najdes takmer v kazdom, ale CPU su dnes len na reziu, nie samotne vypocty.
Odpovedať Známka: 6.7 Hodnotiť:
 

neviem co trepes, hned druhy najvykonnejsi superpocitac sveta bezi na AMD Opteronoch
Odpovedať Známka: -2.0 Hodnotiť:
 

hej, a do konca prvej 50-tky aj posledny ;)
Odpovedať Známka: 6.0 Hodnotiť:
 

Zaujimave, toto vyzera ako mala revolucia, nie len mini evolucia, pripadne iba premenovanie ako bolo doteraz zvykom.
Odpovedať Známka: 3.3 Hodnotiť:
 

Chapem to spravne ze pri

720 GB / s. Kapacita pamäte dosahuje 16 GB

Precita teoreticky celu svoju 16 gogovu pamat pripadne zaplni za:

16/720 sekundy teda za 0,022 sekundy ?
Odpovedať Známka: 3.3 Hodnotiť:
 

Neviem ako čo chápeš, ale to je udávaná priepustnosť RAM.
Teda takým objemom dokáže prenášať dáta vnútri, medzi vlastným GPU rozhraním a vlastnou RAM.
Treba si však pozrieť, že to má šírku dátovej zbernice čudných 4096 bitov...
Odpovedať Známka: -5.0 Hodnotiť:
 

nerozumiem co je cudne na zbernici 4096 bitov pri hbm
Odpovedať Známka: 3.3 Hodnotiť:
 

Neviem čo je HBM, ale čudná(pre mňa) je tá šírka...
Odpovedať Hodnotiť:
 

čo si zaspal pri sériovej linke do RAM či čo???
Odpovedať Hodnotiť:
 

A v ktorom storočí mala RAM sériový prístup???
Odpovedať Známka: 10.0 Hodnotiť:
 

V kazdom, kde ho umoznuje driver.
Odpovedať Známka: 3.3 Hodnotiť:
 

Ty sa mi lúbiš. Teba je tu škoda...
Odpovedať Hodnotiť:
 

nemusi. Priepustnost sata 3 je tiez 600MBs ale mas aj SSD co da len 300mega, ze.. Proste cez ruru z procesora do pamate vie pretiect 720GBs dat.
Odpovedať Známka: 7.5 Hodnotiť:
 

"ruru z procesora " :D

asi to zacnem pouzivat: napajacia rura, rurou tecie 2A... znie to super
Odpovedať Známka: 7.5 Hodnotiť:
 

nerozumeim comu nerozumies a cudujem sa comu sa cudujes

ak ma dnes uplne normalna normalna grafika za 2 stovky napr. 4 gb pamate s rychlostou napr. 320 gb/s, celu ju precita/zapise za 4/320 = 0,0125 sekundy

Odpovedať Známka: 0.0 Hodnotiť:
 

pozor, tych 320 nieje rychlost ramky alezbernice
Odpovedať Známka: 10.0 Hodnotiť:
 

300watt ??to sa nemalo volat Pascal ale Pasteur a pasterizovalo by sa na tych horucich gpu mlieko
Odpovedať Známka: 7.6 Hodnotiť:
 

Parada moj JARVIS beziaci na GTX480 dostane poriadni Updata D:
Odpovedať Známka: 2.0 Hodnotiť:
 

zvladne ma ta masinka porazit v go ?
Odpovedať Známka: 10.0 Hodnotiť:
 

Pokemon Go? Určite...
Odpovedať Známka: 10.0 Hodnotiť:
 

Dá sa to napojiť na môj nový iPhone SE rose gold 64GB?
Odpovedať Známka: 2.5 Hodnotiť:
 

Samozrejme, s novym Lighting2Dgx kablom, ktory Apple predava za 15% ceny pripojeneho zariadenia :-)
P.S.: Pri kupe je samozrejme nutne predlozit uradne overenu kopiu nakupneho dokladu koncoveho zariadenia DGX-1.
Odpovedať Známka: 10.0 Hodnotiť:

Pridať komentár