neprihlásený Utorok, 26. novembra 2024, dnes má meniny Kornel
Nová technológia pre pripojenie akcelerátorov

Značky: Intel

DSL.sk, 22.3.2019


Spoločnosť Intel aktuálne informovala o vyvinutí novej technológie a štandardu CXL pre pripojenie výkonných hardvérových akcelerátorov vyžadujúcich aj vysoké rýchlosti komunikácie.

Technológiu CXL, Compute Express Link, vyvinul Intel a následne ju posúva konzorciu viacerých popredných IT spoločností, ktoré ju budú ďalej rozvíjať. Sú v ňom okrem Intelu aj HPE, Dell EMC, Cisco, Huawei, Microsoft, Google, Facebook a Alibaba.

Rozličné akcelerátory sú čoraz dôležitejším komponentom najmä serverových systémov, pričom v poslednom období sa nasadzujú okrem iného často pre akceleráciu metód umelej inteligencie a strojového učenia.

CXL je fyzicky založená na novej pripravovanej verzii rozhrania PCI Express 5.0. To v novej verzii zdvojnásobuje rýchlosť oproti ešte len prichádzajúcej PCI Express 4.0 a dokáže po jednej linke prenášať dáta rýchlosťou 3.9 GB/s a cez x16 slot rýchlosťou 63 GB/s.

Podstatnou vlastnosťou CXL je zabezpečenie tzv. pamäťovej koherencie, podľa popisu zrejme priamo samotnou technológiou. V prípade viacerých procesorov v jednom systéme pristupujúcich do pamäte, CPU a procesorov akcelerátorov, vzniká problém so zmenou dát v pamäti jedným procesorom ale nacachovaných starších hodnôt ostatnými. Systém má zabezpečenú pamäťovú koherenciu, ak má vyriešený tento problém a zabezpečené správne dáta pre všetky procesory.

CXL bude konkurovať zrejme najmä podobnej technológii CCIX, cache coherent interconnect for accelerators. Tá je tiež nadstavbou PCI Express fungujúcou na rýchlostiach PCI Express 4.0 so 16 GT/s prípadne ešte vyšších s 25 GT/s. Nvidia zase používa technológiu NVLink.

Špecifikácia prvej generácie CXL má byť dostupná v prvom polroku tohto roka a čo sa týka produktov, minimálne Intel avizuje podporu CXL vo svojich produktoch pre dátové centrá na rok 2021.


      Zdieľaj na Twitteri



Najnovšie články:

NASA si objednala vypustenie helikoptéry na Titan, od SpaceX
Notebookov s novým Snapdragonom sa malo predať iba 720-tisíc
Ceny RAM by v 2025 mohli klesnúť, odhadujú analytici
Štátna zaručená konverzia dokumentov má zase výpadok
O2 zvyšuje ceny programov Radosť - aktualizácia 1
Raspberry Pi má nový model, Raspberry Pi Pico 2 W
Japonci uviedli ethernetový kábel s magnetickým konektorom
Starship by mohla za najbližšie štyri roky uskutočniť až 400 štartov
Protimonopolný úrad začal prešetrovať, prečo v SR nie sú skutoční virtuálni mobilní operátori
Nový trailer filmu Minecraft


Diskusia:
                               
 

AMD nas dobieha vo vykone? To nic, vymyslime si novy proprieatarny standard
Odpovedať Známka: 1.0 Hodnotiť:
 

AMD niekoho dobieha?
Odpovedať Známka: -3.8 Hodnotiť:
 

Nie, už ho predbehol.
Odpovedať Známka: 6.3 Hodnotiť:
 

AMD nas predbieha vo vykone? To nic, vymyslime si novy proprieatarny standard
Odpovedať Známka: -5.0 Hodnotiť:
 

Holt, vymysliet proprieatarnu alternativu k neexistujucemu slobodnemu standardu je objektivne priekazne zapeklitejsie.
Odpovedať Známka: -2.9 Hodnotiť:
 

nove a rychlejsie
Odpovedať Známka: 3.3 Hodnotiť:
 

lepšie ako nové a krajšie.
Odpovedať Známka: 6.7 Hodnotiť:
 

hej intel , kolko je 2+2....5 hovori intel instantne...ale to nie je dobre...ale bolo to rychlo...hovori intel...
Odpovedať Známka: -2.5 Hodnotiť:
 

Treba zvazit cestu jedneho silneho jadra s jednym vlaknom a nie xy jadier, kazde s dvoma + vlaknami. Je to slepa vyvojova vetva, ku ktorej potom treba vymyslat riesenia uvedene v clanku. Jedno poriadne jadro, disk s uz implementovanou RAM a grafickou pamatou, zuvukovou kartou a ostatne nalezitosti. Desktop bude mat minimalnu velkost a poriadny vykon. Ostatne je slepa ulica.
Odpovedať Známka: -7.9 Hodnotiť:
 

Slepý si jedine ty. Dokonca už aj widle vedia pracovať s viacerými vláknami, akurát niektoré hry na starých enginoch s tým majú problém.
Odpovedať Známka: 6.7 Hodnotiť:
 

Problem je ze frekvenciu jedneho jadra CPU nejde zvysovat donekonecna naraza to na technicke limity. Takze tam kde nestaci single thread nastupuje paralerizacia. Mas pravdu v tom ze pre programatorov je omnoho komplikovanejsie pisat viac jadrove aplikacie a rozhodne zo 4jadroveho CPU nevymackas 4x vacsi vykon ako z 1neho jadra. Preto kodit multijadrove aplikacie nemozu ziadni php bastlici ale skutocni programatori, ktori vedia v imperativnych jazykoch pouzivat vlakna, alebo ovladaju nejaky funkcionalny jazyk. Funkcionalne jazyky (nie vsetky bohuzial) umoznuju implicitny paralelizmus a fakt sa v nich tieto veci kodia dost dobre, problem je ze sa to hodi len na niektore typy uloh: ak mas napriklad zonam asynchronnych operacii pricom vysledok dalsej zavisi od predchadzajucej tak to jednoducho na vlakna nerozdelis ani keby si sa postavil na hlavu. Takze mas svojim sposobom pravdu, otazka je ako by sa dali obist fyzikalne limity obavam sa ze bude treba objavit nejaku novu technologiu a prejst na nu.
Odpovedať Známka: 2.9 Hodnotiť:
 

HAHaha....na 4 core vypočítam 4 workunity za rovnakú dobu ako jedden na 1core :-)
Odpovedať Známka: -5.0 Hodnotiť:
 

Hahahaha, ano, na Core 2 Quad z roku 2007. Odvtedy existuje vec zvana Turbo Boost, takze nie, na N jadras nevypocitas N-nasobok ako na jednom jadre.

A hahahaha, a este vyrob tie 4 work unity z P-complete uloh, napriklad CVP alebo graph search ordering.


Taky paralelizovany bastlic kodu...
Odpovedať Známka: -2.3 Hodnotiť:
 

Počuli sme slovo pánovo.
Odpovedať Známka: 10.0 Hodnotiť:
 

ano, na E5440 2,83GHz na 3,41 GHz...čiže turbo :-)
A tie workunity nechám robiť tých čo obsluhujú seti@home.
Odpovedať Známka: -1.1 Hodnotiť:
 

Lol, prides do diskusie, kde sa riesi, ze niektore problemy nie su paralelizovatelne, zahras sa na velkeho geroja, kolko workunitov ty zratas na kolko jadras a potom z teba vylezie, ze tie workunity nech tvori niekto iny, not your problem, ty to len spustis... Genius.
Odpovedať Známka: 5.6 Hodnotiť:
 

si ty ale kus kkta...fakt!
si najväčší programátor aký tu kedy bol...paralelné kódenie máš samozrejme v malíčku /len jak to dostať do hlavy/
A v článku neni priamo slovíčko paralelizovanie ani spomenuté, iba určité problémy v prístupe do pamäte viacerými procesormi /čo s tým samozrejme spojené je/
Ty si dalej snívaj o jedinom výkonnom 10GHz jadre...truľo :-)
Odpovedať Známka: -2.5 Hodnotiť:
 

a úplne samozrejmé veci typu:
"ak mas napriklad zoZnam asynchronnych operacii pricom vysledok dalsej zavisi od predchadzajucej tak to jednoducho na vlakna nerozdelis ani keby si sa postavil na hlavu."

nemá ani význam napísať, to je úplne jasné aj mne čo som programoval vykreslenie priamky v BASIC-G na PMD85!! :-)))

A tie WU zo seti@home si mám skompilovať sám zo šumu, ktorý je napríklad momentálne na 325 kHz či ako??? Nemiešaj sa do vecí ktorým nerozumieš...ty trdlo! :-)
Odpovedať Známka: -1.1 Hodnotiť:
 

Lenze ak plati Moorov zakon aj rozpinanie vesmiru a do dvoch svetelnych rokov eti nie je, presne rovnaky vysledok ako seti@home je mozne dat priekazne zrovna uz jednym workunitom - vlastnou hlavou.
Odpovedať Známka: -5.0 Hodnotiť:
 

To sa tu casto nestava ze diskutujuci aboslutne netrafia obsah clanku.

Ide o to, ze na ML treba spracovavat velke.mnozstvo dat a treba vela vypoctovych operacii (najcastesjsie MauMul). Preto sa pouzivaju GPU. Kedze tych vypoctov treba vela zvysjue sa mnozstvo GPU.

Zdravy sedliacky rozum by povedal, ze kedy dam nieco ratat na 8 GPU tak to pojde 8x rychlejsie ako na 1 GPU. Ale nie je to tak, nejde to linearne. Je tam velky bottleneck prave naparameter updaty pre parameter servre. Exiatuju rozne techniky, ktore to kvazi riesia ale je to viac menej len workarround. Intel tymto triafa klinec po hlavicke.
Odpovedať Hodnotiť:
 

* MatMul .
Sorry za preklepy, za to moze pivo.
Odpovedať Hodnotiť:

Pridať komentár