neprihlásený
|
Utorok, 26. novembra 2024, dnes má meniny Kornel |
|
Nová technológia pre pripojenie akcelerátorov
Značky:
Intel
DSL.sk, 22.3.2019
|
|
Spoločnosť Intel aktuálne informovala o vyvinutí novej technológie a štandardu CXL pre pripojenie výkonných hardvérových akcelerátorov vyžadujúcich aj vysoké rýchlosti komunikácie.
Technológiu CXL, Compute Express Link, vyvinul Intel a následne ju posúva konzorciu viacerých popredných IT spoločností, ktoré ju budú ďalej rozvíjať. Sú v ňom okrem Intelu aj HPE, Dell EMC, Cisco, Huawei, Microsoft, Google, Facebook a Alibaba.
Rozličné akcelerátory sú čoraz dôležitejším komponentom najmä serverových systémov, pričom v poslednom období sa nasadzujú okrem iného často pre akceleráciu metód umelej inteligencie a strojového učenia.
CXL je fyzicky založená na novej pripravovanej verzii rozhrania PCI Express 5.0. To v novej verzii zdvojnásobuje rýchlosť oproti ešte len prichádzajúcej PCI Express 4.0 a dokáže po jednej linke prenášať dáta rýchlosťou 3.9 GB/s a cez x16 slot rýchlosťou 63 GB/s.
Podstatnou vlastnosťou CXL je zabezpečenie tzv. pamäťovej koherencie, podľa popisu zrejme priamo samotnou technológiou. V prípade viacerých procesorov v jednom systéme pristupujúcich do pamäte, CPU a procesorov akcelerátorov, vzniká problém so zmenou dát v pamäti jedným procesorom ale nacachovaných starších hodnôt ostatnými. Systém má zabezpečenú pamäťovú koherenciu, ak má vyriešený tento problém a zabezpečené správne dáta pre všetky procesory.
CXL bude konkurovať zrejme najmä podobnej technológii CCIX, cache coherent interconnect for accelerators. Tá je tiež nadstavbou PCI Express fungujúcou na rýchlostiach PCI Express 4.0 so 16 GT/s prípadne ešte vyšších s 25 GT/s. Nvidia zase používa technológiu NVLink.
Špecifikácia prvej generácie CXL má byť dostupná v prvom polroku tohto roka a čo sa týka produktov, minimálne Intel avizuje podporu CXL vo svojich produktoch pre dátové centrá na rok 2021.
Najnovšie články:
Diskusia:
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Ale no tak
Od: Nfjdjsksj
|
Pridané:
22.3.2019 23:05
AMD nas dobieha vo vykone? To nic, vymyslime si novy proprieatarny standard
|
|
Re: Ale no tak
Od: fvfdbdfb
|
Pridané:
23.3.2019 10:58
AMD niekoho dobieha?
|
|
Re: Ale no tak
Od: Jamicon
|
Pridané:
23.3.2019 11:42
Nie, už ho predbehol.
|
|
Re: Ale no tak
Od: xfgysdgys&d
|
Pridané:
24.3.2019 18:20
AMD nas predbieha vo vykone? To nic, vymyslime si novy proprieatarny standard
|
|
ničivý praktik S005E00120
Od: syntaxterrorXX. X
|
Pridané:
23.3.2019 16:55
Holt, vymysliet proprieatarnu alternativu k neexistujucemu slobodnemu standardu je objektivne priekazne zapeklitejsie.
|
|
gdsgsdg
Od: dgsgsg
|
Pridané:
23.3.2019 0:47
nove a rychlejsie
|
|
Re: gdsgsdg
Od: fvfdbdfb
|
Pridané:
23.3.2019 10:59
lepšie ako nové a krajšie.
|
|
Re: gdsgsdg
Od: miro j.
|
Pridané:
24.3.2019 18:38
hej intel , kolko je 2+2....5 hovori intel instantne...ale to nie je dobre...ale bolo to rychlo...hovori intel...
|
|
Ide to zlym smerom.
Od: Jadierok
|
Pridané:
23.3.2019 11:37
Treba zvazit cestu jedneho silneho jadra s jednym vlaknom a nie xy jadier, kazde s dvoma + vlaknami. Je to slepa vyvojova vetva, ku ktorej potom treba vymyslat riesenia uvedene v clanku. Jedno poriadne jadro, disk s uz implementovanou RAM a grafickou pamatou, zuvukovou kartou a ostatne nalezitosti. Desktop bude mat minimalnu velkost a poriadny vykon. Ostatne je slepa ulica.
|
|
Re: Ide to zlym smerom.
Od: Jamicon
|
Pridané:
23.3.2019 11:51
Slepý si jedine ty. Dokonca už aj widle vedia pracovať s viacerými vláknami, akurát niektoré hry na starých enginoch s tým majú problém.
|
|
Re: Ide to zlym smerom.
Od: bekes caba
|
Pridané:
23.3.2019 12:38
Problem je ze frekvenciu jedneho jadra CPU nejde zvysovat donekonecna naraza to na technicke limity. Takze tam kde nestaci single thread nastupuje paralerizacia. Mas pravdu v tom ze pre programatorov je omnoho komplikovanejsie pisat viac jadrove aplikacie a rozhodne zo 4jadroveho CPU nevymackas 4x vacsi vykon ako z 1neho jadra. Preto kodit multijadrove aplikacie nemozu ziadni php bastlici ale skutocni programatori, ktori vedia v imperativnych jazykoch pouzivat vlakna, alebo ovladaju nejaky funkcionalny jazyk. Funkcionalne jazyky (nie vsetky bohuzial) umoznuju implicitny paralelizmus a fakt sa v nich tieto veci kodia dost dobre, problem je ze sa to hodi len na niektore typy uloh: ak mas napriklad zonam asynchronnych operacii pricom vysledok dalsej zavisi od predchadzajucej tak to jednoducho na vlakna nerozdelis ani keby si sa postavil na hlavu. Takze mas svojim sposobom pravdu, otazka je ako by sa dali obist fyzikalne limity obavam sa ze bude treba objavit nejaku novu technologiu a prejst na nu.
|
|
Re: Ide to zlym smerom.
Od: ffdf
|
Pridané:
23.3.2019 14:03
HAHaha....na 4 core vypočítam 4 workunity za rovnakú dobu ako jedden na 1core :-)
|
|
Re: Ide to zlym smerom.
Od: Priekaz
|
Pridané:
23.3.2019 16:29
Hahahaha, ano, na Core 2 Quad z roku 2007. Odvtedy existuje vec zvana Turbo Boost, takze nie, na N jadras nevypocitas N-nasobok ako na jednom jadre.
A hahahaha, a este vyrob tie 4 work unity z P-complete uloh, napriklad CVP alebo graph search ordering.
Taky paralelizovany bastlic kodu...
|
|
Re: Ide to zlym smerom.
Od: Ušatý
|
Pridané:
23.3.2019 20:23
Počuli sme slovo pánovo.
|
|
Re: Ide to zlym smerom.
Od: ffdf
|
Pridané:
23.3.2019 21:58
ano, na E5440 2,83GHz na 3,41 GHz...čiže turbo :-)
A tie workunity nechám robiť tých čo obsluhujú seti@home.
|
|
Re: Ide to zlym smerom.
Od: Priekaz
|
Pridané:
23.3.2019 23:23
Lol, prides do diskusie, kde sa riesi, ze niektore problemy nie su paralelizovatelne, zahras sa na velkeho geroja, kolko workunitov ty zratas na kolko jadras a potom z teba vylezie, ze tie workunity nech tvori niekto iny, not your problem, ty to len spustis... Genius.
|
|
Re: Ide to zlym smerom.
Od: ffdf
|
Pridané:
24.3.2019 13:02
si ty ale kus kkta...fakt!
si najväčší programátor aký tu kedy bol...paralelné kódenie máš samozrejme v malíčku /len jak to dostať do hlavy/
A v článku neni priamo slovíčko paralelizovanie ani spomenuté, iba určité problémy v prístupe do pamäte viacerými procesormi /čo s tým samozrejme spojené je/
Ty si dalej snívaj o jedinom výkonnom 10GHz jadre...truľo :-)
|
|
Re: Ide to zlym smerom.
Od: ffdf
|
Pridané:
24.3.2019 13:07
a úplne samozrejmé veci typu:
"ak mas napriklad zoZnam asynchronnych operacii pricom vysledok dalsej zavisi od predchadzajucej tak to jednoducho na vlakna nerozdelis ani keby si sa postavil na hlavu."
nemá ani význam napísať, to je úplne jasné aj mne čo som programoval vykreslenie priamky v BASIC-G na PMD85!! :-)))
A tie WU zo seti@home si mám skompilovať sám zo šumu, ktorý je napríklad momentálne na 325 kHz či ako??? Nemiešaj sa do vecí ktorým nerozumieš...ty trdlo! :-)
|
|
ultraradikalny fakticizmus
Od: syntaxterrorXX. X
|
Pridané:
24.3.2019 9:31
Lenze ak plati Moorov zakon aj rozpinanie vesmiru a do dvoch svetelnych rokov eti nie je, presne rovnaky vysledok ako seti@home je mozne dat priekazne zrovna uz jednym workunitom - vlastnou hlavou.
|
|
Nepochopeny
Od reg.: Mam nejake
|
Pridané:
24.3.2019 23:03
To sa tu casto nestava ze diskutujuci aboslutne netrafia obsah clanku.
Ide o to, ze na ML treba spracovavat velke.mnozstvo dat a treba vela vypoctovych operacii (najcastesjsie MauMul). Preto sa pouzivaju GPU. Kedze tych vypoctov treba vela zvysjue sa mnozstvo GPU.
Zdravy sedliacky rozum by povedal, ze kedy dam nieco ratat na 8 GPU tak to pojde 8x rychlejsie ako na 1 GPU. Ale nie je to tak, nejde to linearne. Je tam velky bottleneck prave naparameter updaty pre parameter servre. Exiatuju rozne techniky, ktore to kvazi riesia ale je to viac menej len workarround. Intel tymto triafa klinec po hlavicke.
|
|
Re: Nepochopeny
Od reg.: Mam nejake
|
Pridané:
24.3.2019 23:04
* MatMul .
Sorry za preklepy, za to moze pivo.
|
Pridať komentár
|
|
|
|