neprihlásený Piatok, 19. apríla 2024, dnes má meniny Jela
Veľký utorňajší výpadok internetových služieb spôsobil chybne zadaný príkaz

Značky: ITzaujímavosti

DSL.sk, 3.3.2017


Utorňajší viachodinový výpadok služby Amazon S3, Simple Storage Service, ktorý bol príčinou problémov viacerých populárnych internetových služieb, spôsobil podľa analýzy zverejnenej spoločnosťou chybne zadaný vstup príkazu administrátorom.

Cloudová úložná služba S3 je využívaná mnohými internetovými službami, ktoré využívajú pre poskytovanie svojich služieb cloudovú infraštruktúru Amazonu AWS vrátane virtuálnych serverov EC2.

K problémom so službou S3 a náväzne ďalších Amazon služieb prišlo v dátovom centre pre východný región USA v Severnej Virgínii, problém sa tak zrejme dotkol najmä amerických užívateľov internetových služieb. Ak ale konkrétne služby nemajú nezávislú infraštruktúru pre Európu, rovnako sa dotkol aj európskych užívateľov.

O 18:37 stredoeurópskeho času chcel pracovník príkazom vypnúť malú časť serverov zabezpečujúcich účtovací systém pre S3. Jeden zo vstupov príkazu bol ale zadaný podľa spoločnosti nesprávne a príkaz tak vypol väčší počet serverov vrátane serverov, ktoré zabezpečovali subsystém indexovania metadát v S3 a subsystém vytvárania nových úložísk v S3.

V týchto subsystémoch v dôsledku toho zostal malý počet server a subsystémy bolo potrebné reštartovať. Keďže tieto subsystémy neboli reštartované roky, nábeh indexovacieho systému kvôli potrebnej kontrole integrity metadát trval dlhšie ako sa očakávalo. Subsystém začal fungovať až o 21:26 a plne obnovený bol o 22:18.

Subsystém pre vytváranie nových úložísk bol následne naštartovaný do 22:54.

Až potom sa začali obnovovať ostatné naviazané služby, pričom do plnej obnovy ubehol ďalší nespresnený čas.

Podľa amerických médií medzi postihnutými službami boli okrem iného Netflix, Reddit, služby Adobe a Imgur.

V reakcii na incident Amazon mení nástroj pre svojich administrátorov, ktorý už nedovolí naraz odobrať tak rýchlo také veľké množstvo serverov. Zároveň zníži čas potrebný na reštart v prípade viacerých subsystémov, ich rozdelením do viacerých častí.


      Zdieľaj na Twitteri



Najnovšie články:

V najbližších dňoch bude spustený nový vysielač digitálneho rádia
Seriál Fallout podľa počítačovej hry bude mať pokračovanie
Budúci týždeň budú vydané dve dôležité linuxové distribúcie
Špehovacie satelity SpaceX už snímkujú Zem, s vyšším rozlíšením ako doterajšie
Linux si na PC drží podiel 4%
AI výkon tohtoročnej generácie Intel CPU bude vyšší ako 100 teraops/s
Apple bude mať nový seriál o alternatívnom sovietskom vesmírnom programe, predĺžila For All Mankind
Pôsobivého dvojnohého robota Atlas nahradí úplne nová elektrická verzia
O2 spustilo predaj na diaľku. Namiesto eID sa fotí tvár a občiansky, nedá sa objednať eSIM ani predplatenka
Klon populárnej databázy Redis od Linux Foundation k dispozícii v prvej verzii


Diskusia:
                               
 

No, dalsi dokaz, ze cloudove sluzby su presny opak povodnej myslienky decentralizovanej siete a sluzieb... Chyba v cloud managemente a pol internetu v haji...
Odpovedať Známka: 7.1 Hodnotiť:
 

vola sa to hub a je to prirodzenou sucastou uplne kazdej otvorenej a decentralizovanej oblasti vo svete, od IT (internet), cez ekonomiku (kapitalizmus zhromazduje vsetok majetok centralizovane) az po socialne prepojenia na facebooku (zopar ludi ma brutalne vela connections oproti priemeru - co je tak 100 friendov).
http://dopice.sk/jee

kazdy neregulovany system tomuto emerguje, proste je to znamka, ze bol naozaj nastaveny decentralizovane. je to vseobecne platna paradigma, ktorej nezabranis.
Odpovedať Známka: 0.0 Hodnotiť:
 

no a to mi vysvetlite ako moze toto vysvetlenie niekto zaminuskovat
Odpovedať Známka: -4.2 Hodnotiť:
 

Lebo to vysvetlenie ma viac znakov, ako je schopny mozog priemerneho usera prijat a zanalyzovat. Priemerny user je uz iba schopny prijat kratku obrazovu informaciu a posunutim ukazovaka pravej ruky smerom nadol dostat novu informaciu. Rovnako, ako ked sliepke hadzete zrniecko po zrniecku.
Odpovedať Známka: -0.5 Hodnotiť:
 

P2P For Ever
Odpovedať Známka: 6.0 Hodnotiť:
 

tak ono nato co vsetko sa tam premelie su taketo obcasne minoritne vypadky este v pohode, aj ked maju samozrejme majoritny dopad najma co sa tyka negativneho marketingoveho vyznamu
Odpovedať Známka: 2.0 Hodnotiť:
 

Zverejnenim analyzy spolocnostou v subehu so zmenou nastroja pre administrátorov bez zmeny na za vnutornu bezpecnostnu politiku, a vsetky nadvazujuce riadiace posty, zodpovedajucich poziciach vsak znemoznenim nasledovania "Avoid Repeating Your Mistakes" predmetneho zamestnanca dochadza k situacii, riesenie ktorej je interne v kompetencii HR, pricom, samozrejme, o majoritny dopad priekazne nemoze ist.
Odpovedať Známka: -7.3 Hodnotiť:
 

Lenze ako inak spehovat a ovladat svet, ludi, buducnost...
Odpovedať Známka: 6.0 Hodnotiť:
 

There is no cloud, it's just someone else's computer.
Odpovedať Známka: 7.8 Hodnotiť:
 

Sila je, ze jeden clovek dokaze vypnut pol internetu :)
Odpovedať Známka: 10.0 Hodnotiť:
 

Decentralizovany byt nestaci, este treba byt peer-to-peer.
Odpovedať Hodnotiť:
 

Admin omylom zadal prikaz miesto lokalnej konzoly PC pri jeho vypinani na konci sichty, na lognutej vzdialenej dom0:
shutdown -h now
a nasledne odisiel domov, pricom problem odhalil az kolega, ktory nema pravo spustenia virtualov a kedze ten co to sposobil este viazol v zacpe z BA do Samorina, tak museli cakat....
Odpovedať Známka: 7.5 Hodnotiť:
 

tak vsade sa setri, co na tom ze technik povie, ze to tak nema byt a lolo nad nim to chce tak, aby co najviac usetril a prd tomu rozumie.
Odpovedať Známka: 6.4 Hodnotiť:
 

MR. ROBOT
Odpovedať Známka: 6.0 Hodnotiť:
 

chcelo by to p2p cloud :) kazdy si kupime 20TB priestoru a gigabitovu linku a spojime sily aby sme mohli co najviac fotiek a videii Janky H. dostat do cloudu :D
Odpovedať Známka: 8.8 Hodnotiť:
 

Z "co najviac" je sice rozlisenie specifikovane jednoznacne, ale aky format a kontainer?
Odpovedať Známka: -4.3 Hodnotiť:
 

kontajner moze byt aj plastovy a format kludne A0 ... :o)
Odpovedať Známka: 10.0 Hodnotiť:
 

Lenze vo Windows ma skutocny format format formatu format c:
Odpovedať Známka: 3.3 Hodnotiť:
 

Uz vidim toho admina ako stlacil enter a pol serverovni piplo na znak restartu ako pokrcil plecami a isiel na veceru ... :-)
Odpovedať Známka: 10.0 Hodnotiť:
 

Not my job
Odpovedať Známka: 10.0 Hodnotiť:
 

Skor ked uz: Not my f*cking problem :D
Odpovedať Známka: 10.0 Hodnotiť:
 

¯\_(ツ)_/¯
Odpovedať Známka: -5.0 Hodnotiť:
 

¯\_(ツ)_/¯
Odpovedať Známka: -5.0 Hodnotiť:
 

Samozrejme ze to tak dopadne pretoze to bolo uplne napicu a kedze sa věci zmenili iba zvláštním sposobom nemoze to ist inak jako by sme chceli pretoze to je celkom jasne ze to jasne bolo uz uplne na zaciatku a kde sa to cele nepretocilo tak sme tocili salamu celkom inak jako by sme mali lebo tocnie malého mnozstva vody nebolo v plane na urade narodnej nemoralnej nemohucnosti a kedze giganticky mikroskop bol pripojeny na baterku internetovym sposobom mohlo byt docela obsluzny malému poctu rolnikov ktori robili papáju na medenom drote zatocenom doprava a automaticky pumpovali gel najlepsieho providera mikro sluzieb a tieto boli predane nadnarodnym okupaciam německého charakteru a potom uz len sme cakali na dodacie pripinaciky malého mnozstva velkého dopravcu ktory slubil zaslanie etikety postovym spolocnostiam a tieto samozrejme nemali na vyber a museli zacat konzumovat napichane hrusky maloobchodnym olejom a dopékat vlastne halusky pretoze boli celkom dobře.
Odpovedať Známka: -4.0 Hodnotiť:
 

zaujimave, nikto sa tu este nepozastavil nad tym, ze tie servre neboli restartovane roky.
Odpovedať Známka: 8.3 Hodnotiť:
 

Pretoze priekazne su vsetci pozastaveni.
Odpovedať Známka: -2.5 Hodnotiť:
 

pretoze to je uplne bezne ze servre maju uptime roky
práve ulohou serverou je byt online 24/7

moj domaci server má baterkovu zalohu aby sa nevypol pri vypade prudu a má uptime viac ako rok - pre big data spoločnosť ako amazon, google, ... je to úplne bežné
Odpovedať Známka: 1.7 Hodnotiť:
 

A to je Ti načo??
Odpovedať Známka: -1.7 Hodnotiť:
 

NAS? Torrent klient? SFTP? Streaming? Server pre čokoľvek čo je treba online? A ďalších 100 služieb a fun-vecí...
Odpovedať Hodnotiť:
 

a bezpecnostne zaplaty ? ci to mydlia na istotu a idu bez zaplat ? :D
Odpovedať Známka: -3.3 Hodnotiť:
 

v linuxe dokazes aktualizovat system aj bez restartu (viem, pre windowsakov je to cista utopia).
Odpovedať Známka: 6.9 Hodnotiť:
 

oni tam maju linux ? ako si na to prisiel ?
Odpovedať Známka: -8.0 Hodnotiť:
 

pretoze nerestartovali roky...
Odpovedať Známka: 8.6 Hodnotiť:
 

aj kernel sa da takto bez restartu NA PRODUKCNYCH STROJOCH aktualizovat, vsak ?
Odpovedať Hodnotiť:
 

ano, od nejakej verzie spred cca 2 rokov vies aktualizovat aj kernel bez restartu, dostalo to nativnu podporu. predtym si to musel vymachrovat.

kazdopadne, oni nemaju servery postavene na ubuntu, aby ich kazdho pol roka reinstalovali. ja tipujem, ze tam maju nejake vlastne distro odvodene z povedzme debianu a nemaju potrebu aktualizovat kernel
Odpovedať Hodnotiť:
 

Ten moj ma uptime 1490 dni a co je na tom divne? Servery niesu PCcka, aby sa vypinali, alebo barskedy restartovali (pokial na nich teda nebezi Windows:))
Odpovedať Známka: 3.8 Hodnotiť:
 

a bezpecnostne updaty ?
Odpovedať Známka: -5.0 Hodnotiť:
 

mne na tom nie je nic divne, praveze som istu dobu spravoval servre, a uptime v rokoch bol normalny. Teda linuxove. Windows sa pocital na max. mesiace, lebo aktualizacie. Len mi akosi chybalo, ze to tu nikto nespomenul :)
Odpovedať Známka: 2.0 Hodnotiť:
 

ja mam na svojich win xp (resp maval som), tiez roky uptime, kaslal som na aktualizacie, a zijem, nemam AIDS, a ani som neutrpel nic s tym neaktualnym win xp.
ale dnes je celkom v mode, ze PC si povie, ze za 10 minut sa nieco restartuje ci co.. inak teraz tiez pisem z XP.
kazdopadne, na Win7 mam tiez dlhe uptime... uptimy?
aktualizacie a antivirus nemam rad.. naco..
inak, nemam rad ani restart, lebo HW sa rad kazi prave pri restarte.. je to ako V3Ska, ked je nastartovana, tak ide..
Odpovedať Známka: -3.3 Hodnotiť:
 

shit happens
Odpovedať Hodnotiť:
 

"odobrať tak rýchlo také veľké množstvo serverov."
odkedy odobrať znamená vypnúť ??? hmmm
Odpovedať Známka: 3.3 Hodnotiť:
 

Preloz si to sam: The tool that was responsible for causing the outage has been modified to take down servers more slowly and to block operations that will take capacity below safety check levels.
Odpovedať Hodnotiť:
 

z toho clanku som nepochopil nic.

vypli teda zelezo na ktorom bezal zdielany program ?

mozno ak by presli na Raspberry Pi a nechali na nom bezat mezi zariadeniami jeden spolocne zdielany program pisany v phytone, s pristupom na nevypinane raid 5 ?

otazka je ako sa takto da rozdelit jedna sietova linka s jedndou adresou ?

takto by mohli virtualne na intel postavene stroje poslat do prec a vsetko by bol stary dobry hw, co stroj to jednotka.
Odpovedať Známka: -2.0 Hodnotiť:
 

Keby si videl ceny ake maju tieto firmy za servre tak by si plakal, ono sa to kupuje na kila, nie na kusy pri takom odbere ako maju oni.
A po dalsie, rpi nam po 3 mesiacoch 24/7 majnenia dat odchadzali takze sa vobec neoplatili.
Odpovedať Hodnotiť:

Pridať komentár