Chaos Monkey and Supply Chain de la Netflix

Am avut recent o conversație cu Carlos Crespo, director de operațiuni al companiei-mamă Zara, Inditex, în care a menționat un instrument software creat de Netflix în urmă cu peste un deceniu pentru a instituționaliza rezistența sistemului. Numele este captivant, iar pentru liderii lanțului de aprovizionare care încearcă să-și reinventeze rețelele de aprovizionare pentru vremuri tulburi, este irezistibil. Și totuși, un GoogleGOOG
căutarea „maimuță haosului lanțului de aprovizionare” a dat exact o citare, din 2012.

De ce nu aplicăm această idee pentru reziliența lanțului de aprovizionare?

Ce este Chaos Monkey?

Este o instrument software, și mai larg, un principiu de inginerie care oprește aleatoriu părți ale unui sistem complex, forțând operatorii să recupereze live. Un fel de exercițiu de incendiu surpriză, dar zilnic și în moduri și locuri aleatorii. Ideea este că a deveni bun la rezolvarea rapidă a problemelor sistemului este un proces de învățare care ar trebui să beneficieze de o curbă de învățare din ce în ce mai abruptă.

Povestea de fundal este despre modul în care Netflix și-a extins afacerea de streaming pe Amazon Web Services în timp ce a trecut de la livrarea DVD-urilor la ușile clienților. La prima vedere, este o abordare logică a planificării redundanței sistemului, ca ceea ce v-ați aștepta de la NASA, dar în practică exploatează o normă culturală Netflix de a permite contribuitorilor individuali să-și rezolve propriile probleme. După cum este cronicizat în „Ingineria haosului” o carte din 2020 scrisă de Casey Rosenthal și Nora Jones, care au fost pionier în această practică la Netflix, se rezumă la cinci principii:

Construiți o ipoteză în jurul comportamentului în stare de echilibru
Variați evenimentele din lumea reală
Rulați experimente în producție
Automatizați experimentele pentru a rula continuu
Minimizați raza exploziei

Combinația de cultură și proces la Netflix este importantă, deoarece a promovat și a valorificat o abordare open-source de rezolvare a problemelor, în timp ce învârtirea sistematică a închiderilor aleatorii accelerează învățarea în cadrul echipei extinse.

Reziliența lanțului de aprovizionare și ingineria haosului

Transformarea digitală în lanțul de aprovizionare a fost fierbinte în acest an, deoarece ajută lanțurile de aprovizionare să susțină noi modele de afaceri și să conducă către operațiuni sustenabile (vezi studiul BCG X), dar și pentru că promite „reziliență”. Din păcate, aplicațiile practice ale transformării digitale pentru reziliența lanțului de aprovizionare încă se reduc în general la platforme pentru o „vizibilitate” mai bună, susținute de o mulțime de tactici tradiționale, cum ar fi stocarea tampon și aprovizionarea dublă. La baza acestei abordări se află un alt nivel de lucru analitic timpul de recuperare de David Simchi-Levi la MIT și un val de simulări folosind gemeni digitali. Toate acestea sună grozav, dar ceea ce lipsește este orice modalitate sistematică de a experimenta eșecul real al lanțului de aprovizionare pentru a afla cum să se recupereze cel mai bine în practică.

Aplicarea Chaos Monkey la lanțurile de aprovizionare

Medicii depun jurământul lui Hipocrat înainte de a ne deschide, inclusiv faimosul „mai întâi nu face rău”. Nu este o idee rea pentru oricine care aplică principiile Chaos Monkey lanțurilor de aprovizionare, ceea ce presupune închiderea aleatorie a unei mașini reale undeva. Acest lucru nu este banal și, din câte știu eu, nu se întâmplă încă nicăieri.

Primul principiu citat mai sus spune să se concentreze mai degrabă pe ieșirile sistemului decât pe atributele interne. Verificați dacă sistemul funcționează în loc să încercați să înțelegeți de ce funcționează.
Al doilea principiu spune să spargeți diverse lucruri în moduri realiste. Nu este nevoie să simulați războiul termonuclear global, doar opriți un comutator sau pierdeți o comandă și aflați ce soluție funcționează cel mai bine.
Al treilea principiu spune că cel mai bun loc pentru a învăța este în producție. Învățarea prin practică este mai bună decât învățarea prin simulare – adică gemenii digitali sunt grozavi, dar s-ar putea să nu fie de ajuns pentru a construi o cultură a rezilienței.
Al patrulea principiu instituționalizează principiile maimuței haosului, deoarece permite scalarea procesului de experimentare, ceea ce te duce la o curbă de învățare mai abruptă. Utilizați știința datelor pentru stingerea incendiilor.
În sfârșit, minimizați raza exploziei. Aceasta înseamnă „nu face rău” și se traduce printr-un fel de tamponare (inventar, timp de livrare, expediere accelerată) pentru a proteja clienții să nu simtă experimentul tău. Învață să gestionezi exploziile controlate.

S-ar putea argumenta că ultimii trei ani de Covid, razboi, tulburări de muncă, iar frământările economice au fost un mare haos de maimuță pentru toată lumea. Lecția Netflix a fost că acest tip de criză nu este doar ceva de planificat, ci ceva de stăpânit ca un fapt permanent al vieții.

Furtuna perfectă s-ar putea să nu se termine niciodată, așa că poate ar trebui să învățăm să trăim cu ea.

Sursa: https://www.forbes.com/sites/kevinomarah/2022/12/22/netflix-chaos-monkey-and-supply-chain/