Chaos Monkey і ланцуг паставак Netflix

Нядаўна ў мяне была размова з Карласам Крэспа, галоўным аперацыйным дырэктарам мацярынскай кампаніі Zara Inditex, у якой ён згадаў праграмны інструмент, створаны Netflix больш за дзесяць гадоў таму для інстытуцыяналізацыі ўстойлівасці сістэмы. Назва кідкая, і для лідэраў ланцугоў паставак, якія спрабуюць нанава вынаходзіць свае сеткі паставак для бурных часоў, яна непераадольная. І яшчэ, GoogleGOOG
пошук «малпы хаосу ў ланцугу паставак» даў дакладны вынік адна цытата, з 2012 года.

Чаму б нам не прымяніць гэтую ідэю да ўстойлівасці ланцужкоў паставак?

Што такое Chaos Monkey?

Гэта праграмны інструмент, і ў больш шырокім сэнсе, інжынерны прынцып, які выпадкова адключае часткі складанай сістэмы, прымушаючы аператараў аднаўляцца. Накшталт нечаканай супрацьпажарнай трэніроўкі, але штодня, у выпадковых спосабах і месцах. Ідэя заключаецца ў тым, што хуткае вырашэнне сістэмных праблем - гэта працэс навучання, які павінен прынесці карысць ад паглыблення крывой навучання.

Перадгісторыя распавядае пра тое, як Netflix павялічыў свой струменевы бізнес на вэб-сэрвісах Amazon, адначасова пераходзячы ад дастаўкі DVD-дыскаў да парогаў кліентаў. На першы погляд, гэта лагічны падыход да планавання рэзервавання сістэмы, падобнага да таго, што вы чакаеце ад NASA, але на практыцы ён выкарыстоўвае культурную норму Netflix, якая дазваляе асобным удзельнікам вырашаць свае ўласныя праблемы. Як запісана ў «Інжынерынг хаосу»Кніга 2020 г. Кейсі Розэнталь і Норы Джонс, якія сталі піянерамі ў гэтай практыцы ў Netflix, яна зводзіцца да пяці прынцыпаў:

  • Пабудуйце гіпотэзу адносна паводзін у стацыянарным стане
  • Змяняйце падзеі рэальнага свету
  • Правядзіце эксперыменты ў вытворчасці
  • Аўтаматызуйце бесперапынныя эксперыменты
  • Мінімізуйце радыус выбуху

Спалучэнне культуры і працэсу ў Netflix важна, таму што яно спрыяла і выкарыстоўвала падыход да вырашэння праблем з адкрытым зыходным кодам, а сістэматычнае кручэнне кола выпадковых адключэнняў паскарала навучанне ў пашыранай камандзе.

Устойлівасць ланцужкі паставак і распрацоўка хаосу

лічбавае пераўтварэнне у ланцужку паставак гэты год быў вельмі гарачым, таму што гэта дапамагае ланцужкам паставак падтрымліваць новыя бізнес-мадэлі і рухацца да ўстойлівай дзейнасці (гл. даследаванне BCG X), але і таму, што абяцае «ўстойлівасць». На жаль, практычнае прымяненне лічбавай трансфармацыі для павышэння ўстойлівасці ланцужкоў паставак па-ранейшаму звычайна зводзіцца да платформаў для лепшай «бачнасці», якія падтрымліваюцца мноствам традыцыйных тактык, такіх як буферызацыя запасаў і двайны пошук. У аснове гэтага падыходу ляжыць яшчэ адзін пласт аналітычнай працы час аднаўлення Дэвідам Сімчы-Леві з Масачусецкага тэхналагічнага інстытута і хваля мадэлявання з выкарыстаннем лічбавых двайнят. Усё гэта гучыць цудоўна, але чаго не хапае, так гэта любога сістэматычнага спосабу эксперыментаваць з рэальным збоем у ланцужку паставак, каб даведацца, як лепш аднаўляць на практыцы.

Прымяненне Chaos Monkey да ланцугоў паставак

Лекары даюць клятву Гіпакрата, перш чым разрэзаць нас, у тым ліку знакамітае «не нашкодзь». Нядрэнная ідэя для тых, хто прымяняе прынцыпы Chaos Monkey да ланцугоў паставак, што цягне за сабой выпадковае адключэнне дзе-небудзь рэальнай машыны. Гэта нетрывіяльна, і, наколькі я ведаю, такога пакуль нідзе не адбываецца.

  • Першы прынцып, цытаваны вышэй, гаворыць аб тым, каб засяродзіць увагу на сістэмных выніках, а не на ўнутраных атрыбутах. Пераканайцеся, што сістэма працуе, а не спрабуйце зразумець, чаму яна працуе.
  • Другі прынцып сцвярджае, што трэба разбіваць розныя рэчы рэалістычнымі спосабамі. Няма неабходнасці мадэляваць глабальную тэрмаядзерную вайну, проста адключыце выключальнік або страціце заказ і даведайцеся, якое рашэнне працуе лепш за ўсё.
  • Трэці прынцып кажа, што лепшае месца для навучання - гэта вытворчасць. Вучыцца на практыцы лепш, чым вучыцца шляхам мадэлявання - г.зн. лічбавыя двайняты выдатныя, але іх можа быць недастаткова для стварэння культуры ўстойлівасці.
  • Чацвёрты прынцып інстытуцыяналізуе прынцыпы малпы хаосу, таму што дазваляе маштабаваць працэс эксперыментавання, што дае вам больш стромкую крывую навучання. Выкарыстоўвайце навуку аб даных для тушэння пажараў.
  • Нарэшце, мінімізуйце радыус выбуху. Гэта азначае «не нашкодзіць» і азначае нейкую буферызацыю (інвентар, час выканання, паскораная дастаўка), каб абараніць кліентаў ад адчування вашага эксперыменту. Навучыцеся кіраваць кантраляванымі выбухамі.

Можна сцвярджаць, што апошнія тры гады Covid, вайна, працоўныя хваляванні, і эканамічныя ўзрушэнні былі адной вялікай хаотычнай малпай. Урок Netflix заключаўся ў тым, што гэты від крызісу - гэта не проста тое, што трэба планаваць, але тое, што трэба засвоіць як пастаянны факт жыцця.

Ідэальны шторм можа ніколі не скончыцца, таму, магчыма, нам варта навучыцца з гэтым жыць.

Крыніца: https://www.forbes.com/sites/kevinomarah/2022/12/22/netflix-chaos-monkey-and-supply-chain/