5 jatkuvuudenhallinnan termiä, jotka jokaisen pitäisi hallita

RPO ja RTO ovat välttämätömiä termejä kun suunnitellaan jatkuvuutta.

Kirjoitin pari viikkoa sitten siitä, kuinka yhteiskuntamme riippuvuus tietotekniikasta on kasvanut. Digitalisaation myötä myös monen yrityksen riippuvuus tietotekniikasta on kasvanut, jopa enemmän kuin usein ymmärrämmekään. Käyttökatkot päätyvät helposti uutisiin ja voivat aiheuttaa itse katkon lisäksi huomattavia haittoja maineelle. Löydät edellisen kirjoitukseni täältä. Tässä kirjoituksessa alan käsitellä sitä, miten käyttökatkoista huolestunut organisaatio voi tarttua ongelmaan.

Varautumista käyttökatkoihin voi tehdä monella tavalla. Jotkut lähestyvät asiaa kahdentamalla kaikki IT-järjestelmänsä. Tämä lähestyminen on hyvä, jos pyritään varautumaan laiterikon varalta. Laitteiden kahdentaminen ei kuitenkaan suojele esimerkiksi ylläpitäjän tekemältä konfigurointivirheeltä. Jatkuvuuden hallinnan projekteissa, kuten kaikissa IT-projekteissa, on erittäin tärkeää tunnistaa, mikä on oikea ongelma, ja pyrkiä ratkaisemaan juuri tämä ongelma. Oikean ongelman tunnistaminen  ei ole aina itsestään selvää.

Jatkuvuudenhallinnan perustermit

Jotta organisaatio osaa ratkaista oikean ongelman oikealla tavalla, on välttämätöntä ymmärtää tämän alueen perustermit. Olen sen vuoksi kuvannut tähän lyhyesti muutaman keskeisimmän termin. Kuvaukset eivät ole tyhjentäviä, vaan ne lähinnä auttavat ymmärtämään käsitteitä.

  •  BIA. Business Impact Analysis eli (liike)toiminnan vaikutusanalyysi pyrkii selvittämään ja kuvaamaan erilaisten haitallisten tekijöiden vaikutukset tarkastelun alla olevaan liiketoimintaprosessiin. Vaikutusanalyysi on pohjana toiminnan jatkuvuutta uhkaavien riskien arvioinnille sekä toimintojen väliselle priorisoinnille ja niiden välisten riippuvuuksien tunnistamiselle.
  • RTO.  Recovery Time Objective (RTO) tarkoittaa tavoitellun toipumisajan määrittelyä. Toipumisaika määrittelee sen ajan, sekunteina, tunteina tai päivinä, jonka kuluessa kyseessä oleva asia tai toiminto tulee saada palautettua takaisin toimintaan häiriötilanteessa. Esimerkiksi yrityksen kassajärjestelmä saattaa olla vähittäiskaupan alalla toimivan yrityksen tärkein järjestelmä. Ilman kassajärjestelmää asiakkaita ei voida rahastaa, eikä kauppa käy. Kaupan kassajärjestelmän RTO määrittelee sen ajan, jonka kassajärjestelmä saa ongelmatilanteessa enintään olla alhaalla. Vilkkaan nettikaupan kassajärjestelmän RTO voi olla erittäin lyhyt, ehkä joitakin minuutteja, koska asiakkaat siirtyvät hyvin nopeasti toisen kaupan asiakkaiksi, jos tutun kaupan kassajärjestelmä ei toimi. Toisaalta pääosin laskulla myyvän yrityksen kassajärjestelmä ei välttämättä ole kovinkaan kriittinen. Sen RTO voi olla vaikka päiviä, koska asiakastyö ei juurikaan häiriinny, vaikka kassa ei toimisi.
  • RPO. Recovery Point Objective (RPO) tarkoittaa tavoitellun toipumispisteen määrittelyä. Toipumispiste määrittelee sen tilan, johon toiminta, tiedot tai järjestelmät tulee saada palautettua häiriön jälkeen. Toipumispiste ei välttämättä ole sama kuin vakavan häiriön alkamishetki, mihin toiminnasta vastaavien tahojen on varauduttava erilaisin järjestelyin. Käännöstoimisto saattaa todeta, että puolen työpäivän töiden menettäminen ei vielä ole katastrofi, mutta kokonaisen päivän töiden menettäminen olisi liian vakava asia. Tämä vuoksi varmuuskopioita päädytään ottamaan kahdesti päivässä. Pankki taas ei voi hyväksyä, että yksikään sen asiakkaan transaktio häviää. Kukapa haluaisi, että rahan siirtäminen tilille häviäisi ja rahat jäisivät saamatta. Tämän vuoksi tiedoista otetaan jatkuvasti varmuuskopioita ja tietoja replikoidaan reaaliaikaisesti varajärjestelmiin.
  • Korkea käytettävyys (High Availability). Korkea käytettävyys ja toipumissuunnittelu liittyvät toisiinsa, mutta niillä on hieman eri tavoitteet. Korkean käytettävyyden ympäristöt pyrkivät toipumaan automaattisesti tunnetuista uhkaskenaarioista, joita ovat mm. konesalin tuhoutuminen. Korkean käytettävyyden ratkaisuissa siirtokustannus toiseen noodiin (esim. palvelin tai konesali) on pieni, koska siirto tapahtuu tyypillisesti automaattisesti. Korkean käytettävyyden ympäristöllä ei pysty suojautumaan yhtä laajasti eri uhkaskenaarioita vastaan kuin toipumissuunnitteluun tähtäävillä järjestelyillä. Korkean käytettävyyden järjestelmä voi olla erittäin haavoittuvainen konfigurointivirhettä vastaan tai sen tietoturva voi olla haavoittuvainen.
  • Toipumissuunnittelu (Disaster Recovery Planning). Toipumissuunnittelu pyrkii varmistamaan toimintakyvyn jatkumisen monipuolisempia skenaarioita vastaan kuin korkean käytettävyyden ympäristöillä päästään. Vaikka katastrofivalmius yleensä rakennetaan pahimpia tilanteita varten, samoilla menetelmillä voidaan toipua pienemmistä skenaarioista. Katastrofivalmiutta rakennettaessa siirtokustannus toiseen noodiin (esim. toinen konesali) on suurempi kuin korkean käytettävyyden ympäristöissä. Katastrofitilanteeseen siirrytään ihmisten tekemällä päätöksellä toisin kuin korkean käytettävyyden ympäristöissä, joissa siirto on automaattinen.

Miksi käsittelin vain termejä, enkä mennyt suoraan siihen, miten jatkuvuussuunniteluun liittyvä projekti pitäisi toteuttaa? Koska ilman tässä määriteltyjen termien ymmärtämistä, ei jatkuvuuden parantamiseen tähtäävää hanketta voida viedä onnistuneesti läpi. Esimerkiksi BIAn eli liiketoiminnan vaikutusanalyysin tekeminen jonkin järjestelmän tai prosessin osalta on välttämätön työvaihe ennen tekniseen ratkaisuun investoimista. Samoin RTO ja RPO ovat sellaisia keskeisiä parametreja, joiden on oltava selvillä, ennen kuin voidaan tehdä perusteltuja päätöksiä järjestelmän vaatimasta infrastruktuurista tai palvelusopimuksen SLA:sta. Projektiryhmän olisi syytä myös ymmärtää korkean käytettävyyden ja toipumissuunnittelun ero.

Julkaisen helmikuussa kirjoituksen siitä, mitä asioita pitää ottaa huomioon ennen suurien investointipäätöksien tekemistä.

 

Jos pidit tästä artikkelista, myös seuraavat artikkelit voivat olla kiinnostavia:

Tilaa uutiskirjeeni

Saat tiedon uusista artikkeleista suoraan sähköpostiisi.

Annan luvan tallentaa tietoni ja hyväksyn tietosuojakäytännön.