Blog 1 mei 2021

Data is goud

Data is overal en de hoeveelheid neemt nog steeds toe, bedrijven en consumenten produceren steeds meer data. Data kan goud waard zijn voor organisaties, maar hoe win je dat goud?

Naast dat we data vasthouden door deze op te slaan, zullen we deze data ook moeten analyseren om de voor ons bruikbare informatie uit deze data te halen. Door data-analyse en kunstmatige  Intelligentie (AI) los te laten op bedrijfs- en klantgegevens kan het bedrijf worden gestuurd naar betere resultaten door interne/externe verbeteringen en personalisatie richting de klant(en).

Data onderscheiden we ruwweg in 2 vormen, de gestructureerde data en ongestructureerde data. Gestructureerde data, de naam zegt het al, kent een (vaste) structuur en wordt meestal vastgelegd in databases. Bij ongestructureerde data moet je denken aan beelden, audio, video, documenten, e-mail en spreadsheets.

AI en data analyse

De AI en data analyse is in dit verhaal de zeef, en de infrastructuur is de rivier. Omdat je niet weet hoe hard je rivier gaat stromen, is een goede schaalbare infrastructuur van essentieel belang, ook omdat de data groei over het algemeen exponentieel is.

Op dit moment zijn slechts 3% van de bedrijven in de Benelux[1] in staat om data effectief in te zetten voor interne/externe verbeteringen en personalisatie richting de klant(en). Wij realiseren ons dus dat de meeste bedrijven nog niet zo ver zijn, maar we verwachten wel dat zij op dit punt uitkomen.

Niet elke infrastructuur voldoet dus. Cloud is een alternatief, maar komt met een stevig prijskaartje en dat heeft niet iedereen daarvoor over, maar dat is een heel andere discussie. Als die beslissing genomen wordt heeft dat invloed op meer dan alleen de data opslag. De keuze voor een infrastructuur en met name het opslaggedeelte dient aan te sluiten op de huidige wensen, op de toekomstige wensen, maar ook schaalbaar te zijn om de groeiende datastroom aan te kunnen.


[1] Onderzoek Adobe 2020 / McKinsey ‘Achieving business impact with data’

Toekomst vast en schaalbaar

De keuze moet dus toekomstvast en schaalbaar zijn, aansluitbaar in de huidige omgeving, en de omgeving qua aansluitmogelijkheden niet belemmeren naar de toekomst. Om dit te kunnen realiseren moet de opslag ondersteuning bieden voor block based storage, filebased storage (NAS), Vvol, Containers via de nu gebruikelijke aansluitmogelijkheden via FC en iSCSI, en ook toekomstige protocollen als NVM over Fabric over FC en Ethernet ondersteunen om klaar te zijn voor de toekomst. Eigenlijk zijn we dus op zoek naar een “Zwitsers zakmes”, infrastructuur die toepasbaar is voor elke huidige en toekomstige infrastructuur-opzet en -behoefte.

Powerstore

Dell Technologies heeft recent de Dell EMC PowerStore geïntroduceerd, en deze valt in de categorie “Zwitsers zakmes”: de PowerStore biedt file- en block-opslag en kan tevens dienen als opslag voor Vvol’s en Container opslag. Hij ondersteunt alle op dit moment gangbare moderne protocollen.

De PowerStore is een volledig nieuwe ontwikkeling van Dell EMC, en in de komende jaren zullen we nog veel meer functionaliteiten toegevoegd worden. Binnen de PowerStore is alles gevirtualiseerd en draaien alle functionaliteiten in een container bovenop een interne Hypervisor. Het voordeel van deze constructie is dat de verschillende onderdelen van de PowerStore onafhankelijk van elkaar draaien en ook onafhankelijk voorzien kunnen worden van een software-update wanneer er nieuwe functionaliteit beschikbaar komt.

Applicaties

Het is het ook mogelijk om de PowerStore te bestellen in een versie waarbij de ingebouwde Hypervisor vervangen is door VMware vSphere en het beheer volledig is geïntegreerd in vCenter. Dit maakt het mogelijk om naast de PowerStore functies ook andere gevirtualiseerde workloads op de PowerStore te draaien, hiervoor zijn legio toepassingen te bedenken.

Denk hierbij aan de inzet als extra snelle storage binnen een vSAN gebaseerd vShpere cluster, voor die ene applicatie die extra performance nodig heeft (zoals b.v data-analyse). Alle functionaliteit zit in software, waardoor de ontwikkeling van nieuwe en aanvullende functies snel kan gebeuren. De PowerStore maakt gebruik van de laatste generatie NVMe-gebaseerde flash drives waardoor de snelheid meer dan voldoende is voor alle denkbare workloads.

Schaalbaar

Eerder hebben we het gehad over dat een systeem schaalbaar moet zijn om zo voldoende opslagcapaciteit te bieden voor de steeds maar groter wordende hoeveelheid data. Standaard is een PowerStore gebaseerd op 2 controllers, de controllers zijn per paar gegroepeerd (ze kunnen elkaars functie overnemen, als er 1 in onderhoud gaat) en kan uitgebreid worden tot 8 controllers binnen het cluster.

Als er behoefte is aan meer performance of opslagcapaciteit kunnen er disken en/of disk enclosures bijgeplaatst worden. Zo kan een PowerStore cluster doorgroeien tot ~ 10 PetaByte aan bruikbare opslagcapaciteit.

Extreem schaalbare NAS

Als er behoefte is aan een nog verder schaalbare oplossing voor file-based storage (NAS), dan heeft Dell Technologies de Dell EMC PowerScale in het portfolio. Beide producten kunnen uitstekend naast elkaar gebruikt worden, waarbij de block based storage gehost wordt op de PowerStore en de file-based storage op de PowerScale. Denk hierbij aan bijvoorbeeld een ziekenhuis waar de hele server-omgeving gekoppeld is aan de PowerStore en de radiologische data wordt opgeslagen op de PowerScale.

De naam PowerScale geeft al een verwijzing naar zijn schaalbaarheid. De PowerScale werkt met nodes, en die nodes hosten samen de scale-out file omgeving. Het schaalbare principe is heel eenvoudig: als er behoefte is aan meer opslag, plaats er dan meer nodes bij. Zo kan een PowerScale binnen 1 cluster schalen tot 138 PetaByte aan bruikbare opslag.

Deze 138 PetaByte zit binnen 1 filesysteem en wordt ook als zodanig beheerd. Voor zowel de PowerStore als de PowerScale geldt dat nodes verwisseld kunnen worden binnen een cluster. Is een node aan vervanging toe, of is er behoefte aan meer verwerkingssnelheid dan kunnen nodes of controllers uitgewisseld worden terwijl de opslag beschikbaar blijft. Beide systemen hebben de mogelijkheid om snapshots te maken van de data. Deze snapshots nemen geen extra ruimte in en geven de mogelijkheid om een snapshot te gebruiken voor diverse doeleinden, waaronder een snelle restore van data indien dat nodig is.

Uitwijk

Bij zulke hoeveelheden opslag moet je wat langer dan normaal nadenken over hoe je kan zorgen dat die data beschikbaar blijft, mocht er door een calamiteit een cluster niet meer benaderbaar zijn.

Bij een PowerStore en/of PowerScale wordt vaak gekozen voor replicatie tussen 2 fysieke sites, waarbij er bij calamiteiten handmatig of automatisch overgeschakeld wordt tussen deze sites.

Beide systemen hebben de mogelijkheid om snapshots te maken van de data, deze snapshots nemen geen extra ruimte in, en geven de mogelijkheid om een snapshot te gebruiken voor diverse doeleinden, waaronder een snelle restore van data indien dat nodig is. In de meeste gevallen wordt er per datasoort een strategie bepaald op basis van de eventuele wettelijke verplichtingen en/of bewaartermijn, en op basis daarvan wordt een aanvullende strategie met een backup op een andere media ingeregeld.

Data backup

Voor zulke vraagstukken heeft Dell Technologies de Dell EMC PowerProtect appliance ontwikkeld. De PowerProtect kan tot 1 PetaByte lokaal in de appliance opslaan, en tot 3 PetaByte indien de PowerProtect gekoppeld wordt aan (public) cloudstorage. In dit scenario wordt de long term retention data bewaard in de cloud.

Bij grotere hoeveelheden data kunnen meerdere PowerProtects naast elkaar gebruikt worden, maar data kan ook middels retentielock vastgezet worden op o.a. de PowerScale. Door een retentielock kan de data niet meer veranderd, verwijderd of gewist worden op de PowerScale. Een retentielock wordt vaak gebruikt indien data een wettelijke bewaartermijn kent.

Zo zien we dat we met de producten van Dell Technologies een infrastructuur op kunnen zetten die schaalbaar is, hierdoor mee kan groeien, voorzien kan worden van toekomstige hardware vervangingen en software upgrades zonder de IT-dienstverlening naar de business te verstoren. Men kan starten met een PowerStore en als de file-based storage (NAS) capaciteit onvoldoende is, doorgroeien naar een PowerScale. Voor redundancy-doeleinden is het mogelijk om meerdere clusters op te bouwen en deze met elkaar te laten repliceren, en de aangesloten hosts handmatig of automatisch te laten wisselen tussen clusters bij calamiteiten. De back-up en restore kan ingeregeld worden door 1 of meerdere PowerProtect appliances te gebruiken.

Meer weten?

Voor meer informatie en/of advies over de manier waarop je goud uit jouw data kunt winnen, kun je contact met ons opnemen door hier te klikken. Via mail kan natuurlijk ook, kies dan voor hallo@flexvirtual.nl. Wij nemen zo snel mogelijk contact met je op!