Gegevens opschonen en de rol van de-duplicatie daarinGegevens opschonen en de rol van de-duplicatie daarinGegevens opschonen en de rol van de-duplicatie daarinGegevens opschonen en de rol van de-duplicatie daarin
MENUMENU
  • Diensten
    • ICT beheer en support
      • Managed services
      • Werkplekbeheer
      • Datavernietiging
      • Bewustwording
      • Overzicht op onderhoud
    • Cloud
      • On-premise en cloud
      • Microsoft 365
      • Cloud back-up
      • Zakelijke telefonie
      • Disaster recovery
    • Security en advies
      • Netwerkscan
      • IT-beleid (vCIO)
      • Security services (vCISO)
      • ISO 27001
      • AVG/GDPR
      • Cyber security plan
  • Vacatures
    • Werken bij HCA Groep
  • Actueel
    • Blog
      • Het laatste nieuws
    • Nieuwsbrief
      • Nieuwsbrief thuiswerken
  • Over ons
    • Over ons
      • De HCA familie
      • 4Dealers
    • Afspraak maken
      • Maak een afspraak met ons!
    • MVO
      • Maatschappelijk Verantwoord Ondernemen
    • Contact
MENUMENU
  • Diensten
    • ICT beheer en support
      • Managed services
      • Werkplekbeheer
      • Datavernietiging
      • Bewustwording
      • Overzicht op onderhoud
    • Cloud
      • On-premise en cloud
      • Microsoft 365
      • Cloud back-up
      • Zakelijke telefonie
      • Disaster recovery
    • Security en advies
      • Netwerkscan
      • IT-beleid (vCIO)
      • Security services (vCISO)
      • ISO 27001
      • AVG/GDPR
      • Cyber security plan
  • Vacatures
    • Werken bij HCA Groep
  • Actueel
    • Blog
      • Het laatste nieuws
    • Nieuwsbrief
      • Nieuwsbrief thuiswerken
  • Over ons
    • Over ons
      • De HCA familie
      • 4Dealers
    • Afspraak maken
      • Maak een afspraak met ons!
    • MVO
      • Maatschappelijk Verantwoord Ondernemen
    • Contact
✕
De toename van Cyberbedreigingen en tips om je Cybersecurity te versterken
29/03/2022

Gegevens opschonen en de rol van de-duplicatie daarin

12/04/2022

In het huidige digitale tijdperk produceren we wereldwijd, dagelijks het absurde aantal van bijna 2,5 quintiljoen bytes aan gegevens. Zo produceert jouw bedrijf ook een hoop gegevens. Voor efficiëntie, kostenbesparing en voorkoming van het lekken van onnodig veel gevoelige gegevens bij een calamiteit is het regelmatig opschonen van data geen overbodige luxe.1 

In deze blog leggen we meer uit waar je je op moet focussen bij het opschonen van gegevens en de rol van de-duplicatie daarin. Maar eerst lichten we aan de hand van praktische voorbeelden het belang van goed datamanagement toe. Bedrijven die dubbele, onnauwkeurige en verouderde informatie verwerken kunnen bijvoorbeeld te maken krijgen met gevolgen zoals:

  • Ondoeltreffende marketinginspanningen
    De meeste bedrijven maken tegenwoordig gebruik van gerichte promotiecampagnes. Maar wat gebeurt er als de klantinformatie niet meer kloppend is? Het kost je bedrijf dan onnodig kostbare tijd, inkomsten en moeite.
  • Verkeerde beslissingen
    Bedrijven nemen hun beslissingen vaak op basis van gegevens. Maar als je een beslissing neemt op basis van onjuiste gegevens kan dat tot kostbare gevolgen leiden.
  • Slechte klantervaringen
    Een bedrijf moet een goede communicatie onderhouden met zijn huidige en toekomstige klanten om een loyale klantenbestand te ontwikkelen. Maar als de klantengegevens niet regelmatig worden opgeschoond, kan dat ten koste gaan van de kwaliteit van de communicatie. Het kan frustrerend zijn voor een klant wanneer hij iets ervaart dat hij niet verwacht of wenst. In uitzonderlijke gevallen kan dit ook leiden tot klanten verlies.

Daarom is het opschonen van gegevens van vitaal belang voor elke onderneming. Het opschonen van gegevens (data cleansing) is een proces waarbij incorrecte, corrupte, onvolledige of gedupliceerde gegevens worden gewijzigd of verwijderd.

Elementen voor het opschonen van gegevens

Het opschonen van gegevens bevat de volgende 5 elementen — gegevens standaardisatie, gegevens normalisatie, gegevens analyse, kwaliteitscontrole en gegevens de-duplicatie.

Gegevens standaardisatie

De meeste bedrijven gebruiken gegevens uit meerdere bronnen, zoals een gegevensopslag, cloud-opslag en databases. Maar gegevens uit verschillende bronnen hebben mogelijk geen uniform formaat, wat later tot problemen kan leiden. Dit is waar gegevens standaardisatie uitkomst biedt. Standaardisatie is een proces waarbij gegevens worden omgezet in een gemeenschappelijk formaat, zodat gebruikers ze kunnen verwerken en analyseren.

Gegevens normalisatie

Normalisatie is het proces van het ordenen van gegevens in een database. Simpel gezegd omvat dit proces het elimineren van ongestructureerde gegevens en overbodige informatie (duplicaten) om een logische gegevensopslag te garanderen. Dit proces is bijvoorbeeld van toepassing op de registratie van namen van contactpersonen, adressen, telefoonnummers en zelfs codes.

Gegevens analyse

Gegevens analyse is een proces waarbij gegevens worden geanalyseerd met behulp van logische en analytische redeneringen om waardevolle inzichten te verkrijgen. De informatie die daaruit voortkomt, helpt bij het nemen van verantwoorde beslissingen.

Kwaliteitscontrole

Bedrijven hebben gegevens van goede kwaliteit nodig om de juiste beslissingen te kunnen nemen. Daarom zijn kwaliteitscontroles essentieel.

Gegevens de-duplicatie

Gegevens de-duplicatie (data deduplication) is een belangrijk onderdeel voor het opschonen van gegevens. De-duplicatie een proces waarbij dubbele gegevens of bestanden worden geïdentificeerd en verwijderd.

In dit proces worden gegevens verdeeld in verschillende blokken die met elkaar worden vergeleken. Elk blok krijgt hierbij een unieke hashcode. Als de hashcode van een blok overeenkomt met de hashcode van een ander blok, wordt het beschouwd als een duplicaat en gewist. Dit zorgt ervoor dat alleen een unieke kopie van de gegevens wordt opgeslagen. De-duplicatie kan overbodige kopieën van gegevens in verschillende gegevenstypen, mappen, servers en locaties opsporen.

Het belang en de voordelen van gegevens de-duplicatie

De lokale opslagcapaciteit van de meeste MKB-bedrijven is vaak beperkt en de kosten van Cloud opslag kunnen behoorlijk oplopen als de basisopslag wordt overschreden. Maar de hoeveelheid gegenereerde, overgedragen en opgeslagen gegevens neemt gestaag toe. Het proces van gegevens de-duplicatie helpt dit probleem aan te pakken door:

  • De benodigde opslagruimte wordt verkleind door slechts één kopie van een bestand op te slaan.
  • Minimalisering van de netwerkbelasting omdat er minder gegevens worden overgedragen. Zodat er meer bandbreedte overblijft voor andere taken.

De-duplicatie helpt je bedrijf:

  • Sneller herstellen na een incident
  • Besparen op de opslagkosten
  • De productiviteit verbeteren
  • Problemen met versiebeheer verminderen
  • Samenwerking verbeteren
  • Voldoen aan de privacywetgeving (AVG)

Procesdocumentatie kan hier bij helpen, zodat je medewerkers op de hoogte zijn van de de-duplicatie procedures.

Soorten gegevens de-duplicatie

Enkele populaire de-duplicatie technieken zijn:

Bron de-duplicatie
Bij bron de-duplicatie worden dubbele gegevens eerst verwijderd voordat ze naar het back-up medium worden verzonden.

Doel de-duplicatie
Dit proces vindt plaats op het back-up medium zelf. In tegenstelling tot bron de-duplicatie worden hierbij eerst de gegevens verzonden en daarna pas de dubbele gegevens verwijderd.

Inline de-duplicatie
Inline de-duplicatie is het verwijderen van dubbele gegevens terwijl ze naar een back-upmedium worden geschreven.

Post process de-duplicatie
Dit proces, ook bekend als asynchrone de-duplicatie, verwijdert dubbele gegevens nadat deze zijn verzonden naar een opslaglocatie.

5 aanbevolen werkwijzen voor gegevens de-duplicatie

1. Bepaal welk type de-duplicatie het meest geschikt is

Hoewel verschillende de-duplicatie technieken dubbele bestanden of gegevens verwijderen door patronen te identificeren presteren ze allemaal anders. Bij de keuze van de oplossing die het beste bij jouw bedrijf past, moet je rekening houden met factoren als kosten en opslagvereisten. Je moet gaan voor een type de-duplicatie dat zinvol is voor je bedrijf in plaats van gewoon de concurrentie te volgen. Vraag bij twijfel advies aan een expert.

2. Sorteer bestanden op gegevenstype

De-duplicatie is mogelijk niet erg effectief bij sommige mediabestanden, zoals MP4 en JPEG. Denk er altijd aan om de datatypes die je behandelt te sorteren. Anders wordt de efficiëntie van de de-duplicatie aanzienlijk beïnvloed en kunnen de resultaten tegenvallen.

3. Focus niet op de dalingspercentages

Staar je niet blind op beloftes waarbij wordt aangegeven dat je datagrootte met 50%-80% wordt verkleind. De werkelijke dalingspercentages hangen af van het type gegevens, back-up en de wijzigingsfrequentie van de gegevens. Het is belangrijk ervoor te zorgen dat je verwachtingen gebaseerd zijn op feiten.

4. Locaties voor de-duplicatie bepalen

Je hoeft niet op elk opslagmedium een de-duplicatie oplossing te implementeren, want dat zal niet kosteneffectief zijn. In de meeste gevallen is de-duplicatie alleen nodig voor secundaire locaties zoals back-ups, waar de kosten een rol spelen. Daarnaast heeft het toepassen van de-duplicatie in primaire opslag, zoals datacenters, invloed op de opslagprestaties.

5. Houdt rekening met de kosten

Je hoeft niet op elk opslagmedium een de-duplicatie oplossing te implementeren, want dat zal niet kosteneffectief zijn. In de meeste gevallen is de-duplicatie alleen nodig voor secundaire locaties zoals back-ups, waar de kosten een rol spelen. Daarnaast heeft het toepassen van de-duplicatie in primaire opslag, zoals datacenters, invloed op de opslagprestaties.

5. Houdt rekening met de kosten

Om te voorkomen dat je voor verrassingen komt te staan, moet je rekening houden met alle kosten. Denk hierbij aan factoren zoals onderhouds- en beheerskosten, naast de kosten van fysieke opslag.

Wil je graag een strategie voor het opschonen van je gegevens? Begin dan met het implementeren van een de-duplicatie oplossing waarmee je opslagruimte bespaard en sneller herstel mogelijk is na een incident met gegevensverlies. Kies hierbij voor de oplossing die het beste bij je bedrijf past. Kies hierbij voor de oplossing die het beste bij je bedrijf past. Twijfel je over welke oplossing het beste is, neem dan contact met ons op voor een gratis adviesgesprek.

Bronnen:

  1. Techjury.net
Share

Related posts

29/03/2022

De toename van Cyberbedreigingen en tips om je Cybersecurity te versterken


Read more
Herstelgarantie
26/01/2022

Streef naar herstelzekerheid met de juiste back-up oplossingen


Read more
Het belang van een BIA
10/12/2021

Het belang van een Business Impact Analyse (BIA)


Read more

Over Ons

HCA Groep levert een compleet en gespecialiseerd IT-pakket aan. Op maat gemaakt voor ieder bedrijf.

Contact

Vissersdijk Beneden 17
3319 GW Dordrecht

info@hcagroep.nl
078-6351719

HCA automatisering

HCA Computers

KvK-nr: 23076695
BTW-identificatienr: NL809400856B01
IBAN: NL71INGB0008923809
BIC: INGBNL2A

HCA Automatisering

KvK-nr: 24315810
BTW-identificatienr: NL809400704B01
IBAN: NL92INGB0008924110
BIC:INGBNL2A

Maak een afspraak Vraag netwerkscan aan Gratis Whitepaper Phishing
© 2023 HCA Groep. All rights reserved.
Cookie settings aanpassen • Cookieverklaring • Privacyverklaring • Algemene voorwaarden