Ogni giorno le grandi organizzazioni si aggiornano con le tecnologie che facilitano e si adattano meglio a ogni azienda, affrontando grandi sfide che consentono loro di scoprire e analizzare oltre gli strumenti che vengono utilizzati su base giornaliera, è per loro che è stato creato ciò che è noto come Big Data o in big data spagnolo che sono sistemi di archiviazione dati su larga scala .

Questo fenomeno di archiviazione è inquadrato nelle nuove tecnologie dell'informazione e della comunicazione. I Big Data sono ciò che occupa tutte le attività correlate ai sistemi che memorizzano un ampio set di dati. Una delle caratteristiche principali è che manipola una grande quantità di informazioni, raccogliendole, classificandole e quindi memorizzandole. Lo scopo di questa raccolta è quello di creare report statistici per l'utilizzo da parte delle organizzazioni, sia come analisi di piani aziendali, pubblicità, spionaggio, tra gli altri.
Il margine di archiviazione è cresciuto negli anni, dal 2008 il livello di archiviazione è stato misurato in petabyte in zettabyte di dati. Gli esperti sono periodicamente alla ricerca di nuove misure di archiviazione perché vi sono alcune aree in cui è necessario archiviare grandi quantità di dati e i programmi esistenti non sono molto ottimali.
Esistono migliaia di strumenti per eseguire e gestire i Big Data, tuttavia non tutti sono uguali, esistono tre tipi di dati, che sono:
- Dati strutturati : sono quelli in cui i dati hanno una struttura molto particolare, come date, numeri, tra gli altri. Ne sono un esempio i fogli di calcolo.
- Dati non strutturati : di solito sono dati che hanno un formato specifico e non possono essere memorizzati in un foglio di calcolo, tanto meno manipolano le informazioni, un esempio di documenti PDF.
- Dati semi-strutturati : questo tipo di dati non ha un formato particolare, poiché ha i suoi metadati semi-strutturati, un esempio dei quali sono i codici HTML.