913 688 160

¿Qué es el Big Data? La revolución de la cultura de datos

El Big Data es un concepto que, ya en los años noventa, fue popularizado por el informático norteamericano John Mashey. El bueno de Johnny ya apuntó entonces la gran avalancha de datos que se atisbaba en el horizonte y la imposibilidad de poder gestionarlos con los software del momento.

Esa avalancha hace tiempo que es una realidad que ha llegado a nuestros días. Según la Unión Europea generamos más de 1.800 millones de bytes por minuto. Y esta cifra no deja de aumentar con la aparición de nuevos dispositivos a los que no dudamos en conectarnos de un modo u otro. En un mundo informatizado, todo es susceptible de quedar registrado.

Si bien hasta ahora las capacidades y técnicas no permitían aprovechar toda esta información, el Big Data ha llegado para dar un giro a este escenario. Ya no estamos frente a una avalancha de datos. Estamos surfeando sobre ella. No hay dato susceptible de ser captado, manejado y analizado. La información es poder. Así que a la pregunta de “qué es el Big Data”, se puede decir que es el nuevo petróleo.

¿Qué es el Big Data?

El Big Data son grandes cantidades de datos capturados, generados o compartidos a través de flujos que pueden procesarse en tiempo real. Estos datos contienen mucha variedad de información, llegan en altos volúmenes y a una gran velocidad. En el mundo anglosajón estas dimensiones se conocen como las tres Vs (variety, volumes and velocity), aunque incluso se habla de las 5 Vs añadiendo value + veracity.

1. Volumen

En Big Data el volumen describe el enorme conjunto de datos complejos de procesar para extraer información valiosa de ellos. El volumen puede estar en gigabytes, terabytes, exabytes o incluso en zettabytes. El tamaño de los grandes datos hace que sea confuso procesarlos.

Big Data y medidas de memoria

2. Velocidad

La velocidad en Big Data se refiere a la generación, el aumento y el intercambio de datos a una velocidad particular a través de los recursos. La aparición de nuevas tecnologías y el aumento de usuarios hace aumentar día a día la cantidad de datos generados y la velocidad a la que estos se generan, como por ejemplo ocurre con dispositivos IoT (robots, domótica, vehículos autónomos…) o redes sociales.

3. Variedad

Este término demuestra los distintos tipos de datos como textos, audios, videos, archivos XML, datos en filas, columnas… Cada tipo de datos tiene una forma separada de procesarse, por lo tanto y como explicaremos más adelante, es necesario categorizarlos de forma diferente: estructuras, semiestructurados y desestructurados.

4. Veracidad

La veracidad es la exactitud, significado y confirmación de datos verdaderos. Es muy difícil extraer información y datos correctos del enorme conjunto. La veracidad es un término muy importante en el procesamiento de Big Data porque cualquier dato inexacto, falso y sin sentido conduce a daños en los ingresos o en los resultados requeridos.

5. Valor

El pilar más importante de Big Data es el valor. Si un dato extraído no conduce a obtener información valiosa de sí mismo, seguramente el Big Data no cumpla con su función. Los datos precisos y de valor contribuyen a decisiones correctas.

¿Cómo funciona el Big Data?

Para comprender el Big Data y cómo funciona, es necesario entender que existen tres tipos de datos:

  1. Estructurados: son datos almacenables y manejables. Los datos que están en formato de base de datos relacional y se han estructurado correctamente en formato de filas y columnas se conocen como datos estructurados.
  2. Semiestructurados: no residen en bases de datos, pero tienen una lógica interna. Los datos están parcialmente estructurados y mezclados con un formato de datos no estructurado.
  3. Desestructurados: datos que no pueden ser almacenados en estructuras predefinidas. Incluyen varios tipos de datos como audio, vídeo, archivos XML, archivos de Word… y no se organizan en formatos adecuados.

Tanto los sistemas analíticos convencionales como el Big Data, tienen el objetivo de convertir los datos en información relevante que facilite cualquier toma de decisiones. La creciente digitalización, la cantidad de datos y la variedad de formatos y fuentes de origen existentes ha aumentado exponencialmente desde los años 90. como bien vaticinó John Mashey. Sin el uso de la tecnología adecuada, todo este caudal sería imposible de canalizar y tratar. El Big Data permite trabajar sobre un mayor volumen y variedad de datos y, lo que es más importante, a una velocidad endiabladamente mayor.

Big Data con Power BI

En los actuales procesos de transformación digital, las empresas están recibiendo la tendencia del Big Data con los brazos abiertos. El 73% de las organizaciones ya ha invertido en Big Data o planea hacerlo durante el presente ejercicio. Y gracias al uso de grandes volúmenes de datos, tanto pymes como grandes compañías, están aprovechando sus ventajas para realizar análisis de perfiles que visitan sus webs o se comunican con el servicio de atención al cliente, para discernir la mejor ubicación a la hora de abrir un nuevo local, qué tipo de usuarios no están confiando en sus productos… Las posibilidades se presentan de un modo exponencial.

No obstante, el control y la seguridad de los datos será la próxima gran batalla, pues no hay que dejar a un lado la importancia de la ciberseguridad. Muestra de ello son las nuevas y constantes regulaciones realizadas por la Unión Europea.

El presente y futuro del Big Data en datos

  • En 2015 la cantidad de datos producidos en 48 horas fue la misma que la de toda la historia anterior a 2003.
  • El 95% de los datos disponibles en el mundo se han generado en los últimos 24 meses.
  • El volumen de datos no dejará de aumentar. La llegada de nuevos wearables y el IOT aumentará de forma exponencial la generación de datos.
  • Las soluciones de análisis predictivo pasarán a ser una herramienta indispensable en cualquier software de negocios. Para 2025, la mitad de los software para empresas incluirá funcionalidades Big Data. Muestra de ello es la inversión de Microsoft en este campo, materializada en las funcionalidades de las aplicaciones del ecosistema de Microsoft Dynamics 365.
  • “Fast data” y “Actionable data” serán los elementos que hagan evolucionar el Big Data. Las compañías finalmente podrán detectar más fácil y rápidamente las preguntas correctas, y mediante los datos responderlas con la misma efectividad y rapidez.
  • The International Institute for Analytics vaticina que las empresas ante la falta de profesionales formados, utilizarán la formación interna para fomentar, gestionar y potenciar la cultura de datos.
  • Decodificar los datos del genoma humano llevó 10 años. Hoy, con el Big Data, se podría hacer en una semana.

¿Quieres conocer más sobre las últimas tendencias en digitalización e IA? ¡Contacta con nosotros!

Sea cual sea tu empresa, en Marqués mejoramos tus procesos empresariales.

¡Escríbenos si necesitas más información! Encantados de poder ayudarte.

Estaremos encantados de poder ayudarte.

Noticias

Qué se mueve en el mundo tecnológico