Conceptos básicos de Big Data
Inicio con notas básicas sobre Big Data, nada complicado sino buscando sea fácilmente entendido.
Big data aplica a grandes volúmenes de información que deben
ser procesados a alta velocidad. Este procesamiento no es posible en los
sistemas tradicionales.
Los nuevos sistemas conectados a internet con todas sus
transacciones (web, correo, redes sociales diversas que manejan texto, imágenes
estáticas y video, etc), aplicaciones
móviles que generan información de posicionamiento y sensores de Smart phones,
por último, la IoT que define los sensores que continuamente generan datos en la
red.
BD es un conjunto de tecnologías que permiten procesar grandes volúmenes.
- Escalables
- Procesamiento distribuido de información, grandes volúmenes
- Tolerancia a errores
BI es computación distribuida en paralelo, que usa máquinas
no muy fuertes, suma el poder individual de cada máquina. Los datos que maneja
BI son datos no estructurados y semi estructurados. Puede procesar datos de
diferente tipo. Sale del típico modelo de almacenamiento en tablas. BI usa un
lenguaje No-SQL para acceder a información de diverso tipo, desde textos a
videos. Poseen además características
muy importantes para la distribución geográfica de procesamiento, son
multi-tenant.
Sin embargo, la capacidad de llegar a diferentes fuentes de
datos, representa el riesgo de invadir la privacidad de las personas, cuyos
datos están en las fuentes dispersas.
La gobernanza de datos, constituye el control de los datos
manejados por Big Data, existe el concepto Data Lake que se refiere al conjunto
de datos que son analizados por un sistema de BD. La gobernanza, ejecutada a
través de herramientas especializadas, garantiza que los datos sean controlados
desde su ingreso al Data Lake hasta su salida como datos analizado, aseguran
calidad de datos, seguridad de acceso, confidencialidad de datos.
Las perspectivas de futuro apuntan a tener cada vez más
datos, en un crecimiento exponencial. Es importante estar dentro de la ola que
empuja el cambio digital. La adopción de BD se debe transformar en un commodity
más dentro del conjunto de aplicaciones de las empresas. La empresa que no está
dentro de este cambio va a sufrir luego por costos de implementación tardía o
por carencias de herramientas de decisión y análisis frente a la competencia.
