viernes, 28 de julio de 2017

Notas sobre BigData


Conceptos básicos de Big Data


Inicio con notas básicas sobre Big Data, nada complicado sino buscando sea fácilmente entendido.
Big data aplica a grandes volúmenes de información que deben ser procesados a alta velocidad. Este procesamiento no es posible en los sistemas tradicionales.

Los nuevos sistemas conectados a internet con todas sus transacciones (web, correo, redes sociales diversas que manejan texto, imágenes estáticas y video,  etc), aplicaciones móviles que generan información de posicionamiento y sensores de Smart phones, por último, la IoT que define los  sensores que continuamente generan datos en la red.

BD es un conjunto de tecnologías que permiten procesar grandes volúmenes.
  1. Escalables
  2. Procesamiento distribuido de información, grandes volúmenes
  3. Tolerancia a errores
BI está enfocada en información estática procedente de la operación diaria de empresas, la cual es analizada para decisión. A medida que se requiere procesar más información se incrementa el hardware pero tiene un límite y llega un momento en que el tiempo de respuesta es muy alto
 
BI es computación distribuida en paralelo, que usa máquinas no muy fuertes, suma el poder individual de cada máquina. Los datos que maneja BI son datos no estructurados y semi estructurados. Puede procesar datos de diferente tipo. Sale del típico modelo de almacenamiento en tablas. BI usa un lenguaje No-SQL para acceder a información de diverso tipo, desde textos a videos.  Poseen además características muy importantes para la distribución geográfica de procesamiento, son multi-tenant.

Sin embargo, la capacidad de llegar a diferentes fuentes de datos, representa el riesgo de invadir la privacidad de las personas, cuyos datos están en las fuentes dispersas.

La gobernanza de datos, constituye el control de los datos manejados por Big Data, existe el concepto Data Lake que se refiere al conjunto de datos que son analizados por un sistema de BD. La gobernanza, ejecutada a través de herramientas especializadas, garantiza que los datos sean controlados desde su ingreso al Data Lake hasta su salida como datos analizado, aseguran calidad de datos, seguridad de acceso, confidencialidad de datos.

Las perspectivas de futuro apuntan a tener cada vez más datos, en un crecimiento exponencial. Es importante estar dentro de la ola que empuja el cambio digital. La adopción de BD se debe transformar en un commodity más dentro del conjunto de aplicaciones de las empresas. La empresa que no está dentro de este cambio va a sufrir luego por costos de implementación tardía o por carencias de herramientas de decisión y análisis frente a la competencia.

No hay comentarios: