Big Data

BD se refiere a las arquitecturas de datos a gran escala, con herramientas que abordan los nuevos requisitos en el manejo de datos.

Las bases de datos tradicionales (almacenamiento de datos) asumen que los datos están organizados en filas y columnas y emplean métodos de limpieza de datos mientras los volúmenes de datos crecen durante un período de tiempo, y a menudo carecen de un procesamiento de datos a gran escala. Los sistemas tradicionales de base de datos / almacenamiento se diseñaron para abordar volúmenes más pequeños de datos de estructura, con las actualizaciones predecibles y la estructura de datos coherente, que operan principalmente en un único servidor y generan gastos operativos con el aumento del volumen de datos.

Se puede denominar así por las características que tienen los datos que maneja: un gran volumen de información, una alta velocidad de generación de datos, una variedad de formatos que se incrementa y varía su patrón de crecimiento e incertidumbre de los datos.

Existen actualmente varias herramientas que permiten el manejo e implementación de BD tales como Hadoop, Kudo, Jupiter y Spark entre otros; regularmente distribuidas bajo una licencia libre, que permiten trabajar con miles de nodos y petabytes de datos.

A la acción de extraer valor de la información se le llama Ciencia de Datos, esto combina las habilidades de programación, matemáticas y estadística con el conocimiento específico (medicina, hidrología, finanzas). Valor que a su vez se convierte en comprensión, en acción o en decisión.

El sector hídrico puede beneficiarse de la incursión en esta tecnología principalmente con la obtención de datos sobre la cantidad, calidad, consumo y estado de la infraestructura a lo largo de todo el ciclo hidrológico; asimismo con un análisis más eficiente de los datos que permita lograr un manejo sustentable del agua, su mejor distribución, la priorización de acciones de prevención y corrección.

Por ejemplo, Se ha propuesto una solución para predecir indicadores de estrés hídrico útiles para el sector agrícola y forestal llamado FORWARD (Operational Monitoring and Forecasting System for Resilience of Agriculture and forestry under intensification of the Water cycle). Donde se pretende investigar, desarrollar y configurar una herramienta de software capaz de identificar y recopilar variables ecohidrológicas desde fuentes de datos abiertos.

 

BigData

  • Martinez J. Conociendo los beneficios de BigData y Cloud Computing. Universidad Libre. 2017
  • B. Sarmiento. Herramientas y Antecedentes BigData. 2014

Start typing and press Enter to search