- 22 de agosto de 2017

Breve repaso por las bases y la actualidad del Big Data

Por Alejandro Bianchi* – Big Data se define como un campo de las ciencias de la información dedicado al análisis, procesamiento y almacenamiento de grandes volúmenes de datos, que con frecuencia provienen de fuentes dispares como: sistemas internos, fuentes externas, sensores en distintos tipos de equipamiento, redes sociales, etc. Su objetivo fundamental es ser capaz de soportar la toma de decisiones de niveles ejecutivos de las empresas de manera de que obtengan una ventaja competitiva frente a su competencia.


2
Las soluciones y prácticas de Big Data suelen ser necesarias cuando las tecnologías y técnicas tradicionales de análisis, procesamiento y almacenamiento de datos son insuficientes para resolver necesidades de un determinado estadio del negocios. Específicamente, Big Data ha sido pensada, como la combinación de múltiples conjuntos de datos no relacionados, el procesamiento de grandes cantidades de datos estructurados y no estructurados y la recolección de información oculta de una manera que mantenga vigencia a lo largo de tiempo de acuerdo a la demanda de los stakeholders del negocio.

Esta ciencia se ha desarrollado durante años para resolver problemas vinculados a la salud, a los servicios públicos y las actividades actuariales, por mencionar algunos campos representativos. Hoy, la práctica agrega nuevas técnicas que aprovechan los recursos computacionales para ejecutar algoritmos analíticos. La evolución de estos métodos y las tecnologías relacionadas han permitido acompañar el crecimiento de los conjuntos de datos tanto en volumen como en diversidad, facilitando el procesamiento en tiempo real y un flujo continuo de actualización de datos.

El análisis de conjuntos de datos Big Data es un esfuerzo interdisciplinario que combina matemáticas, estadística, informática y conocimiento del dominio especifico. Esta mezcla de habilidades y perspectivas ha llevado a una cierta confusión en cuanto a lo que comprende el campo de Big Data y su análisis, pues la respuesta que uno recibe dependerá de la perspectiva de quien esté respondiendo a la pregunta.

1 (1)Los límites de lo que constituye un problema de Big Data también están evolucionando debido al paisaje siempre cambiante y avanzado de la tecnología de software y hardware. Esto se debe al hecho de que la definición de Big Data tiene en cuenta el impacto de las características de los datos en el diseño del entorno de la solución en sí.

Hace treinta años, un gigabyte de datos podría ser un problema de Big Data y requerir recursos de computación de propósito especial. Ahora, los gigabytes de datos son comunes y pueden ser fácilmente transmitidos, procesados y almacenados en dispositivos orientados al consumidor.

Los datos dentro de los entornos de Big Data generalmente se acumulan dentro de la empresa a través de aplicaciones, sensores y fuentes externas. Los datos procesados por una solución Big Data pueden ser utilizados por las aplicaciones empresariales directamente o pueden ser introducidos en un “lago de datos” para enriquecer datos existentes.

Según IDC, para el 2020 el negocio de Big Data será mayor a los 203 billones de dólares a nivel global, por lo que la demanda de aplicaciones basadas en Big Data está y seguirá creciendo en función a las necesidades de las organizaciones de poder tomar decisiones más acertadas y en tiempo real, de manera de poder responder a las necesidades de sus clientes con nuevos productos y servicios.

*Bianchi es el presidente de Liveware IS

Tags: Alejandro Bianchi, big data, datos, estadística, informática, Liveware IS, matemáticas

Más notas de interés

Registrarse en el Newsletter de Portinos