Data Warehouse vs Database

Hemos hablado anteriormente sobre muchos conceptos como: #Data-Streaming, #Big-Data, #Data-Warehouse, etc… pero, nunca antes, hemos explicado claramente la diferencia entre un Data Warehouse y una Database. Vamos a por ello: ¿Qué es un Data Warehouse? Un #Data-Warehouse es un sistema que reúne datos de muchas fuentes diferentes dentro de una organización para la elaboración de informes y el análisis. Los informes creados a partir de consultas complejas dentro de un #Data-Warehouse se utilizan para tomar decisiones empresariales. [Leer más]

Strategy: Cold, Warm, Hot Data Storage & Data Warehouse vs Data Lake Architecture

Ya por aquí hemos hablado, y mucho, de #Data-Pipeline o #Data-Streaming. Por ejemplo fue el caso del Banco ING Direct, donde a partir de una Pipeline podían extraer el fruto y conectar su proceso de datos basado en #Real-Time con su reporting o sus bases de datos más operacionales. También hemos hablado de CQRS, que no es lo mismo que la construcción de Pipeline basadas en #Real-Time sinó, basadas en un método para optimizar escrituras en bases de datos (write) y leerlas (read). [Leer más]

AWS LocalStack: Develop and test your cloud apps offline

La llegada del Cloud supuso un antes y un después, pero también es cierto, complicó un tanto la vida para poder validar los correctos funcionamientos de nuestras aplicaciones ya que, teníamos que replicar entornos, por ejemplo de Integración, elevando sus costes. Pues bien, el proyecto LocalStack es una fantástica solución para “simular” nuestro AWS Cloud en local, sea instalado localmente o bien desplegado en su versión Docker. Requirements Para poder ejecutar cualquier tipo de interacción con nuestro LocalStack tendremos que tener instaladas las AWS CLI (Command Line Interface), veamos: [Leer más]

Enterprise Data Hub (EDH)

Aunque sabemos que las arquitecturas Enterprise Data Hub (EDH) no son especialmente recomendadas, podemos decir que en muchas situaciones, pueden ayudarnos y bastante. Como idea base tenemos que tener claro que nunca en nuestra EDH tendremos la lógica del negocio, la usaremos “simplemente” como streams de datos. Una manera interesante de conectar distintos tipos de source es mediante una EDH, aunque tendremos distintos tipos de “caminos”, los generados directamente por eventos (PUSH) o los que tendremos que hacer una recuperación para inyectar los datos en el procesos (PULL). [Leer más]

Introduction to CQRS (segregando la tipología de uso y del dato)

En anteriores post hemos hablado sobre Data streaming como también de escalar bases de datos. Pero hoy vengo a darte una introducción, clara y concisa, sobre CQRS y su aplicación; utilizando un tanto los posts mencionados anteriormente. CQRS es un método para optimizar escrituras en bases de datos (write) y leerlas (read). Hoy en día, algunas más que otras, las empresas están ya acostumbradas a trabajar con grandes volúmenes de datos y, por lo tanto, con grandes bases de datos. [Leer más]