Strategy: Cold, Warm, Hot Data Storage & Data Warehouse vs Data Lake Architecture

Ya por aquí hemos hablado, y mucho, de #Data-Pipeline o #Data-Streaming. Por ejemplo fue el caso del Banco ING Direct, donde a partir de una Pipeline podían extraer el fruto y conectar su proceso de datos basado en #Real-Time con su reporting o sus bases de datos más operacionales. También hemos hablado de CQRS, que no es lo mismo que la construcción de Pipeline basadas en #Real-Time sinó, basadas en un método para optimizar escrituras en bases de datos (write) y leerlas (read). [Leer más]

Data Science project lifecycle

La gestión de proyectos, que hemos hablado por aquí bastante, no es cosa fácil… pero lo es todavía menos cuando tenemos frente a nosotros proyectos de “Data Science”. Por ello hemos desarrollado un pequeño framework para poder afrontar, con éxito, nuestro proyecto “Data Science”, veamos: Definition of Project El Sprint 0. ¿Cuántas veces nuestras expectativas vs lo entregado coinciden?. Aunque se esté trabajando con Metodología Agile, por ejemplo, no quiere decir que planifiquemos bien, que pensemos bien, etc… y es por eso de la importancia de trabajar cuanto antes y lo mejor posible nuestro Sprint 0. [Leer más]