Democratización de datos, Data Self-Service con Druid + Imply.io

Tanto las herramientas de Bi (Business Intelligence), más tradicionales, como las más novedosas y nacidas a partir de la “irrupción” del BigData como son por ejemplo: Tableau, PowerBI, entre muchas otras… han transformado fundamentalmente la forma en que operamos los datos las organizaciones. Los directivos de todas las industrias ahora están utilizando la tecnología de análisis Big Data para una amplia gama de procesos, objetivos y necesidades de gestión. Y las aplicaciones potenciales de las herramientas de BI modernas son prácticamente infinitas, ya que han irradiado en casi todos los aspectos de la gestión operativa y la supervisión estratégica como, se han podido beneficiar de conocimientos más potentes y rápidos. [Leer más]

Strategy: Cold, Warm, Hot Data Storage & Data Warehouse vs Data Lake Architecture

Ya por aquí hemos hablado, y mucho, de #Data-Pipeline o #Data-Streaming. Por ejemplo fue el caso del Banco ING Direct, donde a partir de una Pipeline podían extraer el fruto y conectar su proceso de datos basado en #Real-Time con su reporting o sus bases de datos más operacionales. También hemos hablado de CQRS, que no es lo mismo que la construcción de Pipeline basadas en #Real-Time sinó, basadas en un método para optimizar escrituras en bases de datos (write) y leerlas (read). [Leer más]

Data Science project lifecycle

La gestión de proyectos, que hemos hablado por aquí bastante, no es cosa fácil… pero lo es todavía menos cuando tenemos frente a nosotros proyectos de “Data Science”. Por ello hemos desarrollado un pequeño framework para poder afrontar, con éxito, nuestro proyecto “Data Science”, veamos: Definition of Project El Sprint 0. ¿Cuántas veces nuestras expectativas vs lo entregado coinciden?. Aunque se esté trabajando con Metodología Agile, por ejemplo, no quiere decir que planifiquemos bien, que pensemos bien, etc… y es por eso de la importancia de trabajar cuanto antes y lo mejor posible nuestro Sprint 0. [Leer más]

Who is Solution Architect

Hace mucho tiempo que tenía pendiente presentar la más que importante posición de Solutions Architect, aunque cierto es que en algunas empresas puede ser la misma figura el Solutions Architect y el Enterprise Architect o, simplemente, The Architect. A título personal, y ya por el 2008, hace un poco más de 10 años, que vengo trabajando dichas posiciones: era y es uno de mis retos personales. A continuación comparto un Diagrama para poder escenificar rápidamente lo que vendría a ser una estructura de Gobierno para la toma de decisiones en Arquitecturas técnicas, teniendo en cuenta tanto la estrategia del negocio, de datos y de software. [Leer más]

Real-Time: Data Streaming

Desde hace ya un tiempo que vamos hablando sobre #Data-Streaming, publicando casos reales como el de ING Direct. Aunque hoy queremos hacer una “review” general para ir enfocando próximos capítulos ya que, más que nunca, está de “moda” el tener Real-Time en nuestras plataformas de analítica. Por ejemplo en el caso anterior, del Banco ING, podemos ver como las transacciones online que están realizando sus clientes, rápidamente, están disponibles para sus equipos de Customer Support, vital para una eficiente atención al cliente. [Leer más]

CDN services: CloudFlare vs CloudFront vs Fastly

Todos sabemos que la velocidad en una web, influye y mucho, pero no solo influye en aquello que vemos, también Google nos puede llegar a penalizar si somos unos lentos… es por eso que una muy buena solución para poder servir contenido pesado como serían imágenes, videos, etc… es mediante un CDN. Pero: ¿Qué es un CDN?, según la Wikipedia es: “Una red de distribución de contenidos (CDN, content delivery network en inglés) es una red superpuesta de computadoras que contienen copias de datos, colocados en varios puntos de una red con el fin de maximizar el ancho de banda para el acceso a los datos de clientes por la red. [Leer más]

Enterprise Data Hub (EDH)

Aunque sabemos que las arquitecturas Enterprise Data Hub (EDH) no son especialmente recomendadas, podemos decir que en muchas situaciones, pueden ayudarnos y bastante. Como idea base tenemos que tener claro que nunca en nuestra EDH tendremos la lógica del negocio, la usaremos “simplemente” como streams de datos. Una manera interesante de conectar distintos tipos de source es mediante una EDH, aunque tendremos distintos tipos de “caminos”, los generados directamente por eventos (PUSH) o los que tendremos que hacer una recuperación para inyectar los datos en el procesos (PULL). [Leer más]

AWS re:Invent Recap Edition 2018 (Updates)

Como cada año, a finales de noviembre y en Las Vegas (USA), AWS presenta su nueva línea de Productos y, éste año no ha sido menos. AWS ya ha llegado a un producto por cada día del año, es un sin fin de posibilidades adaptados a cada necesidad que podamos tener. En el post de hoy me agradará comentar algunos de los más destacados y los que creo, particularmente, que pueden ser un antes y un después, veamos: [Leer más]

Deep Dive on Amazon Rekognition, ft. Tinder & News UK

Interesante vídeo para conocer de cerca Amazon Rekognition y poder aplicar análisis inteligente de imágenes y vídeos a las aplicaciones para automatizar los flujos de trabajo manuales, mejorar la creatividad y proporcionar experiencias más personalizadas a los clientes. En el vídeo podremos encontrar las mejores prácticas para ajustar y optimizar Amazon Rekognition para una variedad de casos de uso, incluyendo la moderación de contenido, la creación de bibliotecas de contenido con capacidad de búsqueda y la integración de autenticación secundaria en aplicaciones existentes. [Leer más]