Who is Solution Architect

Hace mucho tiempo que tenía pendiente presentar la más que importante posición de Solutions Architect, aunque cierto es que en algunas empresas puede ser la misma figura el Solutions Architect y el Enterprise Architect o, simplemente, The Architect. A título personal, y ya por el 2008, hace un poco más de 10 años, que vengo trabajando dichas posiciones: era y es uno de mis retos personales. A continuación comparto un Diagrama para poder escenificar rápidamente lo que vendría a ser una estructura de Gobierno para la toma de decisiones en Arquitecturas técnicas, teniendo en cuenta tanto la estrategia del negocio, de datos y de software. [Leer más]

Real-Time: Data Streaming

Desde hace ya un tiempo que vamos hablando sobre #Data-Streaming, publicando casos reales como el de ING Direct. Aunque hoy queremos hacer una “review” general para ir enfocando próximos capítulos ya que, más que nunca, está de “moda” el tener Real-Time en nuestras plataformas de analítica. Por ejemplo en el caso anterior, del Banco ING, podemos ver como las transacciones online que están realizando sus clientes, rápidamente, están disponibles para sus equipos de Customer Support, vital para una eficiente atención al cliente. [Leer más]

CDN services: CloudFlare vs CloudFront vs Fastly

Todos sabemos que la velocidad en una web, influye y mucho, pero no solo influye en aquello que vemos, también Google nos puede llegar a penalizar si somos unos lentos… es por eso que una muy buena solución para poder servir contenido pesado como serían imágenes, videos, etc… es mediante un CDN. Pero: ¿Qué es un CDN?, según la Wikipedia es: “Una red de distribución de contenidos (CDN, content delivery network en inglés) es una red superpuesta de computadoras que contienen copias de datos, colocados en varios puntos de una red con el fin de maximizar el ancho de banda para el acceso a los datos de clientes por la red. [Leer más]

Enterprise Data Hub (EDH)

Aunque sabemos que las arquitecturas Enterprise Data Hub (EDH) no son especialmente recomendadas, podemos decir que en muchas situaciones, pueden ayudarnos y bastante. Como idea base tenemos que tener claro que nunca en nuestra EDH tendremos la lógica del negocio, la usaremos “simplemente” como streams de datos. Una manera interesante de conectar distintos tipos de source es mediante una EDH, aunque tendremos distintos tipos de “caminos”, los generados directamente por eventos (PUSH) o los que tendremos que hacer una recuperación para inyectar los datos en el procesos (PULL). [Leer más]

AWS re:Invent Recap Edition 2018 (Updates)

Como cada año, a finales de noviembre y en Las Vegas (USA), AWS presenta su nueva línea de Productos y, éste año no ha sido menos. AWS ya ha llegado a un producto por cada día del año, es un sin fin de posibilidades adaptados a cada necesidad que podamos tener. En el post de hoy me agradará comentar algunos de los más destacados y los que creo, particularmente, que pueden ser un antes y un después, veamos: [Leer más]

Deep Dive on Amazon Rekognition, ft. Tinder & News UK

Interesante vídeo para conocer de cerca Amazon Rekognition y poder aplicar análisis inteligente de imágenes y vídeos a las aplicaciones para automatizar los flujos de trabajo manuales, mejorar la creatividad y proporcionar experiencias más personalizadas a los clientes. En el vídeo podremos encontrar las mejores prácticas para ajustar y optimizar Amazon Rekognition para una variedad de casos de uso, incluyendo la moderación de contenido, la creación de bibliotecas de contenido con capacidad de búsqueda y la integración de autenticación secundaria en aplicaciones existentes. [Leer más]

Traefik, Load Balancer y Reverse Proxy para Docker

Traefik está entre Reverse Proxy y Load Balancer, es fácil de utilizar, es dinámico, es automático, es muy rápido y es de código abierto. En el blog ya hemos hablado anteriormente sobre él, pero, hoy venimos con un caso práctico. Imaginemos que tenemos un conjunto de microservicios desplegados en nuestra infraestructura. Probablemente utilizaremos un servicemesh y/o un orquestador para administrarlos, aunque, si deseamos que nuestros usuarios accedan a algunos desde Internet, tendremos que utilizar un Reverse Proxy y configurarlo mediante hosts virtuales o rutas, por ejemplo: [Leer más]

Ansible Galaxy, official hub for sharing Ansible content.

Ansible Galaxy es el repositorio oficial de Ansible para que podamos compartir nuestras recetas con su Comunidad. Para los que no estéis familiarizados con Ansible, decir que es una herramienta de IT-Automation que nos permite realizar acciones masivas basadas en un archivo de configuración o definición llamado playbook (YAML). Un playbook está compuesto por distintas instrucciones que serán las que concretamente queremos ejecutar sobre nuestra plataforma de servidores. También, Ansible está dividido en unidades de trabajo o módulos, cada módulo es autosuficiente y puede ser escrito distintos lenguajes de scripting, como: Python, Perl, Ruby, etc… Una de las propiedades clave de los módulos es la idempotencia, que nos asegurará que ninguna de las operaciones se realizará una vez el sistema haya alcanzado el estado deseado. [Leer más]

Oozie vs Airflow, Open Source Data Pipeline

Anteriormente ya hemos hablado sobre sistemas de ingestión de datos, como es Apache NiFi o, también, de transformación de la información, como Apache Flink. Pero hoy venimos con sistemas de Data Pipeline o, también conocidos como Workflows. Hablaremos sobre Oozie y Airflow. Oozie Oozie es un sistema para la gestión de flujos de trabajo de código abierto escrito en Java para sistemas Hadoop. Oozie se centra, mayormente, en la flexibilidad y en la creación de flujos de trabajo complejos, permitiéndonos tener trabajos activos por tiempo, por eventos o tener disponibilidad de datos según las situaciones en que la disponibilidad de los mismos pueda ser impredecible. [Leer más]

Introduction to CQRS (segregando la tipología de uso y del dato)

En anteriores post hemos hablado sobre Data streaming como también de escalar bases de datos. Pero hoy vengo a darte una introducción, clara y concisa, sobre CQRS y su aplicación; utilizando un tanto los posts mencionados anteriormente. CQRS es un método para optimizar escrituras en bases de datos (write) y leerlas (read). Hoy en día, algunas más que otras, las empresas están ya acostumbradas a trabajar con grandes volúmenes de datos y, por lo tanto, con grandes bases de datos. [Leer más]