Replicando datos en tiempo real (Log Shipping vs Mirror Data)

Hemos hablado bastante sobre “Stream Processing”, “Data Stream”, “Distributed Real-Time Stream Processing”, “Data Sharding”, etc… pero, por lo general, siempre contamos con que tendremos una fuente de datos lo suficientemente preparada como para poder coger los datos y convertirlos en procesos o streams. Pero, seamos sinceros, raramente pasa. Es por eso que tenemos soluciones interesantes cuando, por ejemplo, tenemos una base de datos SGBD (puede ser Oracle o SQLServer) y queremos realizar una réplica de la base de datos origen hacia un destino. [Leer más]

Democratización de datos, Data Self-Service con Druid + Imply.io

Tanto las herramientas de Bi (Business Intelligence), más tradicionales, como las más novedosas y nacidas a partir de la “irrupción” del BigData como son por ejemplo: Tableau, PowerBI, entre muchas otras… han transformado fundamentalmente la forma en que operamos los datos las organizaciones. Los directivos de todas las industrias ahora están utilizando la tecnología de análisis Big Data para una amplia gama de procesos, objetivos y necesidades de gestión. Y las aplicaciones potenciales de las herramientas de BI modernas son prácticamente infinitas, ya que han irradiado en casi todos los aspectos de la gestión operativa y la supervisión estratégica como, se han podido beneficiar de conocimientos más potentes y rápidos. [Leer más]

Los Beneficios (con seguridad) de los Metadatos (Apache Atlas + Ranger + Kafka)

¿Qué pasa cuando queremos aplicar seguridad a nuestros Datos? Por lo general podemos aplicar muchos tipos como también, distintas capas de seguridad. Por ejemplo lo más frecuente sería una validación mediante OpenID para los usuarios y mediante API Key para los usos programáticos, con una siguiente capa mediante validación IAM para el uso entre infraestructuras o componente más “físicos” y podemos continuar extendiendo mucho más allá, no quiero profundizar ahora mismo con ello… mi pregunta, mejorada, es la siguiente: ¿Qué pasa cuando queremos aplicar seguridad a nuestros Datos que se consumem mediante subscripción? [Leer más]

Democratización de datos, complementando una Estrategia Data Centric

Muchas de las empresas y más las llamadas Data Centric pueden tener estrategias de Gobierno del Dato (de sus datos) pero, seguramente con toda probabilidad, no tendrán sus datos democratizados. ¿Qué entendemos por “Democratización de datos”?. Lo miraré de resolver con otra pregunta: ¿Cuántos de los nuevos productos o nuevas releases nacen mal o más tarde de lo previsto porque no se conocen bien las fuentes origen de los datos que requerimos? [Leer más]

GDPR y nueva Gobernanza de Datos

La Nueva regulación europea sobre la Protección de Datos Personales, la GDPR nos marca muy claramente como se deben obtener, tratar, guardar y destruir estos. Para ello, las nuevas Arquitecturas de Gobierno del Dato que tienen que moverse dentro de la nueva Regulación, deberán estar totalmente orientadas a la Seguridad de los Datos. Ya no hay separación entre la Arquitectura Big Data, propiamente dicha como aquella Seguridad necesaria para poder cumplir con la Regulación. [Leer más]

Una necesidad, unos datos

“¿Poner datos en mi empresa? Como si cupiera algo más y no tuviese ya suficientes problemas…” Esta respuesta es la que dan aquellas personas e inclusive empresas que ignoran parte o la totalidad del significado de los datos y de sus posibilidades. Aunque ya se escribió sobre qué implican los datos en sí mismos en el post anterior, hoy continuaremos con quiénes usan (o no) esos datos, y porqué. Parafraseando a Conzemius y O’Neill en uno de sus libros sobre la cultura SMART, los datos son solo valores vacíos hasta que alguien los convierte en otra cosa, en algo más allá de lo que significan. [Leer más]

Teoría de Grafos aplicada al Gobierno del Dato

La Teoría de Grafos aplicada al mundo Data nos dice que una base de datos, orientada a grafos, representa la información como nodos de un grafo y sus relaciones con las aristas del mismo, de manera que se pueda usar dicha teoría para recorrer la base de datos ya que esta puede describir atributos de los nodos (entidades) y las aristas (relaciones). Bien, dicha afirmación que es sacada casi textual de la Wikipedia, “amañada” un poco a mi interés, nos dice claramente que podemos crear una estructura de control y Gobierno del Dato que a partir de la descripción de los atributos podamos generar tantas relaciones como queramos. [Leer más]

Empresas orientadas a Datos o Normalidad

En pocos días tendremos una trilogía de posts totalmente orientados al poder de los Datos pero hoy quisiera poder hacer un breve enfoque a lo que comentaremos. Tras el post de Estonia, mi mente, casualmente, empezó con el típico run-run. Mi pregunta era muy simple, quizás es la misma, pero me explicaré tras formularla: ¿Empresas de Datos o Orientadas a Datos?. Me explico: con ello no quiero decir que éstas no sean empresa Data Driven, por decirlo así, tampoco que no estén “Gobernadas” por los Datos, tampoco; mi intención va más allá. [Leer más]