Blazing DB, revolucionando el procesamiento de toneladas de información con tarjetas de video (GPU)

Por Alonso Mujica - hace 1 año

Sección: Startups


Con velocidades sorprendentes y funcionalidades para el análisis exhaustivo de data y en corporaciones con miles de clientes, esta solución empieza a generar una amplia expectativa de manera muy rápida. La primera startup peruana en ser acelerada por Techstars, conoce más sobre ellos acá. 

 

A continuación, la primera entrevista que Timov hizo a Rodrigo Aramburú, CEO de Blazing DB.

 

¿Cómo te involucras en este mundo de tecnología y emprendimiento?

Básicamente soy un emprendedor, empecé primero Simply SAC que fue nuestro primer emprendimiento hace 2 años y medio. Es una empresa que desarrolla software y herramientas analíticas que se conoce como Data Science, como se conoce todo tipo de modelamiento avanzado, aprendizaje automatizado, hasta llegar a componentes que se consideran inteligencia artificial. Hacemos eso porque muchas empresas en el mundo, específicamente en Estados Unidos, invierten mucho dinero en este tipo de análisis para extracción de información de fuentes informáticas de grandes volúmenes, y así poder mejorar su producto, servicios, así cómo encuentran oportunidades, entre otras cosas.

 

¿Qué hacías antes de todo esto?

Trabajaba en Deloitte Consulting en Nueva York, desarrollaba sistemas analíticos de pensiones o sistemas administrativos. Un sistema analítico de pensiones es por ejemplo: tengo un montón de fuentes de información de diferentes tipos, una vez me dieron cientos de millones de registros de pagos de planilla de 200 mil empleados de mi cliente, que era una financiera de Nueva York, una importante y es la aseguradora más grande en todo el mundo. Me dijeron: “queremos que recrees la información de planilla como información de pensión o pensionaria utilizando esta data y mostrar todas las consultas como cuando empezaron a trabajar, se fueron de vacaciones, etc.” Tomé el payroll y lo convertí en un historial pensionario de cada empleado (200 mil), a través de diferentes programas que desarrollé.

 

¿Quiénes integran el equipo de Blazing DB y cómo se conocieron?

En realidad, los socios principales y quienes empezaron el trabajo somos mi hermano y yo. El trabajaba como director tecnológico de otra startup que recaudó unos cuantos millones de dólares desarrollando un software de auditoría energética de edificios que franquea apuntar dónde están los vidrios, tamaño, material, flujo de aire en la ventilación, cuántos focos hay, su tipo, etc. Luego de eso, hemos tenido varios consultores o gente contratada part time por diversos proyectos, hasta que comenzamos a armar un equipo sólido y único.

 

 

 

Los hermanos Felipe y Rodrigo Aramburú, el equipo fundador 

 

¿Cuántos son?

Somos 4 a tiempo completo, un contratista y 3 diferentes mentores que tienen un componente de acciones en la organización.

 

¿Cuáles son los roles que tienen?

Yo soy el gerente general (CEO), básicamente me dedico a toda la parte comercial, conversando con clientes, encontrando prospectos, cerrando los tratos. Yo cerré alrededor de 85% de los diferentes contratos que hemos hecho a lo largo de los 2 años que hicimos Simply, tanto en Perú como afuera. De ahí, Felipe es el gerente tecnológico (CTO) y ha estado desarrollando desde que tenía como 12 años y es como nuestro unicornio en varios sentidos y nunca me ha fallado en ese sentido.

 

Rodrigo junto al equipo que opera en Perú

 

¿Cómo surge Blazing DB?

Nosotros tuvimos un contrato con el gobierno de un análisis de redes neuronales, que es una herramienta matemática que te deja construir algoritmos de inteligencia artificial. Digamos que yo tengo una fuente informática muy grande, y esa tiene un montón de “X”, hablamos de un cálculo típico donde hay varios parámetros “X” y tiene una “Y” que es el output. Yo doy toda esa información a la red neuronal sobre millones de registros y a través del tiempo, el modelo mismo empieza a armar las correlaciones entre los parámetros. Los pesos entre dichas correlaciones, si son lineales, cuadráticas, si son de diferentes factores de magnitud o cosas por el estilo. La red neuronal identifica eso y nosotros lo hicimos específicamente para la extracción de información, queríamos ver qué reglas, qué leyes, decretos supremos estaban aplicando sobre esta fuente informática a lo largo de 40 años.

 

Donde hay problemas, hay oportunidades

Bueno, el gran problema es que para gestionar todas estas consultas me demoraba entre 30 y 40 horas en recibir la respuesta, si fallabas al hacer la consulta te tomabas todo ese tiempo en darte cuenta. Esto no era una manera factible de trabajar en el proyecto. Entonces como estábamos haciendo todo este trabajo de redes neuronales con tarjetas de video (GPU), Felipe me dijo “dame cuatro días para trabajar en una herramienta que solucione este tema” y a pesar de ser una locura al cabo de unos días de arduo trabajo resultó que se armó algo que reducía las consultas de 30 horas a 30 segundos. Estábamos hablando de un aumento de velocidad de 4000X, entonces nos miramos y dijimos “tenemos algo sustancialmente diferente de lo que hay en el mercado, ¿qué podemos hacer con esto?” que con el tiempo se volvería una Base de Datos sumamente poderosa y decidimos llevarla al mercado. Allí nació Blazing DB.

 

 

¿Qué problema solucionan?

Blazing DB es sustancialmente más rápido que otras herramientas típicas de base de datos para grandes cantidades de información; entonces, ¿quién lo usa? Todos aquellos que están interactuando en análisis de Big Data. Alrededor del 70% de estos individuos utilizan herramientas SQL en su día a día. El problema es que estas no escalan al nivel o volúmenes informáticos actuales. No puede gestionar tanto, ya que básicamente esa arquitectura que desarrolló, no puede escalarse de esa manera a menos que tengas decenas de miles de computadoras lo cual mucha gente no puede costear a menos que seas Google, Amazon o alguien por el estilo. Entonces lo que hacemos nosotros es gestionar esa misma tonelada de información y consultas al 1% del costo que otras herramientas similares: una base de datos como servicio en la cual puedes hacer toda la gestión de la información a través de una aplicación web sumamente sencilla con una enorme eficiencia en costos sin necesidad de tener que aprender nueva herramientas. Con lo que ya sabes de MySQL, Access, Oracle, SQL Server u otras de las que tienen una amplia base de usuarios ya estás listo.

 

Una vista del aplicativo de Blazing DB

 

¿Cómo funciona Blazing para el usuario?

Blazing DB es una plataforma de Base de Datos SQL en la nube que ofrece a nuestros usuarios velocidades de súpercomputadora utilizando el poder de procesamiento de tarjetas de video (GPUs). Nuestra arquitectura se basa de manera fundamental sobre las unidades de procesamiento gráficas (GPUs), la cual nos brinda la capacidad de procesar datos en paralelo de manera masiva en una sola computadora  (nodo).

              ¿Sabías que Blazing DB se presentó a una ronda de inversión el Segundo Demo Day de Angel Ventures Perú? ¡Conoce más acá!

 

Rodrigo presentando en el Demo Day de Angel Ventures Perú

 

¿En qué tipo de industrias esto puede funcionar?

En general en todas las que haya que hacer análisis de grandes cantidades de información (Big Data). Y esto se da en sectores no solo del área financiera o ventas, sino recursos humanos, proveedores, todo tipo de aspectos de una organización está utilizando análisis masivo para poder optimizar sus procesos, y así sacarle más el jugo. Nosotros vemos como potencial de interés dos sectores específicos: finanzas y telecomunicaciones. Debido a que ellos gestionan cantidades de información enormes, y el costo por segundo de análisis es muy alto, específicamente en financieras. Si tú eres 50 milisegundos más rápido que el otro, puede ser una diferencia de millones de dólares y es lo que nosotros apuntamos como una oportunidad inicial.

 

¿Cuál es el estado actual de Blazing DB?

Terminamos una versión funcional, pero no tiene la totalidad de consultas SQL, solo posee un subgrupo de consultas que es parte del estándar. Eso ya está funcional y nuestro MVP es una aplicación web que te da acceso a eso, esto ya está lanzado hace unos días. Entonces con esa versión, la gente va a poder crear sus propios usuarios, ingresar a la plataforma, cargar sus datos y comenzar a hacer consultas; también, compartir esas bases de datos con amigos.

 

¿Cuál es el mayor diferencial de ustedes contra la competencia?

Como producto, lo que nos diferencia principalmente es la tarjeta de video. El hecho de utilizar GPU para procesamiento general aplicado al mundo de base de dato. Si tú ves productos de base de datos, la edad promedio es mayor a 20 años y su arquitectura está hecha sobre un procesador (CPU) que puede ser tu Intel o AMD. La tarjeta de video se diferencia en que cada procesador, cada núcleo, es mucho menos poderoso pero hay cientos o miles de ellos. Eso significa que yo puedo recrear un clúster o agrupación de servidores en un solo computador. Allí está la diferencia del producto y es lo que nosotros estamos haciendo. La primera vez que vimos la aceleración del GPU, fue lo que nos convenció de tomar esto como algo serio.

Ahora, como organización considero que tenemos algo un poco más interesante, que es lo que nos está diferenciando a mayor nivel. Nosotros nos estamos enfocando en nuestro desarrollo, sobre un estilo de desarrollo que se llama Research Based Development.

 

¿Qué tan difícil es alcanzarte en el tema de GPU?

Los grandes competidores de la industria tienen herramientas que tienen un promedio de 20 años de vejez y todo su negocio está construido en torno a ellas. Para migrar toda la información necesitas un buen tiempo y costos enormes. En el caso de los nuevos jugadores del sector, ya hay algunos atacando el problema desde GPU por lo que nosotros nos enfocamos también en resolver cosas que ellos no han podido hacer.

 

Ventaja diferencial

Estamos enfocándonos específicamente en el target inicial de los Data Scientist, individuos que hemos estado mencionando todo este tiempo. Por ejemplo, Accenture indica que en los últimos 5 años, se han creado 400 mil puestos de data scientists. Su salario mediano en los Estados Unidos, es 115 a 120 mil dólares anuales. Típicamente, en un puesto de esa magnitud en Estados Unidos, tienes cierto poder de compra y toma de decisión como para poder optar por una solución como las nuestra.

 

¿Tu modelo es más como un servicio?

Exacto, nosotros tenemos un producto totalmente nuevo con una propuesta de valor de ser el más veloz, accesible, costo eficiente y también estamos en web, que facilita todos los nuevos paradigmas de trabajo. Es decir, yo como Data Scientist desde la aplicación web puedo hacer una serie de consultas, deshacerlas, corregirlas, compartirlas y demás cosas con mucha simplicidad que la que tendría usando otras herramientas.

 

¿Qué problemas afrontar para llevar a cabo este proyecto?

El tiempo de desarrollo del proyecto. Nos gastamos buena parte de nuestros ahorros haciendo Simply consultoría y poder reinvertir en la otra compañía. Pudimos invertir algo de $ 60 mil en el proyecto además de nuestro tiempo. Entonces, el tema del tiempo y recursos fue un gran obstáculo para poder hacer realidad Blazing DB desde el inicio.

 

Si hubieras podido hacer algo diferente, ¿qué sería?

Hubiera sido ingeniero. Yo, por carrera, soy economista y agregué matemática en mi último año. La razón fue que yo era economista y estaba entrando a artículos más y más sofisticados que son 100% pura matemática; entonces, yo me encontraba con este tope. También, me fui a Tailandia a estudiar un semestre, y los cursos de economía también era una matemática más avanzada. Terminando la carrera me di cuenta que las ciencias estaban más alineadas a lo que yo quería darle al mundo, si retrocediera en el tiempo sería matemático puro con un enfoque sustancial en temas de computación para estar en ello desde un inicio.

 

Recientemente, Blazing DB fue seleccionada por Techstars, aceleradora en EEUU considerada como la tercera mejor del 2015 acorde con Forbes, para su programa de aceleración convirtiéndose en la primera startup peruana en lograr este hito. Conoce más sobre ellos en la segunda parte de esta entrevista.

 

¡Síguenos en Timov para conocer todo sobre innovación y emprendimiento en Latinoamérica!

Autor del artículo

Alonso Mujica

Alonso Mujica es el Director de Timov. Él es un emprendedor que se ha desempeñado en cargos comerciales para empresas de Tecnología, además de consultor para diversas Startups. En la actualidad trabaja en ventas para Lenovo mientras apoya como externo en otros proyectos. Estudió Ingeniería Industrial y está siguiendo una especialización en Trade Marketing. En su tiempo libre disfruta hacer deporte, la música indie y aprender sobre nuevas cosas que están pasando en el mundo.

Comentarios