Proyecto Bonanova
icono-linkedin  icono-twitter  icono-blog  icono-youtube  icono-facebook
logo-hi-spins-mobile-2

Proyecto Bonanova: Paralelismo en Hi-Spins


En 1999 se inici贸 el proyecto conjunto de Software Greenhouse, CEPBA-TTN y Miguel Torres, cuyo objetivo fue introducir la tecnolog铆a de la computaci贸n paralela en el producto Data Mart Hi-Spins. El uso del paralelismo proporcion贸 a Miguel Torres, as铆 como a otros usuarios del producto, mayores velocidades de acceso a la informaci贸n almacenada en su base de datos multi-dimensional, y por tanto permiti贸 extender su uso e implantar nuevas aplicaciones con mucho mayor volumen de informaci贸n.
 

Los enfoques de la paralelizaci贸n

El producto Hi-Spins fue desarrollado por Software Greenhouse en el a帽o 1994, originalmente para sustituir una aplicaci贸n tipo EIS, que hab铆a decepcionado a sus usuarios debido a la lentitud de sus tiempos de respuesta. Miguel Torres fue la tercera empresa que adquiri贸 el producto, en el mes de Diciembre de 1994. Hoy el producto est谩 en la versi贸n 10 y entre sus usuarios m谩s destacados podemos nombrar empresas como Boehringer Ingelheim, Pastas la Familia, Grupo Axel Springer, Mitsubishi Electric, Perfumer铆a Gal, Pierre Fabre Ib茅rica y muchas otras.

Hi-Spins es una aplicaci贸n de la tecnolog铆a Data Warehouse a la problem谩tica de las medianas empresas, (entre las cuales podemos contar muchas de las subsidiarias espa帽olas de las empresas multinacionales).

El objetivo del proyecto es una reducci贸n substancial de los tiempos de respuesta, mediante la introducci贸n de t茅cnicas de procesos paralelos en el motor de la base de datos de Hi-Spins. Dicho motor, que podr谩 trabajar sobre m煤ltiples procesadores, se beneficiar谩 de la opci贸n de distribuir los datos en m煤ltiples discos y tratarlos con procesos paralelos.

En principio se consideraron dos alternativas para lograr el objetivo. La primera opci贸n consist铆a en dividir el Data Warehouse en segmentos que se distribuir铆an entre varias unidades de disco en uno o varios ordenadores. Entonces, los distintos segmentos del Data Warehouse ser铆an tratados por m煤ltiples procesos paralelos de lectura y acumulaci贸n. Dichos procesos podr铆an ser ejecutados en uno o m煤ltiples procesadores, en un ordenador o m煤ltiples ordenadores.

La segunda opci贸n se basaba en la t茅cnica de replicaci贸n, teniendo varias copias del Data Warehouse en diferentes unidades de disco. En este caso, cada uno de los procesos paralelos de lectura y acumulaci贸n, tendr铆a asignado un segmento distinto del Data Warehouse. 

La segunda opci贸n permit铆a aumentar la redundancia pero a la vez introduc铆a la opci贸n de alta disponibilidad. En caso de un fallo de alguna de las unidades, Hi-Spins seguir铆a entregando las consultas solicitadas, con un aumento proporcional del tiempo de respuesta. La opci贸n usada en cada instalaci贸n ser铆a un par谩metro de configuraci贸n del producto. El enfoque tecnol贸gico del motor de base de datos de Hi-Spins se presta especialmente a la introducci贸n del paralelismo. Su estrategia, en vez de la utilizaci贸n de muy altos niveles de redundancia (la utilizada por la mayor铆a de los Data Warehouse), consiste en leer y procesar a grandes velocidades muy grandes cantidades de registros, almacenados en forma altamente comprimida. Esta estrategia tiene como consecuencia un bajo requerimiento de espacio en discos, pero sobre todo una puesta en marcha mucho m谩s sencilla (debido a un menor nivel de redundancias) y tambi茅n tiempos m谩s cortos de mantenimiento del Data Warehouse.

Como contrapartida tiene ciertas limitaciones del tama帽o del Data Warehouse, ofreciendo sin embargo excelentes prestaciones a los m谩s t铆picos usuarios de este tipo de software en Espa帽a, como son por ejemplo los departamentos de marketing de las empresas que generan de 1 a 5 millones de l铆neas de pedidos al a帽o. Con la introducci贸n del paralelismo, un esfuerzo de desarrollo relativamente peque帽o permiti贸 aumentar las posibilidades del producto.
 

Los Integrantes del Proyecto

El proyecto Bonanova est谩 asociado al proyecto ESPRIT CEPBA-TTN orientado a la promoci贸n de los procesos y redes de alto rendimiento (HPCN) en la industria y muy especialmente entre las peque帽as y medianas empresas. Dentro de este proyecto el CEPBA (UPC) forma parte de una red de Nodos de Transferencia de Tecnolog铆a a nivel de la Uni贸n Europea, cuya funci贸n es facilitar la transferencia de tecnolog铆as, intercambio de experiencias, aprovechamiento de sinergias y divulgaci贸n de los resultados. El CEPBA, dirigido por el profesor Jes煤s Labarta, es fue a su vez uno de los participantes del proyecto y aport贸 al proyecto Bonanova la experiencia en las t茅cnicas de paralelizaci贸n e intervino por tanto, de manera m谩s significativa en la fase de an谩lisis de las posibles alternativas de la paralelizaci贸n, as铆 como en el an谩lisis y publicaci贸n de los resultados.

Software Greenhouse es una empresa fundada en el a帽o 1992, con una clara orientaci贸n a la utilizaci贸n de las avanzadas tecnolog铆as inform谩ticas, para obtener productos de alto rendimiento. Aparte del producto propio Hi-Spins, es distribuidor de una amplia gama de productos para object mirroring y alta disponibilidad de sistemas de la empresa Vision Solutions y realiza proyectos de consultor铆a especializada para grandes empresas.

Las Empresas Miguel Torres son un conocido grupo empresarial perteneciente a la familia Torres, dedicado a la producci贸n de vinos. Aparte de la alta calidad de sus productos, se destaca por su af谩n de excelencia en el 谩rea de Gesti贸n y de los Sistemas de Informaci贸n.

Para el Director de Sistemas de Informaci贸n de las empresas Miguel Torres, la implantaci贸n del producto Hi-Spins como herramienta para el an谩lisis de ventas, signific贸 un salto cualitativo en este 谩rea. Hi-Spins permite a los usuarios finales, sin la ayuda de los inform谩ticos, formular una gran cantidad de consultas diferentes y obtener los resultados con unos tiempos de respuesta incomparables con las herramientas usadas anteriormente.

La funci贸n de las Empresas Miguel Torres en el proyecto fue la de concretar las 谩reas de requerimientos de mejoras m谩s importantes, colaborar con las definiciones de las pruebas a realizar y en las mediciones de tiempos de respuesta antes y despu茅s del proyecto, ser el primer usuario de la versi贸n paralelizada de Hi-Spins y realizar demostraciones para otros usuarios actuales, as铆 como para posibles futuros usuarios de Hi-Spins.
 

Los Beneficios

El principal beneficio del proyecto Bonanova para los usuarios de Miguel Torres fue la capacidad de realizar un an谩lisis de informaci贸n a煤n m谩s profundo en menos tiempo e implantar nuevas aplicaciones con a煤n mayores vol煤menes de informaci贸n, tales como la aplicaci贸n financiera. 脡sta 煤ltima requiri贸 una compleja reagrupaci贸n de las cuentas y conceptos definidos en los planes contables de la empresa.

Todos los usuarios de las aplicaciones implantadas se beneficiaron con el proyecto: Consideremos por ejemplo una instalaci贸n con 20 usuarios de los cuales cada uno efect煤a diariamente un promedio de 75 consultas con los tiempos de respuesta entre 10 y 120 segundos. Esto representa aproximadamente 75 minutos diarios por usuario y en un mes da un total de 500 horas con un coste promedio de 36 Euros / hora. El coste mensual por tanto ser铆a de 18.000 Euros logrando reducir los tiempos de respuesta a la mitad, se obtiene un ahorro mensual de 9.000 Euros.

Pero aparte de este ahorro existe un factor a煤n m谩s importante: Como ya se ha comprobado en la mejora de los tiempos de respuesta estimulan al usuario para profundizar en el an谩lisis de la informaci贸n, lo cual redunda en unos beneficios indirectos dif铆cilmente calculables, pero seguramente mayores que los calculados mediante una simple valoraci贸n del tiempo dedicado por los usuarios.

El beneficio que persegu铆a Software Greenhouse con el proyecto, aparte de la mayor satisfacci贸n de sus usuarios, la cual a su vez redunda en un mayor prestigio de su producto, es hacer su producto m谩s competitivo y a la vez m谩s conocido en el mercado, mediante el 茅xito de un proyecto patrocinado por la UE.
 

Las Fases del Proyecto Bonanova

El proyecto estuvo dirigido por Juan Carlos G贸mez, socio y director t茅cnico de Software Greenhouse. El nombre del proyecto proviene de la ubicaci贸n de las oficinas de Software Greenhouse, junto a la conocida Plaza de la Bonanova en Barcelona. Las actividades del proyecto no se limitaron, sin embargo, a esta localidad: muchas de las pruebas se realizaron en los ordenadores de la UPC y toda la fase de las pruebas piloto en entorno real se realizar贸 en las instalaciones de Miguel Torres en Vilafranca del Pened茅s.

El proyecto se dividi贸 en cuatro fases importantes. La primera comienz贸 por un an谩lisis detallado de la implementaci贸n actual, en la cual se utiliz贸 una serie de herramientas que dispon铆a el CEPBA para este prop贸sito y que proporcionaron unas mediciones exactas de los distintos elementos de los procesos. Se definieron los conjuntos de datos de pruebas y los distintos tipos de procesos caracter铆sticos para el producto, cuyos par谩metros fueron medidos en distintos entornos antes y despu茅s del proyecto.

Esta fase incluy贸 tambi茅n el propio dise帽o detallado de la paralelizaci贸n de los procesos de Hi-Spins. Se realiz贸 el an谩lisis del impacto de uso de m煤ltiples discos, de las estrategias de distribuci贸n o replicaci贸n del Data Warehouse, la estructura de los futuros procesos paralelos y el soporte de alta disponibilidad del sistema. Se evalu贸 la utilizaci贸n de 鈥渕ultithreading鈥 y de I/O as铆ncrono. Para la predicci贸n de rendimientos se utiliz贸 una herramienta denominada 鈥淒IMEMAS鈥, desarrollada con anterioridad en la UPC.

La segunda fase consisti贸 en la implantaci贸n del paralelismo en el producto Hi-Spins con las caracter铆sticas decididas en la fase anterior y la evaluaci贸n preliminar de los resultados por los propios desarrolladores.

En la tercera fase, en la cual tuvieron un papel muy importante los usuarios finales y el departamento de Sistemas de Informaci贸n de Miguel Torres, se implant贸 la versi贸n piloto del producto con los procesos paralelos en dicha instalaci贸n. Una vez realizadas las mediciones en un entorno real se analizaron las observaciones y sugerencias de los usuarios y se procedi贸 a la optimizaci贸n del c贸digo. Se verific贸 en especial el cumplimiento de todas aquellas sugerencias que Miguel Torres aport贸 al iniciarse el proyecto.

Una vez cumplidos los prop贸sitos de la fase 3, comenz贸 la 煤ltima fase, en la cual se implant贸 la nueva versi贸n del producto en otras dos instalaciones, que no habian participado en el proyecto. Se evaluaron los incrementos de velocidades en las consultas t铆picas de 茅stas instalaciones y los resultados de las mediciones obtenidas fueron utilizados para determinar las posibilidades de existencia de otras reservas y oportunidades para futuras optimizaciones.
 

para-mas-info-software-greenhouse
Para m谩s informaci贸n sobre Proyectos de Business Intelligence, no dudes en consultarnos
 
DOCUMENTACI脫N HI-SPINS

Presentaci贸n Hi-Spins - Flash Video
hi-spins-flash-video


hi-spins-novedades-10.3.xHi-Spins   Novedades 10.3.x

(Para versiones anteriores, no dudes en consultarnos)

CONTACTO
500 caracteres restantes
D脫NDE ESTAMOS
BARCELONA
Figueres, 8
08022 Barcelona
MADRID
Santo 脕ngel, 110
(Entrada por Ctra. de Canillas, 16)
28043 Madrid
Centralita: +34 93 253 16 50
Soporte clientes: +34 93 212 15 66

S5 Box (1/2-50%, 3/4-40, 5/6-30, 7/8-20, 9/10-80%)

Login

Register

You need to enable user registration from User Manager/Options in the backend of Joomla before this module will activate.