Reciba actualizaciones recientes de Hortonworks por correo electrónico

Una vez al mes, recibir nuevas ideas, tendencias, información de análisis y conocimiento de macrodatos.

cta

Empezar

nube

¿Está preparado para empezar?

Descargue sandbox

¿Cómo podemos ayudarle?

cerrarBotón de cerrar
cta

Arquitectura del almacén de datos de Apache Hadoop para optimización de EDW

Reduzca los costes moviendo los datos y procesándolos con Hadoop®

nube Hortonworks es un líder. Leer el Forrester Wave.

DESCARGAR informe

¿Qué es un EDW?

El almacén de datos de la empresa (EDW) es el repositorio de datos central de la organización construida para apoyar las decisiones de negocios. EDW contiene datos relacionados con las áreas que la empresa quiere analizar. Para un fabricante, podría ser de clientes, productos o lista de datos materiales. EDW se construye al extraer los datos de un número de sistemas operativos. Conformen se alimentan los datos en el EDW, se convierten, formatean y resumen para presentar una visión corporativa única. Se agregan los datos en el almacén de datos conforme pasa el tiempo en forma de instantáneas y un almacén de datos de la empresa contiene normalmente datos de 5 a 10 años. Una arquitectura de almacén de datos Hadoop permite el análisis más profundo y reporte avanzado de estos diversos conjuntos de datos.

Optimización de EDW

Problemas con un EDW típico

El almacén de datos de la empresa se ha convertido en un componente estándar de la arquitectura de datos corporativa. Sin embargo, la complejidad y el volumen de datos ha planteado algunos retos interesantes para la eficacia de las soluciones existentes de EDW.

Darse cuenta del potencial transformador de los macrodatos depende de la capacidad de gestionar la complejidad de las corporaciones mientras movilizan las fuentes de datos para todos los tipos como los sociales, web, IoT y más. La integración de las nuevas fuentes de datos en el sistema existente EDW impulsará a las corporaciones dar unas analíticas más profundas. Más importante aún, la optimización de EDW que utilizan Hadoop proporciona un entorno rentable con un rendimiento óptimo, escalable y flexible.

Elementos de soluciones

Plataforma de datos de Hortonworks

*

La arquitectura del almacén de datos de Hadoop para la gobernanza e integración de los datos, la gestión de los datos, el acceso de los datos, la seguridad y las operaciones— creados para la integración profunda con su tecnología de centro de datos existente. Más información

Syncsort

*

Descarga EDW a Hadoop: ETL de alto rendimiento para acceder y abordar a las empresas de datos tradicionales a HDP. Más información
 
 

JethroData

*

Motor de alto rendimiento analítico para BI interactivo sobre Hadoop Big Data. Más información

SERVICIOS PROFESIONALES

*

Orientación experta y soporte para probar rápidamente el valor de su nueva arquitectura y maximizar el valor de los datos comprobados y validadeos de Hortonworks. Más información

Optimización de EDW con Apache Hadoop®

Flexible

*

Los datos pueden ser cargados en HDP sin contar con un modelo de datos

*

El modelo de datos puede ser aplicado con base en las preguntas realizadas sobre los datos (schema-on-read

*

HDP está diseñado para responder a preguntas conforme le surgen al usuario

Eficiente

*

El 100 % de los datos está disponible a nivel detallado para análisis

*

HDP puede almacenar y analizar datos estructurados y no estructurados

*

Los datos pueden analizarse de diferentes maneras para soportar casos de uso diverso

Rentable

*

HDP (plataforma de datos de Hortonworks) es 100 % abierto; no hay ninguna cuota de licencia para software

*

HDP se ejecuta en hardware básico

*

Los nuevos datos se pueden descargar en HDP y se pueden usar en días o incluso horas

Casos de usos en la optimización de EDW

CASO DE USO 1
img multimedia

BI interactivo en Hadoop

Los sistemas propiedad de EDW se adoptaron para un IB rápido y un análisis profundo, pero los precios EDW son insosteniblemente altos y esos sistemas no adoptaron los retos de macrodatos modernos como los datos no esructurados y los análisis de gran escala.

Hortonworks y JethroData hace que el BI rápido en Hadoop sea una realidad, con la combinación de un motor SQL rápido en memoria para crear almacenes de datos con motor analítico de alto rendimiento para un BI interactivo le permite apoyar a 1.000 usuarios recurrentes y consultar conjuntos de datos en segundos. JethroData creará dinámicamente índices y cubos, reduciendo el costo de instalación inicial y tiempo. El acceso estándar a todos los datos de Hadoop es compatible con las herramientas de BI existentes como Tableau, Qlik o Microstrategy.

Más información

CASO DE USO 2
img multimedia

PROCESOS ETL A BORDO PARA HADOOP

Un EDW típico gasta entre un 45 y un 65 por ciento de sus ciclos de CPU en el procesamiento ETL. Estos trabajos ETL de bajo valor compiten por los recursos con más cargas de trabajo críticas de negocios y puede causar faltas de SLA. Hadoop puede descargar en EDW estos trabajos de ETL con un esfuerzo mínimo y un menor coste, ahorrando dinero y liberando la capacidad en sus cargas de trabajo analíticas EDW de alto valor. Hortonworks hace que sea fácil al proporcionar herramientas ETL de alto rendimiento, un potente motor SQL y una integración con todos los principales vendedores IB.

Más información

CASO DE USO 3
img multimedia

DATOS DE ARCHIVO EN HADOOP

Aumenar los volúmenes de datos y las presoines de costes obliga a muchas empresas archivar antiguos datos a guardarlos donde no pueden analizarse o deben recuperarse a un alto coste.

Una arquitectura de almacén de datos de Hadoop ofrece costo por terabyte a la par con soluciones de respaldo de cinta. Debido al coste atractivo, puede almacenar años de datos en lugar de meses. Todos los datos empresariales permanecen disponibles para su recuperación, solicitud y análisis profundo con las mismas herramientas que utiliza en sistemas EDW existentes.

Más información