cta

Get Started

nube

¿Está preparado para empezar?

Descargue sandbox

¿Cómo podemos ayudarle?

cerrarBotón de cerrar
cta

Apache Hadoop Data Warehouse Architecture
for EDW Optimization

Reduzca los costes moviendo los datos y procesándolos con Hadoop®

nube Learn more about the economic impact of using Hortonworks HDP

DOWNLOAD WHITEPAPER

What is an EDW?

Enterprise Data Warehouse (EDW) is an organization’s central data repository that is built to support business decisions. EDW contains data related to areas that the company wants to analyze. For a manufacturer, it might be customer, product or bill of material. EDW is built by extracting data from a number of operational systems. As the data is fed into EDW it is converted, reformatted and summarized to present a single corporate view. Data is added into the data warehouse over time in the form of snapshots and normally EDW contains data spanning 5 to 10 years.

EDW Optimization

Problems with a typical EDW

El almacén de datos de la empresa se ha convertido en un componente estándar de la arquitectura de datos corporativa. Sin embargo, la complejidad y el volumen de los datos ha supueso algunos retos interesantes para la eficiencia de las soluciones EDW existentes.

Darse cuenta del potencial transformador de los macrodatos depende de la capacidad de gestionar la complejidad de las corporaciones mientras movilizan las fuentes de datos para todos los tipos como los sociales, web, IoT y más. La integración de las neuvas fuentes de datos en el sistema existente EDW impulsará a las corporaciones dar unas analíticas más profundas. Más importante aún, está connvirtiéndose en un reto para las tecnologías EDW existentes para proporcionar un entorno eficiente con un rendimiento óptimo, escalabilidad y flexibilidad.

Elementos de soluciones

Hortonworks Data Platform

icon6.png

Las capacidades de Hadoop para la gobernanza e integración de los datos, la gestión de los datos, el acceso de los datos, la seguridad y las operaciones - creados para la integración profunda con su tecnología de centro de datos existente. Más información

Syncsort

icon6.png

Software ETL de alto rendimiento para acceder y abordar a las empresas de datos tradicionales a HDP. Más información

AtScale

icon6.png

La interfaz de negocios para una rápida inteligencia de negocios (BI) en Hadoop para unir la brecha entre los usuarios de negocios y sus datos. Más información

SERVICIOS PROFESIONALES

icon6.png

Orientación experta y soporte para probar rápidamente el valor de su nueva arquitectura y maximizar el valor de los datos comprobados y validadeos de Hortonworks. Más información

Optimizing EDW with Apache Hadoop ®

Flexible

icon6.png

Data can be loaded in HDP without having a data model in place

icon6.png

Data model can be applied based on the questions being asked of data (schema-on-read

icon6.png

HDP is designed to answer questions as they occur to the user

Efficient

icon6.png

100% of the data is available at granular level for analysis

icon6.png

HDP can store and analyze both structured and unstructured data

icon6.png

Data can be analyzed in different ways to support diverse use cases

Cost Effective

icon6.png

HDP (Hortonworks Data Platform) is 100% open - there is no licensing fee for software

icon6.png

HDP runs on commodity hardware

icon6.png

New data can be landed in HDP and used in days or even hours

Use-Cases on EDW Optimization

CASO DE USO 1
img multimedia

IB rápido en Hadoop

Los sistemas propiedad de EDW se adoptaron para un IB rápido y un análisis profundo, pero los precios EDW son insosteniblemente altos y esos sistemas no adoptaron los retos de macrodatos modernos como los datos no esructurados y los análisis de gran escala.

Hortonworks makes fast BI on Hadoop a reality, with the combination of a fast in-memory SQL engine to create data marts with an OLAP cubing engine that lets you query huge datasets in seconds. This gives you the choice of querying pre-aggregated data for maximum performance or in full-fidelity form when the nest grains of detail are needed, allowing access from any major BI tool that supports ODBC, JDBC or MDX.

Más información

CASO DE USO 2
img multimedia

PROCESOS ETL A BORDO PARA HADOOP

A typical EDW spends between 45 to 65 percent of its CPU cycles on ETL processing.These lower-value ETL jobs compete for resources with more business-critical workloads and can cause SLA misses. Hadoop can offload these ETL jobs with minimal porting effort and at substantially lower cost, saving money and freeing up capacity on your EDW for higher-value analytical workloads. Hortonworks makes it easy by providing high-performance ETL tools, a powerful SQL engine and integration with all major BI vendors.

Más información

CASO DE USO 3
img multimedia

DATOS DE ARCHIVO EN HADOOP

Aumenar los volúmenes de datos y las presoines de costes obliga a muchas empresas archivar antiguos datos a guardarlos donde no pueden analizarse o deben recuperarse a un alto coste.

Hadoop ofrece coste por terabyte a la par con las soluciones de recuperación. Debido al coste atractivo, puede almacenar años de datos en lugar de meses. Todos los datos de empresa permanecen disponibles para su recuperación, solicitud, y análisis profundo con las mismas herramientas que utiliza en sistemas EDW existentes.

Más información