Reciba actualizaciones recientes de Hortonworks por correo electrónico

Una vez al mes, recibir nuevas ideas, tendencias, información de análisis y conocimiento de macrodatos.

cta

Empezar

nube

¿Está preparado para empezar?

Descargue sandbox

¿Cómo podemos ayudarle?

cerrarBotón de cerrar
cta

Maximize the value of data-at-rest to Deliver Big Data Analytics

reproducir video button vídeo

nube ¿Está preparado para empezar?

LEA EL BLOG
HORTONWORKS DATA PLATFORM (HDP®)

HORTONWORKS DATA PLATFORM (HDP®)

HDP es la única distribución de Apache™ Hadoop® de código abierto y lista para empresas basada en una arquitectura centralizada (YARN). HDP responde a las necesidades completas de los datos en espera, impulsa las aplicaciones en tiempo real de los clientes y ofrece un análisis robusto que acelera la toma de decisiones y la innovación.

Impulsar el futuro de los datos
INICIAR SUSCRIPCIÓN
INTEGRACIÓN DE GOBERNANZA
Ciclo de vida de los datos y gobernanza
Flujo de datos
OPERACIONES
Suministro, gestión y monitoreo
Programación
SEGURIDAD
Administración, autenticación, autorización y protección de datos de auditoría
DATA ACCESS
S T
Sistema de archivos distribuidos Hadoop de HDFS
GESTIÓN DE DATOS

Piedra angular de la plataforma de datos de Hortonworks

YARN y el sistema de archivos distribuido de Hadoop (HDFS) son los componentes esenciales de la plataforma de datos de Hortonworks (HDP) para datos en reposo. Aunque HDFS proporciona el almacenamiento de información rentable, escalable y tolerante a fallas para su data lake, YARN proporciona la arquitectura centralizada que le permite procesar simultáneamente múltiples cargas de trabajo. YARN proporciona la gestión de recursos y arquitectura conectable para habilitar una amplia variedad de métodos de acceso de datos.

Más información:

Gestión de datos

Retransmisión de datos, procesamiento y motores de análisis para una variedad de cargas de trabajo

La plataforma de datos de Hortonworks incluye una amplia gama de motores de procesamiento que le permiten interactuar con los mismos datos en múltiples formas, al mismo tiempo. Esto significa que las aplicaciones para análisis de macrodatos pueden interactuar con los datos de la mejor manera: del lote a SQL interactivo o acceso de baja latencia con NoSQL. Los casos de uso emergentes para la ciencia de datos, búsqueda y retransmisión también son compatibles con Apache Spark, Storm y Kafka.

Más información:

Acceso a datos

Cargar y administrar datos de acuerdo a la política

HDP extiende acceso a datos y gestión con herramientas poderosas para el manejo de datos e integración. Proporcionan un marco confiable, repetible y simple para administrar el flujo de datos dentro y fuera de Hadoop. Esta estructura de control, junto con un conjunto de herramientas para facilitar y automatizar la aplicación de esquemas y metadatos sobre las fuentes es fundamental para la integración exitosa de Hadoop en su arquitectura de datos modernos.

Hortonworks tiene relaciones de ingeniería con muchos proveedores líderes de gestión de datos para permitir que sus herramientas funcionen y se integren con HDP.

Más información:

Gobernanza e integración de los datos

Autenticación, autorización y protección de datos

La seguridad está entretejida e integrada en HDP en capas múltiples. Las características críticas para la autenticación, autorización, rendición de cuentas y protección de datos están disponibles para ayudar a asegurar HDP a través de estos requisitos claves. Coherente con este enfoque a lo largo de todas las capacidades de Hadoop empresarial, HDP también asegura que puede integrar y extender sus actuales soluciones de seguridad para proporcionar un marco único, consistente y seguro sobre su arquitectura de datos moderno.

Más información:

Seguridad

Tomar las conjeturas de funcionamiento Hadoop

Los equipos de operaciones despliegan, monitorean y administran un clúster de Hadoop dentro de su ecosistema más amplio de datos empresariales. Apache Ambari simplifica esta experiencia. Ambari es una plataforma de gestión de fuente abierta para el suministro, gestión, monitoreo y aseguramiento de la plataforma de datos de Hortonworks. Permite que Hadoop encaje perfectamente en su entorno empresarial.

Más información:

Operaciones

Proporcionar y administrar clústeres de Hadoop en cualquier entorno de nube

Cloudbreak, como parte de la plataforma de datos de Hortonworks y desarrollado por Apache Ambari, permite el suministro simplificado y gestión de clúster de Hadoop en cualquier ambiente de nube, incluyendo Servicios Web de Amazon, Microsoft Azure, plataforma en la nube de Google y OpenStack. Optimiza el uso de los recursos de la nube conforme cambian las cargas de trabajo.

Más información:

nube

NOVEDADES EN LA PLATAFORMA DE DATOS DE HORTONWORKS 2.6

administrador

Innovación y rendimiento

  • Acceso a la última funcionalidad de ciencia de datos. Amplio soporte para los algoritmos de aprendizaje automático disponibles en Spark 2.1, Spark 1.6.3, Zeppelin 0.7 y Livy REST API
  • Hive LLAP para producción. Gane rendimiento conjunto 10 veces más rápido con filtración de tiempo de ejecución dinámica
  • Cumplimiento de ACID. Acelere y habilite en gran medida los cambios de transmisión/microlotes en el almacén de datos Hive a través de actualizaciones incrementales
  • Rendimiento de consultas de subsegundo para las herramientas de BI. Los clientes ya no necesitan replicar datos en Hadoop al almacenarlos primero en una base de datos analítica basada en SQL
administrador

Listo para la empresa

  • Exportación e importación de políticas de seguridad de Ranger. Mejore la productividad al mover las políticas de seguridad en lotes de un entorno a otro
  • Extienda el soporte de políticas basadas en etiquetas Atlas a lo largo del ecosistema. Habilite la clasificación basada en la cobertura de flujos de trabajo de seguridad para HDFS, Kafka y HBase
  • Fila/columna de seguridad. Implemente el control de acceso de datos granulares en cada nivel de la pila de Hadoop, incluyendo Spark y Hive
  • Soporte SSL para conexiones de retransmisión Spark a Kafka. Proporcionan entornos seguros para la retransmisión de Spark y Kafka
administrador

Facilidad de uso

  • Inicio automático de servicio. Configure fácilmente los servicios y componentes que deben iniciarse automáticamente si se reinicia un nodo del clúster o si el daemon se cierra inesperadamente
  • Configuración de rotación de registro simplificado. Configure rápidamente el número y tamaño de los archivos de respaldo de todos los componentes
  • Visualización de operación y usuario HDFS TopN. Obtenga visibilidad en las operaciones más frecuentes realizadas en el NameNode y sobre quién realiza las operaciones
  • Soporte de paquetes para PySpark (API de Spark Python) y SparkR: los científicos de datos que usan Spark con el lenguaje R ahora pueden implementar su paquete favorito R con su trabajo de Spark
Descargas de HDP

Probar las últimas características de HDP y funcionalidad con Hortonworks Sandbox o establecer HDP para un entorno de producción, instalar y configurar los clústeres.

Complementos de HDP

Si desea complementos de HDP para conectar con las populares herramientas de BI, generamos consultas de búsqueda y mucho más.