München/ Palo Alto (Kalifornien), 02. Februar 2017 – Im Lieferumfang von Cloudera Enterprise 5.10 ist jetzt auch Apache Kudu enthalten. Die Open Source basierende Storage-Engine für die Analyse sich schnell verändernder Daten vereinfacht den Weg zu Echtzeit-Analysen. Mit Kudu können Anwender schnell auf anfallende Daten reagieren, um bessere Entscheidungen zu treffen.
„Die Analyse von Echtzeit-Daten stellte in der Vergangenheit eine große Herausforderung für Unternehmen dar, weil für das Zusammenführen von Stream-Verarbeitung in Echtzeit und Batch-Analyse eine komplexe Lambda-Architektur nötig war. Mit einer einzigen Storage-Engine, die beide Anforderungen abdeckt, erleichtert Kudu diese Architektur erheblich“, so Charles Zedlewski, Senior Vice President of Products bei Cloudera. „Anspruchsvolle Workloads, die zunehmend auch neue Machine-Learning-Modelle enthalten, können Cyber-Bedrohungen identifizieren, Wartungsprobleme vorhersagen und für alle Arten von Online-Berichten die Genauigkeit erhöhen.“
Kudu wurde von Grund auf neu entwickelt, um sich Innovationen der Hardware-Landschaft zunutze zu machen, beispielsweise immer günstigeren Flash- und Arbeitsspeicher. Als eigenständige Storage-Engine hat Kudu sich bereits für den geschäftskritischen Produktiveinsatz in Clustern mit Hunderten von Nodes und vielen Millionen Einsätzen pro Sekunde empfohlen. Kudu wurde speziell mit Blick auf Anwendungsbereiche gebaut, in denen schnelle Analyse-Scans im großen Maßstab benötigt werden, gleichzeitig unterstützt es rasend schnell anfallende Daten. Dies ist notwendig für den Umgang mit Zeitserien-Daten, für die Analyse von Maschinendaten, Online-Berichte oder die Anforderungen anderer analytischer oder operativer Workloads.
„Apache Kudu ist ein hervorragendes Beispiel dafür, wie sich die Apache-Hadoop-Plattform von einem eng umrissenen Set aus Apache-Projekten zu einer Mischung und Verschmelzung von Open-Source- und proprietären Technologie entwickelt hat, die im Wesentlichen eine Arbeitsumgebung für Big Data bilden“, so Tony Baer, Principal Analyst bei Ovum. „Kudu umgeht die Hürden komplexer Lambda-Architekturen und adressiert Anwendungsfelder mit sich schnell ändernden Daten, wo es enorm wichtig ist, die Datenbank schnell modifizieren und aktualisieren zu können.“
„Capgeminis Kunden werden bei der Nutzung von Big Data, Analytics und Data Science immer versierter. Damit ist auch der Bedarf an Echtzeit-Analyse-Workloads für Big und Fast Data, einschließlich IoT- und Streaming-Daten, zu einem immer zentraleren Thema geworden“, so Anne-Laure Thieullent, VP Global Big Data Solutions, Insights & Data bei Capgemini. „Die allgemeine Verfügbarkeit von Kudu ist ein großer Schritt nach vorn. Unsere Klienten sind damit in der Lage, noch wichtigere, erkenntnisorientierte Prozesse auf ihren Business-Analytics-Plattformen laufen zu lassen. Dies wird ihren Weg zur Digitalen Transformation beschleunigen.“
Weitere Verbesserungen in Cloudera 5.10
Zusätzlich zu Kudu erweitern Cloudera 5.10 (und der neu veröffentlichte Cloudera Director 2.3) weiterhin die Möglichkeiten für den Unternehmenseinsatz, etwa für Cloud-Deployments, und verbessern die Kosteneffizienz in diesen Umgebungen. Zu den Verbesserungen zählen:
* Geringere Betriebskosten für die Batch-Verarbeitung kurzzeitiger Workloads, verbunden mit besserer Performance von Apache Hive auf Amazon S3.
* Umfassendere Möglichkeiten für Auditing und Datenherkunft in der Cloud, mit Unterstützung von Single-Cluster für Cloudera Navigator auf Amazon S3.
* Schnellere Einrichtung erster Use-Case und lauffähiger Deployments über verschiedene Cloud-Umgebungen
Im September 2015 hat Cloudera die Public Beta von Apache Kudu vorgestellt und das Projekt zwei Monate später an die Apache Software Foundation (ASF) übergeben, um es einer breiteren Entwicklergemeinde zugänglich zu machen. Seitdem konnten Beiträge von Entwicklern bei State Farm, Xiaomi, Intel und anderen eingesammelt werden. Jetzt ist Kudu allgemein erhältlich und wird als Standardkomponente von Cloudera Enterprise ausgeliefert. Kunden stehen damit eine ganze Reihe stabiler Storage-Engines zur Verfügung – NoSQL, HDFS, Objektspeicher und relationaler Speicher -, um die jeweiligen spezifischen Anforderungen ihrer Einsatzszenarien abzudecken.
Cloudera bietet eine moderne Plattform für Datenmanagement und -analyse auf Basis von Apache Hadoop sowie den neuesten Open Source-Technologien. Weltweit führende Unternehmen vertrauen auf Cloudera, um mit Unterstützung von Cloudera Enterprise – der schnellsten, einfachsten und sichersten Datenplattform der Gegenwart – ihre wichtigsten geschäftlichen Herausforderungen zu meistern. Unsere Kunden erfassen, speichern, verarbeiten und analysieren auf effiziente Weise gewaltige Datenmengen und nutzen fortschrittliche Analysemethoden, um Unternehmensentscheidungen schneller, flexibler und kostengünstiger als je zuvor treffen zu können. Auf dem Weg zum Erfolg bieten wir unseren Kunden umfassenden Support, Schulungen und andere professionelle Services. Weitere Informationen finden Sie unter http://cloudera.com
Firmenkontakt
Cloudera
Deborah Wiltshire
California St. 4333
94104 San Francisco, CA
+1.650.644.3900
[email protected]
http://www.cloudera.com/
Pressekontakt
Public Footprint GmbH
Thomas Schumacher
Mendelssohnstr. 9
51375 Leverkusen
0214 8309 7790
[email protected]
http://www.public-footprint.de