Alternative zu Cloudera und Databricks.

Eigenschaften-Symbol

Offen und kostengünstig – Im Gegensatz zu proprietären Plattformen wie Cloudera oder Databricks ist Ilum eine offene Plattform, die kostenlos genutzt werden kann. Sie behalten die volle Kontrolle über Ihre Daten-, Analyse- und KI-Workflows ohne teure Lizenzgebühren und ohne Anbieterbindung.

Datenherkunft

Verfolgen Sie Ihre Die Reise der Daten muss nicht unbedingt Kopfschmerzen bereiten. Mit Ilum's Automatische Datenherkunft, werden Sie immer wissen Wer, wannund wie Es wurden Änderungen an Ihren Tabellen vorgenommen. Jede Transformation, ob durch Spark-Aufträge oder SQL-Abfragen, wird automatisch in der Datei Ansicht der Datenherkunft– Keine Einrichtung erforderlich.

Aufgebaut auf dem Offenes Lineage-Frameworkstellt Ilum die Kompatibilität mit branchenführenden Tools sicher und bietet Ihnen gleichzeitig die Möglichkeit, Verfolgen Sie die vollständige Historie Ihrer Tabellen.

Vereinfachen Sie die Datenverfolgung und behalten Sie die Kontrolle mit der robusten Datenherkunft Merkmal.

Exploration von Daten

Wollten Sie schon immer schnell verstehen, wie Ihre Daten aussehen, bevor Sie sich in komplexe Analysen stürzen? Ilums Integrierte Tools zur Datenexploration Machen Sie es mühelos, die Form, Verteilungund wichtige Merkmale – und das alles, ohne dass komplexe Abfragen oder Skripts erforderlich sind.

Ilum verfügt außerdem über eine Schnelles Visualisierungstool, mit dem Sie Diagramme wie Balkendiagramme oder Streudiagramme im Handumdrehen erstellen können. Mit nur wenigen Klicks können Sie Rohdaten direkt auf der Plattform in klare, visuelle Einblicke verwandeln.

Und das Beste daran? Es gibt Sie müssen Ihre Daten nicht exportieren auf externe Tools. Alles, was Sie brauchen, um Ihre Daten zu untersuchen, zu visualisieren und zu verstehen, ist direkt in Ilum integriert, sodass Sie sich auf das Wesentliche konzentrieren können – Ihre Analyse.

SQL-Editor

Ilums SQL-Editor Vereinfacht die Abfrage und das Datenmanagement. Ausführen von Abfragen mit Delta, Eisberg, Hudioder Spark SQL von einer vertrauten Benutzeroberfläche aus und Speichern Sie Ihre Abfragen für die zukünftige Verwendung. Sie können Ihre Datenbanken, Tabellen und Schemas auch direkt mit der integrierten Ressourcenstruktur ansehen.

Der Editor lässt sich mit dem von Ilum Werkzeuge zur Datenexploration, sodass Sie schnell Verteilungen überprüfen oder einfache Diagramme erstellen können, ohne die Plattform zu verlassen.

Zukünftige Unterstützung für Dreieinig, Tapferund Hive-SQL wird es noch vielseitiger machen, da es mehrere Motoren an einem Ort handhaben kann.

Notizbuch

Ilum beinhaltet Jupyter Notebooks als voll integriertes Modul, so dass Sie sie ohne externe Einrichtung verwenden können. Über die Notebook-Oberfläche können Sie die volle Leistung Ihres Remote-Cluster über Spark-Microservices und den Zugriff auf alle verfügbaren Arbeitsspeicher-, Rechen- und Speicherressourcen.

Erstellen einer Spark-Sitzung und Verwenden Sparkmagic-Syntax , um Ihren Code oder Ihre SQL-Abfragen direkt auf dem Cluster auszuführen. Dadurch wird sichergestellt, dass Sie nicht durch lokale Ressourcen eingeschränkt sind und die Skalierbarkeit der Plattform voll ausschöpfen können.

Um Ihnen den Einstieg zu erleichtern, enthält Ilum mehrere Tutorial-Notizbücher Fortgeschrittene Anwendungsfälle wie die Architektur des Medaillons, Geospatial Analytics mit Apache Sedonaund vieles mehr – alles über dieselbe Benutzeroberfläche verfügbar.

BI-Integration

Ilum bietet nahtlose BI-Integration mit eingebautem JDBC-Schnittstelle, sodass Sie Tools wie Tisch, PowerBIoder Apache-Obermenge direkt in Ihr Data Lakehouse. So haben Sie sofortigen Zugriff auf alle Ihre definierten Daten ohne zusätzliche Schritte.

Alles läuft durch Funke, sodass Sie es so konfigurieren und skalieren können, dass es Workloads jeder Größe bewältigen kann – von der Erstellung kleiner Berichte bis hin zur Unterstützung großer, komplexer Dashboards.

Datenkatalog

Ilums Datenkatalog Hält Ihre Tabellen und Datenbanken an einem Ort organisiert, sodass Sie nicht mehr über verschiedene Tools hinweg nach Daten suchen müssen. Derzeit lässt sich Ilum in Hive-Metastore, das eine zuverlässige Möglichkeit bietet, Ihre Metadaten zu verwalten.

In der nächsten Version planen wir, Unity-Katalog Standard, unterstützt aber weiterhin mehrere Kataloge wie Bienenkorb, Einheitund Apache Nessie.

Darüber hinaus arbeiten wir daran, Unterstützung für Standarddatenbanken wie PostgreSQL und MS SQL, sodass Sie sie an dieselbe Schnittstelle anschließen können, was die Datenverwaltung einfacher und zentralisierter macht.

Spark-Microservices

Ilums Spark-Microservices Lösen Sie das Problem der langen Initialisierungszeiten in Spark-Aufträgen. Anstatt 20 bis 40 Sekunden auf den Start jedes Jobs zu warten, verwendet Ilum langlebige Spark-Sitzungen die einmal initialisiert werden und nachfolgende API-Aufrufe sofort verarbeiten, wodurch Verzögerungen vermieden werden.

Diese Funktion eignet sich perfekt für erweiterte Workflows wie Retrieval-Augmented Generation (RAG). Sie können einen Microservice erstellen, der kontextspezifische Daten von Webseiten oder Dokumenten abruft, verarbeitet und die Ergebnisse über eine API. Integrieren Sie diese API in Tools wie Chatbots für kontextbezogene Antworten in Echtzeit, um die Arbeitsabläufe der RAG skalierbar und effizient zu gestalten.

Spark-Jobs

Ilum vereinfacht das Laufen Spark-Jobs auf Kubernetes und bietet alle Tools, die Sie benötigen, auf einer Plattform. Sie können Launch-Jobs Planen Sie sie über die Benutzeroberfläche oder die REST-API, und passen Sie die Konfigurationen an Ihre Workload an.

Mit dem Server für den Spark-Verlauf Wenn Sie sofort eingerichtet sind, erhalten Sie direkt in der Benutzeroberfläche einen vollständigen Einblick in die Auftragsleistung. Für tiefere Einblicke integriert sich Ilum mit Grafana-Dashboards, mit dem Sie Metriken überwachen und Ihre Aufträge effektiv optimieren können.

Ilum beseitigt den Aufwand für die Verwaltung von Spark auf Kubernetes und eliminiert komplizierte Setups oder Fehlerbehebungen. Egal, ob es sich um kleine Abfragen oder die Verarbeitung von Terabytes an Daten handelt, Ilum ist bereit, diese effizient zu bewältigen.

Module

Ilums Module wurden entwickelt, um komplexe Data-Engineering-Workflows zu rationalisieren, indem vorkonfigurierte Komponenten direkt in die Plattform integriert werden. Diese Module können über die Benutzeroberfläche verwendet werden, sodass keine separaten Setups oder manuellen Integrationen erforderlich sind.

Zu den aktuellen Modulen gehören Apache-Obermenge für BI-Visualisierungen, Apache Airflow für Workflows und MLflow (Englisch) oder Jupyter Notebooks für maschinelles Lernen. Kommende Ergänzungen wie dbt, Apache NiFiund Mage.ai wird die Flexibilität der Plattform weiter erhöhen.

Das Ziel ist einfach: Bringen Sie die Tools, die Sie bereits kennen und auf die Sie sich verlassen, in ein einheitliches Ökosystem, damit Sie sich auf technische Lösungen konzentrieren können, ohne zwischen den Plattformen hin- und herwechseln zu müssen.

Multi-Cluster-Unterstützung

Ilums Multi-Cluster-Unterstützung Ermöglicht es Ihnen, eine Verbindung mit mehreren Clustern herzustellen und mit ihnen zu arbeiten, auch wenn es sich um unterschiedliche Typen handelt, z. B. Kubernetes (Englisch), GARNoder lokale Cluster für das Debuggen.

Diese Flexibilität ermöglicht es Ihnen, Migrationen zu verwalten, Benchmarking-Tests Indem Sie denselben Auftrag auf verschiedenen Clustern ausführen, und vergleichen Sie die Leistung mit Leichtigkeit. Es ist auch ideal für das Teammanagement, wo Sie Isolierte Umgebungen Verwendung von Kubernetes-Namespaces, um Ressourcen ohne Interferenz zuzuweisen.

Darüber hinaus können Sie Cluster mit unterschiedlichen Einstellungen oder Speicherlösungen konfigurieren, und Ilum kümmert sich um den Rest, indem es Einfügen der richtigen Konfigurationen direkt in Ihre Spark-Aufträge.

Entwickelt für die Datenexploration

Ihre Daten, sicher und zugänglich

Jupyter Notebooks sind direkt in Ilum integriert und ermöglichen eine nahtlose Datenexploration und -analyse in einer sicheren Plattformumgebung.

Ihre Daten, sicher und zugänglich

Erstellen Sie Echtzeit-Interaktion mit Spark-Sitzungen über die Benutzeroberfläche und die API

Hebelkraft Nahtlose Integration zwischen Spark Streaming und Object Storage , um Datenverarbeitung in Echtzeit. Erreichen Latenz in Millisekunden indem Sie Ihre Spark-Sitzungen direkt mit dem Benutzeroberfläche (UI) und API.

Dieser Ansatz ermöglicht es Ihnen, Streamen Sie Daten und lösen Sie sofort Aktionen aus sowohl vom Frontend als auch vom Backend. Ob es Visualisierung von Echtzeitdaten oder Auslösen von Spark-Berechnungen über API-Aufrufekönnen Sie mit Ihrer Spark-Umgebung interagieren mit Keine Verzögerung. Dies verbessert die Reaktionsfähigkeit Ihrer Anwendungen und ermöglicht Schnelle Entscheidungsfindung mit Echtzeit-Einblicken.

Entdecken Sie das Spark-Ökosystem
Artikel-Banner

Verwalteter Spark-Cluster

Verwenden Sie eine Verwalteter Spark-Cluster , um die Bereitstellung, Verwaltung und Skalierung von Apache Spark-Workloads zu vereinfachen. Mit einer verwalteten Lösung können Sie sich auf Folgendes konzentrieren Datenverarbeitung und -analyse während die zugrunde liegende Infrastruktur automatisch verwaltet wird.

Ein Verwalteter Spark-Cluster liefert Automatische Skalierung, Überwachungund Nahtlose Integration mit Speicher- und Rechenressourcen, um sicherzustellen, dass Ihre Spark-Aufträge effizient ausgeführt werden. Dadurch entfällt die Notwendigkeit einer manuellen Konfiguration, was die Optimieren Sie die Leistung und den Betriebsaufwand zu reduzieren. Die verwaltete Umgebung bietet eine zuverlässige und skalierbare Plattform für die Ausführung von Big-Data-Workloads, ohne die Komplexität, einen Cluster selbst zu verwalten.

Artikel-Banner

Flexibler Einsatz, Ihre Wahl

Cloud, On-Premises oder Hybrid – Ilum passt sich Ihrem Setup an

Führen Sie Ihre Datenlösungen in jeder Umgebung aus und verwalten Sie sie, sodass Sie frei wählen können, was für Ihre Infrastruktur am besten geeignet ist.

Cloud, On-Premises oder Hybrid – Ilum passt sich Ihrem Setup an

Nahtloses Debuggen an einem Ort

Optimieren Sie Ihren Entwicklungsprozess, indem Sie eine Integrierte Umgebung , die es Ihnen ermöglicht Nahtloses Debuggen über alle Komponenten Ihrer Anwendung hinweg. Da sich alles an einem Ort befindet, können Sie Probleme in Echtzeit überwachen, beheben und beheben, ohne zwischen verschiedenen Tools oder Plattformen wechseln zu müssen.

Dieser Ansatz bietet Umfassende Debugging-Tools, sodass Sie Verfolgen Sie Protokolle, überwachen Sie die Leistung und untersuchen Sie Fehler über den gesamten Stack hinweg – ob es sich um Backend-Services, APIs oder die Benutzeroberfläche handelt. Indem Sie eine Zentralisierter Arbeitsbereich für das Debuggenverbessern Sie die Effizienz und reduzieren den Zeitaufwand für die Identifizierung und Behebung von Problemen, um einen reibungsloseren Entwicklungs- und Bereitstellungszyklus zu gewährleisten.

Artikel-Banner

Überprüfen Sie, wie es funktioniert

Unsere Pläne skalieren mit Ihren Bedürfnissen. Von kostenlosen bis hin zu Unternehmenslösungen

Flexible Pläne für jeden Bedarf: Kostenlos starten, mit Ihrem Wachstum skalieren

Grundlegend

Gemeinschaft

Ihr eigenes Managed Data Lakehouse

Für immer kostenlos

Loslegen!
Funktion ist vorhanden

Cloud / Onprem / Hybrid

Funktion ist vorhanden

Multi-Cluster-Unterstützung

Funktion ist vorhanden

Interaktive Sitzungen

Funktion ist vorhanden

Kostenlos - Ihre Lizenz für immer kostenlos

Weiterlesen
Fortgeschritten

Unternehmen

Dedizierter Support und benutzerdefinierte Konfigurationen

Funktion ist vorhanden

Vorrangiger Enterprise-Support

Funktion ist vorhanden

Benutzerdefinierte Module/Integrationen

Funktion ist vorhanden

Engagierter Ingenieur

Funktion ist vorhanden

Benutzerdefiniertes SLA

Funktion ist vorhanden

Onboarding, Schulung und Migrationssupport

Weiterlesen
Demnächst!

Verwaltete Cloud

Automatisierung plus Funktionen der Enterprise-Klasse

Funktion ist vorhanden

Wählen Sie Ihre Zone

Funktion ist vorhanden

AWS / GCP / Azure

Funktion ist vorhanden

Kostenlose Hilfe bei der Migration

Funktion ist vorhanden

Automatische Skalierung

Funktion ist vorhanden

Benutzerdefinierte Datenaufbewahrung

Weiterlesen

Hast du ein paar Ideen, wie du Ilum verbessern kannst?

Wir schätzen Ihr Feedback und sind immer bestrebt, uns zu verbessern. Wenn Sie Vorschläge haben, die Ihre Erfahrung verbessern oder die Navigation im Produkt erleichtern könnten, teilen Sie uns dies bitte mit. Gestalten Sie mit uns die Zukunft unserer Plattform! Ihr Input ist wichtig.

Feature-Anfrage hinzufügen
EN
HI
AR
BN
FR
ID
IT
ES
PT
ZH-HANS
DE