Einführung in Databricks

Total time
Location
At location, Online
Starting date and place

Einführung in Databricks

GFU Cyrus AG
Logo GFU Cyrus AG
Provider rating: starstarstarstarstar_border 7.9 GFU Cyrus AG has an average rating of 7.9 (out of 13 reviews)

Need more information? Get more details on the site of the provider.

Starting dates and places
placeKöln
27 Apr 2026 until 28 Apr 2026
computer Online: Zoom
27 Apr 2026 until 28 Apr 2026
placeKöln
30 Jul 2026 until 31 Jul 2026
computer Online: Zoom
30 Jul 2026 until 31 Jul 2026
placeKöln
29 Oct 2026 until 30 Oct 2026
computer Online: Zoom
29 Oct 2026 until 30 Oct 2026
Description

Schulungen der Extraklasse ✔ Durchführungsgarantie ✔ Trainer aus der Praxis ✔ Kostenfreies Storno ✔ 3=2 Kostenfreie Teilnahme für den Dritten ✔ Persönliche Lernumgebung ✔ Kleine Lerngruppen

Seminarziel

Das Seminarziel besteht darin, den Teilnehmenden umfassende Kenntnisse und praktische Fähigkeiten zu vermitteln, um Databricks effizient für Datenintegration, Datenanalyse und Machine Learning zu nutzen. Sie sollen die Architektur und Konfiguration der Plattform verstehen, Datenquellen anbinden und ETL-Pipelines mit Apache Spark erstellen können. 
Darüber hinaus sollen sie in der Lage sein, SQL-Abfragen auszuführen, Dashboards zu erstellen, Machine Learning-Workflows zu entwickeln und Modelle zu trainieren sowie bereitzustellen. Ziel ist es, dass die Teilnehmenden Databricks sicher und effizient für skalierbare Datenanalysen und fortgeschrittene maschinelle Lernprojekte einsetzen…

Read the complete description

Frequently asked questions

There are no frequently asked questions yet. If you have any more questions or need help, contact our customer service.

Didn't find what you were looking for? See also: VMware, CompTIA A+ / Network+ / Security+, Linux, IT Security, and Retail (Management).

Schulungen der Extraklasse ✔ Durchführungsgarantie ✔ Trainer aus der Praxis ✔ Kostenfreies Storno ✔ 3=2 Kostenfreie Teilnahme für den Dritten ✔ Persönliche Lernumgebung ✔ Kleine Lerngruppen

Seminarziel

Das Seminarziel besteht darin, den Teilnehmenden umfassende Kenntnisse und praktische Fähigkeiten zu vermitteln, um Databricks effizient für Datenintegration, Datenanalyse und Machine Learning zu nutzen. Sie sollen die Architektur und Konfiguration der Plattform verstehen, Datenquellen anbinden und ETL-Pipelines mit Apache Spark erstellen können. 
Darüber hinaus sollen sie in der Lage sein, SQL-Abfragen auszuführen, Dashboards zu erstellen, Machine Learning-Workflows zu entwickeln und Modelle zu trainieren sowie bereitzustellen. Ziel ist es, dass die Teilnehmenden Databricks sicher und effizient für skalierbare Datenanalysen und fortgeschrittene maschinelle Lernprojekte einsetzen können.

Inhalt

  • Einführung in Databricks
    • Überblick und Architektur : Verständnis der Databricks-Plattform, ihrer Architektur und ihrer Hauptkomponenten.
    • Anwendungsbereiche : Gängige Anwendungsfälle wie Datenintegration, ETL-Prozesse und Machine Learning.
  • Einrichtung und Konfiguration
    • Installations- und Einrichtungsschritte : Installation und Konfiguration von Databricks-Workspaces und Clustern.
    • Cloud-Integration : Anbindung an Cloud-Plattformen wie AWS und Azure, einschließlich Zugangskontrollen und Netzwerksicherheit.
  • Datenintegration und ETL
    • Datenquellen anbinden : Verbindungen zu Datenbanken, Data Lakes, APIs und Cloud-Speichern einrichten.
    • ETL-Prozesse entwickeln : Erstellung von ETL-Pipelines mit Apache Spark und PySpark in Databricks-Notebooks.
  • Datenaufbereitung und -verwaltung
    • Datenaufbereitung : Bereinigung, Transformation und Aggregation von Daten in Notebooks.
    • Datenkataloge und -verwaltung : Verwendung von Delta Lake, um Datenqualitätsprobleme zu lösen und Versionierung zu ermöglichen.
  • SQL-Analysen und Dashboards
    • SQL-Analyse : Ausführen von SQL-Abfragen auf großen Datensätzen mit Databricks SQL.
    • Visualisierungen und Dashboards : Erstellung von Datenvisualisierungen und Dashboards zur Echtzeitüberwachung.
  • Fortgeschrittene Datenanalysen
    • Streaming-Analysen : Einrichtung von Echtzeitdaten-Pipelines mit Structured Streaming in Apache Spark.
    • Batch-Analysen : Optimierte Batch-Verarbeitung großer Datensätze für verschiedene Anwendungsfälle.
  • Machine Learning-Grundlagen
    • ML-Workflows : Entwicklung von Machine Learning-Workflows mit Databricks MLflow.
    • Feature Engineering : Erstellung von Features und Datenaufbereitung für Machine Learning-Modelle.
  • Modelltraining und -bereitstellung
    • Training von Modellen : Nutzung von MLlib, scikit-learn oder TensorFlow zum Training von Modellen in Databricks.
    • Modellbereitstellung : Bereitstellung und Überwachung von Machine Learning-Modellen in der Produktion.
  • Sicherheit und Zugriffskontrollen
    • Benutzerrollen und Berechtigungen : Einrichtung von Benutzerrollen, Zugriffsrechten und Auditlogs.
    • Datenverschlüsselung : Implementierung von Verschlüsselungsrichtlinien zur Sicherung sensibler Daten.
  • Best Practices und Skalierbarkeit
    • Optimierung der Leistung : Performance-Tuning von Clustern und Pipelines für höhere Effizienz.
    • Skalierbarkeit : Strategien zur Skalierung von Datenanalysen, ETL-Prozessen und Machine Learning-Workflows.



There are no reviews yet.
    Share your review
    Do you have experience with this course? Submit your review and help other people make the right choice. As a thank you for your effort we will donate $1.- to Stichting Edukans.

    There are no frequently asked questions yet. If you have any more questions or need help, contact our customer service.