Einführung in Databricks

Total time: 2 days
Location: At location, Online
Starting date and place: 15 starting dates

Einführung in Databricks

GFU Cyrus AG

Get alternatives

Provider rating:

Need more information? Get more details on the site of the provider.

Get alternatives

Starting dates and places

Online: Zoom

26 May 2026 until 27 May 2026

Starting date guaranteed

Köln

30 Jul 2026 until 31 Jul 2026

Online: Zoom

30 Jul 2026 until 31 Jul 2026

Köln

29 Oct 2026 until 30 Oct 2026

Online: Zoom

29 Oct 2026 until 30 Oct 2026

Köln

18 Feb 2027 until 19 Feb 2027

Online: Zoom

18 Feb 2027 until 19 Feb 2027

Köln

22 Apr 2027 until 23 Apr 2027

Online: Zoom

22 Apr 2027 until 23 Apr 2027

Köln

1 Jul 2027 until 2 Jul 2027

Online: Zoom

1 Jul 2027 until 2 Jul 2027

Köln

16 Sep 2027 until 17 Sep 2027

Online: Zoom

16 Sep 2027 until 17 Sep 2027

Köln

18 Nov 2027 until 19 Nov 2027

Online: Zoom

18 Nov 2027 until 19 Nov 2027

Description

Schulungen der Extraklasse ✔ Durchführungsgarantie ✔ Trainer aus der Praxis ✔ Kostenfreies Storno ✔ 3=2 Kostenfreie Teilnahme für den Dritten ✔ Persönliche Lernumgebung ✔ Kleine Lerngruppen

Seminarziel

Das Seminarziel besteht darin, den Teilnehmenden umfassende Kenntnisse und praktische Fähigkeiten zu vermitteln, um Databricks effizient für Datenintegration, Datenanalyse und Machine Learning zu nutzen. Sie sollen die Architektur und Konfiguration der Plattform verstehen, Datenquellen anbinden und ETL-Pipelines mit Apache Spark erstellen können.
Darüber hinaus sollen sie in der Lage sein, SQL-Abfragen auszuführen, Dashboards zu erstellen, Machine Learning-Workflows zu entwickeln und Modelle zu trainieren sowie bereitzustellen. Ziel ist es, dass die Teilnehmenden Databricks sicher und effizient für skalierbare Datenanalysen und fortgeschrittene maschinelle Lernprojekte einsetzen…

Read the complete description

Frequently asked questions

There are no frequently asked questions yet. If you have any more questions or need help, contact our customer service.

Get alternatives

Didn't find what you were looking for? See also: VMware, CompTIA A+ / Network+ / Security+, Linux, IT Security, and Retail (Management).

Seminarziel

Inhalt

Einführung in Databricks
- Überblick und Architektur : Verständnis der Databricks-Plattform, ihrer Architektur und ihrer Hauptkomponenten.
- Anwendungsbereiche : Gängige Anwendungsfälle wie Datenintegration, ETL-Prozesse und Machine Learning.
Einrichtung und Konfiguration
- Installations- und Einrichtungsschritte : Installation und Konfiguration von Databricks-Workspaces und Clustern.
- Cloud-Integration : Anbindung an Cloud-Plattformen wie AWS und Azure, einschließlich Zugangskontrollen und Netzwerksicherheit.
Datenintegration und ETL
- Datenquellen anbinden : Verbindungen zu Datenbanken, Data Lakes, APIs und Cloud-Speichern einrichten.
- ETL-Prozesse entwickeln : Erstellung von ETL-Pipelines mit Apache Spark und PySpark in Databricks-Notebooks.
Datenaufbereitung und -verwaltung
- Datenaufbereitung : Bereinigung, Transformation und Aggregation von Daten in Notebooks.
- Datenkataloge und -verwaltung : Verwendung von Delta Lake, um Datenqualitätsprobleme zu lösen und Versionierung zu ermöglichen.
SQL-Analysen und Dashboards
- SQL-Analyse : Ausführen von SQL-Abfragen auf großen Datensätzen mit Databricks SQL.
- Visualisierungen und Dashboards : Erstellung von Datenvisualisierungen und Dashboards zur Echtzeitüberwachung.
Fortgeschrittene Datenanalysen
- Streaming-Analysen : Einrichtung von Echtzeitdaten-Pipelines mit Structured Streaming in Apache Spark.
- Batch-Analysen : Optimierte Batch-Verarbeitung großer Datensätze für verschiedene Anwendungsfälle.
Machine Learning-Grundlagen
- ML-Workflows : Entwicklung von Machine Learning-Workflows mit Databricks MLflow.
- Feature Engineering : Erstellung von Features und Datenaufbereitung für Machine Learning-Modelle.
Modelltraining und -bereitstellung
- Training von Modellen : Nutzung von MLlib, scikit-learn oder TensorFlow zum Training von Modellen in Databricks.
- Modellbereitstellung : Bereitstellung und Überwachung von Machine Learning-Modellen in der Produktion.
Sicherheit und Zugriffskontrollen
- Benutzerrollen und Berechtigungen : Einrichtung von Benutzerrollen, Zugriffsrechten und Auditlogs.
- Datenverschlüsselung : Implementierung von Verschlüsselungsrichtlinien zur Sicherung sensibler Daten.
Best Practices und Skalierbarkeit
- Optimierung der Leistung : Performance-Tuning von Clustern und Pipelines für höhere Effizienz.
- Skalierbarkeit : Strategien zur Skalierung von Datenanalysen, ETL-Prozessen und Machine Learning-Workflows.

Get alternatives

There are no reviews yet.

Share your review

Do you have experience with this course? Submit your review and help other people make the right choice. As a thank you for your effort we will donate $1.- to Stichting Edukans.

There are no frequently asked questions yet. If you have any more questions or need help, contact our customer service.