Datenanalyse mit Big Data Technologien

Total time
Location
At location, Online
Starting date and place

Datenanalyse mit Big Data Technologien

GFU Cyrus AG
Logo GFU Cyrus AG
Provider rating: starstarstarstarstar_border 8.1 GFU Cyrus AG has an average rating of 8.1 (out of 14 reviews)

Need more information? Get more details on the site of the provider.

Starting dates and places
placeKöln
27 May 2026 until 29 May 2026
computer Online: Zoom
27 May 2026 until 29 May 2026
placeKöln
24 Aug 2026 until 26 Aug 2026
computer Online: Zoom
24 Aug 2026 until 26 Aug 2026
placeKöln
23 Nov 2026 until 25 Nov 2026
computer Online: Zoom
23 Nov 2026 until 25 Nov 2026
Description

Schulungen der Extraklasse ✔ Durchführungsgarantie ✔ Trainer aus der Praxis ✔ Kostenfreies Storno ✔ 3=2 Kostenfreie Teilnahme für den Dritten ✔ Persönliche Lernumgebung ✔ Kleine Lerngruppen

Seminarziel

Das Seminar zielt darauf ab, Unternehmen dabei zu unterstützen, das  volle Potenzial von Big Data-Technologien und Datenanalyse für ihr  Geschäft zu nutzen. Es soll den Unternehmen ermöglichen, datengesteuerte  Entscheidungen zu treffen, ihre Geschäftsprozesse zu optimieren, ihre  Wettbewerbsposition zu stärken und innovative Ansätze zur  Produktentwicklung zu fördern. Das Seminar soll den Unternehmen helfen,  Big Data-Technologien effektiv einzusetzen, um ihre Datenbestände zu  verwalten, zu analysieren und wertvolle Erkenntnisse daraus zu gewinnen.

Inhalt

  • Grundlagen von Big Data:
    • Definition von Big Data: Volumen, Vielfalt, Geschwindigkeit, Veracity und Value
    • Herausforderunge…

Read the complete description

Frequently asked questions

There are no frequently asked questions yet. If you have any more questions or need help, contact our customer service.

Didn't find what you were looking for? See also: Lean, Building / Construction, Project Management, Planning, and Six Sigma.

Schulungen der Extraklasse ✔ Durchführungsgarantie ✔ Trainer aus der Praxis ✔ Kostenfreies Storno ✔ 3=2 Kostenfreie Teilnahme für den Dritten ✔ Persönliche Lernumgebung ✔ Kleine Lerngruppen

Seminarziel

Das Seminar zielt darauf ab, Unternehmen dabei zu unterstützen, das  volle Potenzial von Big Data-Technologien und Datenanalyse für ihr  Geschäft zu nutzen. Es soll den Unternehmen ermöglichen, datengesteuerte  Entscheidungen zu treffen, ihre Geschäftsprozesse zu optimieren, ihre  Wettbewerbsposition zu stärken und innovative Ansätze zur  Produktentwicklung zu fördern. Das Seminar soll den Unternehmen helfen,  Big Data-Technologien effektiv einzusetzen, um ihre Datenbestände zu  verwalten, zu analysieren und wertvolle Erkenntnisse daraus zu gewinnen.

Inhalt

  • Grundlagen von Big Data:
    • Definition von Big Data: Volumen, Vielfalt, Geschwindigkeit, Veracity und Value
    • Herausforderungen bei der Verarbeitung von Big Data: Speicherung, Verarbeitungsgeschwindigkeit, Datenqualität
    • Chancen und Potenziale von Big Data: Erkenntnisgewinn, verbesserte Entscheidungsfindung, personalisierte Dienstleistungen
  • Überblick über Big Data-Technologien und -Plattformen:
    • Hadoop: Architektur, Hadoop Distributed File System (HDFS), MapReduce-Programmierung
    • Spark: In-Memory-Computing, Spark Core, Spark SQL, Spark Streaming
    • NoSQL-Datenbanken: Key-Value-Stores, Dokumentenorientierte Datenbanken, Spaltenorientierte Datenbanken, Graphdatenbanken
  • Einführung in Datenanalyse und deren Bedeutung in Big Data-Projekten :
    • Datenanalyseprozess: Datenerfassung, Datenvorverarbeitung, Modellbildung, Auswertung, Interpretation
    • Data Mining und Predictive Analytics: Identifizierung von Mustern, Trends und zukünftigen Ereignissen
    • Anwendungsbeispiele für Datenanalyse in verschiedenen Branchen: E-Commerce, Finanzwesen, Gesundheitswesen, Marketing
  • Datenbeschaffung und -integration:
    • Datenquellen identifizieren: interne und externe Datenquellen, strukturierte und unstrukturierte Daten
    • Datenextraktion: Daten aus verschiedenen Quellen extrahieren, z. B. Datenbanken, Log-Dateien, APIs
    • Datenintegration: Daten aus verschiedenen Quellen zusammenführen und konsolidieren
  • Datenqualität und -bereinigung:
    • Datenqualitätsprobleme identifizieren: fehlende Werte, Ausreißer, Duplikate, Inkonsistenzen
    • Datenbereinigungstechniken: Datenbereinigung, Datennormalisierung, Fehlerkorrektur
    • Datenqualitätsmetriken und -bewertung: Vollständigkeit, Genauigkeit, Konsistenz, Aktualität
  • Datenmodellierung:
    • Datenmodellierungskonzepte: Entity-Relationship-Modell, dimensionale Modellierung
    • Big Data-Schemas: NoSQL-Datenmodellierung, Key-Value-Stores, Dokumentenmodelle, Graphdatenbanken
    • Datenbankdesign für Big Data: Verteilte Datenbankarchitekturen, Sharding, Replikation
  • Grundlagen von Datenanalyse-Algorithmen:
    • Clustering-Algorithmen: k-means, hierarchisches Clustering
    • Klassifizierungsalgorithmen: Entscheidungsbaum, Random Forest, Support Vector Machines (SVM)
    • Regressionsanalyse: lineare Regression, logistische Regression
  • Einführung in maschinelles Lernen und Künstliche Intelligenz (KI):
    • Überblick über maschinelles Lernen: überwachtes Lernen, unüberwachtes Lernen, verstärkendes Lernen
    • Anwendung von maschinellem Lernen in Big Data-Szenarien: Empfehlungssysteme, Anomalieerkennung, Textanalyse
    • Einführung in Deep Learning: Neuronale Netze, Faltungsnetze, Rekurrente Netze
  • Big Data-Analysewerkzeuge und -frameworks:
    • Hadoop-Ökosystem: HDFS, MapReduce, Hive, Pig
    • Spark-Ökosystem: Spark Core, Spark SQL, Spark Streaming, MLlib
    • Apache Flink: Stream- und Batch-Verarbeitung, komplexe Ereignisverarbeitung (CEP)
  • Skalierbare Big Data-Architekturen:
    • Cluster-Architektur: Verteilte Rechencluster, verteiltes Dateisystem
    • Cloud Computing: Infrastructure as a Service (IaaS), Platform as a Service (PaaS)
    • Datenpartitionierung und Replikation: Verteilte Datenhaltung und -verarbeitung, hohe Verfügbarkeit
  • Leistungsoptimierung von Big Data-Anwendungen :
    • Datenpartitionierung: horizontale und vertikale Partitionierung, Sharding
    • Parallelverarbeitung: Aufteilen von Aufgaben auf mehrere Rechenknoten, Parallelität
    • Caching: In-Memory-Datenhaltung, Reduzierung von Zugriffszeiten

There are no reviews yet.
    Share your review
    Do you have experience with this course? Submit your review and help other people make the right choice. As a thank you for your effort we will donate $1.- to Stichting Edukans.

    There are no frequently asked questions yet. If you have any more questions or need help, contact our customer service.