Browsing: Datenanalyse

Jeder würde gerne einen Blick in die Zukunft werfen, um Antworten auf drängende Fragen zu finden: „Was möchten meine Kunden?“ oder „Wie lange wird meine Anlage voll funktionsfähig bleiben?“ Mit hellseherischen Fähigkeiten würde es uns leichter fallen, auf „unvorhersehbare Ereignisse“ zu reagieren. Der Einsatz von Künstlicher Intelligenz (KI) zusammen mit Predictive Analytics (PA) könnte diese Aufgabe übernehmen.

Für den Spark+AI Summit Ende Juni 2020 waren mehr als 60.000 Teilnehmer aus über 100 Ländern registriert. Die Veranstaltung brachte die Apache Spark Community zusammen und informierte sie zunächst über die Neuerungen von Spark 3.0 aber auch wie Databricks Machine Learning einsetzt, um die aktuelle COVID-19-Krise zu bewältigen. Im Interview mit dem BI-Themenhub (BIT) erklärt Roman Pritzkow, Regional Vice President für die Region DACH bei Databricks, welche weiteren Entwicklungen geplant sind.

Der Beruf des Data Scientists wurde einst als der „attraktivste Job des 21. Jahrhunderts“ bezeichnet. Wer sich jedoch den Alltag von Datenwissenschaftlern in der Praxis genauer ansieht, kann daran Zweifel bekommen: Die Ergebnisse einer Studie von IDC aus dem Jahr 2019 zeigen, dass diese Experten im Durchschnitt 67 Prozent ihrer Zeit mit der Suche und der Aufbereitung von Daten verbringen. Bezogen auf einen durchschnittlichen Arbeitstag in Deutschland wären dies täglich 5,5 Stunden, die nur für die Datenverwaltung aufgewendet werden.

Die von Databricks geschaffene Open-Source-Plattform für Machine Learning (ML), MLflow, wird der Linux Foundation beitreten. Seit seiner Einführung vor zwei Jahren hat MLflow ein beeindruckendes Engagement der Community von über 200 Mitwirkenden zu verzeichnen und wird monatlich mehr als 2 Millionen Mal heruntergeladen, mit einer vierfachen jährlichen Wachstumsrate bei den Downloads. Die Linux Foundation bietet eine anbieterneutrale Anlaufstelle mit einem Open-Governance-Modell, um das MLflow-Projekt noch weiter auszubauen und noch mehr Community-Beteiligung zu ermöglichen.

Seit 2020 gelten für bestimmte Unternehmen verschärfte Prüfungs- und Meldepflichten, um Geldwäsche oder Terrorfinanzierung aufzudecken. Ein Aufwand, der sich angesichts der Vielzahl von Datenquellen kaum mehr manuell bewältigen lässt. Doch wer die richtigen Parameter kennt, der kann eventuellen Strafen wegen möglicher Verstöße gegen „Know your Customer“ (KYC) entgehen, zumal sie sich mit einer technischen Lösung effizient vermeiden lassen. Denn KYC gilt nicht nur für Finanzinstitute.

Ihr Berufsprofil ist noch wenig bekannt, dabei sind sie in IT-Projekten unverzichtbar: Business Analysten. Als Bindeglied zwischen Fachbereich und IT verantworten sie das Anforderungsmanagement, sind aber zunehmend auch mit neuen Aufgaben bis hin zum Projektmanagement konfrontiert – für Unternehmen oft ein Grund, nach Verstärkung in diesem Bereich zu suchen.

Mit einem Lakehouse sind Unternehmen in der Lage, strukturierte Informationen und Big Data aufzuspalten und sie getrennt für BI- und Machine-Learning-Anwendungen einzusetzen. Roman Pritzkow, Regional Vice President Enterprise Sales Germany bei Databricks, verdeutlicht im Interview mit line-of.biz (LoB) die Vorteile.

„Daten-Unternehmen“ gelten als die künftig marktführenden Unternehmen – und zwar in jedem Segment. Dies erfordert eine Datenplattform, die die Entscheidungen jedes Mitarbeiters steuert und, was ebenso wichtig ist, Datenprodukte antreibt. Dazu ist eine Unified Analytics Plattform nötig, die in jeder Abteilung und jedem Team skalierbar ist.

Beim Auflösen von Datensilos schieben viele Unternehmen alle ihre Daten aus verschiedenen Quellen in einen Data Lake, in dem Data Engineers, Data Scientists und Business Analysten die Daten verarbeiten und abfragen können. Es geht darum, Daten für die Benutzer verfügbar zu machen, aber es entsteht eine neue Herausforderung. Denn diese verschiedene Datenklassen sind vor den Benutzern zu schützen und zu isolieren, die keinen Zugriff auf diese Daten haben.

1 2 3