Eine bzw. ein Data Scientist ist für die Analyse von großen Datenmengen aus verschiedenen Quellen (Big Data) mithilfe von Methoden der Mathematik und Statistik zuständig. Die gewonnenen Informationen werden von Unternehmen genutzt, um zum Beispiel mehr über das Nutzer- bzw. Kundenverhalten zu erfahren oder Markttrends aufzuspüren. Darüber hinaus erstellt ein Data Scientist automatisierte Prozesse, um Daten und Reports effektiver auswerten zu können.
Eine weitere geläufige Berufsbezeichnung ist Datenwissenschaftler bzw. Datenwissenschaftlerin.
Die Hauptaufgabe eines Data Scientists ist es, in großen – häufig unstrukturierten – Datenmengen Muster zu erkennen (Pattern Recognition) und daraus für das Unternehmen interessante Informationen zu generieren. Aus diesen Informationen leitet der Data Scientist Prognosen (Forecasts), Strategien, Optimierungspotenziale und Handlungsempfehlungen ab und präsentiert diese in der Regel der Führungsebene des Unternehmens.
Um diese Aufgabe zu erledigen, muss ein Data Scientist zunächst Datenquellen sowie passende Analysemethoden auswählen oder ggf. entwickeln. Hierzu gehören auch das Design und die Implementierung von Big-Data-Analytics- und Data-Mining-Lösungen. Ziel ist es immer, eine zuvor aufgestellte Hypothese mithilfe der gewonnenen Informationen aus Datenquellen zu belegen oder zu widerlegen, um daraus entsprechende Handlungsempfehlungen abzuleiten und Lösungsanwendungen zu entwickeln.
Weitere Aufgaben sind:
Teilweise überschneiden sich die Aufgaben und Tätigkeiten eines Data Scientists mit denen von Data-Analysten bzw. Data-Analystinnen, Data Minern sowie Data-Warehouse-Managern bzw. Data-Warehouse-Managerinnen.
Ein Data Scientist findet in Unternehmen jeglicher Branchen, die mit großen Datenmengen arbeiten, eine Beschäftigung – von Logistik über Elektro bis zur Hotel- und Tourismusbranche. Häufig arbeitet er jedoch bei Software-Herstellern. Darüber hinaus arbeiten viele promovierte Data Scientists in der Lehre und Forschung an Hochschulen und Universitäten.
Für die Arbeit in diesem Beruf wird in der Regel ein abgeschlossenes Studium vorausgesetzt. Folgende Studienfächer bereiten auf den Beruf vor:
Ein weiterführendes Masterstudium in den oben genannten Studiengängen kann einem Data Scientist den Zugang zu Führungspositionen eröffnen. Teilweise ist für besonders spezialisierte Tätigkeiten darüber hinaus eine Promotion hilfreich. Für eine Karriere in der Lehre und Forschung ist hingegen eine Promotion bzw. eine Habilitation unabdingbar.
Vor allem im Bereich der IT vollzieht sich der wissenschaftliche Fortschritt rasant. Um sich an die neusten Erkenntnisse anzupassen, sollte ein Data Scientist regelmäßig an Anpassungsweiterbildungen teilnehmen. Neue Technologien wie Künstliche Intelligenz (KI), Machine Learning (ML), Deep Learning, Cloud-Technologien oder auch Blockchain stellen wichtige Themengebiete dar. Darüber hinaus sind Weiterbildungen in den folgenden Themengebieten sinnvoll:
Das A und O für den Beruf des Data Scientists sind umfassende Kenntnisse in Big Data. Darüber hinaus sollte er Programmiersprachen wie Java, R, SQL oder Python sowie Analysesoftwares beherrschen. Zudem sind Geduld und Ausdauer wichtige Eigenschaften, die ein erfolgreicher Data Scientist bei der Lösung komplexer Aufgaben und Problemstellungen benötigt. Vor allem bei der Beratung von Kunden und im Austausch mit der Geschäftsführung sind ausgeprägte Kommunikationsfähigkeiten ausschlaggebend. Eine analytische Denkweise sowie eine gute Portion Neugier runden sein Profil ab.