{"id":555,"date":"2022-11-18T10:32:21","date_gmt":"2022-11-18T10:32:21","guid":{"rendered":"https:\/\/d3mlabs.de\/?p=555"},"modified":"2023-02-01T10:24:06","modified_gmt":"2023-02-01T10:24:06","slug":"aufbau-des-ersten-data-teams-in-ihrem-unternehmen","status":"publish","type":"post","link":"https:\/\/d3mlabs.de\/?p=555","title":{"rendered":"Aufbau des ersten Data Teams in ihrem Unternehmen"},"content":{"rendered":"\n<p><strong>Von\u00a0Elizabeth Press und Irina Brudaru<\/strong><\/p>\n\n\n\n<p><strong>Das Bild ist von Irina Brudaru<\/strong><\/p>\n\n\n\n<p>Dieser Blog kombiniert die Erfahrungen anderer mit unseren eigenen, um Gesch\u00e4ftsf\u00fchrern, Gr\u00fcndern und Managern, die ein Data Team in ihrem Unternehmen aufbauen wollen, als Leitfaden zu dienen.&nbsp; Wir haben Erfahrungen und Ratschl\u00e4ge von Greenfield-Veteranen mit unterschiedlichem Hintergrund aus einer Vielzahl von Unternehmen zusammengetragen, die von Startups bis hin zu mittelst\u00e4ndischen Industrieunternehmen reichen. Der gemeinsame Faktor war, dass jeder dieser Personen eine neue Datenfunktion in einem bestimmten Unternehmen aufgebaut hat.<\/p>\n\n\n\n<p>Der Datenbereich ist ein Wirrwarr aus sich \u00fcberschneidenden, trendigen und verwirrenden Begriffen. In diesem Artikel steht &#8222;Daten&#8220; f\u00fcr das breite Spektrum an Werkzeugen, professionellen Rollen und Prozessen, die mit der Verwaltung und Analyse von Daten verbunden sind. &#8222;Business Intelligence&#8220; (BI) ist ein Spektrum von funktions\u00fcbergreifenden Disziplinen, die mit der Verwaltung von Daten von der Erstellung bis zur Gesch\u00e4ftsentscheidung und deren Auswirkungen verbunden sind. Technische Schuld ist eine Schuld in Form von Aufwand und Geld, die Sie f\u00fcr Ihre zuk\u00fcnftigen Gesch\u00e4ftsabl\u00e4ufe als Ergebnis suboptimaler technischer Entscheidungen auf kurze Sicht schaffen.<\/p>\n\n\n\n<p class=\"has-medium-font-size\"><strong>In welcher Phase und in welchem Alter war das Unternehmen, als es ein Datenteam gr\u00fcndete?<\/strong><\/p>\n\n\n\n<p>Die Antworten reichten von kurz vor Tag 1 bis nach 100 Jahren. Im Allgemeinen gab es immer irgendwo im Unternehmen Daten, sei es nur bei den Gr\u00fcndern oder bei einem Mitarbeiter, der ad hoc zum Datenanalysten wurde. Ein zentrales Team mit Fachleuten entstand oft erst nach einer gr\u00f6\u00dferen Investitionsrunde.&nbsp;<\/p>\n\n\n\n<p class=\"has-medium-font-size\"><strong>Wer wird als erstes eingestellt?<\/strong><\/p>\n\n\n\n<p>Data Engineer war die h\u00e4ufigste Antwort. Alle ersten Mitarbeiter hatten einen technischen Hintergrund, eine formale Ausbildung in den Bereichen Ingenieurwesen, Mathematik oder Informatik und praktische Erfahrung in einem technischen Bereich. Der Vorbehalt gegen\u00fcber dem einzigen Dateningenieur besteht darin, dass er in der Lage sein muss, sich selbst zu verwalten und die ersten Analysen zu erstellen, was nicht immer der Fall ist.&nbsp;<\/p>\n\n\n\n<p>Eine Falle, in die der erste eingestellte Ingenieur je nach Unterst\u00fctzung durch das h\u00f6here Management tappen kann, ist die mangelnde Konzentration auf das \u00c4nderungsmanagement.<\/p>\n\n\n\n<p class=\"has-medium-font-size\"><strong>Wann und mit wem erweitern Sie das Team?<\/strong><\/p>\n\n\n\n<p>Das Team wuchs in der Regel innerhalb der ersten zwei Monate. Bei denjenigen, die l\u00e4nger als sechs Monate warteten, handelte es sich in der Regel um Daten Ingenieure, die extrem viele \u00dcberstunden machten.<\/p>\n\n\n\n<p class=\"has-medium-font-size\"><strong>Wir haben zwei haupt Taktiken bei der zweiten Einstellung festgestellt:<\/strong><\/p>\n\n\n\n<p>Dateningenieur: Der Vorteil dieses Weges bestand darin, dass die Infrastruktur schnell aufgebaut wurde und fr\u00fchere technische Schulden oft in unterschiedlichem Ausma\u00df bew\u00e4ltigt werden konnten, je nach Seniorit\u00e4t der eingestellten Mitarbeiter und Personalbestand. Der Nachteil war, dass der Schwerpunkt des Teams auf der Technologie der Pipeline lag, was zu diesem Zeitpunkt gut erschien, aber zu einem technokratischen Schwerpunkt f\u00fchrte. Wie wir sp\u00e4ter noch er\u00f6rtern werden, k\u00f6nnen sich allzu technokratische Teams eher auf technologische Experimente als auf den Gesch\u00e4ftswert konzentrieren, was zu einer Verschwendung von Ressourcen f\u00fchrt und technische Schulden entstehen l\u00e4sst. Ein weiterer Nachteil kann die mangelnde Konzentration auf politische Untert\u00f6ne, \u00c4nderungsmanagement und der Aufbau von Beziehungen zu den Funktionsleitern sein.&nbsp;<\/p>\n\n\n\n<p>Datenanalytiker: Der Vorteil dieses Weges sind die komplement\u00e4ren F\u00e4higkeiten und die schnellere Wertsch\u00f6pfung durch schnellere analytische Ergebnisse. Der Wert f\u00fcr das Unternehmen wird durch die F\u00e4higkeit, gute Anwendungsf\u00e4lle und KPIs zu erstellen, in Verbindung mit der Nutzung der Analyseergebnisse durch die Interessengruppen bei der Entscheidungsfindung realisiert.&nbsp; Die Nachteile sind eine gr\u00f6\u00dfere Belastung f\u00fcr einen einzelnen Dateningenieur und ein langsamerer Ausbau der Infrastruktur, es sei denn, es werden einfachere Tools (mit oder ohne Code) verwendet. Selbst wenn einfachere Tools verwendet werden, werden schnell Fragen an die d\u00fcnne Infrastruktur gestellt, was zu unordentlichen Ad-hoc-Infrastrukturl\u00f6sungen f\u00fchren kann. Das Unternehmen erzielt schnellere analytische Ergebnisse auf Kosten der infrastrukturellen Architektur.&nbsp;&nbsp;<\/p>\n\n\n\n<p>Jede weitere Rolle, die entweder von einem Analysten oder einem Data Engineer oder irgendwo dazwischen, z. B. einem Analytics Engineer, ausgef\u00fcllt wird, bringt die oben genannten Nachteile mit sich. Im Allgemeinen wurde gesagt, dass man sich im ersten Jahr von Data Science fernhalten sollte, vor allem weil sowohl die Infrastruktur als auch die Entwicklung von Anwendungsf\u00e4llen und die Datenreife von Unternehmen in der Anfangsphase eines Greenfield-Projekts noch nicht ausgereift sind.<\/p>\n\n\n\n<p class=\"has-medium-font-size\"><strong>Wie sah das Team am Ende des ersten Jahres aus?<\/strong><\/p>\n\n\n\n<p>Die durchschnittliche Mitarbeiterzahl betrug 6 Personen, obwohl die Antworten von 2 bis 10 reichten.&nbsp;<\/p>\n\n\n\n<p class=\"has-medium-font-size\"><strong>Wie lange hat es gedauert, bis Ergebnisse erzielt wurden?<\/strong><\/p>\n\n\n\n<p>Erste KPIs: 3 Monate, wobei die Zeitspanne je nach Teamgr\u00f6\u00dfe, vorhandener Infrastruktur und Beziehungen zu den Beteiligten von einigen Wochen bis hin zu nie variierte.&nbsp;<\/p>\n\n\n\n<p>Konzeptualisierung der infrastrukturellen Architektur: 3 Monate, wobei die Antworten je nach Gr\u00f6\u00dfe des Teams, Daten und Komplexit\u00e4t des Gesch\u00e4ftsmodells variieren.<\/p>\n\n\n\n<p>Implementierung der Infrastruktur-Architektur: 3-6 Monate bis 1 Jahr, abh\u00e4ngig vom Umfang der Architektur, der Teamgr\u00f6\u00dfe und den vorhandenen Ressourcen sowie den \u00fcbernommenen technischen Schulden.&nbsp;<\/p>\n\n\n\n<p class=\"has-medium-font-size\"><strong>Horizontal arbeiten und iterieren<\/strong><\/p>\n\n\n\n<p>Horizontales Arbeiten f\u00fchrt schneller zu ersten Ergebnissen: Horizontal bedeutet, dass Daten Pipelines und Analysen f\u00fcr ein bestimmtes Problem\/einen bestimmten Bereich mit gro\u00dfen Auswirkungen auf das Gesch\u00e4ft erstellt werden, anstatt sie auf das gesamte Unternehmen auf einmal auszuweiten.<\/p>\n\n\n\n<p>Modularit\u00e4t: Entwerfen Sie Pipeline-Einheiten, die zu einem sp\u00e4teren Zeitpunkt verfeinert werden k\u00f6nnen, um die Lieferung der ersten Meilensteine zu beschleunigen. Je nach Komplexit\u00e4t der Daten und des Gesch\u00e4ftsmodells wird der Transformation Teil der ELT auf einen sp\u00e4teren Zeitpunkt verschoben. Au\u00dferdem sollte die \u00dcbernahme von Trend-Tools zugunsten von Open Source in Frage gestellt werden, oder die Entscheidung sollte zu einem sp\u00e4teren Zeitpunkt getroffen werden. Zu viele neue Tools k\u00f6nnen am Anfang zu viel sein. Beginnen Sie schlank.&nbsp;<\/p>\n\n\n\n<p>Verschiebung der Datenlogik zu DBT: Das Tool ist flexibel und SQL-basiert, so dass es f\u00fcr Analysten einfacher zu bedienen ist. Dies verbessert die Leistung von Abfragen und Dashboards. DBT erm\u00f6glicht auch die Visualisierung der Daten-Abfolge, was sehr wichtig ist und eine L\u00fccke in vielen BI-Stacks darstellt.<\/p>\n\n\n\n<p>Low&nbsp; Code \/ No Code: Der Schwerpunkt sollte auf den Analysen liegen. Teams verbringen oft zu viel Zeit mit Code und technischen Problemen mit der Pipeline, w\u00e4hrend der gesch\u00e4ftliche Wert in den Analysen liegt. Low-Code- und No-Code-Tools erm\u00f6glichen praktikable Pipelines, minimieren die Komplexit\u00e4t und erm\u00f6glichen die Konzentration auf Analysen. Au\u00dferdem k\u00f6nnen Sie ein breites Spektrum an Mitarbeitern einstellen, wenn Code-Kenntnisse kein Einstellungshindernis mehr darstellen. Diese Entscheidung erm\u00f6glicht eine schnellere Bereitstellung von Ergebnissen\/KPIs.<\/p>\n\n\n\n<p class=\"has-medium-font-size\"><strong>Was waren die ersten Erfolge?<\/strong><\/p>\n\n\n\n<p>Die Stakeholder zu \u00fcberzeugen: Stakeholder zu \u00fcberzeugen und ihre Zustimmung zu Datenprojekten zu erhalten, ist ein wichtiger erster Erfolg, da Datenprojekte oft als &#8222;nice to have&#8220; im Hintergrund angesehen werden. Leistungsstarke und aussagekr\u00e4ftige Dashboards wurden ebenfalls als erste Erfolge genannt, ebenso wie die M\u00f6glichkeit, wichtige Metriken f\u00fcr bestimmte Interessengruppen darzustellen.&nbsp;&nbsp;<\/p>\n\n\n\n<p>Auditierung der Daten: Beim Aufbau des Daten Stapels kann man gleichzeitig auch ein Datenqualit\u00e4tsaudit durchf\u00fchren. Sind alle Werte eines bestimmten Variablen Typs dokumentiert? Existieren sie \u00fcberhaupt? Dies ist auch bei der Definition der KPI-Abdeckung der Daten hilfreich und kann zur Entdeckung von Fehlern, zur Qualit\u00e4tssicherung, zur Erstellung eines Datenw\u00f6rterbuchs und zu Funktionsanforderungen f\u00fchren, falls die gew\u00fcnschten KPIs auf nicht verfolgten Daten basieren.<\/p>\n\n\n\n<p class=\"has-medium-font-size\"><strong>Die wichtigsten Lehren<\/strong><\/p>\n\n\n\n<p>Stakeholder! Die Rentabilit\u00e4t der Investition h\u00e4ngt davon ab!: Die Zustimmung der Stakeholder ist wichtig f\u00fcr die Akzeptanz, den anhaltenden Erfolg und die Investitionen.&nbsp; Eine Anweisung von oben nach unten, datenorientierter zu werden, reicht nicht aus. Die Abteilungsleiter und das mittlere Management m\u00fcssen das Datenteam unterst\u00fctzen.&nbsp; Die verantwortliche Person und die Teammitglieder m\u00fcssen Fortschritte, Ergebnisse und positive Auswirkungen auf das Unternehmen vermitteln. Au\u00dferdem m\u00fcssen sie die Entscheidungsfindung der Kultur verstehen und die Stakeholder so weit einbinden, dass sie deren Begeisterung und Feedback einfangen k\u00f6nnen. Der Aufbau eines Daten Teams ist ein funktions\u00fcbergreifendes Projekt, das von einem Ver\u00e4nderungsmanagement abh\u00e4ngt, das von der Unternehmensf\u00fchrung von oben nach unten gestaltet wird. Ein erfolgreiches Datenteam arbeitet nicht in Silos, sondern isoliert.<\/p>\n\n\n\n<p>Fokus auf Benutzerfreundlichkeit statt auf technisches Interesse: Manager von Greenfield-Teams sollten sich nicht davor scheuen, bei Technologieentscheidungen direktiv vorzugehen. Oft versuchen Manager, die technische Neugier der Teammitglieder zu befriedigen, um Talente zu binden. Die Anpassung an die technische Neugier kann zu \u00fcberm\u00e4\u00dfig komplexen Daten Pipelines, mangelnder Skalierbarkeit und technischen Schulden f\u00fchren.&nbsp;&nbsp;<\/p>\n\n\n\n<p>Erstellen ein MVP und iterieren: Ingenieure verwenden gerne komplexe Tools, um zu lernen, und das macht die Skalierung, Einstellen usw. in der Zukunft schwierig. Plug-and-Play-Tools sind wichtig, um schnell voranzukommen und in der dynamischen Welt der Daten wettbewerbsf\u00e4hig zu bleiben.&nbsp;<\/p>\n\n\n\n<p>Manchmal erh\u00e4lt man aufgrund externer Faktoren nicht die Tools, die Sie gerne h\u00e4tten.&nbsp;<\/p>\n\n\n\n<p>Mehr Zeit f\u00fcr Dokumentation, Governance und Datenqualit\u00e4t aufwenden: Es ist besser, Custom Code zu vermeiden. Custom Code wird an Stellen wie Dashboards versteckt und ist oft nicht dokumentiert. Es gibt Tools, die n\u00fctzlich sind, um die Gesch\u00e4ftslogik zu entschl\u00fcsseln und zu verstehen.&nbsp;<\/p>\n\n\n\n<p>Garbage in bedeutet Garbage out: Alles, was ein Datenteam tut, basiert auf dem Vertrauen in Daten. Es gibt einen Punkt, an dem die Daten von so schlechter Qualit\u00e4t sind, dass das Bauchgef\u00fchl tats\u00e4chlich besser ist als das Vertrauen in die Daten. Traurig, aber wahr.<\/p>\n\n\n\n<p class=\"has-medium-font-size\"><strong>Haben unsere Veteranen technische Schulden gemacht?<\/strong><\/p>\n\n\n\n<p>Ja, das haben sie&#8230;.<\/p>\n\n\n\n<p>Spark: Einige der Befragten sagten, dass die Ingenieure Spark attraktiv fanden, aber Spark-F\u00e4higkeiten sind rar, was die Einstellung und Weiterqualifizierung erschwert. Sie bedauerten, dass sie mit Spark begonnen hatten, anstatt eine einfachere Alternative zu w\u00e4hlen.<\/p>\n\n\n\n<p>Geiz: Die Budgets waren knapp, sodass die Wahl einiger Tools suboptimal war. Ein Befragter entschied sich beispielsweise aufgrund von Budgetbeschr\u00e4nkungen und der F\u00e4higkeit, Stakeholder zu \u00fcberzeugen, f\u00fcr Redshift.<\/p>\n\n\n\n<p>Andere Befragte entschieden sich f\u00fcr Postgres und BigQuery und verzichteten auf eine Steuerung.<\/p>\n\n\n\n<p>Fehlende Governance, \u00fcberm\u00e4\u00dfiger Fokus auf Geschwindigkeit statt auf Qualit\u00e4t : Custom Code, Bugs, Hacks, Inkonsistenz. Alle diese Probleme wurden mehrfach genannt und mussten sp\u00e4ter teuer bereinigt werden, oft von anderen Daten Verantwortlichen. Es ist wichtig, sich um Metadaten, Datenqualit\u00e4t, Governance und Dokumentation zu k\u00fcmmern.&nbsp;<\/p>\n\n\n\n<p class=\"has-medium-font-size\"><strong>Wie viel wird das erste Jahr kosten?<\/strong><\/p>\n\n\n\n<p>Der Durchschnitt lag bei 800.000 Euro. 700.000 f\u00fcr Personalkosten, 100.000 f\u00fcr Werkzeuge. Die niedrigsten Kosten beliefen sich auf 300.000 Euro mit einer gro\u00dfen Anzahl von \u00dcberstunden. Die h\u00f6chsten Kosten betrugen 1,1 Millionen Euro f\u00fcr ein Unternehmen, das sein Team nach einer gro\u00dfen Investition aufgestockt hatte.&nbsp;<\/p>\n\n\n\n<p>Data Teams sind ein Artefakt ihrer Organisation, daher gibt es kein Kochbuch f\u00fcr die erfolgreiche Durchf\u00fchrung eines Greenfield-Projekts. Mit einem begrenzten Budget und mittelm\u00e4\u00dfigem politischem Einfluss werden sich Entscheidungen eher auf Kompromisse konzentrieren als auf den Aufbau einer erstklassigen Organisation. Der Aufbau einer Datenfunktion, die strategisch wichtig ist und einen Wettbewerbsvorteil darstellt, ist eine langfristige Investition, deren Rendite im ersten Jahr trotz anf\u00e4nglicher Erfolge wahrscheinlich noch negativ sein wird. Wie lange es dauert, bis die Rentabilit\u00e4t ausgeglichen ist oder sogar ein positiver ROI erzielt wird, h\u00e4ngt von der F\u00e4higkeit des Teams ab, aussagekr\u00e4ftige Anwendungsf\u00e4lle und KPIs zu erstellen und gleichzeitig die Qualit\u00e4t der Daten aufrechtzuerhalten und die Interessengruppen einzubinden.&nbsp;<\/p>\n\n\n\n<p>Artikel:<\/p>\n\n\n\n<p><a href=\"https:\/\/www.bcg.com\/publications\/2019\/dividends-digital-marketing-maturity\">https:\/\/www.bcg.com\/publications\/2019\/dividends-digital-marketing-maturity<\/a><\/p>\n\n\n\n<p><a href=\"https:\/\/inthecloud.withgoogle.com\/startup\/dl-cd.html\">https:\/\/inthecloud.withgoogle.com\/startup\/dl-cd.html<\/a><\/p>\n","protected":false},"excerpt":{"rendered":"<p>Ist Business Intelligence ein Luxus?  Daten &#8211; richtig gemacht &#8211; sind weder billig noch einfach. Die meisten Unternehmen warten, bis sie eine gewisse Gr\u00f6\u00dfe erreicht haben, bevor sie in eine interne Datenkompetenz investieren. Ein Greenfield-Projekt, der erste Aufbau einer internen Datenfunktion, ist ein wichtiger erster Schritt auf dem Weg eines Unternehmens zur Datenreife. Vor der Einrichtung einer internen Datenfunktion kann ein Unternehmen als Daten unreif gelten, unabh\u00e4ngig davon, wer die Daten nutzt oder wie lange das Unternehmen bereits besteht.<\/p>\n","protected":false},"author":1,"featured_media":269,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"om_disable_all_campaigns":false,"_monsterinsights_skip_tracking":false,"_monsterinsights_sitenote_active":false,"_monsterinsights_sitenote_note":"","_monsterinsights_sitenote_category":0,"_uf_show_specific_survey":0,"_uf_disable_surveys":false,"footnotes":""},"categories":[10,15,26],"tags":[],"class_list":["post-555","post","type-post","status-publish","format-standard","has-post-thumbnail","hentry","category-data-leadership","category-data-strategy","category-deutsch","wpcat-10-id","wpcat-15-id","wpcat-26-id"],"aioseo_notices":[],"_links":{"self":[{"href":"https:\/\/d3mlabs.de\/index.php?rest_route=\/wp\/v2\/posts\/555","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/d3mlabs.de\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/d3mlabs.de\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/d3mlabs.de\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/d3mlabs.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=555"}],"version-history":[{"count":4,"href":"https:\/\/d3mlabs.de\/index.php?rest_route=\/wp\/v2\/posts\/555\/revisions"}],"predecessor-version":[{"id":848,"href":"https:\/\/d3mlabs.de\/index.php?rest_route=\/wp\/v2\/posts\/555\/revisions\/848"}],"wp:featuredmedia":[{"embeddable":true,"href":"https:\/\/d3mlabs.de\/index.php?rest_route=\/wp\/v2\/media\/269"}],"wp:attachment":[{"href":"https:\/\/d3mlabs.de\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=555"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/d3mlabs.de\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=555"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/d3mlabs.de\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=555"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}