Dr Andreas Jedlitschka, Fraunhofer IESE, explique dans une interview pourquoi les data scientists sont si demandés aujourd'hui. Crédit :Fraunhofer IESE
Data scientist est l'un des métiers les plus attractifs du 21ème siècle. Cette impression est confirmée lorsque vous jetez un œil aux portails d'emploi en ligne pertinents. Selon une étude du McKinsey Global Institute, aux États-Unis, la demande dépasse de loin l'offre – et cela ne semble pas être différent en Allemagne. Mais qu'est-ce qui rend ce travail si intéressant en premier lieu ? Quelqu'un qui le sait est le Dr Andreas Jedlitschka, Chef du département d'ingénierie des données à l'Institut Fraunhofer de génie logiciel expérimental IESE et membre du comité d'experts sur la science des données de l'organisme de certification personnel de l'Institut Fraunhofer pour les technologies de l'information appliquées FIT, Saint Augustin.
Pourquoi les entreprises ont-elles un si grand besoin de spécialistes des données ?
Avec la mise en réseau croissante de tous les domaines jusqu'aux écosystèmes numériques, le déluge de données dans les entreprises et les organisations augmente également de façon exponentielle. À la fois, la disponibilité croissante des données et les success stories publiées dans la presse conduisent également à un désir croissant d'utiliser les données de manière systématique, c'est à dire., effectuer des analyses de données, et donc le besoin d'experts qui peuvent les exécuter se fait sentir. Ces « data scientists » sont fréquemment regroupés sous le terme de data scientists.
Qu'est-ce qui fait un data scientist en premier lieu ?
Tout d'abord, Je voudrais définir le terme « Data Science » :la Data Science consiste à extraire des connaissances des données et à le faire idéalement au profit de l'entreprise. Faire cela, méthodes et techniques de l'informatique, mathématiques, et les statistiques sont utilisées. Le profil du poste est varié et va de l'analyse Big Data et de l'analyse visuelle via l'architecture Big Data à l'intégration. En outre, les modèles économiques doivent être pris en compte, resp. développé, et doit donc aussi être compris. Par ailleurs, vous devez parler au client, c'est à dire., l'utilisateur des informations en tant que destinataire, et avec l'expert du domaine.
Quelles sont les tâches des data scientists, et de quelles compétences ont-ils besoin ?
Les data scientists doivent être experts dans plusieurs disciplines à la fois :ils ne se contentent pas d'évaluer des données, mais doit aussi comprendre les contextes d'affaires dans les entreprises et les organisations. Ils doivent identifier les sources de données appropriées, déterminer et améliorer la qualité des données, rassembler des données, préparer et réaliser des analyses, puis évaluer les résultats en fonction de critères donnés. Si vous travaillez en tant que data scientist, vous portez souvent une grande responsabilité car des décisions stratégiques de grande envergure ou même des vies humaines peuvent dépendre des résultats des analyses de données - il suffit de penser aux systèmes utilisés pour l'aide au diagnostic dans le domaine médical ou aux processus d'apprentissage utilisés dans divers domaines dans les véhicules autonomes. C'est pourquoi les données sous-jacentes et les résultats d'analyse doivent être contrôlés en permanence en termes de plausibilité, complétude, justesse, et pertinence, en collaboration avec des experts du domaine. Le profil d'exigences d'un data scientist évolue en fonction de l'intégration de son travail dans l'entreprise et comprend non seulement des compétences techniques, mais aussi un certain nombre de soft skills telles que la capacité à travailler en équipe, de solides compétences en communication, et créativité.
Comment devenir data scientist ? Quels sont les prérequis, resp. quelles connaissances préalables sont requises ?
A Fraunhofer, nous proposons une formation certifiante dans le cadre de la Big Data Alliance, où nous adaptons les participants aux projets Big Data. Les participants sont souvent des décideurs, mais principalement des développeurs d'affaires, analystes, gestionnaires de données, et développeurs de logiciels. Le prérequis est une connaissance de base de l'informatique et des mathématiques. Dans les cours pour débutants, les participants apprennent les fondamentaux importants, processus, et les meilleures pratiques pour traiter de grandes quantités de données et pour le développement de solutions intelligentes avec des normes élevées en matière de confidentialité et de sécurité. Dans les cours avancés, les processus individuels sont étudiés en détail; alors l'accent est mis sur la capacité d'appliquer ce qui a été appris. Dans ces cours, nous enseignons les connaissances de pointe dans un fabricant neutre, pertinent en pratique, et en même temps d'une manière théoriquement saine.
Les jeunes scientifiques venant de l'université bénéficient également de votre cours de certification. Quelle formation est nécessaire pour avoir la chance de devenir un data scientist qualifié ?
Les chercheurs qui viennent tout droit de l'université ont une excellente connaissance du sujet, notamment de leur programme d'études, comme l'informatique ou les mathématiques. Ce qui manque souvent aux jeunes scientifiques, cependant, est une vue d'ensemble et l'expérience pratique requise pour collaborer à des projets Big Data. Et c'est exactement ce qu'ils apprennent dans notre cours de data scientist. La formation est conçue pour un large éventail d'applications. Ils apprennent comment les développeurs commerciaux libèrent le potentiel du Big Data dans leur entreprise, comment les ingénieurs de données décrivent et intègrent les données, comment les analystes utilisent les processus d'apprentissage automatique pour détecter les modèles et les tendances, et comment les ingénieurs logiciels utilisent des bases de données modernes et des méthodes de calcul distribuées pour développer des systèmes Big Data robustes et évolutifs. Tout cela en tenant compte de la confidentialité et de la sécurité. L'objectif est d'acquérir des connaissances de base dans tous les domaines pertinents. Ceux qui le souhaitent peuvent ensuite devenir des data scientists certifiés.