Métier

Data Scientist

Sommaire

À l’ère du big data, le data scientist détient une fonction majeure dans la stratégie business de l’entreprise. Les marchés étant de plus en plus concurrentiels, l’élaboration et l’exploitation des bases de données par un data scientist fournissent des indicateurs-clés dans le développement des avantages compétitifs. Perle rare et très recherché, devenir data scientist nécessite une formation et des compétences très poussées.  

Le rôle du data scientist

Le data scientist occupe un poste stratégique dans l’entreprise. Il a un esprit vif et une faculté d’analyse extrêmement aiguisée. Les datas collectées sont de nos jours très volumineuses, d’où le terme big data. Les expertises statistiques, mathématiques et marketing des diverses données collectées ont pour but de fournir des informations capitales pour augmenter la performance et les bénéfices de la société. C’est un métier aux multiples casquettes fonctionnelles et stratégiques.

Les missions du data scientist

Le flux important de données disponibles et collectées par l’entreprise doit être transformé en données exploitables.  Pour y parvenir, le data scientist est en charge de : 

  • Définir des solutions de stockage de données ;
  • Rechercher et développer les meilleurs moyens pour le traitement du big data ;
  • Hiérarchiser les datas ;
  • Construire des algorithmes efficaces pour améliorer les résultats de recherche et de ciblage ;
  • Récupérer et analyser les données pertinentes relatives aux clients, à la vente et au processus de production ;
  • Cartographier les informations ;
  • Analyser des données ;
  • Déterminer les avantages concurrentiels à développer ;
  • Élaborer des modèles prédictifs ;
  • Identifier les leviers de croissance ;
  • Actualiser les profils des clients et leurs évolutions ;
  • Anticiper les changements d’habitudes ou de comportements des consommateurs ;
  • Utiliser des outils de projet de gestion de projet IT ;
  • Modéliser les résultats d’expertise pour une lecture facile et exploitable par les responsables de l’entreprise ;
  • Créer un tableau de bord sur mesure selon les besoins des dirigeants ;
  • Évaluer la rentabilité et les perspectives de développement des projets en cours ou récemment mis en œuvre ;
  • Assurer une veille.

Les compétences du data scientist

Comme pour tous les métiers liés aux datas et à l’instar du data miner, le data scientist avoir de fortes aptitudes : 

  • Une forte capacité de modélisation des données statistiques ;
  • Une importante faculté d’analyse et de synthèse des mégadonnées ;
  • Une excellente maîtrise des fondamentaux de la science des données, de l’analyse métier et de l’ingénierie des données ;
  • Une aisance dans l’utilisation des outils du big data ;
  • Une maîtrise d’au moins un langage de programmation ( Python,Julia, R, Pearl, SQL, Java ou C/C++) ;
  • Une parfaite connaissance des méthodes de machine learning et de deep learning ;
  • Une bonne compréhension de l’algèbre linéraire et des fonctions de plusieurs variables ;
  • Une utilisation aisée de la plateforme Hadoop, des outils de traitement Pig, Hive et du cloud ;
  • Une faculté à gérer les données non structurées issues des réseaux sociaux, des flux audio ou vidéo ;
  • Un traitement efficace des données ayant des imperfections (chaînes de format incohérentes, valeurs manquantes, …) ;
  • Une capacité à identifier et résoudre les problèmes de régression et de classification ;
  • Une importante maîtrise du concept de statistiques descriptives (médianes, moyennes, variance ou déviation), des multiples distributions de probabilité, des échantillons et des statistiques inférentielles ;
  • Une curiosité intellectuelle, un esprit créatif et une vision stratégique marketing ;
  • Une aisance dans la communication écrite et orale ;
  • Une rigueur et une organisation presque militaire ;
  • Un respect de la confidentialité ;
  • Une bonne capacité à travailler sous pression et à maîtriser le stress.

Les études pour devenir data scientist

Une formation bac + 5 ou plus en informatique, management, mathématiques ou statistiques est nécessaire. Les diplômés en ingénierie informatique, en école de statistique ou les titulaires d’un master spécialisé en big data ont le profil idéal pour obtenir ce poste.

À titre d’exemple, citons les formations ou écoles dispensant le cursus nécessaire pour pouvoir postuler à ce métier : 

  •  L’AI school :
    • cycle Bachelor in Artificial Intelligence & Business ;
    • cycle Master in Artificial Intelligence & Management. 
  • Master en Ingénierie du Big Data ;
  • Master Mathématiques et applications, spécialité statistique pour l’évaluation et la prévision ;
  • Master MIASHS, spécialité Big Data et fouille de données ;
  • Master Statistics for smart data ;
  • Master spécialisé Big Data, spécialité gestion et analyse des données massives ;
  • Master MIAGE (Méthodes Informatiques Appliquées à la Gestion des Entreprises ;
  • Diplôme d’ingénieur avec spécialisation big data ;
  • Master SIAD (Système d’Information et d’Aide à la Décision) :
    • Datascience ;
    • Business intelligence.
  • Master informatique : 
    • Optimisation et recherche opérationnelle ;
    • Données et système connectés ;
    • Big data ;
    • Intelligence artificielle embarquée ;
    • Data mining ;
    • Big data et fouille de données.
  • Master Spécialisé : 
  • Big data, gestion des données massives ;
  • Big data, analyse management et valorisation responsable ;
  • Datascience.
  • Data Scientist.

Il est à noter que plus des ¾ des data scientists sont titulaires d’au minimum un master et que près de la moitié possèdent un doctorat. 

Le salaire du data scientist

La profession de data scientist est la plus convoitée en France en 2019. Dans l’hexagone, ce poste offre une rémunération très attrayante avec un salaire annuel moyen situé entre 45 000 € et 60 000 € et pouvant atteindre 120 000 €. Les principaux recruteurs de data scientists sont les grands groupes médicaux, industriels, financiers, pharmaceutiques et de sécurité/défense. 

Aux États-Unis, les salaires sont beaucoup plus élevés. La rémunération moyenne se chiffre à 110 000 dollars. Il fait partie des 50 meilleurs métiers.

Si le salaire augmente avec les années d’expérience, la capacité à construire des algorithmes performants et efficaces est le gage d’une rémunération annuelle à 6 chiffres. 

Les conditions de travail

Le travail de data scientist est sédentaire et exige beaucoup de rigueur et d’autonomie. La pression est importante.  La journée type d’un data scientist lors de la mise en route d’un projet se déroule comme suit : 

  • 9h à 10h : Kick-off. Le data scientist rencontre l’équipe Data science pour définir l’objectif de la journée et comprendre tous les paramètres à prendre en compte pour la réussite du nouveau projet.
  • 10h à 11h : Familiarisation avec les notions et principes pour  lesquels il doit définir un modèle. Le data scientist s’immerge dans l’activité du service qui l’a sollicité afin d’en comprendre les différentes marches à suivre et pour répondre efficacement à leurs besoins.
  • 11h à 12h : Collecte et exploitation des données. Il procède à l’extraction des datas nécessaires pour définir un modèle algorithmique.
  • 12h à 13h : Préparation des données. Il s’agit d’analyser, de comprendre et de trier les données afin de garantir leur fiabilité.
  • 14h à 16h30 : Exploration des datas et modélisation. Le data scientist extrait les variables explicatives les plus pertinentes et supprime ceux qui sont inutiles grâce à une analyse des corrélations. Il doit ensuite choisir l’algorithme le plus adapté au besoin et déterminer les paramètres optimaux.
  • 16h30 à 18h : Évaluation et test. Il va mesurer l’efficacité et la pertinence du modèle créé. Et même si la journée se termine, un data scientist travaillera à l’optimisation de son algorithme jusqu’à ce qu’il soit prêt à être déployé. Bien évidemment, les échéances de livraison imposées par le client modifient le rythme et l’intensité du travail.

Les perspectives d’évolution de carrière  

L’utilisation du big data est de plus en plus répandue. Son chiffre d’affaires est évalué à 210 milliards de dollars en 2020. Le marché du travail connaît une croissance importante et notamment par rapport à la recherche de profils correspondant au data scientist. 

Avant de prétendre à un poste de data scientist, une expérience confirmée en data analyst est généralement demandée. Effectuer de nombreux stages ainsi que suivre une formation en alternance sont également très appréciés par les recruteurs. Ils permettent de valider l’expérience pratique du candidat. 

Un data scientist peut évoluer au poste d’ingénieur business intelligence ou de directeur des systèmes d’information. 

Les data scientists sont très recherchés par : 

  • Les grandes enseignes de commerce en ligne comme Amazon, Netflix, Google, showroomprivé.com, Sosh ;
  • Les médias tels que le Groupe La Dépêche du Midi ;
  • Les SSII (Sociétés de Services et d’Ingénierie Informatique) comme Capgemini, Sopra steria, Atos, Orange business services, Alccenture ;
  • Les banques et mutuelles (Crédit Agricole, Caisse d’Epargne, BNP Paribas, MMA, Cetelem…) ;
  • Les cabinets de conseils (Mckinsey, Boston-Consulting Group, EY-Parthenon…) ;
  • Les assurances (Allianz…).

La science des données est une mine d’or d’informations pour les entreprises. Leur performance et leur rentabilité dépendent considérablement de leur faculté à l’utiliser et l’exploiter. Même si les fabricants de plateformes logicielles de données créent de plus en plus d’outils permettant de nombreuses automatisations, ils ne mettent pas en péril l’avenir de la profession de data scientist. L’homme reste aux commandes de l’intelligence artificielle.