• Skip to main content
  • Skip to header right navigation
  • Skip to after header navigation
  • Skip to site footer
  • Facebook
  • Twitter
  • Instagram
Lesjeudis

Blog Les Jeudis

Actualité Informatique et Digital

  • Tous les annonces
  • Employeurs
  • Développement
  • Réseaux et Systèmes
  • Digital
  • Marché de l’emploi
  • Conseils
  • Evénements
  • Formation
des lunettes avec de code de programmation pour la data science

C’est quoi la Data Science?

16/10/2020 par Dorian H Mekni

Dans ce tutoriel, vous apprendrez :

Table de contenu

  • Définition de la Data Science ?
  • Pourquoi la Data Science ?
    • Les composants et éléments de la Data science
    • Statistiques:
    • Visualisation:
    • Apprentissage automatique:
    • L’apprentissage en profondeur:
  • Le processus de la Data Science
    • 1. Découverte
    • 2. préparation des données:
    • 3. planification du modèle:
    • 4. Construction de modèles:
    • 5. Mise en opération:
    • 6. Communiquer les résultats
  • Les métiers de la Data Science
    • Lead Data Scientist:
    • Data Engineer:
    • Data Analyst:
    • Statisticien:
    • Administrateur de données:
    • Business Analyst:
  • Le point entre la Data Science et la BI (Business Intelligence)
    • Le point de Focus de la BI
    • L’espace BI et son industrie
  • Comment et où s’applique la Data Science ? 
    • Elle s’applique à la recherche Internet
    • Une autre utilisation est la reconnaissance d’image et de parole
    • Elle trouve sa place dans le monde du jeu
    • Son usage facilite la comparaison des prix en ligne:
  • Quels sont les défis de la technologie de la Data Science ?
  • En bref

Définition de la Data Science ?

La Data Science est le domaine d’étude qui consiste à extraire des informations à partir de vastes quantités de données à l’aide de diverses méthodes, certaines algorithmiques et d’autres suivant le processus scientifiques.

Il vous aide à découvrir des modèles cachés à partir des données dites brutes. Le terme Data Science est apparu en raison de l’évolution des statistiques mathématiques, de l’analyse des données et des mégadonnées.

La Data Science est un domaine interdisciplinaire qui vous permet d’extraire des connaissances à partir de données structurées ou non structurées. La Data Science vous permet de traduire un problème commercial en projet de recherche, puis de l’acheminer en une solution pratique.

Commençons par nous poser les bonnes questions avant d’entamer notre parcours de cette science si prise. 

Pourquoi la Data Science ?

Voici les avantages significatifs de l’utilisation de la technologie d’analyse des données:

  • Les données sont le pétrole du monde d’aujourd’hui. Avec les bons outils, technologies et algorithmes, nous pouvons utiliser les données et les convertir en un avantage commercial distinctif
  • La Data Science peut vous aider à détecter la fraude à l’aide d’algorithmes d’apprentissage automatique avancés
  • Elle permet d’ éviter des pertes monétaires importantes et notamment dans le milieu boursier et bancaire
  • Elle permet de développer la capacité d’intelligence des machines
  • Vous pouvez effectuer une analyse de sentiments pour évaluer la fidélité des clients à votre marque
  • Cela vous permet de prendre de meilleures décisions plus rapidement pour une stratégie taillée sur mesure à la demande actuelle mais aussi future. 
  • Elle vous aide à recommander le bon produit au bon client pour améliorer votre entreprise

Tous ces elements permettent aux sociétés comme aux entrepreneurs de gagner des parts de marché et de rester compétitifs avec l’objectif de s’accaparer le monopole d’un marché deja existant ou tout simplement de créer de nouveaux marchés. C’est précisément ce que j’appelle appelle la ‘ Data Intelligence ’ ou bien le renseignement Data. 

Il tient également une place considerable au sein des divers acteurs de l’establisment étatique à travers le monde dans cette course de guerre économique et chasse aux marchés. 

La Data Science est donc une section, ou bien un département au sein d’une structure dite ‘Technologique’ , qui récupère les données des utilisateurs d’applications web et mobile et recycle ses dernières en une arme redoutable. 

https://www.kdnuggets.com/2017/04/models-from-lab-factory.html

Les composants et éléments de la Data science

Statistiques:

Les statistiques sont l’unité la plus critique de la science des données. C’est la méthode ou la science de la collecte et de l’analyse des données numériques en grande quantité pour obtenir des informations utiles.

Visualisation:

La technique de visualisation vous aide à accéder à d’énormes quantités

des données à travers des visuels faciles à comprendre et compréhensibles.

Apprentissage automatique:

L’apprentissage automatique explore la construction et l’étude d’algorithmes qui apprennent à faire des prédictions sur des données imprévues / futures.

L’apprentissage en profondeur:

La méthode Deep Learning est une nouvelle recherche d’apprentissage automatique dans laquelle l’algorithme sélectionne le modèle d’analyse à suivre.

Le processus de la Data Science

the process of data science

1. Découverte

L’étape de découverte consiste à acquérir des données à partir de toutes les sources internes et externes identifiées, ce qui vous aide à répondre à la question commerciale.

Les données peuvent être:

  • Textes à partir de liens de pages Web facilement extirpables via le Web Scrapping
  • Données recueillies sur les réseaux sociaux
  • Data sets ou collections de données rendus publiques disponibles sur certains sites ou payant sur d’autres. 
  • Données diffusées à partir de sources en ligne à l’aide d’API
  • Informations collectés à des sondages envoyés à une tranche de la population lors d’une etude de recherche en utilisant les Google Forms
  • des données disponibles dans les CRMs de l’entreprise

2. préparation des données:

Les données peuvent présenter de nombreuses incohérences telles qu’une valeur manquante, des colonnes vides, un format de données incorrect qui doit être nettoyé. Vous devez traiter, explorer et conditionner les données avant la modélisation. Plus vos données sont propres, plus vos prévisions seront précises.

3. planification du modèle:

Dans cette étape, vous devez déterminer la méthode et la technique pour dessiner la relation entre les variables d’entrée. La planification d’un modèle est effectuée à l’aide de différentes formules statistiques et outils de visualisation. Les procédés d’analyse SQL, R et SAS font partie des outils utilisés à cet effet.

4. Construction de modèles:

Dans cette étape, le processus de création de modèle proprement dit démarre. Ici, le Data Scientist distribue des ensembles de données pour la formation et les tests. Des techniques telles que l’association, la classification et le regroupement sont appliquées à l’ensemble des données d’apprentissage. Le modèle une fois préparé est testé par rapport à l’ensemble de données : “testing”.

5. Mise en opération:

À cette étape, vous livrez le modèle de base final avec des rapports, du code et des documents techniques. Le modèle est déployé dans un environnement de production en temps réel après des tests approfondis.

6. Communiquer les résultats

À ce stade, les principaux résultats sont communiqués à toutes les parties prenantes. Cela vous aide à décider si les résultats du projet sont un succès ou un échec en fonction des entrées du modèle.

Les métiers de la Data Science

Les metiers de la Data Science sont:

  • Lead Data Scientist
  • Data Engineer
  • Data Analyst 
  • Statisticien
  • Data Architect
  • Administrateur de données
  • Analyste d’affaires ou ‘ Business Analyst ‘ 
  • Gestionnaire de données et d’analyses ou ‘ Data Manager ‘


Apprenons ce que chaque rôle implique en détail:

Lead Data Scientist:

Celui-ci est un professionnel qui gère d’énormes quantités de données pour proposer des visions commerciales convaincantes en utilisant divers outils techniques, méthodologies, algorithmes, etc.

Outils:

Julia, R, SAS, Python, SQL, Hive, Matlab, Pig, Spark

Offres d’emploi ‘ pour le Data Scientist’

Data Engineer:

Le rôle de ce métier est de travailler avec de grandes quantités de données. Il développe, construit, teste et maintient des architectures telles que des systèmes de traitement à grande échelle et des bases de données.

Outils:

Scala, Java, SQL, SAS, Matlab, Python, Ruby, C ++, Perl, Hive, et R

Data Analyst:

Un analyste de données est responsable de l’extraction de grandes quantités de données. Il ou elle recherchera des relations, des modèles, des tendances dans les données. Plus tard, il fournira des rapports et une visualisation pertinents pour analyser les données afin de prendre les décisions commerciales les plus viables.

Outils:

Julia, R, Python, SQL, C, C + +, HTML, JS

Voir offres d’emploi ‘pour le Data Analyst’

Statisticien:

Le statisticien recueille, analyse, comprend des données qualitatives et quantitatives en utilisant des théories et des méthodes statistiques.

Outils:

Julia, R, SQL, Matlab, Tableau, Python, Perl, Spark et Hive

Administrateur de données:

L’administrateur des données doit s’assurer que la base de données est accessible à tous les utilisateurs concernés. Il s’assure également qu’elle fonctionne correctement et qu’elle est protégée contre le piratage.

Outils:

Java, C #, Python Ruby on Rails, et SQL.

Voir offres d’emploi ‘pour l’Administrateur des données’

Business Analyst:

L’administrateur des données doit s’assurer que la base de données est accessible à tous les utilisateurs concernés. Il s’assure également qu’il fonctionne correctement et qu’il est protégé contre le piratage.

Outils:

Java, C #, Python Ruby on Rails, et SQL.

Le point entre la Data Science et la BI (Business Intelligence)

Le point de Focus de la BI

La BI se focalise sur le passé et l’incidence des événements precedents pour mieux apprivoiser le rendu présent. Son approche est statistique et visuelle et ses outils de predilection sont Microsoft BI, et QlickView. 

L’espace BI et son industrie

La BI s’applique au monde des affaires et il permet d’analyser le positionnement d’une société ainsi que les acteurs d’une même industrie. Il outille le département d’ingénierie d’affaires en predictions analytiques pour une meilleur prevision et stratégie commerciale sur le court comme le long terme.

Les outils de predilection de la BI sont Alteryx, Power BI et Tableau.

En revanche La Data Science ne se limite pas au monde des affaires. Son espace d’influence s’étend de l’économie jusqu’à l’astronomie en passant par la médecine. Ses outils sont également plus puissants et conséquents pour une analyse plus pointue et poussée.

Comment et où s’applique la Data Science ? 

Elle s’applique à la recherche Internet

La recherche Google utilise la Data Science pour rechercher un résultat spécifique en une fraction de seconde.

Elle s’utilise également aux systèmes de recommandation:

Exemple : “suggestions d’amis” sur Facebook ou suggestions de vidéos “sur YouTube. Tout est fait avec l’aide de la Data Science.

Une autre utilisation est la reconnaissance d’image et de parole

La parole reconnaît un système comme Siri (iOS), et l’assistant Google, Alexa fonctionnent sur la technique de la Data Science et du Machine Learning. De plus, Facebook reconnaît votre ami lorsque vous téléchargez une photo de lui à l’aide de Data Science.

Elle trouve sa place dans le monde du jeu

EA Sports, Sony, Nintendo utilisent la technologie de la Data Science. Cela améliore votre expérience-utilisateur. Les jeux sont maintenant développés à l’aide de la technique d’apprentissage automatique. Il peuvent se mettre à jour lorsque vous passez à des niveaux plus élevés.

Son usage facilite la comparaison des prix en ligne:

PriceRunner, Junglee et Shopzilla travaillent sur le mécanisme de la Data Science. Ici, les données sont extraites des sites Web pertinents à l’aide d’API.

Quels sont les défis de la technologie de la Data Science ?

  • Une grande variété d’informations et de données est nécessaire pour une analyse précise
  • Le marché manque fondamentalement de talents dans ce nouveau secteur prometteur. 
  • Trop peu de direction accorde une importance suffisante au point de financer un département purement Data au sein de leur groupe alors que ce dernier est vital pour la survie de l’entreprise d’ici ces 5 prochaines années 
  • L’accès à la Data n’est pas toujours évidente
  • Les résultats de la Data Science ne sont pas utilisés efficacement par les décideurs commerciaux dû aux manques d’experts dédiés à l’utilisation intelligence de cette science 
  • Expliquer la Data Science aux autres peut s’avérer difficile
  • La loi sur la protection des données est encore trop flou ET non uniformisée de manière claire à l’échelle mondiale ce qui donne lieu à une cybercriminalité extrêmement nocive pour les utilisateurs. 
  • Les salariés demandés n’ont pas toujours les compétences requises car cette industrie grandit à vitesse exponentielle, et les outils ne font que s’optimiser et s’ajouter voyant certains disparaitre au profits de nouveaux. Prenons l’ exemple Power BI qui a littéralement remplacé Tableau dans grands nombres de boites à tel points que de grands groups se rattachant désormais au wagon de la data recherchent des Data Analystes Power BI, et mentionnent de moins en moins Tableau. 
  • Si une organisation est très petite, elle ne peut pas avoir d’équipe Data. 
  • Ce secteur voit naitre de nouveaux métiers tels que DataOps à propos desquels aucune école ne propose une formation, et ne serait connaitre réellement les outils et comment former les apprenants à ce nouveau titre.

En bref

La Data Science est le domaine d’étude qui consiste à extraire des informations à partir de vastes quantités de données à l’aide de diverses méthodes, algorithmes et processus scientifiques.

Les statistiques, la visualisation, l’apprentissage en profondeur, et l’automatisation sont des concepts importants en Data Science. Le processus de la Data Science passe par la découverte, la préparation des données, la planification de modèles, leur construction, la mise en opération, et la communication des résultats en visuel.

Les métiers de la Data Science sont: A) Lead ou Data Scientist B) Data Engineer C) Data Analyst D) Statistician E) Data Architect F) Data Admin G) Business Analyst F) Data Manager

Julia, R, SQL, et Python sont les langages de programmations les plus utilisés dans le secteur de la Data. Les prédictions de la Data Science sont prometteuses et cela grâce aux méthodes du Machine Learning que nous aurons l’occasion d’aborder dans un article qui lui sera dédié.

Categorie: Développement, Digital

About Dorian H Mekni

Dorian.H Mekni est un expert en Data Mining. Il est féru de techniques algorithmiques et de développement d’application mobiles en language natif : Swift | Kotlin.
Ce ‘Data Full-Stack’ travaille en freelance PRO.
Dorian est aussi membre et auteur chez Data Science Central pour lequel il publie des articles sur les Data Structures et Algorithmes: https://www.datasciencecentral.com/profiles/blog/list?user=31ps4xlxoljkx.

Previous Post:Comment utiliser le framework React JS
Next Post:8 tendances webdesign à suivre pour 2021banniere sur les Nouvelles tendances en webdesign

Reader Interactions

Leave a Reply

Your email address will not be published. Required fields are marked *

Sidebar

Déposez CV

Rechercher

Nos meilleurs articles

Bannière Développement de jeu vidéo

Développement de jeux vidéo : Ce qu’il faut savoir

Le processus du RPA (Robotic Process Automation)

La Robotic Process automation, aux frontières du machine learning et de l’IA

Modeles React JS

10 modèles React gratuits que vous pouvez utiliser pour vos projets

smartphone avec l'appli de CB et les textes: iOS, Android et windows

Développer une application mobile pas à pas

Un programmeur en t-shirt 'code master' fait semblant d'utiliser des langages informatiques sur un panneau interactif

Comment se former au métier de développeur informatique ?

Les erreurs courantes en C# à éviter pour exceller en tant que développeur

Tout savoir sur Angular 18

Web design et le SEO

SEO et Webdesign : une association indispensable

Quels emplois sont menacés par l’intelligence artificielle ?

Scrum

Repenser Scrum pour libérer son potentiel

Google Gemini vs ChatGPT

Google frappe fort avec Gemini 1.5 Pro, défiant la suprématie de ChatGPT

Prompt Engineering

Le Prompt Engineering : L’art de converser avec l’intelligence artificielle

Categories

  • Blockchain (14)
  • Conseils (58)
  • Design (38)
  • Développement (166)
  • Digital (298)
  • Divers (7)
  • E-commerce (13)
  • Evénements (24)
  • Fiche métier (2)
  • Formation (16)
  • Interviews (35)
  • Marché de l'emploi (69)
  • Marketing (127)
  • Méthodologie (10)
  • Réseaux et Systèmes (33)
  • Web (149)

Nos Categories

Blockchain
Conseils
Méthodologies
Design
Développement 
Digital
E-commerce
Evénements
Formation
Interviews
Marché de l’emploi
Marketing
Réseaux et Systèmes
Web

Candidats

Emploi par région
Emploi par métier
Fiche métiers informatiques
Nous contacter
Vous êtes recruteur ?

A Propos

Conditions générales d’utilisation
Politique de confidentialité
Droit d’accès aux données personnelles (cookies)

Social

Facebook
Twitter
Linkedin

Les Jeudis

© Copyright 2023 LesJeudis. Tous droits réservés.