Shadow
Shadow
close-up-shot-of-data-center-it-specialist-using-p-2024-09-18-23-58-05-utc
Blog > 04 novembre 2024 - TECH

Le machine learning dans un environnement data : une techno en pleine expansion

Shadow

Cas pratique

Associé aujourd’hui au vaste champ de l’intelligence artificielle, le machine learning désigne une technologie d’apprentissage autonome utilisée pour paramétrer des algorithmes. C’est en particulier dans un environnement data que cette branche de l’IA s’exprime le mieux. Pour ce cas pratique, agap2IT vous propose de connaître un usage professionnel répandu du machine learning

 

Le maching learning : une technologie en pleine expansion 

Que l’on mesure le nombre d’annonces pour des professionnels maîtrisant TensorFlow ou Mathematica ou qu’on lise les rapports sur la croissance économique du machine learning, force est de constater que cette technologie est plus que jamais d’actualité dans le monde de l’informatique.

Si la recherche fondamentale sur l’apprentissage par la machine existe depuis les années 1950, c’est véritablement ces dernières années que son développement pratique est entré dans les mœurs. De la biométrie à la médecine, en passant par la finance et l’industrie, nombre d’applications utilisent désormais des techniques issues du machine learning, qu’il s’agisse de déterminer des patterns dans un vaste ensemble de données, de généraliser la reconnaissance faciale ou de gérer des positions boursières à partir d’un ensemble de datas d’entreprise et de placements.

Automatiser des tâches complexes et aider l’humain dans sa prise de décision : telles sont aujourd’hui les missions les plus évidentes qui imposent le machine learning partout.

 

Différents modèles de machine learning 

Le machine learning utilise différentes techniques mathématiques issues de l’algorithmique et de la statistique. Ces techniques fonctionnent selon un même but : l’organisation des données pour leur classement, leur regroupement et/ou leur apparentement, de manière à comprendre un modèle et effectuer ensuite des prédictions.

Parmi les algorithmes les plus utilisés dans le machine learning, on trouve plusieurs catégories : les algorithmes de classification, par exemple, fonctionnent plutôt bien pour caractériser un élément de données en fonction de différentes questions, qui prennent la forme d’un arbre. Cela donne une prédiction qualitative après apprentissage par la machine. On peut l’opposer, en quelque sorte, aux algorithmes de régression qui utilisent différents coefficients pour associer deux variables ensemble, et ainsi associer quantitativement des données entre elles.

Dans certains domaines, on utilise des algorithmes beaucoup plus complexes, basés sur les réseaux de neurones, qui réclament d’autant plus de ressources et de connaissances que les modèles de ce type permettent des apprentissages à grande échelle sur des données comme les images, par exemple.

 

Cas pratique : machine learning dans une chaîne de production automobile 

Supposons qu’une entreprise de production de pièces pour automobiles ayant pour clients des usines d’assemblage et comme fournisseurs des spécialistes des matières premières souhaite rationaliser et optimiser son planning machine, notamment en affinant la saisonnalité du marché.

Pour ce faire, le service IT de la société développe en interne un outil de machine learning qui va venir s’appuyer sur un historique de commandes fournisseurs et de factures clients pour analyser de manière ultraprécise les tendances du marché, éliminer les anomalies statistiques et proposer un modèle régulièrement mis à jour d’aide à la décision.

Dans un environnement Python, on utilisera des bibliothèques de traitement de données (type Pandas) ainsi que des bibliothèques orientées science, comme scikit-learn et Numpy, afin de mettre en place l’entraînement et l’algorithme.

La première étape consiste à utiliser les données pour en extraire les informations les plus pertinentes : en l’occurrence, il s’agit de connaître les besoins en stock de matière première à un instant t, et dans le même temps d’analyser les ventes au jour près afin d’entretenir la chaîne de production de manière optimisée. Il conviendra donc de nettoyer les données, de normaliser les formats, de traiter les anomalies, de manière à automatiser la transformation des datas brutes en fichier exploitable.

La mise en place de l’entraînement du machine learning commence une fois ces datas formatées et accessibles. Aujourd’hui, pour choisir le meilleur modèle, et le meilleur algorithme, il est conseillé d’effectuer un benchmark de plusieurs algorithmes sur les mêmes données, et d’observer les résultats : XGBoost, TensorFlow ou Random Forest peuvent être utilisés et différentes métriques (MAE, RMSE, MAPE) peuvent être adjointes au résultat final afin d’observer lequel paraît le plus efficace.

Une fois le modèle ayant obtenu les meilleurs scores sélectionné, un entraînement de référence permet d’obtenir des résultats sous forme brute : en l’espèce, le modèle correctement entraîné indiquera les réductions ou augmentations de production à effectuer au jour près, sous forme brute. L’entreprise pourra alors mettre en place, sous la forme d’une API, un accès direct à ces résultats dans le workflow, facilitant la prise de décision des services achats, planning et production, afin de réagir le plus vite possible aux saisonnalités éventuellement détectées par l’algorithme. En parallèle, via une connexion de l’algorithme aux bases de données, une mise à jour régulière, par un entraînement aux nouvelles données de production, d’achat et de facturation, offre au modèle une manière de s’améliorer.

Comme l’illustre ce cas pratique, l’usage du machine learning en entreprise requiert des connaissances vraiment spécifiques. Pour en libérer tout le potentiel, faites appel aux spécialistes d’agap2IT acculturés à cette tendance !