Introduction

Les sites d’emploi en ligne sont devenus une référence majeure pour l’acquisition de talents et la recherche d’emploi. Ces portails d’emploi ont donné lieu à des problématiques difficiles de correspondance et de recherche. La correspondance de base ou la recherche s’effectue entre les compétences, métiers et qualifications requises du poste et ceux présents dans le profil du candidat. La longue liste des compétences métiers et son caractère polyonyme le rend moins efficace pour effectuer une correspondance directe par mot-clé. Cela résulte d’une correspondance d’emploi ou des résultats de recherche inférieurs aux normes qui manque à un candidat correspondant étroitement en raison du fait de ne pas avoir les compétences exactes. Il est important d’utiliser une mesure de similarité sémantique entre les compétences pour améliorer la pertinence des résultats.

Cet article propose une mesure de calcul de similarité sémantique entre les compétences et les métiers par le biais d’une approche basée sur les connaissances métiers. Or cette connaissance peut être représentée par un graphe d’Ontologie.

Qu’est ce que c’est qu’une Ontologie ?

Une ontologie en informatique est un modèle de données qui représente un ensemble de concepts dans un domaine et les relations entre ces concepts. Par exemple, dans l’intelligence artificielle, le génie logiciel, l’informatique biomédicale et l’architecture de l’information, l’ontologie est définie comme une forme de représentation des connaissances sur le monde.

Processus de Construction

Sense4data propose l’utilisation de graphes d’ontologie dans son logiciel de matching entre chercheur et offre d’emploi, afin de faire face aux problématiques mentionnées ci-dessus. Cette approche se caractérise par l’utilisation des ontologies métiers existantes tel que ESCO[1] et Onet[2] et enrichir ces derniers à partir des données recueillies à partir de quelques sites d’emploi en ligne tel que LinkedIn pour dériver un score de similarités entre compétences et métiers. L’enrichissement est une mesure nécessaire pour permettre à notre ontologie de prendre en compte les éventuels changements et l’évolution du marché du travail. L’ontologie aide également à résoudre la problématique de normalisation d’une compétence ou métiers de base à partir de ses multiples représentations.

Aperçu du notre Ontologie résultante

Le graphe construit est caractérisé par différents types d’arêtes qui définissent les types de relations entre les entité des nœuds, tel qu’une compétence est nécessaire ou optionnelle pour tel métier, ou si un métier est un sous-métier d’un autre, ou encore si une compétence est une sous-compétence d’une autre… Je vous recommande de parcourir les ontologies mentionnées sur cet article afin d’avoir une compréhension plus claire des différents types de nœuds et relations qu’on pourrait avoir sur notre graphe.
Ce graphe à travers ses différents types de nœuds et relations fonctionne comme un dictionnaire, décrivant, identifiant et classant les professions, les compétences et les qualifications professionnelles pertinentes pour le marché du travail.

Processus de Calcul de similarité

Pour calculer la similarité entre 2 entrées (compétences ou métiers), on produit une vectorisation de ces derniers à travers les modèles de l’état de l’art de plongements des mots, tel que Bert[3], Fasttext[4], puis on projette les 2 entrées sur notre graphe d’ontologie à partir de la cosine similarité[5] calculée entre chacune des vectorisations des entrées et tous les nœuds du graphe préalablement vectorisés.
Une fois que chacune des entrées est positionnée sur les nœuds relatifs aux scores de cosine similarités les plus supérieurs, on calcule la distance entre ces nœuds au sein du graphe en utilisant les algorithmes des graphes à base d’intelligence artificielle.

Cette distance représente à la fois la proximité lexicale, sémantique et la proximité d’un point de vue du marché du travail.

Au delà d’un calcul de similarité représentatif entre deux entités du lexique du marché de travail, cette ontologie à travers son enrichissement continu, permettra ainsi de suivre l’évolution du marché de travail, tel que :

  • L’identification des compétences et métiers émergents.
  • L’identification des compétences et métiers en voie de disparition.
  • L’identification des proportionnalités géographiques des métiers.

En plus de satisfaire les exigences du poste annoncé, d’autres facteurs tels que les préférences des chercheurs d’emploi et des recruteurs, l’adéquation culturelle, la capacité à s’adapter au marché de l’entreprise et la capacité à évoluer avec l’organisation jouent un rôle important dans la sélection des employés. Et finalement à partir de la connaissance imbriquée dans notre ontologie, une fonctionnalité de proposition de formations à été mise en place afin d’acquérir de nouvelles compétences pour évoluer vers d’autres opportunités de carrière ou vers une reconversion professionnelle.

Chez sense4data, on privilège l’utilisation de la théorie des graphes. Étant donné un ensemble de nœuds et de connexions, qui peuvent résumer l’abstraction de la problématique, la théorie des graphes fournit un outil utile pour quantifier et simplifier les nombreuses parties mobiles des systèmes dynamiques. L’étude des graphes à travers une framework fournit des réponses à de nombreuses problématiques d’agencement, de mise en réseau, d’optimisation, de matching et de ranking. La théorie des graphes peut être utilisée pour modéliser de nombreux types de relations et de processus dans les systèmes physiques, biologiques, sociaux et d’information, et ont un large éventail d’applications utiles telles que par exemple :

  • Classement des liens dans les moteurs de recherche.
  • Cartes GPS pour trouver le chemin le plus court d’un lieu à un autre.
  • Sécurité du réseau informatique
  • Recherche de communautés dans les réseaux

Pour en savoir plus sur le panel de compétences au sein de Sense4data, rendez-vous sur notre site. Suivez nous également sur LinkedIn.

Article rédigé par Adnane El-Mansouri, Data scientist.

Bibliographie

[1] ESCO – Commission européenne – European Commission ec.europa.eu/esco/portal/home?resetLanguage=true&newLanguage=fr

[2] O*NET OnLine onetonline.org

[3] Open Sourcing BERT: State-of-the-Art Pre-training for Natural Language Processing ai.googleblog.com/2018/11/open-sourcing-bert-state-of-art-pre.html

[4] fastText fasttext.cc

[5] Cosine Similarity – Understanding the math and how it works machinelearningplus.com/nlp/cosine-similarity