Contenuti : 1. Machine Learning: come le macchine possono imparare da sole! 2. Quali fattori influenzano la qualità dell'apprendimento automatico? 3. Il tipo di dati utilizzati nel Machine Learning 4. Il caso specifico delle variabili psicologiche e comportamentali 5. La rappresentatività del database su cui viene svolta la formazione
L’obiettivo finale dell’Intelligenza Artificiale nel reclutamento è quello di garantire che decine, centinaia o addirittura migliaia di candidature vengano elaborate nel modo più oggettivo ed efficiente possibile:
- sulla base di una certa quantità di dati,
- applicare un trattamento coerente a questi dati da un’applicazione all’altra,
- liberandoci da tutte le rappresentazioni/stereotipi e dai pregiudizi cognitivi.
La formalizzazione di questa elaborazione sistematica applicata ai dati è nota come algoritmo.
Gli algoritmi in questione…
Un algoritmo è(secondo Wikipedia): “Una sequenza finita e non ambigua di operazioni o istruzioni per risolvere una classe di problemi”.
A prima vista, si potrebbe pensare che sia un modo di lavorare un po’ “meccanico”, addirittura primitivo, soprattutto quando si tratta di gestire le applicazioni (con “persone reali” dietro ciascuna di esse)…
È facile immaginare un algoritmo semplicistico come :
- Se il candidato ha la caratteristica A (ad esempio, istruzione = scuola di economia), vengono aggiunti 20 punti alla domanda.
- Se poi ha la caratteristica B (ad esempio esperienza nello stesso settore dell’azienda che vuole assumere) allora aggiungiamo 40 punti.
- E così via…
È importante capire che gli algoritmi possono anche essere estremamente sofisticati ed eleganti. Ad esempio, possono includere “logiche annidate” come il :
- Se A è compreso tra 70 e 100
- E B ha un valore compreso tra 40 e 60
- E che C…
- E che D….
- E/O che…
- E che… Questo continua quasi all’infinito.
Ma in questo caso, anche se siamo già ben oltre le capacità di elaborazione dei dati del cervello del 100% dei reclutatori (e di qualsiasi essere umano, se è per questo), siamo ancora a un livello abbastanza elementare di algoritmo!
Quando parametrizzi un algoritmo, puoi facilmente integrare altri tipi di elaborazione che prevedono il calcolo di correlazioni e regressioni lineari su un pool di dati per estrarre valori di soglia che possono poi essere applicati all’elaborazione specifica di un insieme di domande per una determinata posizione.
L’intelligenza artificiale nel reclutamento(reclutamento predittivo) è estremamente utile anche per identificare, prima dell’avvio di un incarico, i fattori che determinano il successo e l’impegno per una determinata posizione, in un contesto specifico.
In pratica, l’IA può aiutare a stilare un elenco delle qualità necessarie per avere successo ed essere assunti per un determinato lavoro. Non è un granché… ma è un prerequisito essenziale per un’assunzione di successo. Senza di essa, buona fortuna nel trovare quella gemma rara!
Machine Learning: come le macchine possono imparare da sole!
L’apprendimento automatico può essere definito come: “Un insieme di approcci matematici e statistici per dare a un sistema informatico la capacità di imparare dai dati”.
Il Machine Learning, anche se oggi è chiaramente poco sfruttato (o non sfruttato affatto) dalla maggior parte degli editori di soluzioni HR Tech, è comunque uno dei rami più promettenti dell’Intelligenza Artificiale applicata al reclutamento.
Fondamentalmente, il Machine Learning nel settore del reclutamento consiste nell'”imparare dalle assunzioni precedenti”.
Applicato sistematicamente, il Machine Learning ha il potere di affinare gradualmente i suoi criteri di selezione – per una determinata posizione – verso capacità sempre più potenti di “prevedere il successo e l’impegno delle persone” in quella determinata posizione.
Quali fattori influenzano la qualità del Machine Learning?
I fattori che determinano la qualità e la natura discriminante o meno di un sistema di apprendimento automatico sono principalmente di due tipi:
- Il tipo di dati utilizzati,
- La rappresentatività del database utilizzato per l’apprendimento automatico.
Il tipo di dati utilizzati nel Machine Learning
Va da sé che, per non introdurre effetti perversi, il Machine Learning deve essere applicato a dati che non abbiano “potenzialmente” un carattere discriminatorio diretto (età, sesso, ecc.) o indiretto (indirizzo, scuole, esperienza, ecc.).
I criteri diretti, se definiti come criteri di esclusione, escludono direttamente alcune categorie di persone, senza stabilire un legame assoluto con le prestazioni effettive nel posto di lavoro.
Alcuni criteri sono detti “indiretti” perché, anche se non sembrano indirizzare una specifica categoria di persone, è comunque possibile che sia così. Se prendiamo l’indirizzo, ad esempio, è ovvio che se escludo tutte le candidature provenienti dal dipartimento di Seine-Saint-Denis (93), escluderò la maggior parte delle candidature di candidati provenienti da quartieri e/o immigrati (di prima, seconda o terza generazione).
Idealmente, quando lavori alla selezione di persone per l’assunzione, dovresti far funzionare il sistema di Machine Learning su dati che non sono influenzati (o lo sono solo in minima parte) da nessuno dei criteri considerati come fattori di discriminazione nell’assunzione dalla legislazione del paese in cui operi.
Il caso specifico delle variabili psicologiche e comportamentali
Le caratteristiche psicologiche e comportamentali, invece, offrono un’alternativa particolarmente interessante. Questo per il semplice motivo che queste caratteristiche sono abbastanza ben distribuite, indipendentemente dai criteri utilizzati per definire una popolazione.
Se scelgo di preselezionare i miei candidati sulla base delle loro capacità cognitive, valutate attraverso un test standardizzato, invece di utilizzare il criterio “ha frequentato la tal scuola”, sono destinato a neutralizzare il fattore “è stato generato da genitori socialmente di successo”. Il che rappresenta comunque un passo avanti in termini di equità nelle assunzioni.
Allo stesso modo, se eseguo il Machine Learning su un set di dati che include queste informazioni (la capacità cognitiva degli individui) piuttosto che le informazioni sulla scuola frequentata, il sistema tenderà a propormi candidature molto più diversificate in termini di genere, origine o età.
La rappresentatività del database su cui viene effettuata la formazione
Questo criterio è particolarmente interessante da studiare. Se nella mia azienda, per un lavoro specifico, tendo ad assumere soprattutto uomini che hanno frequentato la scuola di ingegneria e faccio funzionare un algoritmo di Machine Learning sulla base dei loro CV… cosa pensi che verrà fuori?
È molto probabile che uno dei criteri che ti contraddistingue sia il fatto di aver frequentato una determinata scuola di ingegneria. La maggior parte degli studenti delle scuole di ingegneria sono giovani bianchi provenienti da famiglie benestanti.
Se per me la diversità è importante (oltre ad essere – tra l’altro – un obbligo di legge), allora probabilmente è meglio incorporare altri fattori che – come abbiamo appena visto – hanno meno probabilità di essere influenzati dall’estrazione sociale dei candidati.
Se invece analizzo i dati dei risultati dei test cognitivi sulla mia popolazione di ingegneri, è probabile che l’algoritmo di Machine Learning faccia emergere un criterio del tipo: “Capacità cognitive superiori”.
Ciò che è importante capire è che se i criteri di analisi sono criteri che non sono influenzati da variabili potenzialmente discriminanti, la rappresentatività del campione diventa del tutto secondaria.
Perché? Perché, a conti fatti, non ha molta importanza che nella mia azienda ci siano – nel momento in cui faccio l’analisi – essenzialmente “giovani uomini bianchi provenienti da famiglie ben consolidate”.
Dato che il criterio che spicca è la “capacità cognitiva superiore”. Considerando anche che la percentuale di persone con capacità cognitive superiori è tanto alta tra gli uomini quanto tra le donne, tra gli abitanti di Parigi 16 o Neuilly come di Marsiglia, Bondy o Le Mirail…
Se in futuro deciderò di applicare questo criterio di“attitudine cognitiva“, eliminando il criterio della “scuola di ingegneria”, non c’è il rischio che in futuro selezionerò solo “giovani uomini bianchi i cui genitori provengono da classi sociali elevate”. Al contrario, aumenterà automaticamente la diversità dei miei team! (A patto che, ovviamente, diversifichi anche le mie fonti di approvvigionamento).
È vero che il campione di base (le persone della mia azienda all’inizio) era “fortemente caratterizzato”, ma ci ha permesso di evidenziare una caratteristica distintiva che non è “specifica di questa particolare popolazione”. In un certo senso, l’esercizio ha permesso di far emergere una caratteristica “universale”.
Questo per chiarire che l’argomentazione “per fare Machine Learning serve un database enorme e la popolazione di base deve essere sufficientemente diversificata altrimenti non funziona”… è semplicemente inesatta!