Quando si pensa alla biometria applicata al contrasto alla criminalità, nell’immaginario comune è immediato associarla all’utilizzo, da parte delle forze dell’ordine, di strumenti come l’analisi delle impronte digitali e il riconoscimento facciale. In realtà, grazie al rapido sviluppo che le tecnologie vocali base su AI e Machine Learning hanno conosciuto nell’ultimo decennio, è ormai largamente diffuso, anche in questo ambito, l’utilizzo di soluzioni voice based.
Spitch, azienda internazionale specializzata in soluzioni di communication automation, ha raccolto alcuni esempi concreti in cui le tecnologie vocali sono al centro dell’attività investigativa e giudiziaria. Vediamoli insieme:
Siip, il data base mondiale di tracce audio di Interpol
Raccogliendo materiale dai database di 192 forze di polizia di tutto il mondo, Interpol ha avviato, ormai da qualche anno, il proprio sistema di riconoscimento basato sul campionamento di tracce audio: si tratta dello Speaker Identification Integrated Project (abbreviato in Siip). Il sistema biometrico permette di riconoscere il singolo individuo intercettato dalle forze dell’ordine e individuarne genere, età, lingua e dialetto, sulla base di un semplice audio ambientale, della registrazione di una telefonata o del recupero di un messaggio vocale. Il successo dell’identificazione, secondo le fonti ufficiali, è garantito anche con tracce audio compromesse o di bassa qualità.
Un’applicazione realizzata in Italia, da Spitch con Tecnet Systems
A livello italiano, la stessa Spitch, in collaborazione con il partner Tecnet Systems, ha sviluppato una soluzione specificatamente studiata per supportare le forze dell’ordine nel contrasto della criminalità. Attraverso la Biometria Vocale (BV), la soluzione consente la verifica automatica delle identità durante una conversazione, indipendentemente dal canale attraverso cui la stessa viene diffusa, comparando sia audio dal vivo che registrati con le impronte vocali, che equivalgono a espressioni matematiche di voci individuali. Inoltre la trascrizione delle conversazioni tramite il motore di ASR (Automatic Speech Recognition), e l’intent recognition possibile attraverso l’ NLU (Natural Language Understanding) permettono di offrire una analisi più completa