Negli ultimi anni fa da colonna sonora alla nostra vita, ci consola con hit frizzanti, accompagna i nostri breakdown con canzoni tristi e ci fa cantare sotto la doccia, in auto e a una festa con amici. Ora Spotify ha deciso di avvicinarsi ancora di più ai suoi utenti brevettando un sistema di riconoscimento dell’umore per consigliarci canzoni adatte.
Il nuovo brevetto si chiama “Identification of taste attributes from an audio signal” ed è stato depositato da Spotify nel febbraio 2018 e le è stato poi concesso il 12 gennaio 2021. L’azienda intende così sfruttare la tecnologia AI per entrare ancora più in profondità nei gusti e nelle emozioni dei suoi utenti. Utilizzando il riconoscimento vocale, infatti, determinerà il loro stato emotivo, sesso, età o accento, attributi che userà poi per affinare la selezione di contenuti consigliati, prevista per ognuno dei suoi ascoltatori. La piattaforma di streaming sarà in grado quindi di ascoltare le voci e rilevarne le emozioni per dare successivamente consigli musicali personalizzati.
Secondo Music Business Worldwide, la piattaforma musicale ha ora il permesso di ascoltare tutto ciò che viene detto e monitorerà costantemente tutti i suoni provenienti dall’ambiente in cui operiamo.
L’obiettivo sarà quindi quello di recuperare le suddette informazioni (sesso, età, stato emotivo, accento). Questa tecnologia farebbe affidamento sulla nostra intonazione, sul nostro stress o sulla nostra velocità di parola per determinare il nostro mood, capire se ci sentiamo felici o arrabbiati, tristi o neutri. Spotify ha commentato la sua azione in questo modo: “Ciò che serve è un approccio diverso per catturare i gusti di un utente, in particolare è necessario un approccio più efficiente e tecnology-based“. Spiega poi come sia, in realtà, comune per un’applicazione di streaming multimediale includere funzionalità che forniscano consigli multimediali personalizzati a un utente.
Un approccio già esistente nella piattaforma, per identificare la tipologia di contenuti che a un utente dovrebbero essere raccomandati, consisteva nel chiedere loro di fornire direttamente informazioni di base e a quel punto, grazie alle informazioni ricevute, veniva loro chiesto di fornire ulteriori informazioni (scelte musicali, podcast) per restringere il campo. Ad esempio: l’utente veniva spinto a scegliere tra una rosa di artisti e brani e tra i prescelti doveva poi operare altre selezioni per perfezionare ulteriormente l’identificazione dei propri gusti da parte del sistema.
Questo metodo non è stato però abbastanza efficiente a detta di Spotify, poiché richiedeva agli utenti di inserire noiosamente dati e risposte a più domande.
La soluzione di Spotify? Raccogliere gli stessi dati utilizzando la tecnologia di riconoscimento vocale. Il modo in cui Spotify intende farlo? Recuperare appunto i metadati dei contenuti dalla voce dell’utente e/o dal rumore di fondo.
I metadati ambientali potrebbero indicare rumori di sottofondo specifici come suoni di veicoli in strada, altre persone che parlano, cinguettio degli uccelli, stampa di stampanti e così via. Per fare un esempio del funzionamento di questo sistema si vede come l’età, potrà essere determinata approssimativamente in base a una combinazione di lunghezza del tratto vocale e altezza del tono. Solo dopo che tutti questi metadati saranno stati estratti e analizzati contestualmente alle preferenze precedenti di un ascoltatore, alla sua cronologia di ascolto e valutazione e ai suoi collegamenti, nonché alla sua libreria musicale preesistente, i contenuti consigliati saranno dunque disponibili per ogni utente.
Ora non ci resta che attendere la magia e vedere se effettivamente Spotify sarà capace di comprendere i nostri gusti e bisogni al apri di noi stessi (o forse anche meglio).