2020 : Mood, chiffres et musique

Quand les données Spotify jouent avec nos émotions

2020.

L’année du confinement. Le summum de la déprime pour certains, un break productif pour d’autres. La procrastination a côtoyé les bonnes résolutions et les envies de changer le monde. Pour moi le confinement a été l’occasion de me réfugier dans ma collection de disques. Enfin, celle qui tient dans le fond de ma poche, merci Spotify. Dans cette période incertaine, certains ont sans doute voulu compenser en écoutant leurs playlists “feel good” en se remémorant leurs meilleures soirées. Car oui il fallait garder le moral. Moi ça a plutôt été l’inverse. Ma liste de lecture est restée coincée quelque part entre Nick Drake et Elliott Smith. Si vous jetez une oreille à ces deux merveilleux artistes, vous conviendrez qu’ils n’incarnent pas vraiment la joie de vivre. Je vous ai dit qu’ils s’étaient tous les deux suicidés ?

Dans cette période de confinement, la musique a sans doute joué un rôle essentiel pour beaucoup d’entre nous. Les émotions qu’elle peut susciter sont à la fois personnelles et universelles. Mais à l’heure du streaming et des recommandations personnalisées, nous ne sommes plus les seuls à percevoir ces émotions. Vous êtes-vous déjà demandé comment la musique que vous écoutez était interprétée par les algorithmes des plateformes de streaming ? Vous savez, celles qui vous connaissent si bien qu’elles arrivent à vous faire découvrir votre prochain artiste préféré.

J’ai décidé d’aller fouiller sous le capot de Spotify pour découvrir comment l'algorithme quantifiait nos émotions. Je me suis également demandé quel avait été l’impact du confinement sur notre manière d'écouter de la musique. Et surtout, dois-je vraiment m'inquiéter de m'être plongé dans une musique triste et mélancolique pour traverser cette étrange période ? Et suis-je le seul ?

Les données nécessaires à cette analyse ont été obtenues via le langage de programmation R et grâce au package Spotifyr développé par Charlie Thomson, qui permet de communiquer avec l’API Spotify et d’en extraire des données. La méthodologie complète est disponible ici.

Happy or not happy ?

Quand on regarde sous le capot de la machine Spotify, on s’aperçoit que la plateforme associe à chaque morceau une série de caractéristiques propres. Entre autres :  tempo, mode (majeur ou mineur), signature rythmique, energy ou encore danceability. Ces variables sont chiffrées, souvent de 0 à 1. Elles permettent à l’algorithme de classifier les morceaux.

Le concept qui a vraiment retenu mon attention est celui de valence. Spotify définit la valence comme la "positivité musicale véhiculée par un titre". L'algorithme pourrait donc reconnaître quel type de sentiment un morceau pourrait être susceptible de susciter chez l'auditeur. Ainsi, les morceaux à forte valence (qui tendent vers 1) ont un son plus positif tandis que les morceaux à faible valence (qui tendent vers 0) expriment plutôt la tristesse ou la dépression. J’ai donc voulu demander à mon copain l’algorithme s'il était autant touché que moi par la mélancolie de Nick Drake. Et si à l'inverse, il lui arrivait aussi de danser tout seul sur September de Earth, Wind & Fire.

Les accords lugubres de ce morceau en 5 temps n'ont pas trompé notre algorithme qui donne à ce morceau une valence de 0.09. Vous avez dit déprimant ? Nick Drake, artiste "maudit" mort à 26 ans, évoque ici l'amertume de la vie. Le graphique ci-dessus indique que le morceau n'est pas très énergique, est dépressif à souhait et est largement acoustique. Bien vu Spotify ! A côté de ça, "Hello" d'Adèle et sa valence de 0.2 parait presque amusant.

0.97 de valence et 0.83 d'énergie : ce tube groovy a fait danser les générations. La bonne humeur de ce morceau d'Earth, Wind & Fire est contagieuse. Ce n'est pas pour rien que ce morceau est devenu un classique des mariages et est apparu de nombreuses fois à la télévision et au cinéma (Do you remember la danse d'Omar Sy dans Intouchables ?). Les morceaux joyeux et euphoriques comme celui-ci ont souvent des hautes valeurs en valence, energy et danceability.

Jusqu'ici, l'algorithme de Spotify fait plutôt un bon boulot. Evidemment, ces deux exemples sont plutôt extrêmes. Si les ingénieurs de Spotify ont entraîné l'algorithme en le gavant de morceaux joyeux et tristes, il n'est pas sans faille. Il m'est arrivé de tomber sur des exemples moins concluants et il convient d'être conscient des limites de ce genre d'analyse.

Pour vaincre la morosité ambiante, je me suis dis qu'une playlist "Happy & Joyful Songs" me redonnerait la pêche. Je me suis alors demandé si la valence était le critère principal dans la construction des playlists de ce genre. J'ai donc décidé de vérifier les caractéristiques des morceaux de deux playlists créées par Spotify : "Sad Songs" qui propose "des chansons qui nous briseront le coeur". Et "Happy Hits!" qui promet de "booster notre moral". Pile ce dont j'ai besoin.

(Les données issues de ces playlists ont été récoltées le 10/01/2021. Leur contenu a pu varier depuis).

A première vue, notre première intuition semble être la bonne. La playlist "Sad Songs" comporte bel et bien une majorité de chansons à faible valence. La valence moyenne de la playlist est de 0.27, ce qui correspond par exemple au morceau "Heather" de Conan Gray. Au-delà de la valence, on peut remarquer que les titres ne sont pas très réjouissants : "I Need You To Hate Me", "Can't Wait To Be Dead", "Hurt So bad". Ambiance. Heureusement, quelques morceaux de la playlist approchent des valeurs plus joyeuses comme le titre "Crawl" qui avoisine une valence de 0.7.

0.76, c'est également la valence moyenne de notre playlist "Happy Hits!". Parmi les artistes qui ont la plus grande valence, on retrouve les Beatles avec Twist & Shout (0.94) et les Jackson 5 avec ABC (0.96). De quoi remonter le moral, même aux fans absolus de "Can't Wait To Be Dead".

Je sais donc maintenant que la valence est une donnée algorithmique importante pour analyser la positivité d'un morceau de musique. Très bien. Mais cela ne répond toujours pas à ma question initiale : suis-je le seul à avoir écouté de la musique moins joyeuse durant le confinement ? Les évènements extérieurs influencent-ils les artistes que l'on écoute au quotidien ?

Confinement = déprime ?

Analyse data du Top 200 Spotify journalier en Belgique en 2020

Si la partie technique et le code R utilisé dans la suite de cet article vous intéressent, la méthodologie complète est disponible ici.

J'ai alors l'idée d'analyser les caractéristiques du Top 200 en Belgique pour chaque jour de l'année. Après un rapide calcul, cela nous fait 366 x 200 morceaux. Soit 73200 morceaux à analyser. Mission impossible ? Heureusement, je tombe dans mes recherches sur le package Spotifyr développé par Charlie Thomson qui me sera d'une grande aide.

Ni une ni deux, je décide de récolter les données de ces 73200 morceaux afin d'évaluer l'évolution de ce fameux indice de positivité tout au long de l'année en Belgique. Je laisse mon ordinateur tourner pendant une nuit et au réveil je suis prêt à répondre à la question qui me taraude.

J'ai donc réussi à obtenir pour chaque jour de l'année les caractéristiques des 200 morceaux du Top belge Spotify. J'ai alors pu calculer la moyenne de la valence par jour de l'année 2020. Et visiblement je n'ai pas été le seul à écouter de la musique moins positive durant le premier confinement, ouf!

Le premier mois passé et la routine installée, on peut noter une baisse importante de la valence moyenne. Le 28 avril, la musique des Belges était moins positive de 5% par rapport au début du mois. Avec le retour des beaux jours et le déconfinement annoncé, on observe une augmentation de la positivité des morceaux dans le Top 200 belge. Et puis lorsque la deuxième vague et de nouvelles mesures se font sentir, la valence moyenne chute à nouveau.

On pourrait également se dire que nous avons écouté moins de musique dansante durant les week-ends de confinement puisque les bars et les boîtes de nuit étaient fermés et les contacts rapprochés interdits. En effet, alors que la moyenne annuelle de la "danceability" affiche 0.68, celle des week-ends de confinement s'élève à 0.66. Une baisse de 2% par rapport à la moyenne annuelle. La situation sanitaire influencerait-elle les morceaux que nous écoutons quotidiennement ?

C'est un fait, la musique streamée pendant le mois de juillet est plus heureuse que celle du mois de mai ou de novembre. C'est vrai, les Belges ont selon l'algorithme écouté de la musique moins positive durant le premier confinement.

Il ne faut néanmoins pas y voir un lien direct de cause à effet. L'impact saisonnier n'est pas négligeable et la musique que nous écoutons est influencée par le calendrier tel que le montre cette enquête de The Economist. Si l'on compare nos résultats avec la moyenne mondiale de 2019, on peut observer que nous suivons la courbe annuelle caractérisée par une augmentation au printemps et une chute durant l'automne.

The Economist, (Février 2020). https://www.economist.com/graphic-detail/2020/02/08/data-from-spotify-suggest-that-listeners-are-gloomiest-in-february

The Economist, (Février 2020). https://www.economist.com/graphic-detail/2020/02/08/data-from-spotify-suggest-that-listeners-are-gloomiest-in-february

Notre base de données de 73200 morceaux nous permet cependant de mettre en évidence certains comportements particuliers liés au calendrier chez nous.

On remarque que le 31 décembre connait un pic au niveau de la valence moyenne. Les Belges fêtent donc le nouvel-an avec des chansons dont la valence moyenne est 10% plus élevée que celle de la veille.

Nous pouvons également nous intéresser à d'autres caractéristiques comme par exemple la danceability, qui mesure si un morceau est dansant ou non. Le jour où la moyenne de cet indice est la plus haute est le 21 Juillet, pile pour la fête nationale belge !

A l'inverse, et c'est assez surprenant, le jour de l'année où les morceaux sont les moins dansants et où l'indice d'énergie est plus bas est lors du réveillon de Noël, le 24 décembre. Si on regarde de plus près, presque l'intégralité du top 200 belge du 24 décembre est constituée de chansons de Noël. Mariah Carey arrive bien évidemment en tête du classement. All I Want For Christmas Is You a été écouté près de 300.000 fois rien que le soir du réveillon!

Cette petite plongée sous le capot de Spotify nous montre à quel point les algorithmes rythment nos vies et analysent nos comportements. Les plateformes en ligne auront-elles bientôt la mainmise sur nos émotions ?

Les données récoltées dans le cadre de cette brève analyse sont déjà vertigineuses. On pourrait s'y perdre et tirer encore bien des observations de ces quelques 73200 morceaux. Pour ceux qui souhaiteraient réutiliser la base de données pour un travail futur, elle est disponible ici.

Fort heureusement, la musique est plus qu'une histoire de chiffres. Nous restons les seuls à pouvoir percevoir l'émotion qui se trouve entre les 0 et les 1. Et je suis certain d'avoir versé plus de larmes en écoutant Nick Drake que l'algorithme Spotify.

Renaud Verstraete