Publications

Maths & Musique #3 : Musique, combinatoire des mots et improvisation par ordinateur, par Marc Chemillier

Lire la publication originale.

Par Marc Chemillier, Directeur d’études de l’EHESS

La musique entretient depuis toujours des liens étroits avec les mathématiques. Les pythagoriciens à partir du Ve siècle avant J.-C. commencent à s’intéresser aux rapports entre la musique et les nombres.

Beaucoup plus proche de nous, Joseph Fourier (1768-1830) jette les bases de l’analyse harmonique en étudiant certains signaux périodiques tels que les ondes sonores. Au XXe siècle, le développement de l’informatique a introduit un champ complètement nouveau d’étude mathématique de la musique avec des concepts très puissants, tels que ceux de la combinatoire des mots dont nous allons parler ici. Ces derniers permettent de concevoir des logiciels musicaux modifiant radicalement notre manière de faire de la musique.

En informatique théorique, on étudie des suites de symboles appelées des mots sur un alphabet. Il s’agit de symboles abstraits qui peuvent être des actions à exécuter dans un programme quand il s’agit d’informatique, mais aussi des notes de musique ou tout autre objet selon le domaine d’application étudié. Ce concept est bien adapté à la description de la succession d’événements à l’intérieur d’une séquence musicale, de même qu’il l’est pour décrire et contrôler l’enchaînement d’unités syntaxiques d’une langue dans une perspective de linguistique computationnelle.

Lorsque l’on s’intéresse à des séquences de symboles, l’une des choses les plus simples que l’on puisse envisager est la répétition d’éléments dans la séquence. Par exemple, un « carré » est la répétition d’un motif énoncé deux fois consécutivement comme (abc)(abc). Peut-on construire une séquence avec un alphabet à deux lettres a et b qui ne contienne aucun carré ? On commence par placer un a. On ne peut pas en placer un deuxième car on aurait le carré (a)(a), donc on place un b pour former ab. Ensuite, on est obligé de placer un a pour former aba, sinon on aurait le carré (b)(b). On ne peut pas prolonger aba car si on place un a on fait apparaître le carré (a)(a), et si on place un b, on fait apparaître le carré (ab)(ab). On vient de prouver qu’il est impossible de construire un mot sans carré si l’alphabet n’a que deux lettres. En revanche, cela est possible dès que l’alphabet a au moins trois lettres. Avec deux lettres, on peut construire des mots sans cube (c’est-à-dire sans motif énoncé trois fois consécutivement). Le mathématicien norvégien Axel Thue (1863-1922) en a découvert un qui se prolonge à l’infini. Il le décrit dans un article de 1912 considéré comme le fondement de la combinatoire des mots avec un autre article de lui datant de 1906.

En musique, quand on fait se succéder une à une toutes les notes disponibles, en montant ou en descendant, on obtient ce que l’on appelle une gamme. Par exemple, la succession des touches blanches du piano est la gamme diatonique (partant de la note do). Elle a des propriétés mathématiques très particulières, liées au fait que les touches noires qui séparent les touches blanches sont placées de façon irrégulière, deux d’un côté et trois de l’autre. En effet, si l’on considère les intervalles entre les touches blanches, on a deux demi-tons entre do et , puis deux demi-tons entre  et mi, mais seulement un demi-ton entre mi et fa. Sur l’ensemble des touches blanches du clavier, on obtient la séquence d’intervalles 2212221 qui est un mot sur l’alphabet à deux symboles 1 et 2. Ce mot a la propriété remarquable suivante : il existe une rotation 2221221 qui est palindrome si l’on enlève ses deux symboles initial et final 2(22122)1. En effet, le motif entre parenthèses 22122 donne la même succession de chiffres dans un sens ou dans l’autre.

Ce qui est encore plus surprenant, c’est qu’on obtient une propriété similaire en prenant les touches complémentaires, c’est-à-dire celles qui sont noires. La suite d’intervalles de la gamme correspondante appelée pentatonique est le mot 23223 sur l’alphabet 2 et 3. Là encore, il existe une rotation 22323 qui est palindrome, exceptés les premier et dernier symboles 2(232)3. Mais ce n’est pas tout : le même phénomène s’observe également dans le rythme. Vous connaissez sans doute la chanson « Djadja » d’Aya Nakamura. Elle est fondée sur un rythme appelé reggaeton très courant dans les musiques populaires actuelles qui peut s’écrire 332 (deux croches pointées suivies d’une croche). C’est aussi le rythme du rap « Bande organisée ». Il vient d’une famille de rythmes africains asymétriques qui ont été étudiés par l’ethnomusicologue Simha Arom 332, 32322, 3223222, etc. Qu’y a-t-il de commun entre ces différents rythmes ? Ils s’écrivent tous 32n32n+1 si l’on note 2n la suite de 2 répétés n fois. Ils contiennent un très long carré (32n)(32n), mais leur répartition est asymétrique car on a un 2 en plus à droite qui prolonge la deuxième occurrence du carré. Tous ces mots sont palindromes quand on enlève les deux symboles aux extrémités 3(2n32n)2.

En mathématique, ces rythmes ou ces gammes sont en relation avec ce qu’on appelle des mots de Christoffel en l’honneur du mathématicien Elwin Christoffel (1829-1900) qui les a étudiés pour la première fois dans un article de 1875 où il observe leur caractère palindrome. Il est étonnant de retrouver ces séquences dans des domaines aussi variés que les gammes occidentales ou les rythmes africains, d’autant plus que ces derniers relèvent d’une tradition strictement orale. L’étude de telles structures échappant à l’écriture est le sujet de recherches en ethnomathématique. Deux approches s’opposent dans ce domaine. L’une, issue du courant appelé décolonisation des savoirs, considère qu’on ne peut pas rapprocher ces structures de celles de la tradition écrite parce qu’elles apparaissent dans des contextes trop différents. L’autre plus universaliste considère que ce sont bien les mêmes structures qui apparaissent parce que les principes combinatoires sur lesquels elles sont fondées sont les mêmes, qu’il s’agisse d’alternance d’intervalles dans la gamme, ou de durées dans les rythmes. C’est ce deuxième point de vue qui est adopté dans le présent article.

Figure 1. Les mots de Christoffel codent les déplacements permettant d'approximer une droite par des pixels. Le rythme 3223222 correspond au mot de Christoffel de la droite de pente 5/2.

Venons-en maintenant aux logiciels de création musicale dont on a parlé au début. L’une des révolutions de l’intelligence artificielle ces dernières décennies est le développement des algorithmes d’apprentissage automatique. En musique, un ordinateur peut capter le jeu d’un musicien et ensuite, à partir de ces données, créer de la musique tout seul.  L’une des raisons de ce prodige vient de ce que les données enregistrées contiennent déjà énormément de connaissances musicales implicites telles que le phrasé de la musicienne ou du musicien, son timbre, son articulation, son expression. Une situation analogue était apparue avec le sampling, qui permettait de recycler dans la création musicale des fragments musicaux déjà eux-mêmes très élaborés. Mais avec l’intelligence artificielle fondée sur l’apprentissage, ce phénomène est décuplé par sa dimension générative.

Les modèles les plus étudiés actuellement sont ceux de l’apprentissage profond à base de réseaux connexionnistes, mais d’autres modèles symboliques plus simples, et moins coûteux en ressources de calcul, peuvent s’avérer extrêmement performants. L’un des premiers modèles génératifs basé sur les probabilités de transition a été introduit en 1913 par Andreï Markov (1856-1922) à propos d’une étude statistique sur un texte littéraire.

Prenons l’exemple de la séquence abracadabra. Le a peut être suivi de trois lettres bc ou d, mais il a plus de chances d’être suivi de b que des deux autres. D’un autre côté, rc et d sont toujours suivis de a, et le b est toujours suivi de r. Si l’on génère un nouveau mot en effectuant des tirages aléatoires selon ces règles pondérées, le résultat sera limité à des permutations des syllabes braca et da. Ainsi, la capacité générative des données d’apprentissage dépend des répétitions qu’elles contiennent, c’est-à-dire de leur redondance. On retrouve l’idée de répétition dans les mots développés précédemment à propos de la combinatoire des mots. Certains mots autorisent plus de variantes génératives que d’autres. Ces techniques d’apprentissage sont utilisées dans des logiciels pour l’improvisation musicale développés dans le cadre du projet ERC REACH (IRCAM et CAMS) dirigé par Gérard Assayag. Dans ces applications musicales, les lettres formant les mots peuvent être des tranches de signal (entre 2 dates en millisecondes) associés à différentes métadonnées (harmoniques par exemple). Elles permettent de capter le jeu d’une musicienne ou d’un musicien et de créer une sorte de double informatique qui peut dialoguer en direct avec cette musicienne ou ce musicien. L’ordinateur peut également improviser à partir de larges bases de données de solos de grands maîtres de l’improvisation et jouer dans leur style, ou bien hybrider plusieurs styles entre eux.

Figure 2 : Bernard Lubat au piano joue avec l'intelligence artificielle Djazz pilotée par Marc Chemillier à l'aide d'une bague et d'une application sur smartphone, et qui a préalablement capté Bernard Lubat jouant de la batterie, spectacle « Je est un autre », festival Allez savoir (EHESS), Marseille, 27 septembre 2024 (© Hélène Chemillier-Armani)

L’un des logiciels d’improvisation sur lequel nous travaillons, appelé Djazz, est utilisé pour explorer la question suivante : un système d’intelligence artificielle peut-il apprendre à jouer dans le style musical d’une culture donnée au point d’être capable de s’intégrer dans un orchestre ou un rituel local ? C’est possible avec Djazz, car le logiciel effectue un apprentissage supervisé qualifié d’agnostique, c’est-à-dire qu’il ne fait pas d’hypothèse a priori sur les connaissances musicales mises en œuvre – à part quelques hypothèses très simples, comme l’existence d’une pulsation régulière (nécessaire pour les musiques de danse par exemple). Nous avons utilisé Djazz dans différents contextes et l’idée que le logiciel peut apprendre à jouer dans le style d’une musicienne ou d’un musicien a pris une résonance particulière. En effet, l’un des musiciens avec lequel nous avons travaillé à Madagascar, Velonjoro, est décédé en 2017. Mais en 2022, un autre grand musicien malgache Justin Vali a eu envie de jouer en duo avec lui. Cela a été possible virtuellement grâce aux données de jeu de Velonjoro conservées dans l’ordinateur.

Duo virtuel du cithariste malgache Justin Vali avec Velonjoro via le logiciel Djazz piloté par Marc Chemillier, février 2023 (lien vidéo: https://www.youtube.com/watch?v=oZofSI8gWHg) (© Yuri Prado).

Laisser un commentaire

Votre adresse e-mail ne sera pas publiée. Les champs obligatoires sont indiqués avec *