21 août 2010

La découverte de lois naturelles à partir de données expérimentales

Un article paru dans Science [1] présente l'utilisation de méthodes mathématiques et numériques pour découvrir automatiquement des lois physiques à partir de données expérimentales. Notamment, les auteurs arrivent à retrouver les lois régissant le mouvement d'un pendule à partir de mesures de la position de celui-ci. La méthode employée est basée sur le principe de la régression symbolique. Essentiellement, on utilise des méthodes de régression linéaire (ou non linéaire) et de statistique en combinaison avec des techniques informatiques plus « souples » appelées évolutives comme des algorithmes génétiques. En bref, on utilise l'ordinateur pour rechercher parmi toutes les possibilités (sans contraintes) la loi qui explique le mieux les observations.

Image tirée de [1].

Le bioréacteur sur lequel je travaille utilise sensiblement la même approche. Un algorithme génétique sert à chercher parmi toutes les lois possibles une relation qui explique ce qui se passe dans le bioréacteur. Une régression est effectuée pour estimer l'effet de chaque facteur sur la croissance des tissus. J'ai choisi spécialement cette approche plutôt qu'un réseau de neurones, car je trouve important que le modèle sur lequel est basé le contrôle du bioréacteur signifie quelque chose pour les scientifiques. Par exemple : « la déformation circonférentielle cyclique augmente la croissance ».

Je suis heureux que cette idée est trouvée son écho dans la revue Science (2009). Je crois que c'est une approche rare, innovatrice qui a un beau futur devant elle.

1. M. Schmidt et H. Lipson, “Distilling free-form natural laws from experimental data,” Science 324, n°. 5923 (2009): 81.

Publié par : Frédéric Couet

2 commentaires:

  1. Hey!

    Mais si t'étudiais quelque chose qui n'est pas cyclique (un phénomène que tu comprends tout simplement mal, pour être plus général), comment peux-tu à priori tout réduire à une seule forme fonctionnelle? C'est bien ce que tu fais (Chercher «la» fonction) ?

    Tu devines ma question: pourquoi ne pas faire une estimation «ponctuelle» (non-paramétrique) plutôt que de demander à un programme de «simuler» des régularités et de trouver une seule solution pour tout point du support?

    Nic

    RépondreSupprimer
  2. C'est une excellente question, d'autant plus que dans mon type d'application, il est probable que plusieurs « régimes » existent. Par exemple, au début de la culture, il y a une période où les cellules s'attachent au matériau, ensuite une période où elles se multiplient, etc. Toutes ces périodes sont différentes et peuvent nécessiter des modèles différents. Éventuellement, il serait intéressant de développer des méthodes pour générer des modèles plus complexes qu'une simple équation différentielle ou qu'un modèle de régression.

    RépondreSupprimer