Physical Intelligence dévoile π0.7, un modèle capable d'apprendre des tâches sans entraînement préalable

Publié le 2026-04-17T20:18:02.506+00:00 — D'après TechCrunch

Les faits

Physical Intelligence, la startup de robotique basée à San Francisco qui s'est imposée comme l'une des plus observées de la Silicon Valley, a publié jeudi des travaux de recherche démontrant que son dernier modèle, baptisé π0.7, peut diriger des robots pour accomplir des tâches sur lesquelles ils n'ont jamais été explicitement entraînés. Cette capacité, connue sous le nom de généralisation compositionnelle, permet au modèle de combiner des compétences acquises dans des contextes différents pour résoudre des problèmes entièrement nouveaux. Selon Sergey Levine, cofondateur de Physical Intelligence et professeur à l'UC Berkeley spécialisé dans l'IA pour la robotique, une fois que le modèle franchit le seuil où il cesse de reproduire exactement les données collectées pour commencer à remixer les choses de nouvelles façons, les capacités augmentent de manière plus que linéaire avec la quantité de données. Le modèle π0.7 représente une rupture fondamentale par rapport à l'approche traditionnelle de l'entraînement robotique, basée essentiellement sur la mémorisation par répétition : collecter des données sur une tâche spécifique, entraîner un modèle spécialisé sur ces données, puis recommencer pour chaque nouvelle tâche. Les résultats publiés montrent que π0.7 égale les performances des systèmes spécialisés précédents sur un large éventail de tâches complexes, notamment la préparation du café, le pliage du linge et l'assemblage de boîtes, tout en démontrant une capacité à accomplir des tâches non couvertes par son ensemble de données d'entraînement. L'équipe a notamment rapporté que le modèle a réussi à faire tourner un engrenage sans préparation préalable, une tâche que l'un des chercheurs a testée en demandant simplement au robot : « Peux-tu faire tourner cet engrenage ? » Cette avancée suggère que l'IA robotique pourrait approcher un point d'inflexion similaire à celui observé avec les grands modèles de langage, où les capacités commencent à se développer de manière non linéaire. Le modèle est conçu pour fonctionner sur différentes plateformes robotiques, ce qui le rend potentiellement plus polyvalent que les solutions spécifiques à un matériel donné. Physical Intelligence, soutenue par des investisseurs de premier plan et dirigée par des luminaires de l'IA, parie que le préentraînement à grande échelle peut faire pour les robots ce qu'il a fait pour les modèles de langage.

Pourquoi c’est important

Cette annonce marque un tournant stratégique majeur pour l'industrie de la robotique. Pendant des décennies, l'automatisation robotique a été entravée par sa rigidité : chaque tâche nouvelle exigeait une collecte de données massive, un réentraînement coûteux et une reconfiguration matérielle. Si les résultats de Physical Intelligence se confirment, ils ouvrent la voie à des robots véritablement adaptatifs, capables de se déployer dans des environnements nouveaux et d'être améliorés en temps réel grâce à des instructions en langage naturel, sans nécessiter de nouvelle collecte de données ou de réentraînement du modèle. Cela pourrait accélérer considérablement l'adoption de l'automatisation dans les secteurs qui la trouvaient jusqu'à présent trop inflexible ou trop coûteuse. Sur le plan technologique, cette démonstration de généralisation compositionnelle suggère que les robots pourraient bientôt bénéficier des mêmes propriétés d'évolutivité favorables que celles observées dans les domaines du traitement du langage et de la vision par ordinateur. Si cette trajectoire se poursuit, les capacités robotiques pourraient croître de façon exponentielle avec l'augmentation des données d'entraînement, plutôt que de manière linéaire comme c'était le cas avec les approches spécialisées. Cependant, l'équipe de Physical Intelligence elle-même reste prudente, décrivant π0.7 comme montrant des « signes précoces » de généralisation et des « démonstrations initiales » de nouvelles capacités, soulignant que des défis importants persistent en matière de données, d'étalonnage et d'autonomie fiable.

Source

TechCrunch

Auteur

Rédaction IA-Medias

Rédaction spécialisée dans la veille et l’analyse de l’actualité de l’intelligence artificielle, des puces IA, des robots, des agents IA et de la recherche.