Logo EPFL
Votre titre
Ecole Polytechnique Fédérale de Lausanne Votre sous-titre
français | french only    Place centrale > Presse & information > Polyrama
Dossier
Voir, ce mystère qui se cache sous l’évidence

Par Barbara Fournier


Quels sont les mécanismes physiques de la perception et leurs limites chez l’homme? C’est la question qui taraude Michael Herzog, professeur associé en psychophysique à l’EPFL. Entre ce que l’on voit, ce que l’on croit voir et ce que l’on ne voit pas, le champ d’investigation est large. En réunissant les connaissances des mathématiques, des neurosciences et de la philosophie pour interroger les mécanismes de la vision, ce psychophysicien tente de décrypter les secrets du sensible qui contribueront, un jour peut-être, à donner des yeux aux robots.


«
Nous ne voyons pas les choses elles-mêmes. Nous nous bornons le plus souvent à lire des étiquettes collées sur elles. Cette tendance, issue du besoin, s’est encore accentuée sous l’effet du langage. Car les mots, à l’exception des noms propres, désignent des genres. Et ce ne sont pas seulement les objets extérieurs, ce sont aussi nos propres états d’âme qui se dérobent dans ce qu’ils ont d’intime, de personnel, d’originalement vécu. Ainsi, jusque dans notre individu, notre individualité nous échappe, nous nous mouvons parmi des généralités et des symboles.» Ces lignes de Bergson sont citées par Alain Beltzung, dans son Traité du regard, ode au mystère qui se cache sous l’apparence.
Pourtant, est-il de plus simple évidence que d’ouvrir les yeux et de regarder le monde? Nous faisons cela depuis les premiers jours de notre naissance et nos yeux sont pour nous ces deux fenêtres où nous avons collé une de ces innombrables étiquettes dont parle Bergson sur laquelle il est écrit les quatre lettres du verbe «voir». Aurions-nous oublié un petit détail? Si oui, il nous attend trois siècles plus tôt, en Angleterre.

La cohérence du monde s’apprend
En 1728, William Cheselden, génial anatomiste et chirurgien particulièrement brillant, spécialisé dans les opérations de l’œil, opère une jeune garçon, de 13 ou 14 ans, né aveugle en raison d’une double cataracte congénitale. L’intervention réussit et le patient voit pour la première fois. L’accès soudain à la vision est un choc pour le jeune homme, brutalement plongé dans un monde sans cohérence qu’il mettra des mois à apprivoiser. Dans ses notes, au lendemain de l’intervention, le chirurgien rapporte que «loin de pouvoir évaluer les distances, le patient a l’impression que tous les objets sont contre ses yeux, selon sa propre expression, qu’il est incapable de distinguer un objet d’un autre, quelles que soient les différences de forme et de taille».
«L’entendement de la vision», voilà un sujet qui passionne Michael Herzog, professeur de phychophysique à l’EPFL. Il explique:«Nos yeux captent le monde extérieur, ce qui veut dire que le sens de la vue, à lui seul, draine la plus grande partie de l’information qui nous arrive. Pour traiter ce flot continu, la moitié du cerveau est mobilisé, un peu à la manière d’un ordinateur massivement parallèle. Cet apprentissage, nous le faisons depuis notre première enfance. L’information est décryptée avec un temps de réponse extrêmement rapide: en une centaine de millisecondes, nous avons compris à quels types d’objets nous avons à faire. Ces objets peuvent changer de place, de taille, d’inclinaison et de profondeur, nous continuerons de les identifier, avec leur vide, leur plein, leur ombre, leur reflet, etc. Notre système de reconnaissance met en place des propriétés d’invariance spatiale. Mais ce n’est parce que tout cela nous paraît si simple et automatique que la perception visuelle est un système sans complexité. C’est même tout le contraire! Quels mécanismes se met-tent en place pour organiser l’image que nous voyons, faite d’éléments disparates, pour lui donner une cohésion immédiate? Le seul fait de distinguer des objets distants et de les mettre en cohérence est un processus si complexe que nous n’avons à ce jour pas encore compris son fonctionnement», reconnaît le professeur.

Processus dynamique à l’épreuve du gorille
Voir derrière les étiquettes, remonter au mystère de la vision, c’est d’abord une démarche de l’art qui, bien souvent, a l’intuition que la science, plus tard, formalisera. Dans son essai, Inner vision, an exploration of Art and the brain, le neurobiologiste Samir Zeki cite ce maître du regard qu’est Matisse. «Voir, écrit-il, est déjà un processus créatif qui exige un effort.»
Michael Herzog donne raison au peintre. Qu’il s’agisse de voir une simple ligne ou un arbre, on est engagé dans une action dynamique. La vision est un processus actif, car il exige du cerveau de faire abstraction des continuels changements et d’en extraire ce qui est nécessaire pour catégoriser des objets, sacrifier ainsi toute l’information qui n’a pas d’intérêt pour en obtenir la connaissance recherchée et comparer l’information sélectionnée avec celle qu’il possède déjà.
Pour illustrer cette dynamique et pour mesurer le travail qui se produit entre l’image projetée et ce que nous en restitue notre cer-veau, le Professeur Herzog ne résiste pas au plaisir de vous faire subir un test. Il vous installe devant son ordinateur et vous invite à regarder un petit film.
Six joueurs de basket dribblent avec deux ballons, trois appartiennent à l’équipe des t-shirts noirs et les trois autres à l’équipe des t-shirts blancs. Il s’agit de compter combien de passes de ballon exécutent les t-shirts blancs.
Vous vous mettez donc à compter avec une attention soutenue, car les ballons cir-cu-lent vite et les joueurs se déplacent rapidement. Un instant, quelque chose vous obstrue la vue, alors vous redoublez de concentration pour suivre le ballon des blancs. Le petit film s’arrête. Il semble avoir duré une quinzaine de secondes, moins sans doute. Vous avez compté 17 ou 18 passes de ballon et alors Michael Herzog vous demande le plus sérieusement du monde: «Have you seen the gorilla?» Le gorille? Mais quel gorille?
Vous visionnez le film une seconde fois et alors que vos yeux embrassent consciemment l’intégralité de l’écran, vous voyez apparaître au beau milieu des joueurs, déambulant d’un pas lent, un faux gorille à l’air débonnaire, qui vient même frapper de ses poings ses pectoraux au beau milieu de votre champ de vision, avant de repartir, toujours aussi nonchalant.
Michael Herzog vous démontre par cette brève expérience qu’il ne suffit pas de détecter visuellement un objet pour le reconnaître. «En l’occurrence, explique-t-il, le cerveau de l’observateur gomme tout ce qui peut nuire à la compréhension nécessaire du processus, tout comme, dans d’autres cas, il reconstruira quelque chose d’absent. Un bel exemple de cette reconstruction est fourni par les illusions de luminosité qui font apparaître des figures par effet de contraste.»

Le cerveau visuel, champion de la spécialisation
Plongé dans l’étude des mécanismes de la vision, le professeur Hergog dit qu’on en mesure la profondeur complexe lorsqu’on essaie d’implémenter ses principes dans un robot. Et pourtant, les automates d’aujourd’hui savent se déplacer dans des environnements difficiles, contourner des obstacles, saisir des objets. Des capacités qui n’ont pourtant rien à voir avec les extraordinaires compétences de l’homme et de certains d’animaux. «Pour voir, explique le Professeur Herzog, un robot devrait apprendre à reconnaître le monde dans lequel il évolue.» Mais reconnaître, cela ne veut-il pas dire produire des représentations? Ne sommes-nous pas ce que nous voyons et ne voyons-nous pas que ce que nous sommes? Notre système perceptif est ainsi nourri de notre mémoire, de notre culture, de notre histoire, qu’il nourrit à son tour dans un circuit perpétuel.
«C’est aussi cette dimension qui rend si difficile l’élaboration d’un modèle fin de la perception visuelle», admet le chercheur.
Evidemment tout serait plus simple si, comme on le crut longtemps, il y avait deux zones bien limitées dans le cortex, l’une pour voir et l’autre pour comprendre ce que l’on voit. Mais les scientifiques savent aujourd’hui que plusieurs zones agissent simultanément à la fois sur l’action de voir et sur l’action de comprendre.
Ainsi l’image bidimensionnelle formée dans l’œil, traitée dans les circuits nerveux de la rétine et renvoyée dans les différentes zones du cortex occipital, est littéralement décodée et traduite par le cerveau qui en reproduira une interprétation compréhensible en tridimensionnel. Cette interprétation se fonde donc à la fois sur une part de réel de l’élément perçu et une part d’illusion qui rend ce réel intelligible.
Les chercheurs s’intéressent notamment à ces aires visuelles situées dans le cortex occipital, chacune d’elles étant spécialisée pour détecter un champ particulier de la scène visuelle, comme la forme, la couleur, le mouvement. Différents genres de signaux sont donc analysés en relation avec la couleur, la luminosité, le mouvement, la forme la profondeur, car le cerveau visuel est un champion de la spécialisation. Les cellules individuelles qui sont à l’œuvre sont toutes hautement spécialisées, ce qui entraîne ce traitement de l’information massivement parallèle, aboutissant à une image finale extraordinairement unitaire. Et c’est justement sur cette caractéristique que travaillent assidûment Michael Herzog et son équipe.
«Nous essayons d’élaborer des modèles mathématiques qui s’appuient sur les propriétés des neurones. Afin de mieux comprendre les mécanismes qui nous permettent de définir les contours d’un objet, nous avons développé un modèle simple sur la base d’une expérience visuelle de type illusion d’optique. Le modèle tient compte des propriétés des cellules nerveuses et de leur activation différenciée devant ces illusions d’optique que l’œil perçoit mais que le cerveau ne parvient pas à comprendre, l’interprétation étant perturbée par la couleur, la lumière, la perspective, ou autre. Le modèle mathématique peut expliquer les effets produits lors de l’expérience sur les mécanismes neuronaux. Nos travaux sont aussi un premier pas pour tenter de mieux comprendre comment nous maîtrisons quelque chose qui nous semble aussi évident que différencier un palmier d’un chameau!»

La révélation d’un regard autre
Un an après son opération, le jeune garçon opéré par Cheselden voyait le monde d’un œil neuf dont il avait appris à comprendre le sens. «Il disait, note son médecin, que chaque nouvel objet était un nouveau délice, et le plaisir était si vif qu’il aurait voulu d’autres mots pour les exprimer. (…) Quand on l’amena sur les collines d’Epson Downs, regardant la vaste perspective, il s’en délecta à l’extrême.»
Sans l’ombre d’un doute, cet adolescent, ne se mouvait pas dans les généralités et les symboles évoqués par Bergson. Sa très longue intimité avec l’obscurité l’avait préparé, en somme, non à voir le monde, mais à voir le monde se révéler. Si la vision est bien un apprentissage, il s’agirait de se souvenir que cet apprentissage est toujours à recommencer. Sans doute est-ce pour cette raison que Cézanne pensait parfois à «s’arracher les yeux», que Turner se retirait longtemps dans l’obscurité avant de retourner à la lumière «car on ne voit bien qu’ébloui» et que Tanizaki, dans son inoubliable Eloge de l’ombre écrivait: «J’aimerais élargir l’auvent de cet édifice qui a nom Littérature, en obscurcir les murs, plonger dans l’ombre ce qui est trop visible, et en dépouiller l’intérieur de tout ce qui est superflu. Je ne prétends pas qu’il faille en faire autant de toutes les maisons. Mais il serait bon je crois, qu’il en reste, ne fût-ce qu’une seule, de ce genre. Et pour voir ce que cela peut donner, eh bien, je m’en vais éteindre ma lampe électrique».



Pour en savoir plus:

Le Traité du regard, Alain Beltzung, Ed. Albin Michel, 1998, et Inner Vision, an exploration of Art and the Brain, Samir Zeki, Oxford University Press, 1999


Retour au sommaire

©2005 EPFL, 1015 Lausanne, tél. 021 693 22 22, mediacom@epfl.ch
mise à jour: 01 juillet 2005