Définition Artificial Neuronal Network

⌚: 6 minutes

Dans le domaine des technologies de l’information (TI), un réseau neuronal artificiel ou artificial neuronal network (ANN) est un système de matériel et/ou de logiciel modelé sur le fonctionnement des neurones du cerveau humain. Les ANN – également appelés, simplement, réseaux neuronaux – sont une variété de technologies d’apprentissage profond, qui relèvent également de l’intelligence artificielle, ou IA.

Les applications commerciales de ces technologies se concentrent généralement sur la résolution de problèmes complexes de traitement des signaux ou de reconnaissance des formes. Parmi les exemples d’applications commerciales importantes depuis 2000, on peut citer la reconnaissance de l’écriture manuscrite pour le traitement des chèques, la transcription de la parole en texte, l’analyse de données sur l’exploration pétrolière, les prévisions météorologiques et la reconnaissance faciale.

Comment fonctionnent les réseaux neuronaux artificiels

Une ANN implique généralement un grand nombre de processeurs fonctionnant en parallèle et disposés en étages. Le premier niveau reçoit les informations d’entrée brutes, comme les nerfs optiques dans le traitement visuel humain. Chaque niveau successif reçoit la sortie du niveau précédent, plutôt que l’entrée brute — de la même manière que les neurones plus éloignés du nerf optique reçoivent les signaux de ceux qui en sont plus proches. Le dernier niveau produit la sortie du système.

Chaque nœud de traitement possède sa propre petite sphère de connaissances, y compris ce qu’il a vu et toutes les règles qu’il a programmées à l’origine ou développées pour lui-même. Les niveaux sont fortement interconnectés, ce qui signifie que chaque nœud du niveau n sera connecté à de nombreux nœuds du niveau n-1 – ses entrées – et du niveau n+1, qui fournit les données d’entrée pour ces nœuds. Il peut y avoir un ou plusieurs nœuds dans la couche de sortie, à partir desquels on peut lire la réponse qu’elle produit.

Les réseaux neuronaux artificiels se distinguent par leur capacité d’adaptation, ce qui signifie qu’ils se modifient au fur et à mesure de leur formation initiale et que les exécutions ultérieures fournissent davantage d’informations sur le monde. Le modèle d’apprentissage le plus élémentaire est centré sur la pondération des flux d’entrée, c’est-à-dire la façon dont chaque nœud pondère l’importance des données d’entrée de chacun de ses prédécesseurs. Les intrants qui contribuent à l’obtention de bonnes réponses ont une pondération plus élevée.

Réseau neuronal profond

Comment les réseaux neuronaux apprennent

En général, un ANN est d’abord formé ou alimenté en grandes quantités de données. La formation consiste à fournir des données d’entrée et à indiquer au réseau ce que doit être la sortie. Par exemple, pour construire un réseau qui identifie les visages des acteurs, la formation initiale peut consister en une série d’images, comprenant des acteurs, des non-acteurs, des masques, des statues et des visages d’animaux. Chaque entrée est accompagnée de l’identification correspondante, telle que le nom des acteurs, des informations « non acteurs » ou « non humains ». Le fait de fournir les réponses permet au modèle d’ajuster ses pondérations internes pour apprendre à mieux faire son travail.

Par exemple, si les nœuds David, Dianne et Dakota disent au nœud Ernie que l’image d’entrée actuelle est une photo de Brad Pitt, mais que le nœud Durango dit que c’est Betty White, et que le programme de formation confirme que c’est Pitt, Ernie diminuera le poids qu’il attribue à l’entrée de Durango et augmentera le poids qu’il donne à celle de David, Dianne et Dakota.

En définissant les règles et en faisant des déterminations — c’est-à-dire la décision de chaque noeud sur ce qu’il doit envoyer au niveau suivant en fonction des entrées du niveau précédent — les réseaux neuronaux utilisent plusieurs principes. Ceux-ci comprennent l’entraînement par gradient, la logique floue, les algorithmes génétiques et les méthodes bayésiennes. On peut leur donner quelques règles de base sur les relations entre les objets dans l’espace modélisé.

Par exemple, un système de reconnaissance faciale peut recevoir l’instruction suivante : « Les sourcils se trouvent au-dessus des yeux » ou « Les moustaches sont sous le nez ». Les moustaches se trouvent au-dessus et/ou à côté d’une bouche ». Les règles de précharge peuvent rendre l’entraînement plus rapide et rendre le modèle plus puissant plus tôt. Mais elles intègrent également des hypothèses sur la nature de l’espace problématique, qui peuvent s’avérer soit non pertinentes et inutiles, soit incorrectes et contre-productives, ce qui rend la décision sur les règles à intégrer, le cas échéant, très importante.

En outre, les hypothèses que les gens font lorsqu’ils forment des algorithmes font que les réseaux neuronaux amplifient les préjugés culturels. Les ensembles de données biaisées constituent un défi permanent pour les systèmes de formation qui trouvent des réponses par eux-mêmes en reconnaissant les schémas dans les données. Si les données qui alimentent l’algorithme ne sont pas neutres – et si presque aucune donnée ne l’est – la machine propage un biais.

Types de réseaux neuronaux

Les réseaux neuronaux sont parfois décrits en fonction de leur profondeur, y compris le nombre de couches qu’ils comportent entre l’entrée et la sortie, ou les couches dites cachées du modèle. C’est pourquoi le terme de réseau de neurones est presque synonyme d’apprentissage profond. Ils peuvent également être décrits par le nombre de nœuds cachés du modèle ou en termes de nombre d’entrées et de sorties de chaque nœud. Des variantes de la conception classique des réseaux de neurones permettent diverses formes de propagation de l’information en avant et en arrière entre les couches.

Parmi les types spécifiques de réseaux neuronaux artificiels, on peut citer

Les réseaux neuronaux à action directe
Réseaux neuronaux récurrents
Réseaux neuronaux convolutifs
Réseaux de neurones déconvolutionnels
Réseaux de neurones modulaires

Les réseaux de neurones à action directe sont l’une des variantes les plus simples des réseaux de neurones. Ils transmettent l’information dans une direction, à travers divers nœuds d’entrée, jusqu’à ce qu’elle arrive au nœud de sortie. Le réseau peut avoir ou non des couches de nœuds cachées, ce qui rend leur fonctionnement plus interprétable. Il est prêt à traiter de grandes quantités de bruit. Ce type de modèle de calcul ANN est utilisé dans des technologies telles que la reconnaissance faciale et la vision par ordinateur.

Les réseaux neuronaux récurrents (RNN) sont plus complexes. Ils sauvegardent la sortie des nœuds de traitement et réintègrent le résultat dans le modèle. C’est ainsi que le modèle apprend à prédire le résultat d’une couche. Chaque nœud du modèle RNN agit comme une cellule de mémoire, poursuivant le calcul et la mise en œuvre des opérations. Ce réseau neuronal commence avec la même propagation frontale qu’un réseau feed-forward, mais continue ensuite à se souvenir de toutes les informations traitées afin de les réutiliser à l’avenir. Si la prédiction du réseau est incorrecte, alors le système s’auto-apprend et continue à travailler pour obtenir la bonne prédiction pendant la rétropropagation. Ce type d’ANN est fréquemment utilisé dans les conversions de texte en parole.

Les réseaux neuronaux convolutifs (CNN) sont l’un des modèles les plus utilisés aujourd’hui. Ce modèle de calcul des réseaux neuronaux utilise une variation de perceptrons multicouches et contient une ou plusieurs couches convolutionnelles qui peuvent être soit entièrement connectées, soit mises en commun. Ces couches convolutionnelles créent des cartes de caractéristiques qui enregistrent une région de l’image qui est finalement divisée en rectangles et envoyée pour un traitement non linéaire. Le modèle CNN est particulièrement populaire dans le domaine de la reconnaissance d’images ; il a été utilisé dans un grand nombre des applications les plus avancées de l’IA, notamment la reconnaissance faciale, la numérisation de texte et le traitement du langage naturel. Il est également utilisé pour la détection des paraphrases, le traitement du signal et la classification des images.

Les réseaux neuronaux déconvolutionnels utilisent un processus de modèle CNN inversé. Ils visent à retrouver des caractéristiques ou des signaux perdus qui, à l’origine, auraient pu être considérés comme sans importance pour la tâche du système CNN. Ce modèle de réseau peut être utilisé pour la synthèse et l’analyse d’images.

Les réseaux neuronaux modulaires contiennent plusieurs réseaux neuronaux fonctionnant séparément les uns des autres. Les réseaux ne communiquent pas et n’interfèrent pas avec les activités des autres pendant le processus de calcul. Par conséquent, les processus de calcul complexes ou de grande envergure peuvent être exécutés plus efficacement.

Avantages des réseaux neuronaux artificiels

Parmi les avantages des réseaux neuronaux artificiels, on peut citer :

Les capacités de traitement parallèle signifient que le réseau peut effectuer plus d’une tâche à la fois.
Les informations sont stockées sur un réseau entier, pas seulement sur une base de données.
La capacité d’apprendre et de modéliser des relations complexes non linéaires permet de modéliser les relations réelles entre l’entrée et la sortie.
La tolérance aux fautes signifie que la corruption d’une ou plusieurs cellules de l’ANN n’arrêtera pas la génération de la sortie.
La corruption graduelle signifie que le réseau se dégradera lentement au fil du temps, au lieu qu’un problème détruise le réseau instantanément.
La capacité à produire des résultats avec des connaissances incomplètes, la perte de performance étant basée sur l’importance des informations manquantes.
Aucune restriction n’est imposée aux variables d’entrée, comme la manière dont elles doivent être distribuées.
L’apprentissage machine signifie que l’ANN peut tirer des enseignements des événements et prendre des décisions sur la base des observations.
La capacité d’apprendre des relations cachées dans les données sans commander une relation fixe signifie qu’un ANN peut mieux modéliser des données très volatiles et une variance non constante.

Inconvénients des réseaux neuronaux artificiels

Les inconvénients des ANN sont notamment les suivants :

L’absence de règles pour déterminer la structure de réseau appropriée signifie que l’architecture de réseau neuronal artificiel appropriée ne peut être trouvée que par essais et erreurs et par l’expérience.
L’exigence de processeurs ayant des capacités de traitement parallèle rend les réseaux neuronaux dépendants du matériel.
Le réseau fonctionne avec des informations numériques, c’est pourquoi tous les problèmes doivent être traduits en valeurs numériques avant de pouvoir être présentés à l’ANN.
Le manque d’explication des solutions est l’un des plus grands inconvénients des ANN. L’incapacité à expliquer le pourquoi ou le comment de la solution génère un manque de confiance dans le réseau.

Applications des réseaux de neurones artificiels

La reconnaissance d’images a été l’un des premiers domaines dans lesquels les réseaux neuronaux ont été appliqués avec succès, mais les utilisations de la technologie se sont étendues à de nombreux autres domaines, notamment :

Chatbots
Traitement des langues naturelles, traduction et génération de langues
Prévision de la bourse
Planification et optimisation des itinéraires des livreurs
Découverte et développement de médicaments

Ce ne sont là que quelques domaines spécifiques auxquels les réseaux de neurones sont appliqués aujourd’hui. Les utilisations principales impliquent tout processus fonctionnant selon des règles ou des modèles stricts et comportant de grandes quantités de données. Si les données concernées sont trop volumineuses pour qu’un humain puisse les comprendre dans un délai raisonnable, le processus est probablement un candidat de choix pour l’automatisation par le biais de réseaux neuronaux artificiels.