Le réseau neuronal : qu'est-ce que c'est ? Définition, signification et applications. Le cours vidéo le plus compréhensible sur le fonctionnement des réseaux de neurones

Au premier semestre 2016, le monde a entendu parler de nombreux développements dans le domaine des réseaux de neurones - Google (le lecteur réseau Go AlphaGo), Microsoft (un certain nombre de services d'identification d'images), les startups MSQRD, Prisma et d'autres ont démontré leurs algorithmes.

Vers les favoris

Les éditeurs du site vous expliquent ce que sont les réseaux de neurones, à quoi ils servent, pourquoi ils ont conquis la planète maintenant, et non des années plus tôt ou plus tard, combien vous pouvez gagner grâce à eux et qui sont les principaux acteurs du marché. Des experts du MIPT, Yandex, Mail.Ru Group et Microsoft ont également partagé leurs opinions.

Que sont les réseaux de neurones et quels problèmes peuvent-ils résoudre ?

Les réseaux de neurones sont l'une des orientations du développement des systèmes d'intelligence artificielle. L’idée est de modéliser au plus près le fonctionnement du système nerveux humain, c’est-à-dire sa capacité à apprendre et à corriger les erreurs. C'est caractéristique principale n'importe quel réseau neuronal - il est capable d'apprendre de manière indépendante et d'agir sur la base d'expériences antérieures, en commettant de moins en moins d'erreurs à chaque fois.

Le réseau neuronal imite non seulement l'activité, mais aussi la structure du système nerveux humain. Un tel réseau est constitué d’un grand nombre d’éléments informatiques individuels (« neurones »). Dans la plupart des cas, chaque « neurone » appartient à une couche spécifique du réseau. Les données d'entrée sont traitées séquentiellement à toutes les couches du réseau. Les paramètres de chaque « neurone » peuvent changer en fonction des résultats obtenus sur les ensembles de données d'entrée précédents, modifiant ainsi l'ordre de fonctionnement de l'ensemble du système.

Le chef du département de recherche Mail.ru du groupe Mail.Ru, Andrey Kalinin, note que les réseaux de neurones sont capables de résoudre les mêmes problèmes que d'autres algorithmes d'apprentissage automatique, la différence réside uniquement dans l'approche de la formation.

Toutes les tâches que les réseaux neuronaux peuvent résoudre sont liées d’une manière ou d’une autre à l’apprentissage. Parmi les principaux domaines d'application des réseaux de neurones figurent la prévision, la prise de décision, la reconnaissance de formes, l'optimisation et l'analyse des données.

Le directeur des programmes de coopération technologique chez Microsoft en Russie, Vlad Shershulsky, note que les réseaux de neurones sont désormais utilisés partout : « Par exemple, de nombreux grands sites Internet les utilisent pour rendre les réactions au comportement des utilisateurs plus naturelles et plus utiles à leur public. Les réseaux de neurones sont à la base de la plupart systèmes modernes la reconnaissance et la synthèse vocales, ainsi que la reconnaissance et le traitement d'images. Ils sont utilisés dans certains systèmes de navigation, qu’il s’agisse de robots industriels ou de voitures autonomes. Les algorithmes basés sur les réseaux neuronaux protègent Systèmes d'information contre les attaques malveillantes et aider à identifier les contenus illégaux sur le réseau.

Dans un avenir proche (5 à 10 ans), estime Shershulsky, les réseaux de neurones seront encore plus largement utilisés :

Imaginez une moissonneuse-batteuse agricole dont les actionneurs sont équipés de nombreuses caméras vidéo. Il prend cinq mille photos par minute de chaque plante sur sa trajectoire et, à l'aide d'un réseau neuronal, analyse s'il s'agit d'une mauvaise herbe, si elle est affectée par une maladie ou des ravageurs. Et chaque plante est traitée individuellement. Fantastique? Plus vraiment. Et dans cinq ans, cela pourrait devenir la norme. - Vlad Shershulsky, Microsoft

Mikhail Burtsev, responsable du laboratoire des systèmes neuronaux et de l'apprentissage profond au MIPT Center for Living Systems, propose une carte provisoire du développement des réseaux de neurones pour 2016-2018 :

  • systèmes de reconnaissance et de classification d'objets dans des images;
  • interfaces d'interaction vocale pour l'Internet des objets ;
  • systèmes de surveillance de la qualité des services dans les centres d'appels ;
  • des systèmes d'identification des problèmes (y compris la prévision du temps de maintenance), des anomalies, des menaces cyber-physiques ;
  • systèmes de sécurité intellectuelle et de surveillance;
  • remplacer certaines fonctions des opérateurs de centres d'appels par des robots ;
  • systèmes d'analyse vidéo ;
  • des systèmes d'auto-apprentissage qui optimisent la gestion des flux de matières ou la localisation des objets (dans les entrepôts, les transports) ;
  • systèmes de contrôle intelligents et auto-apprenants processus de production et appareils (y compris robotiques) ;
  • l'émergence de systèmes universels de traduction à la volée pour les conférences et l'usage personnel ;
  • émergence des consultants bots soutien technique ou des assistants personnels avec des fonctions similaires à celles d'une personne.

Le directeur de la distribution technologique chez Yandex, Grigory Bakunov, estime que la base de la propagation des réseaux de neurones au cours des cinq prochaines années sera la capacité de ces systèmes à prendre diverses décisions : « La principale chose que les réseaux de neurones font désormais pour une personne est de sauver l'empêcher de prendre des décisions inutiles. Ils peuvent donc être utilisés presque partout où des décisions peu intelligentes sont prises par une personne vivante. Dans les cinq prochaines années, c’est cette compétence qui sera exploitée, qui remplacera la prise de décision humaine par une simple machine.»

Pourquoi les réseaux de neurones sont-ils devenus si populaires à l’heure actuelle ?

Les scientifiques développent des réseaux de neurones artificiels depuis plus de 70 ans. La première tentative de formalisation d'un réseau neuronal remonte à 1943, lorsque deux scientifiques américains (Warren McCulloch et Walter Pitts) présentèrent un article sur le calcul logique des idées humaines et de l'activité neuronale.

Cependant, jusqu'à récemment, explique Andrey Kalinin du groupe Mail.Ru, la vitesse des réseaux de neurones était trop faible pour qu'ils se généralisent, et donc de tels systèmes étaient principalement utilisés dans les développements liés à la vision par ordinateur, et dans d'autres domaines, d'autres algorithmes étaient utilisés. apprentissage automatique.

Sa formation est une partie laborieuse et chronophage du processus de développement du réseau neuronal. Pour qu'un réseau de neurones résolve correctement les problèmes posés, il doit « exécuter » son travail sur des dizaines de millions d'ensembles de données d'entrée. C'était avec l'avènement diverses technologies apprentissage accéléré et connecter la propagation des réseaux de neurones Andrey Kalinin et Grigory Bakunov.

La principale chose qui s'est produite maintenant est que diverses astuces sont apparues qui permettent de créer des réseaux de neurones beaucoup moins susceptibles d'être recyclés. - Grigory Bakunov, Yandex

« Premièrement, un large éventail d'images étiquetées (ImageNet) accessibles au public est apparu sur lequel vous pouvez apprendre. Deuxièmement, les cartes vidéo modernes permettent d'entraîner les réseaux de neurones et de les utiliser des centaines de fois plus rapidement. Troisièmement, des réseaux de neurones prêts à l'emploi et pré-entraînés sont apparus qui reconnaissent les images, sur la base desquelles vous pouvez créer vos propres applications sans avoir à passer beaucoup de temps à préparer le réseau de neurones au travail. Tout cela garantit un développement très puissant des réseaux de neurones, notamment dans le domaine de la reconnaissance d'images », note Kalinin.

Quelle est la taille du marché des réseaux de neurones ?

« Très facile à calculer. Vous pouvez prendre n’importe quel domaine qui utilise une main-d’œuvre peu qualifiée, comme les agents de centres d’appels, et simplement soustraire toutes les ressources humaines. Je dirais que nous parlons d'un marché de plusieurs milliards de dollars, même au sein d'un seul pays. Il est facile de comprendre combien de personnes dans le monde occupent des emplois peu qualifiés. Donc, même de manière très abstraite, je pense que nous parlons d'un marché d'une centaine de milliards de dollars dans le monde entier », déclare Grigory Bakunov, directeur de la distribution technologique chez Yandex.

Selon certaines estimations, plus de la moitié des professions seront automatisées. volume maximum, grâce auquel le marché des algorithmes d'apprentissage automatique (et des réseaux de neurones en particulier) peut être augmenté. - Andrey Kalinin, Mail.Ru Group

« Les algorithmes d'apprentissage automatique constituent la prochaine étape dans l'automatisation de tous les processus, dans le développement de tout logiciel. Par conséquent, le marché coïncide au moins avec l'ensemble du marché des logiciels, mais le dépasse plutôt, car il devient possible de créer de nouvelles solutions intelligentes inaccessibles aux anciens logiciels », poursuit Andrey Kalinin, chef du département de recherche Mail.ru chez Mail. Groupe Ru.

Pourquoi les développeurs de réseaux neuronaux créent des applications mobiles pour le marché de masse

Au cours des derniers mois, plusieurs projets de divertissement de grande envergure utilisant des réseaux de neurones sont apparus sur le marché. Il s'agit d'un service vidéo populaire qui réseau social Facebook et les applications russes de traitement d'images (investissements du groupe Mail.Ru en juin) et autres.

Les capacités de leurs propres réseaux de neurones ont été démontrées à la fois par Google (la technologie AlphaGo a gagné contre le champion du Go ; en mars 2016, la société a vendu aux enchères 29 tableaux dessinés par des réseaux de neurones, etc.) et par Microsoft (le projet CaptionBot, qui reconnaît les images dans les photographies et génère automatiquement des légendes pour celles-ci ; le projet WhatDog, qui détermine la race d'un chien à partir d'une photographie ; le service HowOld, qui détermine l'âge d'une personne sur une photo, etc.), et Yandex (en En juin, l'équipe a créé un service de reconnaissance des voitures en images dans l'application Avto.ru ; a présenté un enregistrement musical enregistré par un album de réseaux neuronaux ; en mai, elle a créé le projet LikeMo.net pour dessiner dans le style d'artistes célèbres).

De tels services de divertissement ne sont pas créés pour résoudre les problèmes mondiaux auxquels sont destinés les réseaux de neurones, mais pour démontrer les capacités d'un réseau de neurones et mener sa formation.

« Les jeux sont un trait caractéristique de notre comportement en tant qu’espèce. D'une part, les situations de jeu peuvent être utilisées pour simuler presque tous les scénarios typiques du comportement humain, et d'autre part, les créateurs de jeux et, en particulier, les joueurs peuvent tirer beaucoup de plaisir du processus. Il y a aussi un aspect purement utilitaire. Un jeu bien conçu n’apporte pas seulement de la satisfaction aux joueurs : au fur et à mesure qu’ils jouent, ils entraînent l’algorithme du réseau neuronal. Après tout, les réseaux de neurones reposent sur l’apprentissage par l’exemple », explique Vlad Shershulsky de Microsoft.

« Tout d’abord, cela a pour but de montrer les capacités de la technologie. Il n'y a vraiment aucune autre raison. Si nous parlons de Prisma, la raison pour laquelle ils l'ont fait est claire. Les gars ont construit une sorte de pipeline qui leur permet de travailler avec des images. Pour le démontrer, ils ont choisi une méthode assez simple de création de stylisations. Pourquoi pas? Ceci n'est qu'une démonstration du fonctionnement des algorithmes », explique Grigory Bakunov de Yandex.

Andrey Kalinin du groupe Mail.Ru a un avis différent : « Bien sûr, c'est impressionnant du point de vue du public. D’un autre côté, je ne dirais pas que les produits de divertissement ne peuvent pas être appliqués à des domaines plus utiles. Par exemple, la tâche de styliser les images est extrêmement pertinente pour un certain nombre d'industries (le design, les jeux informatiques, l'animation ne sont que quelques exemples), et utilisation complète les réseaux de neurones peuvent optimiser considérablement les coûts et les méthodes de création de contenu pour eux.

Acteurs majeurs du marché des réseaux de neurones

Comme le note Andrey Kalinin, dans l'ensemble, la plupart des réseaux de neurones disponibles sur le marché ne sont pas très différents les uns des autres. « La technologie de chacun est à peu près la même. Mais utiliser les réseaux de neurones est un plaisir que tout le monde ne peut pas se permettre. Pour entraîner indépendamment un réseau de neurones et y exécuter de nombreuses expériences, vous avez besoin de grands ensembles de formation et d'un parc de machines dotés de cartes vidéo coûteuses. De toute évidence, les grandes entreprises ont de telles opportunités », dit-il.

Parmi les principaux acteurs du marché, Kalinin cite Google et sa division Google DeepMind, qui a créé le réseau AlphaGo, et Google Brain. Microsoft a ses propres développements dans ce domaine - ils sont réalisés par le laboratoire Microsoft Research. La création de réseaux de neurones est réalisée chez IBM, Facebook (une division de Facebook AI Research), Baidu (Baidu Institute of Deep Learning) et d'autres. De nombreux développements sont en cours dans universités techniques Mondial.

Grigory Bakunov, directeur de la distribution technologique de Yandex, note que des développements intéressants dans le domaine des réseaux de neurones se retrouvent également parmi les startups. « Je me souviendrais par exemple de la société ClarifAI. Il s'agit d'une petite startup, autrefois créée par des gens de Google. Aujourd’hui, ils sont peut-être les meilleurs au monde pour déterminer le contenu d’une image. Ces startups incluent MSQRD, Prisma et d'autres.

En Russie, les développements dans le domaine des réseaux de neurones sont réalisés non seulement par des startups, mais également par de grandes entreprises technologiques - par exemple, la holding Mail.Ru Group utilise des réseaux de neurones pour traiter et classer des textes dans la recherche et l'analyse d'images. L'entreprise mène également des développements expérimentaux liés aux robots et aux systèmes conversationnels.

Yandex crée également ses propres réseaux de neurones : « Fondamentalement, de tels réseaux sont déjà utilisés pour travailler avec des images et du son, mais nous explorons leurs capacités dans d'autres domaines. Nous faisons actuellement de nombreuses expériences sur l’utilisation des réseaux de neurones pour travailler avec du texte. Des développements sont en cours dans les universités : Skoltech, MIPT, Université d'État de Moscou, École supérieure d'économie et autres.

Bien entendu, Prisma est loin d'être le seul, et depuis lors, ils ont eu de nombreux concurrents. Facebook a acheté une application appelée MSQRD, qui ajoute des masques animés à vos vidéos. Contrairement à Prizma, l'accent est ici mis sur la reconnaissance des visages et sur leur application de filtres.

SwiftKey et autres claviers

Majorité claviers modernes n'ont pas été utilisés pour les téléphones portables depuis longtemps dictionnaires personnalisés, tel que T9. Si vous tapez une phrase, un réseau neuronal est probablement impliqué. Certains développeurs vont plus loin. SwiftKey a publié une version bêta du clavier, entièrement basée sur le travail d'un réseau neuronal. Grâce à cela, le clavier ne se contente pas de substituer les phrases les plus fréquemment saisies, mais se base sur le contexte.

La nouvelle technologie est actuellement disponible pour un nombre limité de langues et est au stade bêta. Mais la version publique de SwiftKey s’appuie également sur le Big Data. Par exemple, les dictionnaires utilisateur sont accessibles à toute personne ayant installé un clavier. Bien entendu, à l’exception des données personnelles.

Snapchat et ses filtres sont une autre des applications les plus connues des réseaux de neurones. Pour simplifier quelque chose de complexe, l'application utilise reconnaissance informatique visages pour identifier les expressions faciales et les points de mouvement musculaire. Et ce n'est qu'alors qu'il leur applique ses propres filtres.

Shazam et SoundHound

Ces deux applications populaires reconnaissent la musique qui joue autour de nous et la comparent ensuite à un échantillon de leur « bibliothèque ». Cela semble assez simple, mais l'application utilise des réseaux de neurones pour ce faire. Il y a quelques choses à décider ici tâches complexes, et même pas tant pour trouver des correspondances, mais pour éliminer l'excès de bruit lors de la reconnaissance.

Assistant Google et Siri

Parlez seulement de Assistant Google ou Siri ne sera pas tout à fait correct. Présent moderne Services Google et Apple est impossible sans Big Data et les réseaux de neurones. Tout développement de ces deux sociétés, d'une manière ou d'une autre, utilise des réseaux de neurones. Suggestions de recherche automatiques, affichage de publicités, nettoyage du courrier du spam et bien plus encore. Et pourtant, l’application la plus évidente pour nous est celle des assistants vocaux. Le smartphone reconnaît notre demande et exécute la tâche en fonction non seulement du contexte de la phrase, mais aussi de notre localisation.

Carat

Certaines applications, au contraire, visent à effectuer une seule tâche. Par exemple, Carat, à partir des données d'utilisation de votre smartphone (analyse de la consommation de la batterie), vous indiquera les applications qui consomment le plus de batterie. Vous pouvez supprimer ou limiter l'utilisation de tels programmes et aider le téléphone à « survivre » avant d'atteindre la prise.

Netflix, YouTube, Apple et Google Music… Tous ces services proposent de la musique et des vidéos en fonction de vos préférences. Au cours des dernières années, cette tendance est allée un peu plus loin et on nous propose désormais des draps intelligents complets adaptés à notre profession ou à notre moment de la journée.

Le Big Data et les réseaux de neurones peuvent non seulement nous vendre de la publicité, guérir nos maladies ou contrôler notre esprit. Nous ne remarquons la plupart des développements que lorsqu'ils nous sont présentés sous un format divertissant ou améliorent nos tâches quotidiennes les plus simples. Pour cette raison, nous oublions souvent qu’un réseau neuronal n’est pas seulement un chaton carlin sur notre téléphone.

Autrefois connu uniquement dans les livres de science-fiction, le terme réseau de neurones est progressivement et imperceptiblement entré dans la vie publique ces dernières années en tant que partie intégrante des derniers développements scientifiques. Bien entendu, les personnes impliquées dans l’industrie du jeu vidéo savaient depuis longtemps qu’il s’agissait d’un réseau de neurones. Mais aujourd’hui le terme est commun à tous, il est connu et compris du grand public. Sans aucun doute, cela indique que la science s'est rapprochée de la vie réelle et que de nouvelles avancées nous attendent à l'avenir. Et pourtant, qu’est-ce que c’est : un réseau de neurones ? Essayons de comprendre le sens du mot.

Présent et futur

Autrefois, le réseau neuronal, Hort et les personnes dans l'espace étaient des concepts étroitement liés, car rencontrer une intelligence artificielle dotée de capacités nettement supérieures à celles d'une simple machine n'était possible que dans un monde fantastique né dans l'imagination de certains auteurs. Et pourtant, les tendances sont telles qu'en Dernièrement autour personne ordinaire En réalité, de plus en plus d’éléments apparaissent qui n’étaient auparavant mentionnés que dans la littérature de science-fiction. Cela nous permet de dire que même l’envolée la plus folle de l’imagination trouvera probablement tôt ou tard son équivalent dans la réalité. Les livres sur les étrangers et les réseaux de neurones ont déjà plus en commun avec la réalité qu’il y a dix ans, et qui sait ce qui se passera dans une autre décennie ?

Réseau neuronal dans réalités modernes est une technologie qui vous permet d'identifier des personnes avec seulement une photographie à votre disposition. L’intelligence artificielle est tout à fait capable de conduire une voiture et peut jouer et gagner une partie de poker. De plus, les réseaux de neurones constituent de nouveaux moyens de réaliser des découvertes scientifiques, permettant des capacités de calcul auparavant impossibles. Cela offre des chances uniques de comprendre le monde d’aujourd’hui. Cependant, ce n'est qu'à partir des reportages annonçant les dernières découvertes que ce qu'est un réseau neuronal est rarement clair. Ce terme doit-il être considéré comme applicable à un programme, une machine ou un ensemble de serveurs ?

Aperçu général

Comme le montre le terme « réseau de neurones » (les photos présentées dans cet article nous permettent également de le comprendre), il s'agit d'une structure qui a été conçue par analogie avec la logique du cerveau humain. Bien sûr, copier une structure entièrement biologique est tellement haut niveau La complexité ne semble pas réaliste pour le moment, mais les scientifiques ont déjà pu se rapprocher considérablement de la résolution du problème. Par exemple, les réseaux de neurones récemment créés sont très efficaces. Hort et d'autres écrivains qui ont publié des œuvres fantastiques ne savaient guère, au moment de la rédaction de leurs ouvrages, que la science serait en mesure de progresser aussi loin cette année.

La particularité du cerveau humain est qu'il s'agit d'une structure composée de nombreux éléments entre lesquels des informations sont constamment transmises par les neurones. En fait, les nouveaux réseaux de neurones sont également des structures similaires, dans lesquelles des impulsions électriques assurent l'échange de données actuelles. En un mot, comme dans le cerveau humain. Et pourtant, ce n’est pas clair : y a-t-il une différence avec un ordinateur classique ? Après tout, une machine, comme vous le savez, est également créée à partir de pièces entre lesquelles les données sont transférées via courant électrique. Dans les réseaux de neurones, tout semble généralement enchanteur - des machines énormes ou minuscules, sur lesquelles les héros comprennent d'un seul coup d'œil à quoi ils ont affaire. Mais en réalité, la situation est différente.

Comment est-il construit ?

Comme le montrent les travaux scientifiques consacrés aux réseaux de neurones (« les Spacemen », malheureusement, n'appartiennent pas à cette catégorie, aussi passionnants soient-ils), l'idée s'inscrit dans la structure la plus progressiste dans le domaine de l'intelligence artificielle, en la création d'une structure complexe dont les différentes parties sont très simples. En fait, en faisant un parallèle avec une personne, on peut trouver des similitudes : disons, une seule partie du cerveau du mammifère n'a pas de grandes capacités, capacités et ne peut pas assurer un comportement intelligent. Mais quand nous parlons d'une personne dans son ensemble, une telle créature passe sereinement le test d'intelligence sans aucun problème particulier.

Malgré ces similitudes, une approche similaire à celle d’il y a quelques années seulement a été mise au ban. Cela se voit aussi bien dans les travaux scientifiques que dans les livres de science-fiction sur les réseaux de neurones (« Entertainers in Space » évoqué plus haut, par exemple). À propos, dans une certaine mesure, même les déclarations de Cicéron peuvent être associées à l'idée moderne des réseaux de neurones : il a suggéré à un moment donné de manière plutôt caustique que les singes jettent en l'air les lettres écrites sur des jetons, de sorte que tôt ou tard, ils former un texte significatif. Et seul le XXIe siècle a montré qu’une telle méchanceté était totalement injustifiée. Le réseau de neurones et la science-fiction se sont séparés : si vous donnez beaucoup de jetons à une armée de singes, ils créeront non seulement un texte riche en sens, mais gagneront également en pouvoir sur le monde.

Il y a de la force dans l'unité, frère

Comme nous l’avons appris de nombreuses expériences, l’entraînement d’un réseau de neurones conduit alors au succès lorsque l’objet lui-même comprend un très grand nombre d’éléments. Comme plaisantent les scientifiques, en fait, un réseau neuronal peut être assemblé à partir de n'importe quoi, même à partir de boîtes d'allumettes, puisque l'idée principale est un ensemble de règles auxquelles obéit la communauté résultante. Habituellement, les règles sont assez simples, mais elles vous permettent de contrôler le processus de traitement des données. Dans une telle situation, un neurone (même artificiel) ne sera pas du tout un appareil, ni une structure complexe ni un système incompréhensible, mais des opérations arithmétiques, assez simples, mises en œuvre avec une dépense énergétique minimale. Officiellement en science, les neurones artificiels sont appelés « perceptrons ». Les réseaux de neurones (« Entertainers in Space » l’illustrent bien) dans l’esprit de certains auteurs d’ouvrages scientifiques devraient être beaucoup plus complexes, mais science moderne montre que la simplicité produit également des résultats supérieurs.

Le fonctionnement d'un neurone artificiel est simple : des nombres sont fournis en entrée, la valeur de chaque bloc d'information est calculée, les résultats sont additionnés et une unité ou la valeur « -1 » est formée en sortie. Le lecteur a-t-il voulu au moins une fois faire partie des victimes ? Les réseaux de neurones fonctionnent en réalité complètement différemment, du moins à l'heure actuelle. Par conséquent, lorsque vous vous imaginez dans une œuvre de science-fiction, vous ne devez pas l'oublier. En fait l'homme moderne pouvez travailler avec l'intelligence artificielle, par exemple, comme ceci : vous pouvez montrer une image, et système électronique répondra à la question « soit - soit ». Supposons qu'une personne donne au système les coordonnées d'un point et demande ce qui est représenté : la terre ou, disons, le ciel. Après avoir analysé les informations, le système produit une réponse, très probablement incorrecte (selon la perfection de l'IA).

Doigt vers le ciel

Comme le montre la logique de fonctionnement d'un réseau neuronal moderne, chaque élément de celui-ci tente de deviner la bonne réponse à la question posée au système. Dans ce cas, il y a peu de précision, le résultat est comparable au résultat d'un tirage au sort. Mais réel travail scientifique commence quand il est temps de former le réseau neuronal. L'espace, l'exploration de nouveaux mondes, la compréhension de l'essence des lois physiques de notre univers (sur lesquelles les scientifiques modernes s'appuient à l'aide de réseaux neuronaux) s'ouvriront précisément au moment où l'intelligence artificielle apprend avec une efficacité bien plus grande que celle des humains.

Le fait est que la personne qui pose une question au système connaît la bonne réponse. Cela signifie que vous pouvez l'écrire dans les blocs d'informations du programme. Un perceptron qui donne la bonne réponse gagne de la valeur, mais celui qui répond incorrectement la perd et reçoit une amende. Chaque cycle de lancement d'un nouveau programme diffère du précédent en raison des changements de niveau de valeur. Revenons à l'exemple précédent : tôt ou tard, le programme apprendra à distinguer clairement où se trouve la terre et où se trouve l'espace. Les réseaux de neurones apprennent plus efficacement à mesure que le programme d'apprentissage est élaboré correctement - et sa formation coûte beaucoup d'efforts aux scientifiques modernes. Dans le cadre de la tâche posée précédemment : si le réseau neuronal reçoit une autre photographie pour analyse, il ne sera probablement pas immédiatement en mesure de la traiter avec précision, mais, sur la base des données précédemment obtenues lors de l'entraînement, il déterminera avec précision où se trouve la Terre. est et où se trouvent les nuages, l'espace ou quelque chose du genre.

Appliquer une idée à la réalité

Bien entendu, en réalité, les réseaux de neurones sont bien plus complexes que ceux décrits ci-dessus, même si le principe lui-même reste le même. La tâche principale des éléments à partir desquels un réseau de neurones est formé est de systématiser les informations numériques. Lorsqu'on combine une abondance d'éléments, la tâche devient plus compliquée, puisque les informations d'entrée peuvent ne pas provenir de l'extérieur, mais du perceptron, qui a déjà terminé son travail de systématisation.

Si nous revenons au problème ci-dessus, alors à l'intérieur du réseau neuronal, nous pouvons proposer les processus suivants : un neurone distingue les pixels bleus des autres, un autre traite les coordonnées, le troisième analyse les données reçues par les deux premiers, sur la base de dont il décide si c'est la terre ou le ciel point donné. De plus, le tri en bleu et autres pixels peut être confié à plusieurs neurones simultanément, et les informations qu'ils reçoivent peuvent être résumées. Les perceptrons qui donnent des résultats meilleurs et plus précis recevront un bonus sous la forme d'une plus grande valeur, et leurs résultats seront prioritaires lors du retraitement de toute tâche. Bien sûr, le réseau neuronal s'avère extrêmement volumineux et les informations qui y seront traitées constitueront une montagne insurmontable, mais il sera possible de prendre en compte et d'analyser les erreurs et de les éviter à l'avenir. Les implants largement basés sur des réseaux neuronaux que l'on trouve dans de nombreux livres de science-fiction fonctionnent sur ce principe (si, bien sûr, les auteurs prennent la peine de réfléchir au principe de fonctionnement).

Jalons historiques

Cela peut surprendre le profane, mais les premiers réseaux de neurones sont apparus en 1958. Cela est dû au fait que la structure des neurones artificiels est similaire à celle d'autres éléments informatiques, entre lesquels les informations sont transmises sous la forme d'un système de nombres binaires. Vers la fin des années soixante, une machine a été inventée, appelée Mark I Perceptron, dans laquelle les principes des réseaux neuronaux étaient mis en œuvre. Cela signifie que le premier réseau neuronal est apparu dix ans seulement après la construction du premier ordinateur.

Les premiers neurones du premier réseau neuronal étaient constitués de résistances et de tubes radio (à cette époque, un tel code n'avait pas encore été développé que les scientifiques modernes puissent utiliser). Travailler avec un réseau neuronal était la tâche de Frank Rosenblatt, qui a créé un réseau à deux couches. Un écran d'une résolution de 400 pixels a été utilisé pour transmettre les données externes au réseau. La machine fut bientôt capable de reconnaître des formes géométriques. Cela nous permettait déjà de supposer qu'avec l'amélioration solutions techniques, les réseaux de neurones peuvent apprendre à lire les lettres. Et qui sait quoi d'autre?

Premier réseau de neurones

Comme le montre l’histoire, Rosenblatt était littéralement passionné par son travail, excellait dans ce domaine et était spécialiste en neurophysiologie. Il est l'auteur d'un cours universitaire fascinant et populaire dans lequel chacun pouvait comprendre comment mettre en œuvre le cerveau humain dans une incarnation technique. Déjà à cette époque, la communauté scientifique espérait qu'il y aurait bientôt de réelles opportunités pour former des robots intelligents capables de se déplacer, de parler et de former des systèmes similaires à eux-mêmes. Qui sait, peut-être que ces robots iraient coloniser d’autres planètes ?

Rosentblatt était un passionné, et cela se comprend. Les scientifiques pensaient que l’intelligence artificielle pourrait être réalisée si elle était entièrement implémentée dans une machine. logique mathématique. A cette époque, Asimov existait déjà et popularisait l'idée de la robotique. La communauté scientifique était convaincue que l’exploration de l’Univers n’était qu’une question de temps.

Un scepticisme justifié

Déjà dans les années soixante, des scientifiques discutaient avec Rosenblatt et d’autres grands esprits travaillant sur l’intelligence artificielle. Une idée assez précise de la logique de leurs fabrications peut être obtenue à partir des publications de Marvin Minsky, célèbre dans son domaine. À propos, on sait que Stanley Kubrick a fait l’éloge des capacités de Minsky (Minsky l’a aidé à travailler sur « L’Odyssée de l’espace »). Minsky n’était pas contre la création de réseaux neuronaux, comme en témoigne le film de Kubrick, et dans le cadre de sa carrière scientifique, il a participé à l’entraînement de machines dans les années cinquante. Néanmoins, Minsky était catégorique sur les opinions erronées et critiquait les espoirs pour lesquels, à ce moment-là, il n'y avait pas encore de fondement solide. À propos, Marvin des livres porte le nom de Minsky.

La critique des réseaux de neurones et de l'approche de l'époque a été systématisée dans la publication « Perceptron », datée de 1969. C'est ce livre qui a littéralement tué pour beaucoup l'intérêt pour les réseaux de neurones, car un scientifique jouissant d'une excellente réputation a clairement montré que « Mark the First » présentait un certain nombre de défauts. Premièrement, la présence de seulement deux couches était clairement insuffisante et la machine ne pouvait pas faire grand-chose, malgré sa taille gigantesque et son énorme consommation d'énergie. Le deuxième point de critique portait sur les algorithmes développés par Rosenblatt pour entraîner le réseau. Selon Minsky, les informations sur les erreurs risquaient fort d'être perdues et la couche requise n'avait tout simplement pas reçu la totalité des données pour analyser correctement la situation.

L'affaire est au point mort

Malgré le fait que l’idée principale de Minsky était de signaler les erreurs à ses collègues afin de les encourager à améliorer le développement, la situation s’est avérée différente. Rosenblatt est décédé en 1971 et il n'y avait personne pour poursuivre son œuvre. Au cours de cette période, l’ère des ordinateurs a commencé et ce domaine technologique a progressé à grands pas. Les meilleurs esprits en mathématiques et en informatique étaient déployés dans ce secteur, et l’intelligence artificielle semblait être un gaspillage imprudent de ressources.

Les réseaux de neurones n’ont plus attiré l’attention de la communauté scientifique depuis plus d’une décennie. Le tournant s’est produit lorsque le cyberpunk est devenu à la mode. Il a été possible de découvrir des formules qui peuvent être utilisées pour haute précision compter les erreurs. En 1986, le problème formulé par Minsky trouva une troisième solution (toutes les trois furent développées par des groupes de scientifiques indépendants les uns des autres), et c'est sa découverte qui poussa les passionnés à explorer un nouveau domaine : les travaux sur les réseaux de neurones s'intensifièrent à nouveau. Cependant, le terme perceptrons a été discrètement remplacé par l'informatique cognitive, ils se sont débarrassés des dispositifs expérimentaux et ont commencé à utiliser le codage, en utilisant les techniques de programmation les plus efficaces. En quelques années seulement, les neurones sont déjà assemblés en structures complexes capables de faire face à des tâches assez sérieuses. Au fil du temps, il a été possible, par exemple, de créer des programmes permettant de lire l'écriture humaine. Les premiers réseaux sont apparus, capables d'auto-apprentissage, c'est-à-dire qu'ils ont trouvé indépendamment les bonnes réponses, sans l'aide de la personne qui utilisait l'ordinateur. Les réseaux de neurones ont trouvé une application pratique. Par exemple, ils constituent la base des programmes qui reconnaissent les numéros sur les chèques et sont utilisés dans les structures bancaires en Amérique.

Avancer à pas de géant

Dans les années 90, il est devenu clair que caractéristique clé Les réseaux de neurones, qui nécessitent une attention particulière de la part des scientifiques, sont la capacité d'explorer une zone donnée à la recherche de la bonne solution sans l'aide d'une personne. Le programme utilise la méthode des essais et des erreurs, sur la base de laquelle il crée des règles de comportement.

Cette période a été marquée par un regain d’intérêt du public pour les robots artisanaux. Des concepteurs enthousiastes de différentes régions du monde ont commencé à concevoir activement leurs propres robots capables d'apprendre. En 1997, il a connu le premier succès vraiment sérieux au niveau mondial : pour la première fois, un ordinateur a battu le meilleur joueur d'échecs du monde - Garry Kasparov. Cependant, à la fin des années 90, les scientifiques sont arrivés à la conclusion qu’ils avaient atteint le plafond et que l’intelligence artificielle ne pouvait plus se développer. De plus, un algorithme bien optimisé est beaucoup plus efficace que n'importe quel autre Un réseau de neurones résout les mêmes problèmes. Certaines fonctions sont restées derrière les réseaux de neurones, par exemple la reconnaissance de textes d'archives, mais rien de plus complexe n'était disponible. Fondamentalement, comme le disent les scientifiques modernes, il y avait un manque de capacités techniques.

Aujourd'hui

Les réseaux de neurones sont aujourd'hui un moyen de résoudre les problèmes les plus complexes en utilisant la méthode « la solution se trouvera d'elle-même ». En fait, cela n’est lié à aucune sorte de révolution scientifique, c’est simplement que les scientifiques modernes, sommités du monde de la programmation, ont accès à une technologie puissante qui leur permet de mettre en pratique ce qu’une personne ne pouvait auparavant imaginer qu’en termes généraux. Revenons à la phrase de Cicéron sur les singes et les jetons : si vous assignez quelqu'un aux animaux qui lui donnera une récompense pour la phrase correcte, il créera non seulement un texte significatif, mais il écrira un nouveau "Guerre et Paix", et non pire.

Les réseaux de neurones de nos jours sont en service les plus grandes entreprises travaillant dans le domaine des technologies de l’information. Il s'agit de réseaux neuronaux multicouches, mis en œuvre via des serveurs puissants, tirant parti des capacités World Wide Web, un ensemble d'informations accumulées au cours des dernières décennies.

Vous appréciez toujours les images lumineuses et la reconnaissance faciale ? Il y a de mauvaises nouvelles.

Tout le monde parle de réseaux de neurones : Prisma, MSQRD, AlphaGo... Tout cela semble si nouveau, incroyable, drôle. Mais peu de gens comprennent ce qu'est un réseau de neurones, quelles sont ses capacités et à quoi conduira l'utilisation généralisée de telles solutions dans un avenir assez proche.

Comment fonctionne un réseau de neurones artificiels ?


Un réseau de neurones est un modèle mathématique qui peut être facilement imaginé comme une structure en couches d’éléments similaires.

La première « couche » est responsable de la réception des informations entrantes, et toutes les suivantes, qui peuvent être des dizaines, sont responsables du traitement. des idées de plus en plus abstraites de ces données, jusqu'à ce que finalement ces représentations se transforment en un certain signal de sortie, qui est le résultat du fonctionnement de l'ensemble du système.

Comment fonctionne un réseau de neurones ?


La tâche la plus évidente pour un réseau neuronal est la reconnaissance d’images. Disons que nous avons téléchargé une photo d'une voiture. En termes simples, les éléments du premier niveau ne sont capables de distinguer qu'une ligne droite d'une ligne courbe, un élément clair d'un élément sombre.

La couche suivante, basée sur les « primitifs » reçus, tente de tirer des conclusions sur la signification de certains éléments individuels des images et ainsi de suite jusqu'à ce que la dernière couche d'éléments « conclue » que l'image montre une voiture ou autre chose.

La chose la plus intéressante ici est que le réseau de neurones n'est pas programmé de la manière habituelle, mais apprend d'un grand nombre d'exemples- des images de chatons, de voitures, de peintures de grands artistes et Dieu sait quoi d'autre.

Faisant alternativement des conclusions correctes et incorrectes, elle augmente progressivement le pourcentage de « clics » jusqu'à ce qu'il atteigne la valeur requise. Si le réseau neuronal est suffisamment complexe, à ce stade, même ses créateurs et « formateurs » ne sont plus en mesure de dire de quelle façon précisément elle a résolu le problème. "Boîte noire" classique.

Pourquoi les réseaux de neurones ont-ils décollé à ce moment-là ?

La plupart des travaux théoriques qui constituent la base des réseaux de neurones ont été écrits il y a un demi-siècle, mais pour application pratique ces idées n'avaient pas le terrain nécessaire. Ces dernières années, les neurosciences ont fait de grands progrès, grâce à une bonne compréhension des principes du cortex visuel du cerveau. Et les performances informatiques ont atteint le niveau nécessaire pour modéliser des structures neuronales hiérarchiques.

La méthode de « deep learning » créée au début des années 2000 s’est avérée très utile ( L'apprentissage en profondeur). Cela nous a permis de réduire considérablement le temps de formation du réseau neuronal.

Cependant, tout cela serait resté l’apanage des scientifiques universitaires de haut niveau si un jour quelqu’un n’avait pas eu l’idée de gérer le réseau neuronal « à l’envers ».

Comment fonctionnent Prisma, Google Deep Dream et autres

C'est une vision très simplifiée, mais c'est le cas. Un réseau de neurones pré-entraîné sur un ensemble particulier d'images « nourrit » une photographie non pas dans le but de la reconnaître, mais au contraire, dans le but d'y identifier et d'accentuer les éléments dont le système « se souvient » après l'entraînement. . Répéter cette opération plusieurs fois donne le même résultat. que tu as tant aimé dans Prisma.

En fonction des peintures sur lesquelles le système est formé, la photo est très efficacement adaptée à son style unique. Oui, c’est un produit de masse, dépourvu de toute valeur scientifique. La mode pour cela passera aussi vite que pour tout le reste. Mais les réseaux de neurones perdureront et se diffuseront de plus en plus largement autour de nous. Imperceptiblement et rapidement.

Pourquoi n’entend-on parler que d’images ?

Il y a exactement deux raisons et toutes deux sont banales. Premièrement, ce sont les astuces avec des images qui attirent le plus l'attention. Certaines personnes ont entendu parler d'AlphaGo, mais le plus grand joueur de Go au monde ne peut égaler la popularité de Prisma. La résolution de problèmes complexes dans le domaine de l’automatisation ne relève pas d’une manière ou d’une autre de la sphère d’intérêt du grand public.

Deuxièmement, c'est dans le domaine des images qu'il est le plus simple de former des réseaux de neurones - il existe de véritables bibliothèques gigantesques d'images étiquetées comme ImageNet, sur lesquelles vous pouvez former rapidement un réseau de neurones pour n'importe quel objectif.

Que nous apportent les réseaux de neurones ?

La beauté est qu'un réseau de neurones peut être formé sur n'importe quel ensemble de données - il vous suffit de lui faire savoir quel résultat de son travail sera considéré comme correct. Cela signifie que vous pouvez lui confier presque toutes les tâches.

Il n'est pas nécessaire de chercher bien loin des exemples : récemment, les spécialistes de Yandex ont mené une expérience très révélatrice en enregistrant un album de musique non officiel dont les paroles entièrement créé par un réseau de neurones et stylisé d'après les travaux de Yegor Letov et du groupe de défense civile.

Il y a aussi des succès plus sérieux. Des résultats impressionnants ont été obtenus dans le domaine du diagnostic médical - le réseau neuronal fait de meilleurs diagnostics que les médecins. Nous n’entrerons pas dans les détails ; recherchez simplement sur Google « diagnostics médicaux des réseaux neuronaux ». Recherche vocale Google utilise des réseaux de neurones et c'est grâce à eux qu'ils ont réussi à améliorer considérablement la qualité du service. Et ce n'est que le début d'une longue liste.

Que se passe-t-il si vous installez un réseau de neurones pour surveiller le travail d'un spécialiste ? Après un certain temps, elle pourra effectuer les mêmes actions, mais en mieux. Et ce n'est pas le genre d'automatisation à laquelle nous sommes habitués, lorsqu'un blanc placé sous le mauvais angle par rapport à la caméra conduit le robot à une confusion totale. Ce sera la fin de professions entières.

Où allons-nous?

Nous nous dirigeons à peu près vers la direction que prenait le monde pendant la révolution industrielle. Les nouveaux moyens de production rendront inutiles des millions d’emplois. Tout commence par traducteurs(entraînons simplement le réseau de neurones sur une quantité suffisante de textes synchronisés), employés du centre d'appels(reconnaissance vocale et scripts de dialogue flexibles), gardes de sécurité(reconnaissance des visages et comportements atypiques), Conducteurs(oui, ces mêmes pilotes automatiques) et ainsi de suite.

Au fil du temps, de plus en plus de professions seront attirées vers l’entonnoir d’automatisation. Vous devez être une personne très sûre d’elle pour croire que cela ne vous affectera pas. Ou nous.

Qu'est-ce qui nous attend alors ? Probablement un revenu de base inconditionnel, un chômage de masse et l’attente que les réseaux de neurones se développent suffisamment pour prendre complètement soin de leurs créateurs autrefois si indépendants.

Des nouvelles sur les réseaux de neurones apparaissent chaque jour. Soit les réseaux ont appris à déterminer le sexe et l'âge des personnes à partir de photographies, soit ils ont battu une personne dans une autre encore jeu de plateau, puis ils ont commencé à générer des textes scientifiques, du code d'application et à peindre des images dans l'esprit de Salvador Dali. Et demain, Skynet vous enlèvera votre travail, votre voiture, votre espace de vie et vous-même... non, pas éliminé, mais confortablement placé sur le canapé et obligé de ne rien faire, bénéficiant d'un revenu inconditionnel. Ou n'est-ce pas ?

Naissance d'un mythe

Les chercheurs et les entreprises qui travaillent avec de gros volumes de données utilisent les réseaux de neurones depuis les années 80, mais les Terriens ordinaires ne prêtent attention aux progrès dans ce domaine qu'après les victoires démonstratives des machines sur les humains. Deep Blue a battu Kasparov ! Watson bat les gens dans Jeopardy ! Et maintenant, AlphaGo de Google a vaincu Lee Sedol, l'un des meilleurs joueurs de Go aujourd'hui.

Le dernier cas est particulièrement intéressant. Une stratégie gagnante au Go ne peut tout simplement pas être programmée à l’aide de méthodes traditionnelles. Le nombre de combinaisons possibles après le premier coup est ici de 129 960 (aux échecs, à titre de comparaison, quatre cents), et pendant tout le match, il y en a plus qu'il n'y a d'atomes dans l'Univers. L'algorithme de calcul des mouvements n'est pas capable de réfléchir à toutes les combinaisons possibles et perd face aux joueurs professionnels qui s'appuient sur l'intuition développée au fil des années d'entraînement.

AlphaGo a, sinon de l'intuition, du moins quelque chose de très similaire. Le système s'est longtemps entraîné sur des centaines de milliers de jeux joués par des personnes et joués avec lui-même. Elle a appris à « ressentir » les mouvements prometteurs et, sur cette base, elle prédit le jeu avec plusieurs coups d'avance. Autrement dit, le programme a adopté ce trait humain que les gens utilisent chaque seconde, mais qu'il est difficile de transférer dans un algorithme.

AVEC main légère journalistes AlphaGo est passé d'un réseau neuronal banal, décrit il y a soixante ans, à Intelligence artificielle, qui n’est pas loin de prendre conscience de lui-même. En réalité, ce n’est évidemment pas le cas. AlphaGo est plus ou moins exemple standard réseau neuronal multicouche qui peut résoudre efficacement un problème tâche spécifique. Son « intuition » inhérente est une propriété bien connue d’un système formé sur de nombreux exemples. Cependant, les réseaux de neurones ne doivent pas non plus être considérés comme un jouet faisant l’objet d’une publicité excessive.

Perceptron et trois cents races de chiens

L'idée d'un réseau neuronal artificiel a été proposée pour la première fois par le neurophysiologiste Frank Rosenblatt en 1957 et mise en œuvre dans le neuroordinateur Mark-1 en 1960. Le modèle mathématique d'un tel réseau a été nommé « perceptron », et le dispositif lui-même a été petit ordinateur, équipé d'un affichage de plusieurs centaines de photocellules. En montrant les images informatiques puis en ajustant les coefficients de pondération des connexions de neurones artificiels, il a été possible d'apprendre à un réseau de neurones à reconnaître des formes géométriques et certaines lettres de l'alphabet.

Dans les temps modernes, Mark 1 est un jouet. De plus, il souffrait de nombreux problèmes : par exemple, les images n'étaient pas reconnues lorsqu'elles étaient déformées ou pivotées. Il est désormais clair qu’avec le niveau de puissance de calcul de l’époque, beaucoup de choses ne pouvaient tout simplement pas être réalisées. Les perceptrons sont intéressants d’un point de vue historique : ils n’ont pas résolu de vrais problèmes. En 1969, Marvin Minsky et Seymour Papert ont décrit ces expériences dans le livre « Perceptrons », après quoi la recherche dans le domaine des réseaux neuronaux a été réduite au profit, semblait-il alors, d'une informatique symbolique plus prometteuse.

Un nouvel intérêt pour les réseaux de neurones ne s'est produit qu'en 1986, lorsque la méthode d'apprentissage automatique utilisant la méthode de rétropropagation est apparue. Cela a permis d'augmenter considérablement la vitesse et la qualité de la formation des réseaux de neurones. Cependant, les ressources informatiques étaient encore limitées et il n’existait pas de très gros volumes de données pour entraîner les réseaux neuronaux. Par conséquent, ils existaient principalement sous forme de projets de recherche et étaient utilisés pour résoudre un éventail très limité de problèmes. Ceux qui ne nécessitent pas trop de mégahertz ou de mégaoctets, comme la reconnaissance de texte.

En 2012, un événement s'est produit qui a radicalement changé l'attitude envers les réseaux de neurones. Le réseau SuperVision, développé à l'Université de Toronto, a remporté le concours ImageNet LSVRP (Large-Scale Visual Recognition Challenge) pour la reconnaissance d'objets dans des images avec une large marge. Son taux d'erreur était de 16,4 %, tandis que le programme de deuxième place s'est trompé dans 26 % des cas. A titre de comparaison : une personne fait des erreurs 5 % du temps. Mais le plus surprenant était que pour la formation préliminaire du réseau, ce n'est pas un cluster qui a été utilisé, mais ordinateur ordinaire avec deux Cartes vidéo NVIDIA. La formation a duré environ une semaine.

C’était la première fois qu’un réseau neuronal surpassait les algorithmes classiques de vision par ordinateur dans un test très complexe et spécifique. La base de données d’images comprenait non seulement des objets simples comme des voitures, des bus, des tables et des chaises, mais également trois cents races de chiens, dont deux douzaines de terriers.

Ça a l'air drôle ? Peut-être. Mais voici ce qui est important : vous ne connaîtrez jamais autant de races de chiens, mais la machine peut les reconnaître en toute confiance. Et nous ne parlons pas d’un énorme ordinateur IBM, mais d’un système comme ceux que les fans de jeux aux graphismes sympas assemblent eux-mêmes.

Retour vers le futur

Ce n'est pas un hasard si SuperVision est devenu un symbole de la nouvelle ère des réseaux de neurones. La classification d'images est quelque chose de beaucoup plus complexe et de haut niveau que la simple analyse de lettres sur papier. Même un enfant peut dire ce qui distingue la lettre A de toutes les autres lettres de l'alphabet, mais essayez de parler immédiatement des caractéristiques distinctives, par exemple, d'un nuage. Quelle est exactement sa différence par rapport aux autres objets que vous voyez ? Les mots « blanc », « ciel », « cumulus », etc. me viennent à l’esprit. Ce sont de nombreux paramètres, dont chacun doit également avoir une idée. Qu'est-ce que "blanc" ? Et le « ciel » ?

Ce problème est désormais résolu à l'aide de la méthode Deep Learning, dont l'essence est de combiner un grand nombre de couches de neurones (dans SuperVision il y en avait cinq, dans les réseaux modernes il y en a des centaines). Il en résulte quelque chose comme une hiérarchie d'abstractions. Et puis les filets sont nourris exemples, grâce auquel elle « voit » à quoi ressemble le nuage dans différentes situations, et peut comprendre comment l'identifier. En cas d'erreur, le système se reconfigure.

La méthode a fait ses preuves, mais pour qu’elle fonctionne, deux conditions doivent être remplies. Premièrement, il devrait y avoir beaucoup d’exemples. Pas des centaines ni même des milliers, mais des dizaines et des centaines de milliers, et plus il y en aura, meilleurs seront les résultats. Deuxièmement, le réseau doit être très vaste et composé de centaines de milliers, voire de millions de neurones, combinés en plusieurs couches. Au cours du processus de formation d'une telle IA, des exemples sont exécutés sur l'ensemble du réseau avec une correction d'erreur constante. Les exigences en matière de puissance de calcul sont appropriées.

Auparavant, ils essayaient de résoudre des problèmes similaires en utilisant des clusters de milliers de machines. Par exemple, Google a créé un réseau de neurones fonctionnant sur 16 000 cœurs de processeur. Ce qui, bien entendu, rendait son utilisation totalement non rentable.

En 2014, Google a réessayé et a utilisé cette fois le deep learning. Le résultat est un réseau GoogLeNet à 22 couches qui, selon les auteurs, comme SuperVision, peut être entraîné sur plusieurs GPU haut de gamme en une semaine. Lors du concours ImageNet, le réseau Google a réalisé d'excellents résultats : le nombre d'erreurs est tombé à 6,7 %. Presque comme un humain !

Si vous pensez que c'est impressionnant, c'est que vous ne connaissez pas les dernières nouvelles. Les réseaux neuronaux d'aujourd'hui reconnaissent les objets non seulement pas pire, mais même mieux que l'homme, et savoir aussi reconnaître ce qui est montré sur une photographie. Fin 2014, des chercheurs de Google et de l'Université de Stanford ont démontré un réseau neuronal capable de générer des légendes significatives pour les photographies. Malgré le pourcentage élevé d’erreurs, c’était impressionnant.

La suite est disponible uniquement pour les abonnés

Option 1. Abonnez-vous à Hacker pour lire tous les documents sur le site

L'abonnement vous permettra de lire TOUS les documents payants sur le site dans la période spécifiée. Nous acceptons le paiement cartes bancaires, monnaie électronique et virements depuis les comptes des opérateurs mobiles.