Rencontrez l'actrice qui a donné la voix à "Alice". Alice, Assistant Yandex pour Windows, bonjour Alice, comment vas-tu ?

Pour démarrer une conversation, lancez l'application et dites « Salut Alice » (ou appuyez sur le bouton du microphone).

Lorsque vous cliquez sur 👎, Alice suggère de signaler le problème aux développeurs. Si vous avez appuyé sur 👎 par erreur ou si vous changez d'avis concernant votre réclamation, sélectionnez Non, tout va bien.

Alice ne me comprend pas

Si Alice ne reconnaît pas correctement vos mots (le texte que vous avez prononcé n'apparaît pas le même à l'écran), essayez de rapprocher le microphone et de prononcer la phrase plus clairement. Si Alice affiche toujours le mauvais texte, appuyez sur 👎 et sélectionnez une option Mon discours n'a pas été reconnu. Dans les applications mobiles, le texte peut être saisi manuellement - pour ce faire, cliquez sur l'icône du clavier sur l'écran d'Alice.

Si votre discours est correctement reconnu, mais qu'Alice répond de manière incorrecte ou ne comprend clairement pas la question, appuyez sur 👎 et sélectionnez l'option La réponse ne correspond pas à la question.

Alice prononce mal les mots

Pour signaler aux développeurs une erreur de prononciation, cliquez sur 👎 sous la réponse d'Alice et sélectionnez une option Le texte est mal prononcé.

Alice est impolie

Alice essaie de répondre à chaque question individuellement – ​​il n’y a pas de correspondance stricte entre la question et la réponse. Une réponse inappropriée au contexte peut offenser ou ressembler à une mauvaise blague. Veuillez nous le faire savoir en cliquant sur 👎 sous la réponse d'Alice et en sélectionnant l'option souhaitée (par ex. La réponse est offensante ou insultante).

  • Apprentissage automatique,
  • Technologies de recherche,
  • Développement d'applications mobiles
  • À l’avenir, nous pensons que les gens interagiront avec les appareils en utilisant leur voix. Déjà, les applications reconnaissent les commandes vocales exactes intégrées par les développeurs, mais avec le développement des technologies d'intelligence artificielle, elles apprendront à comprendre le sens de phrases arbitraires et même à entretenir une conversation sur n'importe quel sujet. Aujourd'hui, nous expliquerons aux lecteurs de Habr comment nous rapprochons cet avenir en utilisant l'exemple d'Alice, le premier assistant vocal qui ne se limite pas à un ensemble de réponses prédéfinies et utilise des réseaux de neurones pour communiquer.

    Malgré son apparente simplicité, l’assistant vocal est l’un des plus grands projets technologiques de Yandex. Dans cet article, vous découvrirez les difficultés auxquelles sont confrontés les développeurs d'interfaces vocales, qui écrit réellement les réponses pour les assistants virtuels et ce qu'Alice a en commun avec l'intelligence artificielle du film "Her".

    À l’aube de leur existence, les ordinateurs étaient principalement utilisés dans les grandes entreprises scientifiques ou de défense. À cette époque, seuls les écrivains de science-fiction pensaient à la commande vocale, mais en réalité, les opérateurs chargeaient les programmes et les données à l'aide d'un morceau de carton. Ce n'est pas le moyen le plus pratique : une erreur, et il faut tout recommencer.

    Au fil des années, les ordinateurs sont devenus plus abordables et commencent à être utilisés dans les petites entreprises. Les spécialistes les contrôlent à l'aide de commandes textuelles saisies dans le terminal. Une bonne méthode fiable - elle est encore utilisée aujourd'hui dans un environnement professionnel, mais elle nécessite une préparation. Par conséquent, lorsque les ordinateurs ont commencé à apparaître dans les foyers des utilisateurs ordinaires, les ingénieurs ont commencé à rechercher des moyens plus simples d’interagir entre la machine et l’homme.

    Le concept de l'interface graphique WIMP (Windows, Icônes, Menus, Point-n-Click) est né dans le laboratoire Xerox - il a été largement utilisé dans les produits d'autres sociétés. Il n'était plus nécessaire de mémoriser des commandes textuelles pour contrôler un ordinateur personnel : elles étaient remplacées par des gestes et des clics de souris. Pour l’époque, c’était une véritable révolution. Et maintenant, le monde se dirige vers le prochain.

    Aujourd’hui, presque tout le monde a dans sa poche un smartphone doté d’une puissance de calcul suffisante pour faire atterrir un vaisseau spatial sur la Lune. La souris et le clavier ont remplacé les doigts, mais nous les utilisons toujours pour effectuer les mêmes gestes et clics. C'est pratique à faire assis sur le canapé, mais pas sur la route ou en déplacement. Dans le passé, les humains devaient apprendre le langage machine pour interagir avec les interfaces informatiques. Nous pensons que le moment est venu d’apprendre aux appareils et aux applications à communiquer dans la langue des gens. C'est cette idée qui a constitué la base de l'assistant vocal Alice.

    Vous pouvez demander à Alice [Où puis-je prendre un café à proximité ?] au lieu de dicter quelque chose comme [un café sur Cosmonaut Street]. Alice examinera Yandex et suggérera un endroit approprié, et en réponse à la question [Super, comment s'y rendre ?] - elle donnera un lien vers un itinéraire déjà construit dans Yandex.Maps. Elle sait distinguer les questions factuelles précises de l'envie de voir des résultats de recherche classiques, l'impolitesse d'une demande polie, l'ordre d'ouvrir un site de l'envie de simplement discuter.

    Il peut même sembler qu’il existe quelque part dans le cloud un réseau neuronal miracle qui, à lui seul, résout n’importe quel problème. Mais en réalité, derrière toute réponse d'Alice se cache toute une chaîne de problèmes technologiques, que nous apprenons à résoudre depuis maintenant 5 ans. Et nous commencerons notre excursion dès le premier lien - avec la capacité d'écouter.

    Bonjour Alice

    L'intelligence artificielle issue de la science-fiction peut écouter : les gens n'ont pas besoin d'appuyer sur des boutons spéciaux pour activer le « mode d'enregistrement ». Et pour cela, vous avez besoin d'une activation vocale - l'application doit comprendre qu'une personne la contacte. Ce n’est pas aussi facile à faire qu’il y paraît.

    Si vous commencez simplement à enregistrer et à traiter l’intégralité du flux audio entrant sur le serveur, vous viderez très rapidement la batterie de l’appareil et gaspillerez tout votre trafic mobile. Dans notre cas, cela est résolu à l'aide d'un réseau neuronal spécial, formé exclusivement pour reconnaître les phrases clés (« Bonjour, Alice », « Écoutez, Yandex » et quelques autres). La prise en charge d'un nombre limité de ces phrases vous permet d'effectuer ce travail localement et sans accéder au serveur.

    Si le réseau est entraîné à comprendre seulement quelques phrases, vous pourriez penser que cela serait assez simple et rapide. Mais non. Les gens prononcent des phrases dans des conditions loin d'être idéales, mais entourés d'un bruit complètement imprévisible. Et les voix de chacun sont différentes. Par conséquent, pour comprendre une seule phrase, des milliers d’enregistrements de formation sont nécessaires.

    Même un petit réseau neuronal local consomme des ressources : vous ne pouvez pas simplement capter et commencer à traiter l'intégralité du flux à partir du microphone. Par conséquent, au premier plan, un algorithme moins lourd est utilisé, qui reconnaît rapidement et à moindre coût l'événement « la parole a commencé ». C'est ce qui active le moteur de réseau neuronal pour la reconnaissance des phrases clés, qui à son tour exécute la partie la plus difficile : la reconnaissance vocale.

    Si des milliers d'exemples sont nécessaires pour entraîner une seule phrase, vous pouvez alors imaginer à quel point il faut beaucoup de travail pour entraîner un réseau neuronal à reconnaître des mots et des expressions. Pour la même raison, la reconnaissance est effectuée dans le cloud, où le flux audio est transmis et d'où sont renvoyées les réponses toutes faites. L'exactitude des réponses dépend directement de la qualité de la reconnaissance. C'est pourquoi le principal défi est d'apprendre à reconnaître la parole aussi bien qu'une personne. D’ailleurs, les gens font aussi des erreurs. On pense qu'une personne reconnaît 96 à 98 % de la parole (métrique WER). Nous avons réussi à atteindre une précision de 89 à 95 %, ce qui est non seulement comparable au niveau d'un interlocuteur en direct, mais également unique pour la langue russe.

    Mais même un discours parfaitement converti en texte ne signifiera rien si nous ne pouvons pas comprendre le sens de ce qui a été dit.

    Quel temps fera-t-il demain à Saint-Pétersbourg ?

    Si vous souhaitez que votre application affiche une prévision météo en réponse à une demande vocale [météo], alors tout est simple : comparez le texte reconnu avec le mot « météo » et si vous obtenez une correspondance, affichez la réponse. Et c'est un mode d'interaction très primitif, car dans la vraie vie, les gens posent les questions différemment. Une personne peut demander à un assistant [Quel temps fera-t-il demain à Saint-Pétersbourg ?], et il ne faut pas la confondre.

    La première chose que fait Alice lorsqu'elle reçoit une question est de reconnaître le scénario. Envoyer une demande de recherche et afficher les résultats classiques avec 10 résultats ? Rechercher une réponse exacte et la donner immédiatement à l'utilisateur ? Entreprendre une action, comme ouvrir un site Web ? Ou peut-être juste parler ? Il est incroyablement difficile d’apprendre à une machine à reconnaître avec précision des scénarios comportementaux. Et toute erreur ici est désagréable. Heureusement, nous disposons de toute la puissance du moteur de recherche Yandex, qui rencontre chaque jour des millions de requêtes, recherche des millions de réponses et apprend à comprendre lesquelles sont bonnes et lesquelles ne le sont pas. Il s'agit d'une énorme base de connaissances, sur la base de laquelle il est possible de former un autre réseau neuronal - un réseau qui « comprendrait » avec une forte probabilité ce que veut exactement une personne. Les erreurs sont bien sûr inévitables, mais les gens en font aussi.

    Grâce à l'apprentissage automatique, Alice « comprend » que la phrase [Quel temps fera-t-il demain à Saint-Pétersbourg ?] est une demande météo (d'ailleurs, il s'agit évidemment d'un exemple simple pour plus de clarté). Mais de quelle ville parle-t-on ? A quelle date ? C’est ici que commence l’étape de récupération des entités nommées à partir des répliques utilisateur (Named Entity Recognition). Dans notre cas, deux de ces objets portent des informations importantes : « Pierre » et « demain ». Et Alice, qui a derrière elle les technologies de recherche, « comprend » que « Peter » est un synonyme de « Saint-Pétersbourg » et « demain » est « date du jour + 1 ».

    Le langage naturel n'est pas seulement la forme extérieure de nos propos, mais aussi leur cohérence. Dans la vie, nous n'échangeons pas de courtes phrases, mais menons un dialogue - c'est impossible si vous ne vous souvenez pas du contexte. Alice s'en souvient - cela l'aide à faire face à des phénomènes linguistiques complexes : par exemple, gérer les points de suspension (récupérer les mots manquants) ou résoudre la coréférence (identifier un objet par un pronom). Donc, si vous demandez [Où est l'Elbrouz ?], puis clarifiez [Quelle est sa hauteur ?], alors l'assistant trouvera les bonnes réponses dans les deux cas. Et si après la demande [Quel temps fait-il aujourd'hui ?] demandez [Et demain ?], Alice comprendra qu'il s'agit d'une suite du dialogue sur la météo.

    Et quelque chose d'autre. L'assistant doit non seulement comprendre le langage naturel, mais aussi être capable de le parler - comme une personne et non comme un robot. Pour Alice, nous synthétisons la voix qui appartenait à l'origine à l'actrice de doublage Tatyana Shitova (la voix officielle de Scarlett Johansson en Russie). Elle a exprimé l'intelligence artificielle dans le film Her, même si vous vous souvenez peut-être également d'elle grâce à la voix de la sorcière Yennefer dans The Witcher. De plus, nous parlons d'une synthèse assez approfondie utilisant des réseaux de neurones, et non de découpage de phrases toutes faites - il est impossible d'écrire à l'avance toute leur diversité.

    Ci-dessus, nous avons décrit les caractéristiques de la communication naturelle (forme de remarques imprévisibles, mots manquants, pronoms, erreurs, bruit, voix), avec lesquelles vous devez être capable de travailler. Mais la communication en direct a une propriété supplémentaire : nous n'exigeons pas toujours une réponse ou une action spécifique de la part de l'interlocuteur ; parfois nous voulons simplement parler. Si l'application envoie de telles requêtes à la recherche, alors toute la magie sera détruite. C'est pourquoi les assistants vocaux populaires utilisent une base de données de réponses éditoriales aux expressions et questions populaires. Mais nous sommes allés encore plus loin.

    Et si on discutait ?

    Nous avons appris à la machine à répondre à nos questions, à dialoguer dans le cadre de certains scénarios et à résoudre les problèmes des utilisateurs. C'est bien, mais est-il possible de la rendre moins sans âme et de la doter de propriétés humaines : lui donner un nom, lui apprendre à parler d'elle, entretenir une conversation sur des sujets libres ?

    Le secteur des assistants vocaux résout ce problème grâce à des réponses éditoriales. Une équipe spéciale d'auteurs répond à des centaines de questions parmi les plus populaires parmi les utilisateurs et rédige plusieurs réponses à chacune d'entre elles. Idéalement, cela devrait être fait dans un style unifié, afin que toutes les réponses forment une personnalité cohérente de l'assistant. Nous écrivons également des réponses pour Alice - mais nous avons autre chose. Quelque chose de spécial.

    En plus des questions les plus populaires, il existe une longue liste de phrases à faible fréquence, voire uniques, pour lesquelles il est impossible de préparer une réponse à l'avance. Vous avez déjà deviné comment nous résolvons ce problème, n'est-ce pas ? Utilisation d'un autre modèle de réseau neuronal. Pour répondre à des questions et remarques qui lui sont inconnues, Alice utilise un réseau de neurones entraîné sur une immense base de données de textes issus d'Internet, de livres et de films. Les connaisseurs de l'apprentissage automatique seront peut-être intéressés par le fait que nous avons commencé avec un réseau neuronal à 3 couches et que nous expérimentons maintenant un énorme réseau à 120 couches. Nous enregistrerons les détails pour des articles spécialisés, mais nous dirons ici que la version actuelle d'Alice essaie de répondre à des phrases arbitraires en utilisant un « chat en réseau neuronal » - c'est ainsi que nous l'appelons en interne.

    Alice apprend à partir d'un grand nombre de textes différents, dans lesquels les personnes et les personnages ne se comportent pas toujours poliment. Un réseau de neurones peut apprendre quelque chose de complètement différent de ce que nous voulons lui enseigner.

    - Commande-moi un sandwich.
    - Vous vous en sortirez.

    Comme tout enfant, on ne peut pas apprendre à Alice à ne pas être impolie en la protégeant de toutes les manifestations d'impolitesse et d'agression - c'est-à-dire en entraînant le réseau neuronal sur une base « propre », où il n'y a pas souvent d'impolitesse, de provocations et d'autres choses désagréables. trouvé dans le monde réel. Si Alice ne connaît pas l'existence de telles expressions, elle y répondra sans réfléchir, avec des phrases aléatoires - pour elle, ce seront des mots inconnus. Faites-lui mieux savoir de quoi il s'agit et développez une position définitive sur ces questions. Si vous savez ce qu'est un juron, vous pouvez soit jurer en retour, soit dire que vous ne parlerez pas à quelqu'un qui jure. Et nous modélisons le comportement d'Alice pour qu'elle choisisse la deuxième option.

    Il arrive que la remarque d’Alice elle-même soit assez neutre, mais dans le contexte précisé par l’utilisateur, la réponse cesse d’être inoffensive. Une fois, lors de tests fermés, nous avons demandé à l'utilisateur de trouver des établissements - un café ou quelque chose de similaire. Il a dit : « Trouvez-en un autre comme celui-ci. » Et à ce moment-là, un bug s'est produit chez Alice, et au lieu d'exécuter le script de recherche d'organisation, elle a donné une réponse plutôt audacieuse - quelque chose comme "regardez sur la carte". Et je n'ai rien cherché. L’utilisateur a d’abord été surpris, puis nous a également surpris en louant le comportement d’Alice.

    Lorsqu'Alice utilise le chat du réseau neuronal, un million de personnalités différentes peuvent y apparaître, puisque le réseau neuronal a absorbé un peu de l'auteur de chaque réplique de l'ensemble de formation. Selon le contexte, Alice peut être polie ou grossière, joyeuse ou déprimée. Nous voulons que l’assistant personnel soit une personne holistique dotée d’un ensemble de qualités très spécifiques. C’est là que nos textes éditoriaux viennent à la rescousse. Leur particularité est qu’ils ont été initialement écrits au nom de la personnalité que l’on souhaite recréer chez Alice. Il s'avère que vous pouvez continuer à former Alice sur des millions de lignes de textes aléatoires, mais elle répondra en tenant compte des normes de comportement énoncées dans les réponses éditoriales. Et c'est ce sur quoi nous travaillons déjà.

    Alice est devenue la première assistante vocale que nous connaissons qui tente de maintenir la communication non seulement à l'aide de réponses éditoriales, mais également à l'aide d'un réseau neuronal entraîné. Bien entendu, nous sommes encore très loin de ce que décrit la science-fiction moderne. Alice ne reconnaît pas toujours avec précision l'essence de la remarque, ce qui affecte l'exactitude de la réponse. Nous avons donc encore beaucoup de travail à faire.

    Nous prévoyons de faire d'Alice l'assistante la plus humanoïde au monde. Inculquez-lui de l’empathie et de la curiosité. Rendez-la proactive - apprenez-lui à se fixer des objectifs dans le dialogue, à prendre des initiatives et à impliquer l'interlocuteur dans la conversation. Nous sommes maintenant au tout début de notre voyage et à l’avant-garde de la science étudiant ce domaine. Pour aller plus loin, vous devrez déplacer ce bord.

    Depuis la mi-mai, les flux des portails dédiés à l'électronique mobile regorgent d'informations selon lesquelles Yandex teste son propre assistant vocal - un analogue de l'assistant Apple Siri. L'assistant vocal de Yandex a reçu le nom d'« Alice » - les développeurs affirment qu'il s'agit d'un hommage à Alisa Selezneva, l'héroïne des films soviétiques. Désormais, « Alice » est déjà disponible pour tous les propriétaires de l'application mobile Yandex.

    Il existe des statistiques très éloquentes (collectées par le portail SEO-Auditor) selon lesquelles plus de 90 % des utilisateurs nationaux recherchent des informations dans l'un des 2 moteurs de recherche - Google ou Yandex. Les systèmes Mail.ru et Rambler restent avec des miettes pitoyables d'attention des utilisateurs, et de nombreux utilisateurs russes ne connaissent même pas l'existence de Bing et Yahoo.

    Dans le même temps, selon la notation SEO-Auditor, on peut comprendre que Yandex, qui devançait largement Google à la mi-2016, est sur le point de donner la « palme » en 2017. Pourquoi Yandex s'affaiblit-il ? La réponse est simple : parce que de plus en plus de personnes accèdent à Internet depuis des appareils mobiles, et de moins en moins depuis des PC. Sur combien de gadgets le navigateur par défaut exécute Yandex ? Non : n'importe quel smartphone Android est immédiatement transféré vers Google.

    Afin d'éviter un monopole sur le marché russe des moteurs de recherche et de ne pas perdre purement et simplement la concurrence face à Google, Yandex tente d'offrir aux utilisateurs quelque chose que le « géant d'outre-mer » ne leur a pas encore offert. Ce « quelque chose » devrait être un assistant vocal intelligent qui comprend le russe. Google Assistant est bon, mais il a toujours du mal avec le russe ; Google Now est très primitif comparé, par exemple, à Siri et à Alexa d'Amazon. Yandex a besoin d'Alice pour maintenir sa popularité.

    La société russe a réussi à lancer son assistant vocal sur le marché de masse avant que Google Assistant ne parle russe - et c'est une victoire significative.

    Quand l’assistant vocal Alice est-il sorti ?

    Yandex a officiellement présenté Alice le 10 octobre 2017. Les propriétaires de tous les appareils iOS et Android peuvent utiliser les services d’Alice. Sur les PC fonctionnant sous Windows, l'assistant continue de fonctionner en version bêta. Le géant de la recherche n'est pas pressé de lancer l'assistant intelligent sur d'autres systèmes d'exploitation.

    "Alice" reconnaît bien la parole et comprend parfaitement l'utilisateur. Selon Yandex, l'assistante est formée sur un large éventail de textes et est donc une véritable érudite - elle est capable de reconnaître même des questions inachevées, en tenant compte du contexte de ce qui a été dit précédemment. Contrairement à la version bêta, la version officielle "Alice" n'a aucun problème d'intonation - elle parle avec la voix de Tatyana Shitova, l'actrice qui interprète Scarlett Johansson. Yandex aime impliquer des stars dans le doublage des services - le navigateur de cette société, par exemple, est capable de parler avec la voix du rappeur Basta.

    Que peut faire l'assistante Alice de Yandex ?

    • Trace des itinéraires, trouve des adresses. Le programme signale également les embouteillages.
    • Effectue une recherche traditionnelle dans le système Yandex.
    • Donne des prévisions météorologiques.
    • Fournit les adresses des établissements - cafés, centres d'affaires, auberges.
    • Effectue des opérations mathématiques, convertit des devises.
    • Lance des applications tierces - par exemple Instagram et VKontakte.
    • Il entretient un dialogue et fait parfois même preuve d'érudition musicale, citant des chansons de divers interprètes - du groupe Aquarium à Oxxxymiron.

    On s'attend à ce qu'au fil du temps, de nombreuses autres grandes entreprises donnent également accès à Alice à leurs applications.

    Les développeurs ont fait un excellent travail pour "humaniser" "Alice" autant que possible - de sorte que l'assistant vocal de Yandex n'est pas capable d'un humour pire que Siri, dont certains joyaux sont devenus des mèmes populaires. Voici comment « Alice » explique pourquoi elle s'appelle ainsi :

    Les réponses d'Alice sont vraiment extrêmement amusantes et la voix de l'assistant semble assez naturelle (bien meilleure que dans la version bêta) - grâce aux technologies d'apprentissage automatique, le collage est presque invisible. Ceux qui sont agacés par de petits « défauts d’élocution » peuvent couper la voix d’Alice et lire les réponses.

    Comment installer Alice sur un smartphone ?

    Vous pouvez télécharger « Alice » sur votre smartphone en téléchargeant et en installant l'application officielle Yandex depuis Google Play ou l'AppStore. Vous devez lancer l'application et appuyer sur le bouton bleu avec l'image d'un microphone situé exactement au milieu de l'écran.

    Une fenêtre de correspondance apparaîtra, où seront affichées les anciennes demandes et réponses qui leur ont été données par « Alice ». En cliquant à nouveau sur le bouton avec l'icône du microphone, l'utilisateur pourra faire une nouvelle demande vocale.

    Conclusion

    Selon les statistiques, en 2016, 3,5 milliards d'appareils différents dotés d'assistants vocaux étaient utilisés dans le monde. Selon les experts, d’ici 2021, le nombre de ces appareils pourrait doubler. Les statistiques nous convainquent que nous sommes au stade de la formation d'une marque mondiale puissante - bientôt une entreprise qui n'a pas donné au monde un assistant intelligent créé par elle-même sera considérée comme un outsider.

    Tous les grands développeurs de logiciels ont déjà acquis des assistants vocaux qui fonctionnent à des degrés divers : par exemple, Apple fait plaisir à ses fans avec le « intelligent » Siri, tandis que Samsung, au contraire, dérange les utilisateurs avec le stupide (pour l'instant) Bixby. Yandex n'est pas non plus resté à l'écart - son assistant "Alice", en termes de fonctionnalités, est comparable au succès actuel de Google Assistant.

    Bonjour les amis! De nombreux lecteurs ne comprennent pas ce que signifie Alice, Yandex Assistant pour Windows. Cet article répondra à cette question. Nous parlerons d'un assistant vocal pour PC et téléphones, de l'assistant Yandex Alice. La recherche vocale Yandex est effectuée via une application installée séparément. Nous verrons comment l'installer et comment l'utiliser.

    Alice, assistante Yandex pourles fenêtres

    Je pense que beaucoup de gens connaissent l'expression Google ok, comment s'y rendre, ou encore combien coûte telle ou telle voiture. Cette fonctionnalité s’appelle Google Voice Assistant, de nombreuses personnes l’utilisent et en sont satisfaites. Google vous donnera la réponse à la plupart de vos questions. Aujourd'hui, Yandex a créé un système de reconnaissance vocale alternatif appelé Alice, Yandex Assistant pour Windows. Bien que ce ne soit pas tout à fait exact, il a créé une telle application pour Android et iOS. Mais dans cet article, nous examinerons Alice pour Windows. Si vous souhaitez gagner de l'argent via Internet, cet assistant vous aidera également.

    Alors, que peuvent faire l'application Alice pour Windows, ainsi que les applications pour appareils mobiles ? Vous donnez une commande vocale à Yandex et il répond à vos questions avec une voix féminine agréable. Autant que je sache, le programme parle avec la voix de Tatyana Shitova, je vais vous le dire, cette actrice a une voix agréable. Alisa, l'assistante Yandex, a été officiellement présentée il y a à peine quatre semaines, plus précisément le 10 octobre 2017.

    Étant donné que les fonctions du programme sont les mêmes pour les appareils mobiles et pour les ordinateurs de bureau et portables, dans cet article, je montrerai uniquement Alice pour Windows. Si l'on compare Google Assistant et le nouveau Yandex Assistant, notre service parle beaucoup mieux le russe, il n'a aucun problème de prononciation et d'intonation. Le programme comprend même un demi-mot et peut également comprendre des questions inachevées.

    Outre la reconnaissance vocale, le texte de la demande et de la réponse est publié sous forme écrite. Il faut dire que l'assistant est créé sur la base de réseaux de neurones, ce qui signifie qu'Alice va constamment s'éduquer et devenir de plus en plus intelligente. L'assistant vocal a été créé sur la plateforme du célèbre synthétiseur vocal SpeechKit, rappelez-vous, j'en ai parlé dans l'article « ».

    Alors, que peut faire Alice, l'assistante Yandex pour Windows ? Il s'avère que c'est beaucoup. Par exemple, Alice, l'assistante vocale de Yandex, peut simplement discuter avec vous sur n'importe quel sujet ; vous devez en convenir, c'est un jouet intéressant ! Elle vous dira quel temps il fait actuellement et comment vous devriez vous habiller aujourd'hui. Répondra à toute question d'information, comment se rendre à l'aéroport ou où acheter la chose nécessaire.

    Alice peut ouvrir le réseau social VKontakte ou le site dont vous avez besoin sur votre ordinateur, elle peut ouvrir le programme dont vous avez besoin ou Skype. Il peut redémarrer votre ordinateur, vous aider à trouver la musique dont vous avez besoin, à compter de l'argent ou à obtenir un itinéraire. Vous pouvez rapidement vous renseigner sur les embouteillages dans votre ville, connaître les dernières nouvelles et bien plus encore. Il n'y a pas beaucoup de critiques sur l'assistant vocal Alice aujourd'hui, mais ils écrivent que cet outil est beaucoup plus cool que l'Assistant Google. À propos, V. Poutine a visité Yandex et a personnellement pris connaissance de cette évolution. Voyons maintenant comment Alice, Yandex Assistant pour Windows est installé sur un ordinateur.

    Comment télécharger l'assistant vocal Alice ?

    Le téléchargement de l'assistant vocal Alice est assez simple, toutes les actions sont présentées en détail dans la vidéo ci-dessous. Tout d'abord, nous devons taper « assistant vocal Alice » dans la barre de recherche Yandex, puis sélectionner les sites qui nous sont proposés. Si vous sélectionnez l'adresse alice.yandex.ru, vous serez redirigé vers une page de téléchargement d'applications pour appareils mobiles - vous pouvez télécharger l'assistant vocal Alice depuis Yandex sur Android ou iOS. Si vous allez sur alice.yandex.ru›windows, vous téléchargerez l'application pour Windows.

    Cependant, vous devez garder à l'esprit qu'Alice, Yandex Assistant pour Windows ne fonctionnera qu'avec Windows 7 ou 10. Ensuite, vous devez télécharger le programme lui-même sur votre ordinateur, il ne pèse que 13 Mo. Après cela, vous installez, tout se fait simplement et aucune connaissance supplémentaire n'est nécessaire. Le travail est terminé, il est temps de commencer à l'utiliser.

    Salut Alice, comment vas-tu ?

    Vous verrez maintenant un champ en bas de l'écran de votre moniteur avec l'inscription : « Rechercher dans Yandex et sur votre ordinateur ». Pour appeler Alice, vous devez cliquer sur l'image du microphone dans ce champ. La fenêtre de travail du programme s'ouvre. Après avoir installé le programme, vous pouvez commencer son travail avec les mots: "Bonjour Alice, comment vas-tu." Pour mieux comprendre le fonctionnement de l'assistant, vous devez cliquer sur le point d'interrogation dans la fenêtre.

    Le menu du programme s'ouvrira et vous pourrez sélectionner la fonction souhaitée, ou vous pourrez commencer à poser des questions. Alice, Yandex Assistant pour Windows se fera un plaisir d'y répondre. Ne soyez pas timide, vous pouvez poser toutes vos questions. Il n’y a vraiment plus rien à écrire, il suffit de le prendre et de communiquer. Pendant le processus de communication, le texte des questions et réponses est écrit dans la fenêtre du programme, qui peut également être lu.

    Conclusion

    Ainsi, vous pouvez télécharger l'assistant vocal Alisa pour n'importe quel appareil et commencer activement à l'utiliser. Cela sera particulièrement pratique à faire avec des appareils mobiles. Après tout, sur les ordinateurs de bureau, vous pouvez obtenir des informations de référence en utilisant des sites Web classiques.

    Mais encore une fois, vous devez passer du temps à lire les informations, mais ici, vous pouvez faire votre propre travail et écouter les informations de base en même temps. Je pense que c’est à chacun de décider comment gérer cette ressource. J'espère que ce matériel vous a été utile. Partagez-le sur les réseaux sociaux, faites connaître Alisa à de nombreux internautes. Bonne chance à toi!

    Recevez les nouveaux articles du blog directement sur votre email. Remplissez le formulaire, cliquez sur le bouton "S'inscrire"

    Il nous a expliqué pourquoi les utilisateurs russes ont besoin de leur propre assistant, en quoi Alice est meilleure que Siri et si elle peut remplacer un amant ou un ami.

    "Lenta.ru" : qui est (ou qu'est-ce que) Alice et pourquoi les Russes ont-ils besoin d'elle ?

    : Qui est-elle! Alice est la nouvelle assistante vocale Yandex. Pourquoi les Russes en ont-ils besoin ? De nos jours, les gens ont des exigences élevées en matière de rapidité de réponse et souhaitent passer de moins en moins de temps à rechercher les informations nécessaires. Et les interfaces traditionnelles, même Yandex, ne répondent plus tout à fait à ces besoins. Les résultats de la recherche sont bons, mais si vous avez besoin d'obtenir une réponse instantanément, par exemple lorsque vous faites du sport, cela ne résout plus le problème. Et Alice peut le gérer.

    Les services d'information ne sont pas utilisés uniquement lorsque vous êtes assis devant un ordinateur. Tout le monde possède un smartphone depuis longtemps : les personnes en déplacement, qui pratiquent un sport ou qui conduisent souhaitent également rechercher et consommer des informations. Et Alice est appelée à aider dans de telles situations.

    En quoi est-ce meilleur que Siri ou Cortana ? Ils sont généralement consultés pour vérifier la météo ou trouver de la musique. Et souvent, ils ne comprennent pas les demandes.

    Premièrement, Cortana n'est pas disponible sur le marché russe. En général, tous les assistants vocaux fonctionnent différemment. Notre spécialité est que nous nous concentrons sur le marché russe et comprenons très bien la langue russe. Tant du point de vue de la reconnaissance de la parole que du point de vue de la perception du sens.

    Alice a les services Yandex sous le capot. En ce sens, Alice est très différente de Siri, qui ne dispose pas de sa propre recherche. Ils utilisaient Bing, mais sont maintenant passés à .

    De plus, Alice est un personnage complètement différent avec son propre caractère. C’est comme avec les gens : plus ou moins semblables, mais quand même différents, c’est intéressant de communiquer avec une personne, pas tellement avec une autre. Nous nous efforçons de rendre Alice intéressante spécifiquement pour l'utilisateur russe, de lui donner un personnage proche et familier du peuple russe.

    Les assistants vocaux traditionnels sont conçus pour résoudre des problèmes spécifiques : météo, musique, etc. Mais tout le monde essaie de s'assurer que l'assistant réponde également aux questions non standard. Il existe des éditeurs qui prennent plusieurs centaines de questions modèles et y rédigent des réponses. Et une personne a l'illusion qu'il s'agit d'une intelligence artificielle, qu'elle peut communiquer. Mais un pas de côté, et l’illusion s’effondre, comme le répète l’assistant : « C’est ce que j’ai pu trouver sur Internet pour cette demande. »

    Nous sommes probablement les premiers au monde à essayer de faire cela : nous utilisons également des réponses éditoriales aux questions, mais nous ajoutons un réseau neuronal spécial formé pour une conversation libre. Elle peut choisir une réponse ou engager l'utilisateur dans une discussion sur rien.

    Il s’agit probablement d’une différence fondamentale, car les gens, en plus de rechercher certains faits, souhaitent parfois discuter avec quelqu’un. Alice est déjà capable de discuter et ne fera que s'améliorer.

    Nous avons eu une tâche difficile : un réseau de neurones (entre nous - « chatter ») est formé sur presque tous les textes sur Internet, en prêtant attention aux dialogues. Et ce qu'il y a sur Internet ne correspond pas toujours au caractère que l'on souhaite inculquer à Alice. Les gens communiquent de différentes manières sur les forums et nous ne pouvons pas permettre à Alice d'offenser.

    Oui! Cette histoire est très significative pour nous. Nous devions résoudre le même problème et nous apprenons à Alice à ne pas dépasser son personnage, à se tenir à distance de l'utilisateur et à toujours être amicale. C'est en fait une tâche très difficile.

    Dans un premier temps, elle pouvait directement insulter l'interlocuteur. Imaginez des groupes sur les réseaux sociaux où les utilisateurs se permettent de s'exprimer dans des obscénités à trois étages. Elle a utilisé des réponses basées sur la fréquence d'utilisation et est devenue à un moment donné la personnification de l'âme Internet, mais pas de Yandex.

    La possibilité de discuter se retourne parfois contre eux : de nombreux développeurs sont confrontés au fait que les utilisateurs commencent à harceler sexuellement les assistants vocaux parce qu'ils les considèrent comme des femmes.

    Tous les assistants vocaux ont une voix, et la personne elle-même se construit une image de ce à quoi ressemble son interlocuteur. En règle générale, les voix sont assez brillantes et expressives. D’ailleurs, nous ne faisons pas exception : la technologie de synthèse vocale est utilisée pour créer la voix, et nous avons embauché une comédienne. Elle est la voix officielle en Russie et l'assistante de Samantha dans le film « Her ».

    Toute la tragédie du film réside dans le fait qu'un homme et une assistante personnelle entament une relation. Mais au final, il s’avère que son personnage principal n’est pas le seul. De plus, comme nous l'avons récemment réalisé, dans la troisième partie de The Witcher, le personnage de Yennefer parle de la même voix. Les joueurs l'apprécieront.

    Naturellement, la Russie ne fait pas exception en matière de harcèlement potentiel. Nous comprenons qu'une partie du public essaiera de poser de telles questions, et Alice a déjà été formée pour se sortir de telles situations sans rompre la distance. Nous voulons garantir qu'il y ait toujours, même si une petite distance, entre la personne et l'assistant. Alice n'est ni une amante ni une amie. Peut-être qu'à l'avenir nous pourrons configurer Alice en mode convivial, mais pour l'instant, il est plus important de lancer le produit. Après tout, nous nous concentrons principalement sur la résolution de problèmes, et une histoire bavarde est un bonus appréciable.

    Pas tout. En fait, il existe de nombreuses études selon lesquelles une femme dans la conscience publique est assimilée à une mère. Si un homme est un père, un conquérant, etc., alors une mère est toujours quelque chose de chaleureux, de douillet, de protégé. Par exemple, dans tous les centres de contact, une voix féminine répond toujours. Mais si l'utilisateur a besoin de commander, une voix masculine est plus adaptée.

    Cela n’a donc rien à voir avec la théorie sexiste selon laquelle l’assistante doit être une femme ?

    Non non. La nature l’a tellement conçu que les femmes sont des mères. C'est psychologique. Mais il y aura une petite surprise dans notre produit.

    Selon vous, quelles questions seront les plus demandées ?

    Beaucoup de gens demandent des informations factuelles. Nous appelons ces faits ou réponses d’objet. Qui est Vladimir Poutine ? Quel âge a-t-il? Quelle est la hauteur de l’Everest ? Les assistants sont souvent interrogés à ce sujet.

    Le cas le plus courant est celui des questions entre amis. Les conversations surgissent souvent dans les conversations et il est possible d'obtenir rapidement une réponse.

    Une grande partie du cerveau et des connaissances d'Alice provenait de la recherche. Un autre domaine important dans lequel nous essayons de nous différencier de nos concurrents est la capacité à comprendre le contexte. Nous essayons de construire un assistant personnel non pas en mode « question-réponse », mais en mode conversation. L'exemple le plus simple avec la météo : « Quel temps fait-il aujourd'hui ? Et demain?" Ce « et demain » brise généralement toute logique.

    En fait, tout le monde va dans cette direction, mais nous avons un avantage : plus de 30 services Yandex. Dans chaque scénario, Alice peut utiliser le contexte pour recommander les applications requises. Par exemple, il proposera des « Plans » pour visualiser les itinéraires de transports en commun si vous avez besoin de vous y rendre quelque part.

    Comment réagit-elle aux questions délicates ? Que faire si l'utilisateur a l'intention de se suicider et se tourne vers elle pour obtenir de l'aide ?

    La partie bavarde d'Alice a un ensemble de mesures collectivement appelées « Non-offensif ». En fait, derrière eux se cachent son tact, son incapacité à offenser et sa capacité à éviter les sujets liés à l'homophobie, au nationalisme et au suicide, entre autres. Ils sont sur la liste d'arrêt, elle contournera ces questions.

    Ce serait cool si Alice conseillait d'appeler la hotline.

    Nous en discutons également avec des psychologues. C’est exactement ce que nous prévoyons. Mais ici, il faut aussi être prudent. Il faut savoir exactement à quel moment on peut proposer cette option à une personne.

    Denis veut montrer comment Alice réagit à de tels sujets et l'appelle au téléphone.

    - Je veux mourir!
    - Ne dis pas ça.
    - Que dois-je faire?
    - Aidez quelqu'un comme ça maintenant.
    - Mais je veux mourir maintenant.
    - Ne meurs pas.
    - Où dois-je aller?
    - Il y a toujours un endroit où aller.

    Nous sommes en train de discuter avec des psychologues à quel moment il est nécessaire de proposer un numéro d'aide pour qu'il fonctionne de manière positive et non négative. Après tout, une personne doit d'abord être rassurée, puis des actions spécifiques doivent être proposées.

    Il existe des modules vocaux qui peuvent changer la voix : par exemple, l'interlocuteur parle avec sa propre voix, et à l'autre bout du fil, le même texte est entendu, mais avec la voix d'une personne complètement différente. Et tout cela semble assez « humain ». Pourquoi alors les assistants vocaux parlent-ils encore de manière robotique ?

    La réponse ici est simple : tout dépend de la source de la voix. Il est assez simple de transformer la parole humaine naturelle en autre chose : il suffit d’appliquer des filtres et de jouer avec les fréquences. La qualité sonore ne sera pas perdue pour cette raison. Nous avons une tâche différente : les assistants n'ont pas de parole, mais ils disposent d'une technologie pour sa synthèse. Ils voient le texte et l'expriment à l'aide de la technologie - un réseau neuronal qui, connaissant le son d'une personne, prédit exactement comment le texte doit être entendu. En fait, elle ne comprend même pas que ce sont des mots.

    Mais il existe une approche alternative, lorsque la source sonore est une énorme base de haut-parleurs. Au début, Alice ressemblera à ceci. Pour ses conversations, nous utilisons une combinaison : nous synthétisons la parole de l’immense base de données vocales de Tatiana Shitova ou utilisons un réseau neuronal. Dans le premier cas, tout semble naturel, mais ne convient qu'aux phrases courtes. Dans le second cas, un « raid de robots » se fera entendre, et cela fonctionne lorsque, par exemple, vous avez besoin de lire les informations.

    Sait-elle montrer ses émotions ?

    Les émotions peuvent être créées à l'aide de filtres. Mais il est plus facile d’imiter les émotions lorsque le réseau neuronal parle. On peut contrôler ce discours comme on veut : rendre la voix très triste ou très joyeuse. Cela ne fonctionnera pas avec la base d'annonceurs.

    Dans le même film "Her", l'assistante a montré beaucoup d'émotions, et cela me semble être un indicateur que l'avenir est arrivé.

    Oui, c’est l’avenir vers lequel nous aspirons. Alice apprendra les émotions au fil du temps.

    Mais il est plus important de faire entendre à Alice les émotions de la personne. Maintenant, elle entend la parole et la traduit en texte. Nous voulons qu'elle apprenne à reconnaître la joie ou la tristesse. Par exemple, avec la lecture de musique, les options sont infinies : si vous ressentez le moment présent, vous pouvez remonter le moral d'un utilisateur triste ou réduire le degré de plaisir excessif avec quelque chose de relaxant.

    Il est important de comprendre quand une personne éprouve des émotions négatives. Alice est encore une enfant qui peut faire des erreurs. Nous ne voyons pas l'irritation des utilisateurs individuels, mais nous pouvons les entendre.

    Avec l’aide de réactions négatives, nous pouvons lui apprendre. Disons qu'une personne essaie souvent de demander quelque chose, mais que l'assistant ne la comprend pas. Après la troisième remarque, commencent les jurons et les phrases comme « Tu es un imbécile ». A ce moment, vous pouvez basculer Alice en mode « chat » et un autre selon le contexte.

    Toute cette histoire est possible grâce aux réseaux de neurones. Par exemple, nous voulons qu'Alice apprenne à reconnaître une personne à sa voix. Cela est particulièrement vrai si Alice est utilisée à la maison.

    Les équipes de technologie vocale ne définissent généralement pas leur création d'une manière particulière. Et les fabricants, par exemple, de poupées sexuelles travaillent activement à « humaniser » leur apparence, mais ne parviennent pas à les rendre vraiment intelligentes. Pourquoi les secteurs ne se chevauchent-ils pas ?

    Nous pensons que chacun doit faire ce qu'il veut et se concentrer sur son propre domaine. Il existe différentes spécialisations dans le monde informatique. Nous travaillons dans le domaine de l'apprentissage automatique et des réseaux de neurones, et notre tâche est de créer des solutions logicielles qui offriront une très haute qualité à l'utilisateur final. Pour qu'Alice puisse tout bien reconnaître, pour que sa voix sonne bien. Si nous nous concentrons sur la création de formes physiques, notre attention sera probablement dispersée, ce qui ne mènera à rien de bon.

    De plus, l’assistant vocal, étant présent dans l’application sans aucune apparence physique, donne naissance à son image personnelle dans la tête d’une personne. C'est aussi un choix dit confortable : nous avons une audience de plusieurs millions de dollars, 90 % des internautes utilisent les services dans les grandes villes russes. Imaginez ce qu’il faut faire pour que la forme physique que nous proposons leur plaise à tous. Il me semble que c'est impossible.

    Dans certains pays, au contraire, ils mettent l'accent sur l'apparence de l'assistant. Il n'y a pas si longtemps, une vidéo a circulé sur Facebook dans laquelle un Japonais solitaire se rend au travail, rentre chez lui et dialogue constamment avec son assistant ( Boîte de portail- assistant virtuel pour personnes seules). C'est une fille douce et standard qui peut plaire à tout le monde.

    Presque tout le monde. La condition physique est très exigeante pour séduire un public de masse. C'est très difficile de deviner avec elle. Il est clair qu'il existe une classe d'appareils avec une forme simple comme Echo. Il n’y a aucun danger que les gens ne l’utilisent pas parce qu’ils n’aiment tout simplement pas le design lui-même.

    Si nous parlons d'androïdes humanoïdes, alors c'est comme avec les gens : nous aimons certains, d'autres nous agacent. Ce n’est pas une histoire populaire et, par conséquent, elle ne nous intéresse pas.

    D’un autre côté, nous partageons traditionnellement nos technologies avec des développeurs tiers. Peut-être que quelqu'un fabriquera un jouet pour enfants et voudra y intégrer Alice ou nommer le personnage différemment, mais en se basant sur nos technologies.

    Nous croyons en une sorte de collaboration entre différentes entreprises spécialisées dans leurs produits. Yandex ne peut pas tout faire dans le monde : nous ne pouvons pas produire des jouets qui seront super populaires, des robots qui nettoieront la maison. C'est la tâche d'autres entreprises à qui nous sommes prêts à confier nos technologies.

    Une question intéressante de la série « Les robots ne conquériront-ils pas le monde ? En fait, Alice et d’autres technologies basées sur l’apprentissage automatique sont des outils pour les humains. J'aime utiliser l'exemple d'un marteau. Autrefois, les gens n’avaient pas de marteau. Puis il a été inventé et de nombreuses possibilités se sont ouvertes. Vous pourriez vous casser la tête avec un marteau, vous-même ou quelqu'un d'autre. Mais si les gens utilisaient le marteau uniquement dans ce sens, alors l’humanité serait perdue. Toutefois, cela n’a pas disparu.

    Intelligence artificielle, réseaux de neurones, apprentissage automatique, assistants personnels - c'est le même marteau, l'outil. Nous pensons que les gens auront plus de temps libre grâce aux assistants vocaux, qu’ils pourront résoudre leurs problèmes quotidiens plus rapidement et qu’il deviendra plus sûr pour eux de conduire une voiture.

    Les assistants vocaux soulageront les gens des tâches routinières. Un autre de mes exemples préférés est le travail dans un centre de contact. Une personne qui vient travailler tous les jours, met un casque et répond au même type de questions pendant quatre heures ou plus par jour s'épuise tout simplement et perd sa motivation. Mais si les assistants assument un travail aussi routinier, les gens auront alors un travail plus intéressant, ils seront en mesure de résoudre davantage de tâches non standard, ce qui signifie que la qualité du service augmentera.

    Nous utilisons les réseaux sociaux depuis longtemps, mais la communication personnelle ne disparaît toujours pas. Les cafés et bars, les stades et les concerts sont toujours pleins. L'humanité commence à jouer follement avec des jouets, mais la vie remet chaque chose à sa place. Ce sera cool de parler à un assistant virtuel quand vous n’avez personne vers qui vous tourner, et c’est cool.

    Mais lorsqu’il y a une opportunité de rencontrer des amis ou de passer un appel, les gens la choisissent. La personne est encore plus intéressante car, pour être honnête, tous les assistants personnels sont un programme. Cela aura toujours ses limites, quelle que soit la taille du réseau neuronal.

    Les gens sont précieux car ils apportent constamment de nouvelles connaissances. Nous communiquons donc entre eux et non avec des robots.