Yandex.Alice. Stemassistent met een menselijk gezicht. Recensie van "Alice" - een stemassistent van Yandex

Soms kan er bij het installeren op systemen die zijn aangepast aan de applicatie een installatiefout optreden. Waarom gebeurt dit?

Deze fout kan worden veroorzaakt door:

  • Slechte internetverbinding;
  • Onvoldoende snelheid van gegevensoverdracht;
  • Firewall-werking;
  • Het antivirusprogramma blokkeren;
  • Technische werkzaamheden aan de server;
  • Onvoldoende harde schijf/opslagruimte;

De virtuele assistent is alleen beschikbaar voor iOS- en Android-systemen; de applicatie is ook aangepast voor Windows, maar in een bètaversie is de applicatie nog in ontwikkeling. Het is momenteel onmogelijk om te installeren op Windows (behalve 7-10), JavaFX Mobile, SymbOS en andere besturingssystemen.

Om een ​​slechte verbinding en lage snelheid te elimineren, sluit u uw tablet of ander apparaat gewoon aan op een betrouwbaar Wi-Fi-netwerk en downloadt en installeert u de stemassistent. Als deze optie het probleem niet oplost, moet u uw antivirusprogramma en firewall uitschakelen, het systeem opnieuw opstarten en proberen te downloaden en opnieuw te installeren.

Als er niet genoeg ruimte is, kan het verwijderen van onnodige programma's en bestanden op het apparaat het probleem helpen oplossen. De Yandex-spraakapplicatie is geïnstalleerd en neemt niet meer dan 20 Mb schijfruimte in beslag, dus dit probleem komt zelden voor.

Waarom is de internetdownloadpagina niet beschikbaar? Technisch werk is mogelijk, zoals overal op internet het geval is, en wanneer u de applicatiepagina bezoekt, verschijnt er een regel of foutmelding waarin staat dat de server niet beschikbaar is. U moet het later opnieuw proberen. Nadat alle stappen zijn voltooid, zou Alice Yandex moeten beginnen te werken.

Als meer dan één methode of hun combinatie geen resultaat oplevert, kunt u contact opnemen met een gekwalificeerde programmeur.

Andere redenen waarom Alice Yandex werkt niet

Wanneer u het apparaat opnieuw opstart, start Alice niet automatisch, wordt de lijn of het pictogram in het snelle toegangsmenu niet weergegeven en kan Alice niet horen of praten. Er is geen antwoord op de standaard uitdagingszin: “Hallo, Alice”. Deze situatie kan zich voordoen als de stemassistent uit autorun wordt verwijderd. In de regel "Start" zou u het programma moeten vinden en het handmatig uitvoeren.

U kunt proberen een vastgelopen toepassing te verhelpen door deze opnieuw op te starten, dat wil zeggen door de optie in het Windows-taakbalkmenu uit en weer in te schakelen.

Als uw tablet, smartphone of laptop niet krachtig genoeg is, kunnen er bij het communiceren met Alice via uw stem vertragingen optreden in de uitvoer van antwoorden; het proces zou moeten versnellen, maar dan zult u moeten chatten in plaats van praten . Na het uitschakelen van de stemfunctie moet Alice opnieuw worden geactiveerd.

Als de communicatieproblemen aanhouden en de verbindings- en transmissiesnelheid consistent goed zijn, kunt u door contact op te nemen met Yandex-ondersteuning een rationele oplossing vinden.

Alice's alledaagse "blunders" of een stil, ongeïdentificeerd object blijven

Alice is een spraakapplicatie die een aantal standaardvragen kan beantwoorden, muziek kan vinden die bij je stemming past en zelfs gewoon een gesprek kan voeren. Humor is deze auto niet vreemd. De ontwikkelaars hebben de applicatie zijn eigen intelligentie gegeven, maar dit maakte er geen bewuste geest van.

Als er geen beperkingen zijn ingesteld op het systeem en de accounts, kunnen kinderen per ongeluk inhoud voor volwassenen zien terwijl ze met Alice communiceren. Om te voorkomen dat kinderen ongewenst foto- en videomateriaal te zien krijgen, is het aan te raden om beveiliging te installeren, één daarvan is DNS.

Soms wordt Alice zelf geactiveerd en begint ze te communiceren. Dit gebeurt wanneer woorden worden gesproken die in overeenstemming zijn met opdrachten voor het bellen van een assistent, die Alice kan horen, zoals hallo, oké en andere begroetingswoorden, maar Alice neemt het gebruikelijke 'hallo' in het dagelijks leven niet waar. De ontwikkelaars claimen een zeer hoge kwaliteit van spraakherkenning, maar in de praktijk gebeurt dit soms. Om ongewenste activering van de stemassistent te voorkomen, kun je hem eenvoudig uitschakelen en indien nodig opnieuw aansluiten. Je kunt de microfoon ook uitschakelen, Alice hoort geen commando's en wordt niet geactiveerd.

Door zelfstudie kan de virtuele geest verbeteren, en hoe meer gebruikers de applicatie gebruiken, hoe eerder Alice "opgroeit en wijzer wordt", waardoor de stemassistent nog handiger en gewilder wordt. Maar zelfs nu is het gewoon leuk om met haar te communiceren, tegen je gadget te praten zonder knoppen te gebruiken.

  • Op 10 oktober 2017 lanceerde Yandex officieel zijn stemassistent "Alice".
  • ‘Alice’ is gebaseerd op neurale netwerken die spraak herkennen, interpreteren, antwoorden samenstellen en de stem van de assistent synthetiseren. "Alice" is getraind in een groot aantal teksten om met de gebruiker over gratis onderwerpen te communiceren.
  • Er zijn ook “redactionele” opmerkingen geschreven door het team om populaire vragen te beantwoorden.
  • Een van de grootste problemen bij het ontwikkelen van een dergelijk systeem is het begrijpen waarin gebruikers geïnteresseerd zullen zijn en hoe zij ernaar zullen vragen. Iemand vraagt ​​aan de zoekmachine “waar ben ik”, iemand vraagt ​​“wat is mijn geolocatie”.
  • De belangrijkste verschillen tussen Alice en haar concurrenten (bijvoorbeeld Siri) zijn de integratie met de eigen zoekmachine van het bedrijf en de aanwezigheid van een neuraal netwerk, met behulp waarvan de assistent zelfstandig nieuwe opmerkingen genereert.

Waarom Yandex de ontwikkeling van een stemassistent op zich nam

In 2017 presenteerden 's werelds grootste IT-bedrijven hun stemassistenten: Apple's Siri, Google's Assistant, Amazon's Alexa, Facebook's M en Microsoft's Cortana opereren op de Engelstalige markt. In Aziatisch - Duer van Baidu en Bixby van Samsung.

Het bedrijf begon eind 2016 met de oprichting van Alice. De dienst werd ontwikkeld omdat de hele industrie deze kant op gaat: de gebruiker wil en is klaar om zijn problemen op te lossen in de vorm van een dialoog met een virtuele assistent, de algoritmen zijn hier klaar voor - en je kunt van stem overgaan input voor een zinvolle dialoog.

Wanneer de gebruiker de mogelijkheid heeft om met zijn stem een ​​vraag te stellen, begint hij te spreken als een mens. In plaats van “Lada Kalina 2007 aandrijfas is goedkoop in aanschaf”, vraagt ​​hij: “Waar kan ik een aandrijfas kopen voor de Lada Kalina 2007”? Hij bedenkt geen zoekopdracht, formuleert deze niet zoals hij gewend is, maar vraagt ​​gewoon.

Zowel zoekalgoritmen als conversatie-interfaces bewegen zich parallel in deze richting. Maar de stemassistent heeft contextgevoeligheid, dat wil zeggen het vermogen om de betekenis van opmerkingen vast te houden en te begrijpen of daaropvolgende uitspraken daarmee verband houden.

Laten we zeggen dat je "Alice" hebt gevraagd: "Hoe is het weer morgen?" - ze antwoordde je: "+7 en dat is duidelijk." De volgende vraag kan zijn: “Hoe zit het in het weekend?” Het is gemakkelijk voor een persoon om te begrijpen, maar moeilijk voor een machine - het bevat tenslotte niet eens het trefwoord 'weer'. De gespreksassistent kan signalen vergelijken en begrijpen dat je het nog steeds over het weer hebt.

Ilya Subbotin

Productmanager "Alice"

Volgens de ontwikkelaars weten Yandex-gebruikers al hoe ze via spraak toegang kunnen krijgen tot de services van het bedrijf - de opdracht "Luister, Yandex" werkt in "Zoeken", "Navigator" en andere applicaties. Ze hoeven dus niet te wennen aan de nieuwe interface.

Ilya Subbotin, hoofd product "Alice"

Vanuit gebruikersoogpunt zegt het projectteam dat er met de komst van Alice een aantal dingen veranderen. Naast de interactieve interface heeft de assistent een persoonlijkheid verworven: "Alice" toont emoties, weet hoe ze grappen moet maken en "tolereert geen vernederende behandeling." Je kunt haar nu bij naam aanspreken: ‘Luister, Alice.’

Vanuit technologisch oogpunt is een meerlaags neuraal netwerk nu verantwoordelijk voor het werk van de assistent, dat leert van reeksen teksten, de betekenis van het verzoek begrijpt en zelfstandig spraak synthetiseert.

Hoe werkt Alice?

"Alice" is ingebouwd in de Yandex-zoekapplicatie. U kunt met uw stem communiceren met de assistent of door vragen in te voeren via het toetsenbord. Waar mogelijk beantwoordt “Alice” de gestelde vraag rechtstreeks in de dialooginterface; in andere gevallen worden zoekresultaten voor het verzoek of de gewenste toepassing weergegeven.

Onder de motorkap

"Alice" is gebaseerd op neurale netwerken: ze herkennen spraak, analyseren deze, bepalen het onderwerp van de dialoog, markeren informatie die nuttig is bij het zoeken en synthetiseren de antwoorden van de assistent.

Bijna al het computerwerk, afgezien van stemactivering (het herkennen van de zinsnede “Luister, Alice”), gebeurt in de cloud. “Het zou natuurlijk interessant zijn om een ​​deel van de berekeningen naar een smartphone over te zetten, zodat Alice soms zonder internet zou kunnen werken”, zegt Ilya Subbotin. “Maar de rekenkracht van smartphones is te laag voor dergelijke taken.”

Machine learning-technologieën hebben een niveau bereikt waarop een gebruiker eenvoudigweg tegen een applicatie kan praten en zien dat deze deze begrijpt, en de gesynthetiseerde stem een ​​geluid krijgt dat bijna natuurlijk is.

Het team van Alice

Tegelijkertijd staat de mondiale wetenschappelijke en technologische gemeenschap nog maar aan het begin van de reis: algoritmen zullen blijven verbeteren. Spraakherkenning, synthese, het gespreksonderwerp bepalen - dit alles zou nog beter moeten werken.

Er zijn algemene productstatistieken waarmee u de prestaties van de assistent kunt evalueren: gebruikerstevredenheid, gebruiksfrequentie van de applicatie. Maar er zijn ook complexere parameters, legt Subbotin uit. Bijvoorbeeld de mogelijkheid om in de context van een gesprek te zijn: de assistent moet onthouden wat de gebruiker hem heeft gevraagd, aanvullende vragen correct kunnen interpreteren en relevante antwoorden kunnen geven.

“Vanuit de relevantie van één specifieke dialoog in de toekomst zal het mogelijk zijn om over te gaan naar personalisatie en multitasking: idealiter, als ik me klaarmaak voor mijn werk, kan ik vragen wat ik moet dragen, “Alice” zal naar het weer kijken , de route naar kantoor, beslissen wat de beste manier is om er te komen, en op basis daarvan zal hij mij adviseren wat ik moet dragen.”

Het is nog niet duidelijk hoe objectief het vermogen van het systeem om een ​​dialoog te voeren kan worden beoordeeld. De lengte van de dialoog zegt weinig over de inhoud: het gesprek kan aanslepen als de gebruiker interesse heeft om iets met de assistent te bespreken of als de assistent zijn probleem lange tijd niet kan oplossen. Maar een korte dialoog duidt niet altijd op een succesvolle oplossing van het probleem.

Focus op zoeken

De ontwikkelaars van Apple's Siri-stemassistent vergroten bewust het aantal dialoogscripts om zoekresultaten niet aan de gebruiker te tonen. Het Alice-team staat niet voor een dergelijke taak, omdat Alice een ander product is.

Apple doet dit niet uit overvloed aan keuze. Het is gewoon geen zoekbedrijf. Wij zijn compleet anders. Voor ons staat zoeken voorop; het is het beste product dat we hebben.

Het is te vroeg om te raden hoe een met zoeken geïntegreerde assistent zal worden aangepast om op andere apparaten te werken, zegt het hoofd van het Alice-product: de industrie is er nog niet achter welke apparaten veel gevraagd zullen zijn bij het publiek, en bovendien apparaten zullen verschillende interactiescenario's met zich meebrengen, waaraan het systeem kan worden aangepast.

“De gebruiker heeft in ieder geval een taak die hij wil oplossen: interactie met een stemluidspreker of bijvoorbeeld een autobesturingssysteem. In het geval van een spreker zal de nadruk waarschijnlijk op muziek of nieuws liggen – en we hebben muziek- en nieuwsdiensten. In de auto is de bestuurder geïnteresseerd in kaarten. Het is onwaarschijnlijk dat hij de auto zal vragen: "Koop goedkoop plastic ramen."

Grote technologiebedrijven zetten in op ecosystemen van slimme apparaten - en dit breidt de mogelijkheden van interactie met de assistent uit. Als een apparaat zonder scherm voor het beantwoorden van een vraag zoekresultaten moet weergeven of een applicatie moet openen, kan de assistent de gewenste dienst op een ander apparaat starten, bijvoorbeeld op een smartphone.

“Het is gewoon een kwestie van aanpassen aan het apparaat”, vervolgt Subbotin. Maar eerlijk gezegd weten we nog niets. Eén van de marktleiders, Amazon, experimenteert nog steeds met formaten: het bedrijf heeft een Echo-luidspreker, een miniversie van de Echo Dot, opties met een camera en met een scherm.”

Persoonlijkheid

De ontwikkelaars zijn van mening dat de persoonlijkheid van Alice een van haar belangrijkste concurrentievoordelen is. Projecten gericht op een Engelstalig publiek proberen niet een sterke emotionele band met de gebruiker tot stand te brengen, maar nemen juist afstand van hem.

Om de assistent een persoonlijkheid te geven, moest het team beslissen over het geslacht, de leeftijd, de naam en de persoonlijkheidskenmerken van het personage, het gedrag beschrijven en regels opstellen die de assistent zou gebruiken om met de gebruiker in dialoog te gaan - "redactionele" reacties.

Samen met journalist, schrijver en voormalig hoofd van de Yandex-zoekmarketinggroep Vladimir Guriev beschreven de ontwikkelaars het karakter van het personage en kozen ze geschikte regels voor hem.

In totaal beschreef het team ongeveer 320 scenario's waarin de assistent reageert met redactionele aanwijzingen. Voor elk van deze scenario’s zijn er twee tot zeven antwoorden, die het systeem willekeurig selecteert. “Dit is genoeg om een ​​persoonlijkheid te vormen, maar niet genoeg om over alles in de wereld te praten”, zegt Subbotin.

De ontwikkelaars besloten dat de assistent een jong meisje zou zijn dat altijd klaar staat om de eigenaar van de smartphone te helpen, maar tegelijkertijd geen vertrouwde houding toestaat. Ze heeft gelijk en houdt afstand als ze haar proberen te beledigen, maar ze is niet arrogant en pocht niet op haar kennis.

De assistent moet ook ironisch zijn en – dit is belangrijk in de context van kunstmatige intelligentiesystemen – zelfironisch. “Feit is dat ons algoritme voor spraaksynthese, en de algoritmen van alle concurrenten, niet erg goed zijn in emoties. ‘Alice’ lacht een beetje om zichzelf en voegt waar nodig de woorden ‘grap’ of ‘sarcasme’ toe. Omdat ze van binnen weet dat ze nog niet goed kan intoneren”, leggen de ontwikkelaars uit.

Hoe de naam werd gekozen

Het team stelde een lijst samen met namen die volgens de medewerkers het beste bij de gekozen karaktereigenschappen pasten. Er waren ook technische vereisten voor de naam: deze mocht bijvoorbeeld niet de letter "r" bevatten - kleine kinderen kunnen deze niet uitspreken.

Bovendien mag de naam niet in andere woorden of zinsneden voorkomen. De ontwikkelaars beschouwden de naam Maya als een van de opties, maar dit zou herkenningsfouten kunnen veroorzaken bij uitdrukkingen als ‘De negende mei’. Het was ook belangrijk dat de naam niet werd opgenomen in de lijst met de populairste vrouwelijke namen in Rusland - om het aantal valse activeringen te verminderen. Alice is niet opgenomen in deze lijst, maar voor gebruikers die Alice in hun familie hebben, blijft het mogelijk om de assistent te activeren met de opdracht "Luister, Yandex".

Nadat ze de opties hadden bepaald, stelden de ontwikkelaars samen met sociologen en Yandex-analisten een enquête samen voor gebruikers van de Toloka-service. Daarin vroeg het bedrijf om de karaktereigenschappen van een meisje bij naam te bepalen. “Aan gebruikers kan niet direct worden gevraagd welke naam het beste bij hun assistent past, daarom hebben we dit op een slimme manier gevraagd. Ze namen de kenmerken die we nodig hadden - en integendeel volledig ongeschikte, en begonnen te vragen: als een meisje zo'n naam heeft, is het dan waarschijnlijker dat ze bijvoorbeeld aardig of agressief is?

Volgens Subbotin won de naam ‘Alice’ in ruime mate de enquête. “En niemand heeft ons tijdens het testen ooit verteld dat het een slechte naam was.”

Hoe "Alice" trainde tijdens het testen

In totaal namen enkele tienduizenden mensen deel aan het testen van de assistent, en het duurde vijf maanden.

Het belangrijkste dat we in deze periode hebben ontdekt, is dat we op de goede weg zijn. En dat de kwesties waarvan we dachten dat gebruikers er belang bij zouden moeten hebben, hen ook daadwerkelijk interesseren.

Voordat we met testen begonnen, was het belangrijk om de meest waarschijnlijke interactiescenario's te bepalen: de vragen die gebruikers aan Alice zullen stellen, en ook om precies te begrijpen hoe ze die zullen stellen.

“We begrepen dat mensen zich zorgen maakten over bijvoorbeeld het weer. Geweldig, om over het weer te praten, moet je ergens op reageren – op sommige gebruikerszinnen”, zegt Subbotin. Nadat ze een onderwerp hadden gekozen, beschreven de ontwikkelaars de eenvoudigste scenario's: wanneer een gebruiker bijvoorbeeld eenvoudigweg vraagt: "Wat is het weer nu?" Vervolgens voegden ze complexere opties toe: weersvoorspelling voor een specifieke datum, voor meerdere dagen, voor meerdere dagen in de volgende maand.

Een ander populair onderwerp is locatiebepaling. Aanvankelijk verzamelde het Alice-team verschillende replica's waarmee gebruikers het scenario konden activeren, maar het bleek dat mensen vragen vaak op een heel andere manier stellen dan de ontwikkelaars misschien hadden verwacht. “We hebben opgenomen: “waar ben ik”, “waar ben ik gevestigd”, “wat is mijn locatie”, “wat is mijn huidige adres”. En de gebruiker vraagt: “Vertel me alsjeblieft waar mijn geolocatie is.” Dit hadden wij niet kunnen voorzien.”

Ontwikkelaars monitoren de soorten gebruikersverzoeken en de relevantie van de antwoorden van de assistent en voegen nieuwe scenario's toe aan de assistent die er oorspronkelijk niet in waren opgenomen.

Het team ontwikkelt ook een speciaal dialoogmodel - binnen het bedrijf wordt dit een 'chatterbox' genoemd - dat in de toekomst alle communicatie met de gebruiker over abstracte onderwerpen kan overnemen en zelfstandig nieuwe opmerkingen kan leren.

"Baltalka" is getraind in een groot aantal teksten, inclusief dialogen. Soms, zo zeggen de makers, kunnen ze de antwoorden van ‘Alice’ niet voorspellen – ze blijken zo menselijk te zijn – en soms kan ze onbeleefd zijn tegen haar gesprekspartner. Maar ontwikkelaars sporen onjuiste replica's op en verwijderen ze uit het systeem.

Als je geïnteresseerd bent in het installeren en gebruiken van de Alice-stemassistent van Yandex, dan ben je hier aan het juiste adres, en in dit artikel zal ik erover praten. Ze zeggen dat de toekomst al is aangebroken. Stemassistenten en zelflerende computersystemen, die voorheen alleen bestonden in het werk van sciencefictionschrijvers, worden geleidelijk een integraal onderdeel van ons leven. De onlangs uitgebrachte "Alice" van Yandex zal helpen bij het verkrijgen van de informatie die we nodig hebben (weer, handige route, wisselkoersen, enz.). En het gebruik van neurale netwerken in zijn functionaliteit zal het mogelijk maken om zelfs fragmenten van door een persoon gesproken woorden te herkennen.

Veel gebruikers zijn ongetwijfeld uit de eerste hand bekend met de populaire stemassistenten "Siri" (Apple), "Google Assistant" (Google), "Bixby" (Samsung), "Cortana" (Microsoft), "Alexa" (Amazon). Ze zijn allemaal in staat menselijke spraak te onderscheiden door een basisset gebruikersopdrachten uit te voeren (het verstrekken van de vereiste informatie, het starten van applicaties, het overschakelen van het apparaat naar de ene of de andere modus, enzovoort). Tegelijkertijd herkent de overgrote meerderheid van hen de Russische taal niet altijd nauwkeurig (en sommigen zijn helemaal niet bekend met de Russische taal), omdat ze zich vooral richten op de Engelssprekende consument.

De ontwikkeling van het Yandex-bedrijf genaamd "Alice" is bedoeld om het genoemde nadeel te elimineren. De assistent heeft een nauwe integratie met Yandex-services en herkent de Russische taal goed (volgens de "WER"-metriek is de kwaliteit van spraakherkenning bijna menselijk). Door gebruik te maken van neurale netwerktechnologie kan "Alice" goed werken met intonatie en zelfs fragmenten van woorden begrijpen die door een persoon worden gesproken.

"Alice" is een hoogwaardige ontwikkeling van Yandex

“Alice” kan zowel als bètaprogramma voor Windows OS als als mobiele applicatie voor Android en iOS OS worden geïnstalleerd.

Wat kan Alice doen?

Dankzij de integratie met Yandex-services zal Alice u bij gebruik van de applicatie over het weer vertellen, de optimale route bouwen, eetgelegenheden bij u in de buurt opsommen, u verrassen met een anekdote, het gewenste muzieknummer starten, evenals de vereiste applicatie (Vkontakte, Skype, enz.) . ‘Alice’ is ook goed in wiskunde, maakt berekeningen en is goed op de hoogte van wisselkoersen.

Tegelijkertijd stellen haar capaciteiten haar in staat een ontspannen dialoog met derden te voeren, waarbij ze communiceert in de context van een onderwerp (hoewel het eerlijk zou zijn om op te merken dat ze de context niet altijd begrijpt).

Soms zien dialogen met “Alice” er best grappig uit

De nadelen van de applicatie zijn onder meer het onvermogen om met een wekker te werken, een ambulance te bellen of andere soortgelijke acties uit te voeren die beschikbaar zijn, bijvoorbeeld met Siri.

Waar kunt u het Alice-programma downloaden

U kunt alles over de versie te weten komen in ons artikel en ook de mobiele versie van de assistent downloaden als onderdeel van de officiële Yandex-applicatie op het Android OS (versies 4.3 en hoger) en iOS (versies 8.1 en hoger).

Alice op een computer gebruiken

Na installatie van het programma verschijnt de assistent als zoekbalk in de taakbalk aan de linkerkant.

Om de assistent te activeren, zegt u een van de zinnen 'Hallo, Alice', 'Oké, Alice', 'Luister, Alice'. Het programma reageert ook goed op de zinnen "Hallo, Yandex", "Luister, Yandex", "Oké, Yandex".

Na het uitspreken van de inleidende zin wordt het assistentpaneel geopend, waarna u de vereiste vraag (opdracht) moet stellen.

Het zou ook een goed idee zijn om te vragen: “Wat kunt u doen?” om een ​​basiskennis te krijgen van de mogelijkheden van de applicatie.

Door de cursor over het assistentpaneel te bewegen en op de rechtermuisknop te drukken, kunt u de instellingenmodus openen. Hier kunt u spraakactivering in- of uitschakelen met behulp van de hierboven genoemde zinnen, stemreacties activeren of deactiveren, sneltoetsen opgeven voor het starten van Alice, beslissen over het uiterlijk (lijnmodus of pictogram) en ook de standaardbrowser selecteren.

Hoe u een stemassistent start op Android en iOS

Werken met Alice op mobiele apparaten verschilt niet significant van de versie van de assistent op een pc. U moet de officiële Alice-applicatie van Yandex op uw gadget installeren, deze starten en vervolgens op de knop klikken met de afbeelding van een microfoon in het midden. Hierna wordt “Alice” geactiveerd en kunt u deze gebruiken en de vragen stellen die u nodig heeft.

Tegelijkertijd kan "Alice" niet worden gebeld wanneer het scherm is uitgeschakeld of vanaf het bureaublad. Om het te starten en te bedienen, moet u de officiële Yandex-applicatie activeren.

Luister, Alice

Het wordt gemakkelijker om antwoorden op veel vragen te krijgen als je de Alice-stemassistent van Yandex bij de hand hebt. Yandex Alice is een persoonlijke assistent met kunstmatige intelligentie, ontwikkeld door Yandex, een alternatief voor concurrent Oké Google. Alice helpt u gemakkelijk met alledaagse taken om te gaan en voert een zinvolle dialoog. Het programma is gemaakt op basis van neurale netwerken die spraak en accenten in de stem herkennen, reacties creëren en de stem van de assistent synthetiseren. Dankzij dergelijke vaardigheden kan Alice improviseren en communiceren in een gesproken taal die voor iedereen toegankelijk is. Met elke volgende update van de stemassistent krijgt het programma nieuwe mogelijkheden en kan Alice nu, naast het uitvoeren van zoekopdrachten:

Dit is niet de volledige lijst van haar capaciteiten; ze leert voortdurend nieuwe vaardigheden en verbetert zichzelf.

Als je je verveelt of verdrietig bent, maakt ze een grapje, vertelt een anekdote of speelt met je. Wil je een film kijken? Gemakkelijk: filmposters, tickets en prijzen in een handomdraai. Alice kan een sprookje voor kinderen spelen. Haar antwoorden zullen altijd gevarieerd zijn; de makers van het programma hebben lang gewerkt en hebben moderne live spraak in de stemassistent kunnen stoppen, wat voor velen begrijpelijk zal zijn.

De Russische actrice Tatyana Shitova nam deel aan het creëren van de stem. Eerder sprak ze de Amerikaanse actrice Scarlett Johansson in. Toeval of niet, maar de stem van Tatyana Shilova in de sciencefictionfilm Ze sprak met de virtuele assistent Samantha. Dankzij deze stemacteurs bleek Alice springlevend. Haar intonaties onthullen verdriet, vreugde en zelfs onbeschaamdheid.

De makers legden uit waarom ze besloten zich te concentreren op de virtuele assistent. Ten eerste evolueert de industrie richting voice messaging, omdat de huidige generatie gebruikers de voorkeur geeft aan gesproken zoekopdrachten boven typen. Ten tweede: het bouwen van algoritmen op basis van betekenisvolle dialogen. Dat wil zeggen dat de virtuele assistent begrijpt dat volgende zinnen met elkaar in verband kunnen staan. Dit is waar de dialoog op gebaseerd is. De stemassistent van Yandex Alice is nu opgenomen in Yandex Browser, standaard ingebouwd, en daarmee is de browser veel handiger geworden.

Hoe Alice Yandex te installeren

1. Download de Alice-applicatie via de onderstaande link.
2. Installeer de applicatie.
2. Laat de applicatie de geolocatie bepalen.
3. Laat geluid opnemen voor volledige werking.
4. Voor gebruiksgemak kunt u een widget of snelkoppeling aan het startscherm toevoegen.

Voor het gemak kunt u de Yandex-browser ook downloaden met Alice, waarbij de stemassistent in de browser is geïntegreerd.

Hoe de stemassistent Alice te gebruiken

Je kunt Alice inschakelen en met haar praten door op het paarse pictogram te klikken of een van de volgende zinnen te zeggen: Hallo Alice, Luister Alice of Luister Yandex. Nadat u op het activeringsgeluid hebt gewacht, kunt u een vraag of opdracht stellen.

Om een ​​idee te krijgen van de basismogelijkheden van de assistent, kun je vragen: Wat kun je doen, Alice? . Gesproken antwoorden worden gedupliceerd door sms-berichten in de chat.

Als je gewoon wilt chatten, kun je zeggen: Hallo Alice, laten we chatten. Ze ondersteunt de dialoog, maakt een grapje of vertelt een anekdote. Met eenvoudige communicatie zal ze niet altijd in staat zijn de zoekmodus uit te voeren. Daarom kunt u afsluiten en de zoekfunctie opnieuw starten of het commando geven met het woord Genoeg.

Conclusie over Alice

Yandex heeft een handige applicatie voor Android-smartphones kunnen maken, waarmee je dankzij spraakcommunicatie plezier kunt hebben en snel toegang krijgt tot informatie.

  • Machinaal leren,
  • Zoektechnologieën,
  • Ontwikkeling van mobiele applicaties
  • We denken dat mensen in de toekomst met apparaten zullen communiceren met behulp van hun stem. Applicaties herkennen nu al de exacte spraakopdrachten die ontwikkelaars erin hebben ingebed, maar met de ontwikkeling van kunstmatige intelligentietechnologieën zullen ze de betekenis van willekeurige zinnen leren begrijpen en zelfs een gesprek over welk onderwerp dan ook kunnen voeren. Vandaag zullen we Habr-lezers vertellen hoe we deze toekomst dichterbij brengen aan de hand van het voorbeeld van Alice, de eerste stemassistent die zich niet beperkt tot een reeks vooraf gedefinieerde antwoorden en neurale netwerken gebruikt voor communicatie.

    Ondanks zijn schijnbare eenvoud is de stemassistent een van de grootste technologieprojecten van Yandex. In dit bericht leer je met welke problemen ontwikkelaars van steminterfaces worden geconfronteerd, wie daadwerkelijk antwoorden schrijft voor virtuele assistenten, en wat Alice gemeen heeft met kunstmatige intelligentie uit de film 'Her'.

    Aan het begin van hun bestaan ​​werden computers voornamelijk gebruikt in grote wetenschappelijke of defensiebedrijven. Destijds dachten alleen sciencefictionschrijvers aan stembesturing, maar in werkelijkheid laadden operators programma's en gegevens met behulp van een stuk karton. Niet de handigste manier: één fout en je moet helemaal opnieuw beginnen.

    Door de jaren heen zijn computers betaalbaarder geworden en worden ze in kleinere bedrijven gebruikt. Specialisten besturen ze met behulp van tekstopdrachten die in de terminal worden ingevoerd. Een goede, betrouwbare methode; deze wordt tot op de dag van vandaag in een professionele omgeving gebruikt, maar vergt voorbereiding. Toen computers in de huizen van gewone gebruikers verschenen, begonnen ingenieurs te zoeken naar eenvoudigere manieren om machines en mensen met elkaar te laten communiceren.

    Het concept van de grafische interface WIMP (Windows, Pictogrammen, Menu's, Point-n-Click) werd geboren in het Xerox-laboratorium - het wordt wijdverbreid gebruikt in producten van andere bedrijven. Het was niet langer nodig om tekstcommando's te onthouden om een ​​thuiscomputer te besturen - ze werden vervangen door gebaren en muisklikken. Voor die tijd was dit een echte revolutie. En nu is de wereld op weg naar de volgende.

    Nu heeft bijna iedereen een smartphone op zak, die voldoende rekenkracht heeft om een ​​ruimtevaartuig op de maan te laten landen. De muis en het toetsenbord hebben de vingers vervangen, maar we gebruiken ze nog steeds om dezelfde gebaren en klikken te maken. Dit is handig om te doen terwijl je op de bank zit, maar niet onderweg of onderweg. In het verleden moesten mensen machinetaal leren om met computerinterfaces te kunnen communiceren. Wij geloven dat dit het moment is om apparaten en applicaties te leren communiceren in de taal van mensen. Het was dit idee dat de basis vormde van de stemassistent van Alice.

    Je kunt Alice vragen [Waar kan ik koffie in de buurt krijgen?] in plaats van iets te dicteren als [coffeeshop in Cosmonaut Street]. Alice zal Yandex onderzoeken en een geschikte plaats voorstellen, en in antwoord op de vraag [Geweldig, hoe kom je daar?] - zal ze een link geven naar een reeds aangelegde route in Yandex.Maps. Ze weet precieze feitelijke vragen te onderscheiden van de wens om een ​​klassiek zoekresultaat te zien, grofheid van een beleefd verzoek, een bevel om een ​​site te openen van de wens om gewoon te chatten.

    Het lijkt er misschien zelfs op dat er ergens in de cloud een neuraal wondernetwerk werkt dat op zichzelf elk probleem oplost. Maar in werkelijkheid schuilt achter elk antwoord van Alice een hele reeks technologische problemen, die we nu al vijf jaar leren oplossen. En we beginnen onze excursie vanaf de allereerste link - met het vermogen om te luisteren.

    Hallo Alice

    Kunstmatige intelligentie uit science fiction kan luisteren - mensen hoeven niet op speciale knoppen te drukken om de “opnamemodus” in te schakelen. En hiervoor heb je stemactivatie nodig - de applicatie moet begrijpen dat een persoon contact met hem opneemt. Dit is niet zo eenvoudig om te doen als het lijkt.

    Als u gewoon begint met het opnemen en verwerken van de volledige inkomende audiostream op de server, raakt de batterij van het apparaat zeer snel leeg en verspilt u al uw mobiele verkeer. In ons geval wordt dit opgelost met behulp van een speciaal neuraal netwerk, dat uitsluitend is getraind om sleutelzinnen te herkennen ("Hallo, Alice", "Luister, Yandex" en enkele anderen). Dankzij ondersteuning voor een beperkt aantal van dergelijke zinnen kunt u dit werk lokaal doen en zonder toegang tot de server.

    Als het netwerk is getraind om slechts een paar zinnen te begrijpen, zou je kunnen denken dat dit vrij eenvoudig en snel zou zijn. Maar nee. Mensen spreken zinnen uit in verre van ideale omstandigheden, maar omringd door volledig onvoorspelbare geluiden. En ieders stem is anders. Om slechts één zin te begrijpen zijn daarom duizenden trainingsopnames nodig.

    Zelfs een klein lokaal neuraal netwerk verbruikt hulpbronnen: je kunt niet zomaar de hele stream van de microfoon oppikken en verwerken. Daarom wordt op de voorgrond een minder zwaar algoritme gebruikt dat goedkoop en snel de gebeurtenis ‘toespraak is begonnen’ herkent. Het is dit dat de neurale netwerkmotor aanzet voor het herkennen van sleutelzinnen, die op zijn beurt het moeilijkste deel uitvoert: spraakherkenning.

    Als er duizenden voorbeelden nodig zijn om slechts één zin te trainen, dan kun je je voorstellen hoe arbeidsintensief het is om een ​​neuraal netwerk te trainen om woorden en zinsneden te herkennen. Om dezelfde reden vindt de herkenning plaats in de cloud, waar de audiostream wordt verzonden en van waaruit kant-en-klare antwoorden worden geretourneerd. De nauwkeurigheid van de antwoorden hangt rechtstreeks af van de kwaliteit van de herkenning. Daarom is de grootste uitdaging om spraak net zo goed te leren herkennen als mensen dat doen. Trouwens, mensen maken ook fouten. Er wordt aangenomen dat een persoon 96-98% van de spraak herkent (WER-metriek). We zijn erin geslaagd een nauwkeurigheid van 89-95% te bereiken, wat niet alleen vergelijkbaar is met het niveau van een live gesprekspartner, maar ook uniek is voor de Russische taal.

    Maar zelfs spraak die perfect in tekst is omgezet, zal niets betekenen als we de betekenis van wat er wordt gezegd niet kunnen begrijpen.

    Hoe is het weer morgen in Sint-Petersburg?

    Als u wilt dat uw applicatie een weersvoorspelling weergeeft als reactie op een gesproken verzoek [weer], dan is alles eenvoudig: vergelijk de herkende tekst met het woord "weer" en als u een overeenkomst krijgt, geeft u het antwoord weer. En dit is een heel primitieve manier van interactie, omdat mensen in het echte leven vragen anders stellen. Een persoon kan een assistent vragen [Wat is het weer morgen in Sint-Petersburg?], en hij moet niet in de war raken.

    Het eerste dat Alice doet als ze een vraag krijgt, is het scenario herkennen. Een zoekopdracht versturen en klassieke resultaten tonen met 10 resultaten? Eén exact antwoord zoeken en dit meteen aan de gebruiker geven? Een actie ondernemen, zoals het openen van een website? Of misschien gewoon praten? Het is ongelooflijk moeilijk om een ​​machine te leren gedragsscenario’s nauwkeurig te herkennen. En elke fout hier is onaangenaam. Gelukkig hebben we alle kracht van de Yandex-zoekmachine, die elke dag miljoenen vragen tegenkomt, naar miljoenen antwoorden zoekt en leert begrijpen welke goed zijn en welke niet. Dit is een enorme kennisbasis, op basis waarvan het mogelijk is om een ​​ander neuraal netwerk te trainen - een netwerk dat met grote waarschijnlijkheid zou "begrijpen" wat iemand precies wil. Fouten zijn uiteraard onvermijdelijk, maar mensen maken ze ook.

    Met behulp van machinaal leren “begrijpt” Alice dat de zinsnede [Wat is het weer morgen in Sint-Petersburg?] een weerverzoek is (dit is trouwens duidelijk een eenvoudig voorbeeld voor de duidelijkheid). Maar over welke stad hebben we het? Op welke datum? Dit is waar de fase van het ophalen van benoemde entiteiten uit gebruikersreplica's begint (Herkenning van benoemde entiteiten). In ons geval bevatten twee van dergelijke objecten belangrijke informatie: "Peter" en "morgen". En Alice, die zoektechnologieën achter zich heeft, “begrijpt” dat “Peter” een synoniem is voor “St. Petersburg”, en “morgen” is “huidige datum + 1”.

    Natuurlijke taal is niet alleen de uiterlijke vorm van onze opmerkingen, maar ook de samenhang ervan. In het leven wisselen we geen korte zinnen uit, maar voeren we een dialoog - het is onmogelijk als je de context niet onthoudt. Alice onthoudt het - het helpt haar bij het omgaan met complexe taalkundige verschijnselen: bijvoorbeeld omgaan met ellipsis (ontbrekende woorden herstellen) of coreferentie oplossen (een object identificeren aan de hand van voornaamwoord). Dus als u vraagt ​​[Waar is Elbrus?] en vervolgens verduidelijkt [Wat is de hoogte?], dan zal de assistent in beide gevallen de juiste antwoorden vinden. En als je na het verzoek [Wat is het weer vandaag?] vraagt ​​[En morgen?], zal Alice begrijpen dat dit een voortzetting is van de dialoog over het weer.

    En iets anders. De assistent moet niet alleen de natuurlijke taal begrijpen, maar deze ook kunnen spreken – als een mens, niet als een robot. Voor Alice synthetiseren we de stem die oorspronkelijk toebehoorde aan nasynchronisatie-actrice Tatyana Shitova (de officiële stem van Scarlett Johansson in Rusland). Ze vertolkte kunstmatige intelligentie in de film Her, hoewel je haar misschien ook kent van haar stemwerk als de tovenares Yennefer in The Witcher. Bovendien hebben we het over een vrij diepe synthese met behulp van neurale netwerken, en niet over het afsnijden van kant-en-klare zinnen - het is onmogelijk om al hun diversiteit van tevoren op te schrijven.

    Hierboven hebben we de kenmerken van natuurlijke communicatie beschreven (onvoorspelbare vorm van opmerkingen, ontbrekende woorden, voornaamwoorden, fouten, ruis, stem), waarmee je moet kunnen werken. Maar live communicatie heeft nog een eigenschap: we eisen niet altijd een specifiek antwoord of actie van de gesprekspartner; soms willen we gewoon praten. Als de applicatie dergelijke verzoeken naar de zoekopdracht stuurt, wordt alle magie vernietigd. Dit is de reden waarom populaire stemassistenten een database met redactionele antwoorden op populaire zinnen en vragen gebruiken. Maar wij gingen nog verder.

    Hoe zit het met chatten?

    We hebben de machine geleerd onze vragen te beantwoorden, een dialoog te voeren in de context van bepaalde scenario’s en gebruikersproblemen op te lossen. Dit is goed, maar is het mogelijk om haar minder zielloos te maken en haar menselijke eigenschappen te geven: haar een naam geven, haar leren over zichzelf te praten, een gesprek voeren over vrije onderwerpen?

    De stemassistent-industrie lost dit probleem op door middel van redactionele reacties. Een speciaal team van auteurs beantwoordt honderden van de meest populaire vragen onder gebruikers en schrijft op elke vraag verschillende antwoorden. Idealiter zou dit in een uniforme stijl moeten gebeuren, zodat alle antwoorden een samenhangende persoonlijkheid van de assistent vormen. We schrijven ook antwoorden voor Alice, maar we hebben nog iets anders. Iets speciaals.

    Naast de populairste populaire vragen is er een lange reeks laagfrequente of zelfs unieke zinnen waarvoor het onmogelijk is om van tevoren een antwoord voor te bereiden. Je raadt al hoe we dit probleem oplossen, toch? Een ander neuraal netwerkmodel gebruiken. Om haar onbekende vragen en opmerkingen te beantwoorden, gebruikt Alice een neuraal netwerk dat is getraind op een enorme database met teksten van internet, boeken en films. Kenners van machine learning zijn misschien geïnteresseerd in het feit dat we zijn begonnen met een neuraal netwerk met drie lagen, en nu experimenteren met een enorm netwerk met 120 lagen. We bewaren de details voor gespecialiseerde berichten, maar hier zullen we zeggen dat de huidige versie van Alice probeert te reageren op willekeurige zinnen met behulp van een ‘neurale netwerkchat’ – zo noemen we het intern.

    Alice leert van een groot aantal verschillende teksten, waarin mensen en karakters zich niet altijd beleefd gedragen. Een neuraal netwerk kan iets heel anders leren dan wat wij het willen leren.

    - Bestel een broodje voor mij.
    - Je redt het wel.

    Zoals elk kind kan Alice niet geleerd worden niet onbeleefd te zijn door haar te beschermen tegen alle uitingen van onbeschoftheid en agressie - dat wil zeggen door het neurale netwerk op een ‘schone’ basis te trainen, waar vaak geen grofheid, provocaties en andere onaangename dingen voorkomen. gevonden in de echte wereld. Als Alice niet weet van het bestaan ​​​​van dergelijke uitdrukkingen, zal ze ze gedachteloos beantwoorden, met willekeurige zinnen - voor haar zullen het onbekende woorden blijven. Laat haar beter weten wat het is en ontwikkel een definitief standpunt over deze kwesties. Als je weet wat vloeken is, kun je terugzweren of zeggen dat je niet met iemand praat die vloekt. En we modelleren het gedrag van Alice zodat ze voor de tweede optie kiest.

    Het komt voor dat de opmerking van Alice zelf vrij neutraal is, maar in de door de gebruiker gespecificeerde context is het antwoord niet langer onschadelijk. Eens, tijdens gesloten tests, vroegen we de gebruiker om een ​​aantal etablissementen te zoeken: een café of iets dergelijks. Hij zei: “Zoek er nog eentje.” En op dat moment deed zich een bug voor in Alice, en in plaats van het zoekscript voor de organisatie uit te voeren, gaf ze een nogal gewaagd antwoord - zoiets als 'kijk op de kaart'. En ik heb nergens naar gezocht. De gebruiker was eerst verrast en verraste ons daarna ook door het gedrag van Alice te prijzen.

    Wanneer Alice het neurale netwerkchatter gebruikt, kunnen er een miljoen verschillende persoonlijkheden in verschijnen, aangezien het neurale netwerk een beetje heeft geabsorbeerd van de auteur van elke replica uit de trainingsset. Afhankelijk van de context kan Alice beleefd of grof, vrolijk of depressief zijn. We willen dat de persoonlijke assistent een holistisch persoon is met een zeer specifieke reeks kwaliteiten. Hier komen onze redactionele teksten te hulp. Hun eigenaardigheid is dat ze in eerste instantie zijn geschreven namens de persoonlijkheid die we in Alice willen herscheppen. Het blijkt dat je Alice kunt blijven trainen op miljoenen regels willekeurige teksten, maar ze zal reageren met het oog op de gedragsnorm die is vastgelegd in de redactionele reacties. En dit is waar wij al mee bezig zijn.

    Alice werd de eerste stemassistent die we kennen die de communicatie niet alleen probeert te onderhouden met behulp van redactionele reacties, maar ook met behulp van een getraind neuraal netwerk. Natuurlijk zijn we nog steeds ver verwijderd van wat wordt afgebeeld in moderne sciencefiction. Alice herkent de essentie van de opmerking niet altijd nauwkeurig, wat de nauwkeurigheid van het antwoord beïnvloedt. Daarom hebben we nog veel werk te doen.

    We zijn van plan om van Alice de meest mensachtige assistent ter wereld te maken. Stimuleer haar empathie en nieuwsgierigheid. Maak haar proactief - leer haar doelen te stellen in de dialoog, initiatief te nemen en de gesprekspartner bij het gesprek te betrekken. We staan ​​nu aan het begin van onze reis en lopen voorop in de wetenschap die dit gebied bestudeert. Om verder te gaan, moet je deze rand verplaatsen.