Det kognitive systemet IBM Watson Health er et gjennombrudd innen helsevesenet. IBM Watson-superdatamaskinen vant Jeopardy-spillet (russisk motstykke - Svoya igry)

IBM Watson er et av de første kognitive systemene i verden. Dette systemet er svært dyktig, takket være at egenskapene til Watson brukes på mange områder - fra matlaging til å forutsi ulykker i bosetninger. Generelt er de fleste egenskapene til Watson ikke noe unikt, men samlet sett representerer alle disse egenskapene et veldig kraftig verktøy for å løse ulike problemer.

For eksempel - naturlig språkgjenkjenning, dynamisk læring av systemet, konstruksjon og evaluering av hypoteser. Alt dette tillot IBM Watson å lære å gi direkte riktige svar (med høy grad av pålitelighet) på spørsmål fra operatører. Samtidig er det kognitive systemet i stand til å bruke store arrayer av globale ustrukturerte data, Big Data, til arbeid. Hva er de grunnleggende prinsippene for hvordan IBM Watson jobber med språk? Mer om dette i oppfølgeren.

De viktigste vanskelighetene med naturlig språkgjenkjenning

For en person er språk et middel til å uttrykke tanker. Vi bruker språk for å formidle vår mening, data og informasjon. Vi kan lage spådommer og danne teorier. Det er språket som er hjørnesteinen i vår bevissthet. Samtidig er her paradokset, det menneskelige språket er veldig upresist.

Mange begreper er ulogiske, og det kan være svært vanskelig for datasystemer å forstå oss. Hvordan kan det for eksempel være en tynn stemme? Hvordan kan du brenne ut av skam? For en maskin er dette et problem, men for en person er det en ganske vanlig ting. Faktum er at for å svare på et spørsmål riktig, er det i mange tilfeller nødvendig å ta hensyn til den eksisterende konteksten. I mangel av tilstrekkelig faktainformasjon er det vanskelig å svare riktig på spørsmålet, selv om du bokstavelig talt kan finne det nøyaktige svaret på elementene i spørsmålet.

Naturlig språkbehandling – Komme i gang

Mange datasystemer er i stand til å analysere et språk, men de gjør en overfladisk analyse. Dette kan for eksempel være fornuftig for å levere en statistisk valid vurdering av trender i endringer i følelser på store mengder informasjon. Her er ikke nøyaktigheten av informasjonsoverføring så viktig, for selv om vi antar at antall falske positive resultater er omtrent lik antall falske negative resultater, så kompenserer de hverandre.

Men hvis alle tilfeller betyr noe, kan ikke systemer som jobber med en overfladisk analyse av språket lenger gjøre jobben sin normalt. Et slående eksempel på det ovennevnte kan være en oppgave for en stemmeassistent på en hvilken som helst av de mobile enhetene. Hvis du sier "finn meg en pizza", vil assistenten vise en liste over pizzeriaer. Hvis du sier "ikke se etter meg en pizza i Madrid", for eksempel, vil systemet fortsatt søke. Slike systemer fungerer ved å identifisere visse nøkkelord og bruke et spesifikt sett med regler. Resultatet kan være nøyaktig under det gitte regelsystemet, men ikke korrekt.

Dyp naturlig språkbehandling

For å lære systemet å analysere komplekse semantiske strukturer, tatt i betraktning følelser og andre faktorer, brukte spesialister dyp behandling av naturlig språk. Nemlig et spørsmål-svar-system for innholdsanalyse (Deep Question * Answering, DeepQA). Hvis det kreves mer presisjon, må flere naturlige språkbehandlingsmetoder brukes.
IBM Watson er et dypt naturlig språkbehandlingssystem. Når man analyserer et spesifikt spørsmål, for å gi riktig svar, prøver systemet å vurdere en bredest mulig kontekst. I dette tilfellet brukes ikke bare informasjonen om spørsmålet, men også dataene til kunnskapsbasen.
Opprettelsen av et system som er i stand til dyp behandling av naturlig språk, gjorde det mulig å løse et annet problem - analysen av en enorm mengde informasjon som genereres daglig. Dette er ustrukturert informasjon som tweets, innlegg på sosiale medier, rapporter, artikler og mer. IBM Watson har lært å bruke alt dette til å løse menneskedefinerte problemer.

Kognitivt system IBM Watson

Watson tar datakraft til et annet nivå. Systemet er i stand til å skille visse utsagn i naturlig språk og finne sammenhenger mellom disse utsagnene. Samtidig takler Watson oppgaven, i mange tilfeller enda bedre enn en person, mens databehandlingen er mye raskere, arbeidet utføres med mye større volumer - en person klarer rett og slett ikke å gjøre dette.

De viktigste egenskapene til det kognitive systemet

Systemet fungerer i denne rekkefølgen:

1. Når Watson mottar et spørsmål, analyserer det det for å fremheve hovedtrekkene i spørsmålet.

2. Systemet genererer en rekke hypoteser ved å skanne korpuset på jakt etter fraser som med en viss grad av sannsynlighet kan inneholde det nødvendige svaret. For å effektivt søke i strømmer av ustrukturert informasjon, trengs helt andre beregningsevner * de kalles kognitive systemer. (Jeg forstår egentlig ikke den siste setningen og stjernens rolle)

3. Systemet utfører en dyp sammenligning av språket i spørsmålet og språket til hvert av de mulige svaralternativene, ved å bruke forskjellige inferensalgoritmer.

Dette er et vanskelig stadium. Det er hundrevis av inferensalgoritmer, og de utfører alle forskjellige sammenligninger. Noen ser for eksempel etter samsvarende termer og synonymer, noen ser på tidsmessige og romlige trekk, mens andre ser på passende kilder til kontekstuell informasjon.

4. Hver slutningsalgoritme setter ett eller flere merker som viser i hvilken grad et mulig svar følger av spørsmålet, i området som vurderes av denne algoritmen.

5. Hver oppnådd poengsum blir deretter vektet i henhold til en statistisk modell som fanger opp hvor godt algoritmen har prestert i å identifisere logiske sammenhenger mellom to lignende fraser fra det domenet under Watsons «læringsperiode». Denne statistiske modellen kan deretter brukes til å bestemme Watsons generelle grad av tillit til at et mulig svar følger av et spørsmål.

6. Watson gjentar prosessen for hvert mulig svar til den finner svar som er mer sannsynlig å være riktige enn andre.

Som nevnt ovenfor, for riktig svar på spørsmålet, må systemet referere til ytterligere datakilder. Det kan være lærebøker, manualer, FAQ, nyheter og så videre. Watson behandler enorme mengder informasjon i løpet av sekunder for å få det riktige svaret. Samtidig blir det funnet innholdet også sjekket, utdatert og ubrukelig data eliminert.

Elementer i det kognitive systemet

Watson utleder den generelle betydningen av teksten fra informasjonen som mottas, fra en ekstra database. Dette bruker tittelen på dokumentet, en del av teksten i dokumentet eller hele teksten.

Kognitive systemer, deres måter å samle inn, huske og hente informasjon på ligner på hvordan en person analyserer informasjon. I dette tilfellet kan kognitive systemer overføre informasjon og handle. Her er eksempler på atferdskonstruksjoner som brukes i dette tilfellet:

Evne til å lage og teste hypoteser;
- Evnen til å bryte ned i komponenter og bygge logiske konklusjoner om språket;
- Evnen til å trekke ut og vurdere nyttig informasjon (som datoer, steder og kjennetegn).

Uten disse evnene vil verken en datamaskin eller et menneske kunne bestemme det riktige forholdet mellom spørsmål og svar.
Kognitive prosesser av høyere orden kan oppnå et høyt nivå av forståelse ved å fokusere på grunnleggende atferd. For å forstå noe må vi kunne dele informasjon i mindre elementer som er rimelig godt ordnet på det aktuelle nivået. Fysiske prosesser hos mennesker foregår på en helt annen måte enn prosesser i kosmisk skala eller på nivå med elementærpartikler. På samme måte er kognitive systemer designet for å fungere på menneskelig nivå, selv om de representerer et stort utvalg mennesker.

I denne forbindelse begynner å forstå språket med å forstå de enklere regler for språket - ikke bare formell grammatikk, men også uformelle konvensjoner som observeres i daglig bruk.

Hva er alt dette for noe?

Nå kan det kognitive systemet IBM Watson, takket være år med opplæring og forbedring, utføre arbeid på en rekke områder. Her er det medisin, og matlaging, og lingvistikk, og løsning av forretningsproblemer med vitenskapelige problemer.

I utgangspunktet hadde spesialistene et valg - å gjøre systemet universelt eller spesialisert. Hvert av alternativene har sine egne fordeler og ulemper, men valget ble tatt mot allsidighet.

Selskapet har allerede vært overbevist om riktigheten av det perfekte valget mange ganger - før

3. september 2015 kl. 11:34

IBM Watson Cognitive System: Principles of Working with Natural Language

  • IBM blogg,
  • Algoritmer

IBM Watson er et av de første kognitive systemene i verden. Dette systemet er svært dyktig, takket være at egenskapene til Watson brukes på mange områder - fra matlaging til å forutsi ulykker i bosetninger. Generelt er de fleste egenskapene til Watson ikke noe unikt, men samlet sett representerer alle disse egenskapene et veldig kraftig verktøy for å løse ulike problemer.

For eksempel - naturlig språkgjenkjenning, dynamisk læring av systemet, konstruksjon og evaluering av hypoteser. Alt dette tillot IBM Watson å lære å gi direkte riktige svar (med høy grad av pålitelighet) på spørsmål fra operatører. Samtidig er det kognitive systemet i stand til å bruke store arrayer av globale ustrukturerte data, Big Data, til arbeid. Hva er de grunnleggende prinsippene for hvordan IBM Watson jobber med språk? Mer om dette i oppfølgeren.

De viktigste vanskelighetene med naturlig språkgjenkjenning

For en person er språk et middel til å uttrykke tanker. Vi bruker språk for å formidle vår mening, data og informasjon. Vi kan lage spådommer og danne teorier. Det er språket som er hjørnesteinen i vår bevissthet. Samtidig er her paradokset, det menneskelige språket er veldig upresist.

Mange begreper er ulogiske, og det kan være svært vanskelig for datasystemer å forstå oss. Hvordan kan det for eksempel være en tynn stemme? Hvordan kan du brenne ut av skam? For en maskin er dette et problem, men for en person er det en ganske vanlig ting. Faktum er at for å svare på et spørsmål riktig, er det i mange tilfeller nødvendig å ta hensyn til den eksisterende konteksten. I mangel av tilstrekkelig faktainformasjon er det vanskelig å svare riktig på spørsmålet, selv om du bokstavelig talt kan finne det nøyaktige svaret på elementene i spørsmålet.

Naturlig språkbehandling – Komme i gang

Mange datasystemer er i stand til å analysere et språk, men de gjør en overfladisk analyse. Dette kan for eksempel være fornuftig for å levere en statistisk valid vurdering av trender i endringer i følelser på store mengder informasjon. Her er ikke nøyaktigheten av informasjonsoverføring så viktig, for selv om vi antar at antall falske positive resultater er omtrent lik antall falske negative resultater, så kompenserer de hverandre.

Men hvis alle tilfeller betyr noe, kan ikke systemer som jobber med en overfladisk analyse av språket lenger gjøre jobben sin normalt. Et slående eksempel på det ovennevnte kan være en oppgave for en stemmeassistent på en hvilken som helst av de mobile enhetene. Hvis du sier "finn meg en pizza", vil assistenten vise en liste over pizzeriaer. Hvis du sier "ikke se etter meg en pizza i Madrid", for eksempel, vil systemet fortsatt søke. Slike systemer fungerer ved å identifisere visse nøkkelord og bruke et spesifikt sett med regler. Resultatet kan være nøyaktig under det gitte regelsystemet, men ikke korrekt.

Dyp naturlig språkbehandling

For å lære systemet å analysere komplekse semantiske strukturer, tatt i betraktning følelser og andre faktorer, brukte spesialister dyp behandling av naturlig språk. Nemlig et spørsmål-svar-system for innholdsanalyse (Deep Question * Answering, DeepQA). Hvis det kreves mer presisjon, må flere naturlige språkbehandlingsmetoder brukes.
IBM Watson er et dypt naturlig språkbehandlingssystem. Når man analyserer et spesifikt spørsmål, for å gi riktig svar, prøver systemet å vurdere en bredest mulig kontekst. I dette tilfellet brukes ikke bare informasjonen om spørsmålet, men også dataene til kunnskapsbasen.
Opprettelsen av et system som er i stand til dyp behandling av naturlig språk, gjorde det mulig å løse et annet problem - analysen av en enorm mengde informasjon som genereres daglig. Dette er ustrukturert informasjon som tweets, innlegg på sosiale medier, rapporter, artikler og mer. IBM Watson har lært å bruke alt dette til å løse menneskedefinerte problemer.

Kognitivt system IBM Watson

Watson tar datakraft til et annet nivå. Systemet er i stand til å skille visse utsagn i naturlig språk og finne sammenhenger mellom disse utsagnene. Samtidig takler Watson oppgaven, i mange tilfeller enda bedre enn en person, mens databehandlingen er mye raskere, arbeidet utføres med mye større volumer - en person klarer rett og slett ikke å gjøre dette.

De viktigste egenskapene til det kognitive systemet

Systemet fungerer i denne rekkefølgen:

1. Når Watson mottar et spørsmål, analyserer det det for å fremheve hovedtrekkene i spørsmålet.

2. Systemet genererer en rekke hypoteser ved å skanne korpuset på jakt etter fraser som med en viss grad av sannsynlighet kan inneholde det nødvendige svaret. For å effektivt søke i strømmer av ustrukturert informasjon, trengs helt andre beregningsevner * de kalles kognitive systemer. (Jeg forstår egentlig ikke den siste setningen og stjernens rolle)

3. Systemet utfører en dyp sammenligning av språket i spørsmålet og språket til hvert av de mulige svaralternativene, ved å bruke forskjellige inferensalgoritmer.

Dette er et vanskelig stadium. Det er hundrevis av inferensalgoritmer, og de utfører alle forskjellige sammenligninger. Noen ser for eksempel etter samsvarende termer og synonymer, noen ser på tidsmessige og romlige trekk, mens andre ser på passende kilder til kontekstuell informasjon.

4. Hver slutningsalgoritme setter ett eller flere merker som viser i hvilken grad et mulig svar følger av spørsmålet, i området som vurderes av denne algoritmen.

5. Hver oppnådd poengsum blir deretter vektet i henhold til en statistisk modell som fanger opp hvor godt algoritmen har prestert i å identifisere logiske sammenhenger mellom to lignende fraser fra det domenet under Watsons «læringsperiode». Denne statistiske modellen kan deretter brukes til å bestemme Watsons generelle grad av tillit til at et mulig svar følger av et spørsmål.

6. Watson gjentar prosessen for hvert mulig svar til den finner svar som er mer sannsynlig å være riktige enn andre.

Som nevnt ovenfor, for riktig svar på spørsmålet, må systemet referere til ytterligere datakilder. Det kan være lærebøker, manualer, FAQ, nyheter og så videre. Watson behandler enorme mengder informasjon i løpet av sekunder for å få det riktige svaret. Samtidig blir det funnet innholdet også sjekket, utdatert og ubrukelig data eliminert.

Elementer i det kognitive systemet

Watson utleder den generelle betydningen av teksten fra informasjonen som mottas, fra en ekstra database. Dette bruker tittelen på dokumentet, en del av teksten i dokumentet eller hele teksten.

Kognitive systemer, deres måter å samle inn, huske og hente informasjon på ligner på hvordan en person analyserer informasjon. I dette tilfellet kan kognitive systemer overføre informasjon og handle. Her er eksempler på atferdskonstruksjoner som brukes i dette tilfellet:

Evne til å lage og teste hypoteser;
- Evnen til å bryte ned i komponenter og bygge logiske konklusjoner om språket;
- Evnen til å trekke ut og vurdere nyttig informasjon (som datoer, steder og kjennetegn).

Uten disse evnene vil verken en datamaskin eller et menneske kunne bestemme det riktige forholdet mellom spørsmål og svar.
Kognitive prosesser av høyere orden kan oppnå et høyt nivå av forståelse ved å fokusere på grunnleggende atferd. For å forstå noe må vi kunne dele informasjon i mindre elementer som er rimelig godt ordnet på det aktuelle nivået. Fysiske prosesser hos mennesker foregår på en helt annen måte enn prosesser i kosmisk skala eller på nivå med elementærpartikler. På samme måte er kognitive systemer designet for å fungere på menneskelig nivå, selv om de representerer et stort utvalg mennesker.

I denne forbindelse begynner å forstå språket med å forstå de enklere regler for språket - ikke bare formell grammatikk, men også uformelle konvensjoner som observeres i daglig bruk.

Hva er alt dette for noe?

Nå kan det kognitive systemet IBM Watson, takket være år med opplæring og forbedring, utføre arbeid på en rekke områder. Her er det medisin, og matlaging, og lingvistikk, og løsning av forretningsproblemer med vitenskapelige problemer.

I utgangspunktet hadde spesialistene et valg - å gjøre systemet universelt eller spesialisert. Hvert av alternativene har sine egne fordeler og ulemper, men valget ble tatt mot allsidighet.

Selskapet har allerede vært overbevist om riktigheten av det perfekte valget mange ganger - før

Volumet av medisinske data dobles hvert tredje år, og de tilhørende kostnadene øker med 7 billioner dollar. Helsesektoren er ikke i stand til å "holde tritt" med den svimlende hastigheten til ny informasjon som dukker opp, inkludert data om laboratorieforskning, medisinske tester og ulike parametere for en person (kroppsvekt, blodtrykk, etc.). Omtrent hver 35 cent av $1 brukt på medisinsk behandling er bortkastet.

Det var de høye kostnadene ved databehandling som førte til utviklingen av det unike IBM Watson-systemet. Den er i stand til ikke bare å generere kolossale mengder medisinsk informasjon, men også å gjenkjenne de minste avvik i helsetilstanden til pasienter, som selv en høyt kvalifisert lege med mange års erfaring kan gå glipp av.

IBM Watsons kognitive system ble oppkalt etter skaperen, Thomas Watson. Utviklerne klarte å lage en superdatamaskin som er i stand til å behandle informasjon på lik linje med menneskesinnet. Før du trekker en bestemt konklusjon, går IBM Watsons analytiske plattform gjennom stadier som:

  • forskning av problemet;
  • primær søk og generering av hypoteser;
  • filtreringsresultater;
  • prøvetaking av fakta og analyse av deres kvalitet;
  • kombinere resultatene og evaluere dem.

Dermed behandler superdatamaskinen det menneskelige språket og gir raskt svar på de vanskeligste spørsmålene. Medisin er ikke det eneste fokusområdet for IBM Watson. Å lage en værmelding, komme opp med en original kulinarisk oppskrift og til og med drive din egen virksomhet blir mye enklere med dette systemet. Men i fremtiden vil det hovedsakelig bli brukt i helsesektoren.

Bruksområder innen medisin

IBM Watson-superdatamaskinen forbedrer brukervennligheten til elektroniske helsejournaler. For dette har forskere utviklet et spesielt verktøy kalt EMRA. En lege kan bruke denne applikasjonen til å overvåke sykehistorien til både én pasient og hele familien hans, sykehistorie fra andre leger, samt data om forsikringsselskaper. I tillegg er applikasjonen synkronisert med treningssporeren, slik at en spesialist har mulighet til å overvåke de minste endringene i en persons helse. Et slikt kognitivt system, etter å ha analysert alle dataene, gir individuelle anbefalinger for å ta vare på helsen til hver pasient.

IBM Watson Health analyserer ulike typer grafiske medisinske data. Superdatamaskinen kan oppdage detaljene og anomaliene til alle indre menneskelige organer i høy hastighet. Ved å kombinere grafiske og multimodale (tekst) data, forenkler IBM Watson dramatisk arbeidet til onkologer og radiologer. Så i flere år nå har systemet fungert på det thailandske sykehuset Bumrungrad, diagnostisert og gitt anbefalinger for behandling av ulike kreftformer.

IBM Watson hjelper leger med å identifisere rollen til genetiske faktorer i diagnostisering og behandling av kreft og sjeldne tilstander. Systemet analyserer genomiske data fra pasientens elektroniske journal, filtrerer informasjon om de samme sykdommene og overfører etter bearbeiding dataene til en spesialist.

Superdatamaskinen hjelper hudleger med å identifisere ulike hudsykdommer. IBM Watson Cognitive System analyserer bilder tatt med et dermatoskop. Hvis en spesialist visuelt er i stand til å stille en diagnose med en nøyaktighet på 75%, fungerer det kognitive systemet med en nøyaktighet på 94%.

Pasienten bør ikke bekymre seg for utleveringen av sine personlige data. IBM er forpliktet til konfidensialitet og anonymitet.

IBM Watson analyserer allerede medisiner og hjelper farmasøytiske selskaper med å lage nye. Ved hjelp av en superdatamaskin er det mulig å redusere antall feildiagnoser, øke effektiviteten av behandlingen og gi selv håpløse pasienter en sjanse til å bli frisk. Over tid blir superdatamaskinen smartere, noe som betyr at den i nær fremtid vil bidra til å forhindre utvikling av sykdommer før de må behandles.

Hvordan moderne teknologier fungerer er ofte vanskelig å forklare, og når det kommer til kognitiv databehandling og IBM Watson-systemet, ser det ut til at dette emnet er utenfor rekkevidden for den gjennomsnittlige person. Men dette er slett ikke tilfelle: fagfolk kan forklare alt, inkludert de mest komplekse sakene, og i ganske tilgjengelige ord. I dag snakker IBM-spesialister om arbeidet til det kognitive systemet IBM Watson og andre innovative løsninger i selskapet. Disse er Vladimir Alekseev, forretningskonsulent for industrielle løsninger hos IBM i Russland og CIS, Alexander Dmitriev, en ledende systemarkitekt hos IBM i Russland og CIS, og Yulia Pakina, forretningsutviklingssjef for IBM i Russland og CIS.

IBM har vært i kognitiv teknologibransjen i mange år. Fortell oss hvilke prosjekter selskapet for tiden er engasjert i i denne retningen?

Alexander Dmitriev

For å svare på dette spørsmålet må du snakke litt om selve teknologiene. Kognitive teknologier er retningen for utvikling av kunstige intelligenssystemer, hvis hovedoppgave er å hjelpe en person til å ta avgjørelser i et vanskelig miljø. Det er en rekke bransjer og prosesser som krever ledelse med et stort antall skiftende parametere, komplekse avhengigheter og uforutsigbare resultater. I dette tilfellet bør beslutninger tas i en tidsmodus nær reell. Det enkleste eksemplet vil være elektronisk handel på en børs eller nettkjøp. For eksempel, på populære shoppingsider, holdes det ofte kampanjer når et billig produkt legges ut for salg fra et bestemt tidspunkt. En person har ikke engang tid til å trykke på en knapp, og produktet er allerede solgt: automatiske innkjøpssystemer utløses. På samme måte støttes kjøp og salg av aksjer på verdens børser av systemer som samler inn en enorm mengde informasjon fra ulike kilder og «automatisk» tar beslutninger om kjøp eller salg av bestemte aksjeblokker. Faktisk er avgjørelsen tatt av en person når han lager og trener dette systemet.

Alt dette innebærer en forståelse av rekkevidden av klienter og mulige prosjekter som kognitive teknologier er egnet for: dette er først og fremst store selskaper fra de forretningssektorene hvor det er nødvendig å raskt og effektivt behandle store mengder data, identifisere komplekse sammenhenger og avhengigheter, og ved å bruke algoritmer nær menneskelig tenkning, utvikle alternativer for løsninger slik at administrerende spesialister raskt kan foreta et valg av nødvendige handlinger. Dette er for det første store næringer, der store ressurser og datamengder er involvert – både fra tekniske systemer og fra handlinger til personell (oljeindustri, banker, bygg, anlegg, tungteknikk, etc.). Dette er også områder hvor det kreves mestring og forståelse av en stor mengde informasjon om nye utviklinger, tatt i betraktning den akkumulerte erfaringen og høye risikoer når du tar beslutninger. Dette gjelder feltet medisin, sosial ledelse. Prisen for medisinske beslutninger er menneskers liv og helse. Det er her kognitiv teknologi er spesielt verdifull. De gir spesialister abstrakt informasjon om nye fremskritt innen et spesifikt medisinsk felt, hjelper til med å velge det beste behandlingsalternativet for hver pasient, med tanke på historien og spesifikasjonene til hans sykdom.


I tillegg er et av de viktigste områdene opprettelsen av kunnskapsdatabaser innen et bestemt felt innen vitenskap, teknologi, yrke, historie, etc.

Nå om spesifikke prosjekter. I dag lager en rekke store selskaper allerede komplekse beslutningsstøttesystemer, ikke bare i utlandet, men også i Russland. Når det gjelder internasjonale eksempler, har det største australske oljeselskapet Woodside bygget en kunnskapsbase for sin industri basert på egen erfaring. Dette gjorde det mulig å løse en rekke komplekse problemer - først og fremst for å øke effektiviteten til personellet, øke hastigheten på treningssyklusen betydelig, og gjorde det mulig å bruke og replikere opplevelsen av allerede implementerte prosjekter. Dette er en enorm pengebesparelse for hele selskapet.

Et russisk eksempel er implementeringen av et system for å arbeide med store tekstvolumer hos VINITI RAS, hvor teknologier basert på Watson Explorer blir implementert med suksess. Dette systemet vil bidra til å behandle ulike strukturerte og ustrukturerte opplysninger for å identifisere sammenhenger mellom indikatorer som karakteriserer tematiske områder av vitenskapelig forskning i Russland.

Det ble også utført et prosjekt sammen med det allrussiske senteret for studie av offentlig mening om temaet internasjonale relasjoner. Mer enn 55 tusen åpen kildekodetekster ble analysert ved hjelp av Watsons kognitive teknologier for å fremheve viktige øyeblikk i kulturelle og sosiale bånd mellom Russland og Sør-Korea.

Det har også vært en rekke medisinske pilotprosjekter basert på Watson Health sitt produkt, og resultatene viser at det er store muligheter for å forbedre pasientbehandlingen.

Jeg må si at retningen for kognitive teknologier fortsatt er veldig ny, og derfor kommer det nesten hver dag nye kunder fra ulike felt til oss, og vi velger de riktige verktøyene for dem fra hele spekteret av løsninger tilgjengelig for IBM.

Fortell meg hva IBM Watson opprinnelig var og hvorfor de bestemte seg for å bruke dette systemet på områder som medisin, virksomhet, forsikring?

Yulia Pakina

Watsons aller første opptreden var i 2011 på Jeopardy! Deretter var Watson et stort kompleks av forskjellige programmer, som ble satt sammen spesielt for dette spillet, og egenskapene som lå i det på den tiden var rettet mot å forstå naturlig språk. For dette var det nødvendig for det første å oversette stemmen til tekst og for det andre å tolke det mottatte tekstmaterialet riktig. Dermed var systemet i utgangspunktet i stand til å tolke teksten, analysere spørsmål og "forstå" deres betydning. Selvfølgelig er nivået og ytelsen til Watson nå mye bedre enn det var i 2011.

Hva annet kunne Watson-systemet gjøre da? Se etter svaret på spørsmålet i dybden av informasjonen i det. Et særtrekk ved det systemet var at det ikke var koblet til eksterne kilder – verken til Internett, eller til noe annet. Det som ble lagt inn i minnet hennes, brukte hun. Det mest interessante er at, takket være den iboende logikken, rangerte systemet de mulige svarene og ga ut den der, takket være sin logikk, var sikker på å være så korrekt som mulig. I 2011 vant Watson-systemet med god margin resten av deltakerne - folk, gapet der var alvorlig. Og etter dette spillet dukket spørsmålet opp: "Hva neste?"


Spillet er kjempebra! Men hvilken videre anvendelse av systemet kan det være? Etter det begynte spesialister å tenke på hvor Watson-teknologier kunne brukes kommersielt, i hvilket forretningsområde, i hvilke markeder. IBM bestemte at Watson skulle brukes der det er en stor strøm av tekstlig ustrukturert informasjon på naturlig språk, og der en person trenger en intelligent assistent. Og vi begynte å jobbe i helsesektoren. Saken er at Watson, som vi allerede vet, er i stand til å behandle en enorm mengde informasjon. Og for eksempel innen onkologi dukker det opp 500 tusen nye vitenskapelige artikler årlig innen ulike felt og forskningsområder. Og det er klart at en levende person ikke kan takle en slik bølge av informasjon. Men nye materialer på dette området kan ikke ignoreres, de må behandles intellektuelt, veie, sammenligne, referere til tidligere erfaring.

Man bør huske på at alt Watson kan gjøre nå, har blitt satt inn i det av talentfulle programmerere, lingvister og fageksperter.

Hva er din visjon for fremtiden til IBM Watson? Hvilke oppgaver vil systemet for eksempel kunne løse om 5-10 år? Hva kan hun ikke gjøre nå, men snart planlegger selskapets spesialister å lære henne hvordan det skal gjøres?

Alexander Dmitriev

Ledende systemarkitekt, IBM Russland og CIS

Det er ganske vanskelig å forutsi fremtiden, det er ikke for ingenting at de fleste spesialister, når de snakker om moderne løsninger, bruker uttrykket "i den moderne raskt skiftende verden". Situasjonen endrer seg faktisk veldig raskt og ofte uforutsigbart, men hovedtrendene innen kognitive teknologier er fortsatt ganske klare.

For det første er dette opprettelsen av store kunnskapsbaser på privat og statlig nivå. Nå er alle de ledende landene i verden bekymret for dette. De søker veldig aktivt etter å samle inn, behandle og sette i drift et system for å trekke ut verdifull informasjon fra en lang rekke kilder. Vi ser at denne prosessen foregår på to hovednivåer. For det første på nivå med store selskaper av internasjonal betydning med hundretusenvis av ansatte, kontorer i forskjellige land og kompleks produksjon. Hoveddriveren her er å få et konkurransefortrinn. Det er klart at prosjekter på dette nivået krever seriøse investeringer, men de begynner å betale seg nesten umiddelbart, noe som øker arbeidseffektiviteten dramatisk. Det legges vekt på prediktiv analyse levert av Watson-teknologier: ledelsen utføres ikke etter at visse hendelser har skjedd, men tar hensyn til hele selskapets opplevelse i prognosemodus. Et høyere nivå er statens nivå når systemer for akkumulering og bearbeiding av kunnskap i nasjonal målestokk og informasjon fra andre land skapes. Dette er områder knyttet til utvikling av vitenskap, teknologi, nasjonens helse og sosial ledelse.

Watson har allerede mestret yrkene som kokk, lege, finansmann og oversetter. Hvilke andre yrker skal hun mestre i nær fremtid?

Alexander Dmitriev

Ledende systemarkitekt, IBM Russland og CIS

Det er to aspekter ved Watsons "profesjoner". Den første er å utvide spekteret av muligheter innenfor profesjonene som allerede er mestret. For eksempel, innen det medisinske feltet, brukes Watson i behandlingen av en rekke kreftformer. Men spesifisiteten til medisinen er at det ikke bare er et stort antall typer sykdommer, men også pasientene selv er forskjellige i personlige egenskaper og historien til deres sykdommer. Derfor fortsetter utviklingen på grunn av både en økning i spekteret av helbredelige sykdommer og på grunn av muligheten for å utvikle et stadig mer detaljert personlig behandlingsforløp for en bestemt pasient.

Det andre er å "mestre" andre yrker. Watson har allerede "mestret" spesialiseringen av oljeindustrien: en rekke utenlandske selskaper har implementert beslutningsstøttesystemer for sine oljefagfolk. Et annet lovende område er arbeid med sosiale grupper og befolkning. Dette er også områder hvor det er behov for informasjonsbehandling og utvikling av tjenester og tilbud for store grupper av klienter (hundretusenvis og millioner av mennesker). Dermed er de nærmeste utviklingsutsiktene profesjoner fra banknæringen, telekommunikasjon, hvor datamengdene er utrolig store, og beslutninger skal tas i sanntid.

Generelt tror jeg at Watson snart nok vil komme i form av en tjeneste bare til hver person - du kan stille et spørsmål om nesten alle områder av interesse og få et kvalifisert svar.

Yulia Pakina

Business Development Manager, IBM Russland og CIS

Nyere områder hvor IBM Watson har blitt brukt er gruvedrift. Alexander har allerede nevnt et godt eksempel på en suksesshistorie – det australske selskapet Woodside Energy, som har fått hjelp av sitt kognitive system til å jobbe mye mer effektivt ved å strømlinjeforme arbeidsflyten. Før Watson ble beslutningen om å bore brønner tatt av Woodside Energy-spesialister på grunnlag av langt og møysommelig arbeid med å samle inn all mulig dokumentasjon i dette området, inkludert den geologiske strukturen i området, tilstedeværelsen av brønner i nærheten, type felt , muligheten til å bruke utstyret som må brukes til dette prosjektet.

Tidligere tok dessuten denne forberedelsesperioden opptil 80 % av selskapets tid. Følgelig var det bare 20 % av tiden igjen til utviklingen av selve brønnen. Vi har nå jobbet med Woodside Energy for å sikre at kun 20 % av tiden brukes til leting og forberedelse til boring, og resten av tiden brukes til boring og utvikling av nye brønner.

Mange selskaper snakker nå om utviklingen innen kunstig intelligens. IBM snakker om den kognitive plattformen. Fortell meg hva som er særegenheten til IBMs kognitive tjenester, og kan de kalles en viss type kunstig intelligens?

Alexander Dmitriev

Ledende systemarkitekt, IBM Russland og CIS

Når det gjelder kunstig intelligens, ville jeg ikke lagt for mye vekt på terminologi. Inntil vitenskapen som helhet ikke helt forstår metodene for menneskelig tenkning (og det fortsatt er mange tomme flekker på dette området), er det upassende å krangle om hva som er kunstig intelligens og hva som ikke er det. Vi kan si at Watson-systemet i 2011 «bestod» en litt modifisert formell Turing-test for retten til å bli kalt kunstig intelligens. Den generelle ideen om testen er enkel: hvis en person, som kommuniserer med et system og stiller det en rekke spørsmål i fri form, ikke kan skille om han kommuniserer med en person eller med et maskinsystem, så er et slikt system kan kreve tittelen "kunstig intelligens".

Når Watson vant spillet Jeopardy, hvor det var nødvendig å svare på spørsmål fra et bredt spekter av kunnskap, slo Watson live-deltakerne og besto denne testen. Men det er ikke poenget. Uansett hva vi kaller kognitive teknologier, er det viktig at de oppfyller hovedoppgaven sin, blir en «forsterker» av sinnet når de skal ta vanskelige beslutninger, både operasjonelle og strategiske. Menneskelig hukommelse er ikke ubegrenset; opplæring av kompetente spesialister i enhver bransje er dyrt og tidkrevende. Kognitive systemer skaper så å si slike virtuelle spesialistkonsulenter, hvis tjenester alle kan henvende seg til. Dette er essensen av kunstig intelligens. Det er viktig at den endelige avgjørelsen om eventuelle spørsmål fortsatt ligger hos personen.

Yulia Pakina

Business Development Manager, IBM Russland og CIS

Ja, generelt er det kognitive systemet bare opprettet for å fjerne rutinen fra en person og gi mer tid til kreativitet, løse komplekse problemer og skape nye systemer. Derfor snakker vi om en løsning ikke av kunstig intelligens, men av forbedret intelligens, ekstra intelligens.

Fortell oss mer om bruk av kraften til kognitive teknologier i virksomheten.

Alexander Dmitriev

Ledende systemarkitekt, IBM Russland og CIS

Bruken av kognitive teknologier i næringslivet er rettet mot å løse en rekke problemer assosiert ikke bare med store mengder raskt skiftende data, men med behovet for raskt å trekke ut den nødvendige informasjonen fra disse dataene og bruke den for virksomheten, tatt i betraktning industrien og selskapets egen erfaring. Dermed er kognitive systemer koblet til en rekke informasjonskilder (bedriftens egne databaser, Internett, streaming video, informasjon fra tekniske sensorer til ulike systemer, data om hendelser i et bestemt område). Allerede på grunnlag av disse dataene finner kognitive systemer, ved hjelp av spesielle algoritmer, de nødvendige løsningene og tilbyr dem til ledere og spesialister.

Det er viktig at med akkumulering av arbeidserfaring og vellykket aktivitet i et bestemt område, kan kognitive systemer trenes, konfigureres og også sette en selvlæringsmodus. Derfor har kognitive systemer for virksomhet én viktig kvalitet som ingen andre systemer besitter: jo lenger de fungerer, jo høyere er effektiviteten. De i seg selv blir mer verdifulle for selskapet i prosessen med drift. Og det som er viktig er at denne akkumulerte erfaringen er tilgjengelig for de ansatte i bedriften og dermed stadig brukes – gjentatte ganger, gjentatte ganger, når det er nødvendig. En vanlig situasjon er at en spesialist har sluttet, og selskapet har mistet sin personlige kunnskap og erfaring. Med det implementerte kognitive systemet forblir all erfaring i bedriften og kan enkelt overføres til andre spesialister.

Hvordan kan blokkjedevirksomhet være nyttig? Nå sier de at denne teknologien kan endre entreprenørskapens velkjente verden. Er dette sant, og i så fall, hva er disse endringene?

Vladimir Alekseev

Tidlige meninger om hvordan teknologi kan endre entreprenørskapsverdenen kokte vanligvis ned til opprettelsen av peer-to-peer-nettverk, det vil si et miljø der hvert selskap kunne samhandle direkte med andre uten noen mellomledd. Dette er riktignok en for forenklet beskrivelse, og over tid har ideen utviklet seg og supplert. Nå kan vi si at blockchain, for det første, lar oss gi distribuert ansvar, noe som er ekstremt viktig hvis vi har flere selskaper som ikke stoler sterkt på hverandre og ikke er relatert til hverandre på noen måte. For det andre åpenheten av alle transaksjoner og umuligheten av å gjøre endringer i transaksjonene som allerede er utført. En transaksjon forstås ikke bare som en banktransaksjon, men mer som overføringen av en eiendel fra ett selskap til et annet. For det tredje er det muligheten til å bruke smarte kontrakter for forretningslogikk, nemlig å sikre hele prosessen med operasjonen. Ellers kunne blokkjeden bare brukes som et lagringssystem, og all logikk for operasjoner kunne gjøres utenfor rammeverket, noe som ikke ville sikre åpenhet eller pålitelighet av operasjoner.


Finnes det allerede positive eksempler på blokkjedebruk av kommersielle selskaper?

Vladimir Alekseev

Bedriftskonsulent for industrielle løsninger for IBM i Russland og CIS

I løpet av det siste året har IBM vært vertskap for mer enn 400 piloter over hele verden med kunder over et bredt spekter av bransjer. Dette inkluderer selvfølgelig finanssektoren, detaljhandel og energi. Spesielt pilotprosjekter med ABN Amro innen finansiell restrukturering og eiendomsforvaltning. Med Bank of Tokio-Mitsubishi ble et prosjekt fullført om bruk av blokkjedeteknologi for å automatisere outsourcingkontrakter innen IT.

Det er for tidlig å snakke om de praktiske resultatene av implementeringer (kvantitative forretningsindikatorer): blokkjede er fortsatt en ny teknologi som også tar tid å bli testet. Blockchain kan ikke eksistere isolert, så integrasjon med eksisterende systemer kreves, tjenesteutvikling kreves, kompetanse kreves. 2016 var dedikert til pilotering, 2017 skulle være preget av integrering av blokkjedeteknologi i den eksisterende IT-infrastrukturen til organisasjoner.

I følge undersøkelser utført av IBM Institute for Business Value, planlegger mer enn 50 % av administrerende direktører i finanssektoren å gå over til den kommersielle fasen av teknologien i 2018-2020.

Blockchain gir, så vidt man kan forstå, store muligheter for mange forretningsområder. Hva synes du om børser? Kan denne teknologien være nyttig der?

Vladimir Alekseev

Bedriftskonsulent for industrielle løsninger for IBM i Russland og CIS

Det er verdt å erkjenne at utvekslinger var blant de første organisasjonene som ble interessert i teknologien og deltok aktivt i utviklingen av den. For eksempel er den tyske børsen (Deutsche Boerse) den fremste deltakeren i HyperLedger-blokkjedeprosjektet sammen med IBM, og Moskva-børsen er også medlem. Fra den praktiske erfaringen med å bruke teknologien ved børser, vil jeg bemerke følgende: I fjor gjennomførte den japanske børsen, med hjelp fra IBM, en studie av mulighetene for å bruke distribuerte hovedbøker i sin virksomhet. I sin rapport la børsen vekt på løftet om teknologien, og bemerket blant de viktigste fordelene muligheten for å skape nye innovative finansielle tjenester og redusere kostnader. I følge spesialistene til den japanske børsen vil blockchain bidra til å automatisere prosessene for å avtale handelsprosedyrer og øke feiltoleransen til systemet som helhet ved å introdusere distribusjonsprinsippet.


Fortell oss hva IBM planlegger å gjøre i løpet av de neste 5-10 årene? Hvordan ser selskapet på fremtidens næringsliv?

Vladimir Alekseev

Bedriftskonsulent for industrielle løsninger for IBM i Russland og CIS

Tidligere i år avduket IBM sin visjon om hvordan teknologisk innovasjon vil forandre verden i fremtiden. Rapporten er produsert av IBM Research og reflekterer selskapets syn på hvordan verden vil endre seg om fem år i fem retninger. For det første legger selskapet stor vekt på måten vi alle snakker og skriver på, og tror disse faktorene vil bli brukt som indikatorer på psykologisk og fysisk helse. Videre - folk vil kunne få "tilsyn" takket være bittesmå og kraftige kameraer, som vil gjøre det mulig å utforske nesten 100 % av det elektromagnetiske spekteret mot mindre enn 1 % i dag. Teknologien kan bygges inn i mobile enheter og bidra til å analysere sammensetningen av produkter eller legemidler. På den annen side, om fem år vil vi være i stand til å forstå kompleksiteten til jorden med forbløffende detaljer. Dette vil bli mulig på grunn av utviklingen av tingenes internett (IoT) og maskinlæringsalgoritmer, på grunnlag av hvilke konklusjoner kan trekkes fra analysen av de fangede parameterne. IBM-forskere omtaler dette samlet som en "makroskopisk". Det vil bidra til å forutsi fenomener som klimaendringer, vannstander, forurensningstrusler eller virkningen av eksterne faktorer på planeten vår.

Det neste området for teknologiutvikling IBM ser opprettelsen av medisinske laboratorier "på sjetonger" for å spore sykdommer på nanonivå, noe som vil bidra til å forutsi sykdommer på et tidligere stadium. I IBM-laboratorier jobber spesialister med å lage 20 nm-brikker som kan kobles til både kunstig intelligens-systemer og andre sensorer i sanntid. Og til slutt, det femte området er opprettelsen og distribusjonen av "smarte" sensorer for en tidligere bestemmelse av nivået av miljøforurensning. Slike sensorer kan også være svært nyttige for gassrørledninger, så vel som nær naturlige utslippskilder, for eksempel metan for å varsle økningen i konsentrasjoner av ulike stoffer.

Det er verdt å merke seg at på alle områder er teknologier allerede i utvikling, så prognosen ser ikke for futuristisk ut. På den annen side tar det tid og krefter å foredle eksisterende produkter og bringe dem til vanlig bruk.

Fra et langsiktig perspektiv (10 år eller mer) kan vi gi et eksempel på teknologien til kvantedatamaskiner. I kvantedatamaskiners arbeidsalgoritme er det helt andre prinsipper enn de som moderne datamaskiner fungerer etter. Derfor kan bruken deres fullstendig endre eksisterende prosesser, for eksempel kryptografi, og gi et helt nytt nivå av datakraft. IBM er en av lederne på dette feltet, og gir allerede gratis testtilgang til en ekte kvantedatamaskin gjennom IBM Quantum Experience-skyinfrastrukturen.

Spør en IBM-ekspert Elena Sinka, salgsrepresentant for IBM Solutions Spørre

Takk!
spørsmålet ditt har blitt sendt

) er en IBM-superdatamaskin utstyrt med et kunstig intelligenssystem, som ble laget av en gruppe forskere ledet av David Ferucci. Opprettelsen er en del av DeepQA-prosjektet. Watsons hovedoppgave er å forstå spørsmål om naturlig språk og finne svar på dem i en database. Oppkalt etter IBM-grunnlegger Thomas Watson.

Deltakelse i "Jeopardy!"

I februar 2011, for å teste Watsons evner, deltok han i TV-showet Jeopardy! (Russisk analog - Eget spill). Rivalene hans var Brad Rutter - vinneren av den største seieren i programmet, og Ken Jennings - rekorden for lengst ubeseiret løp. Watson vant, og mottok 1 million dollar, mens Jennings og Rutter mottok henholdsvis 300 og 200 tusen dollar.

Plattform

Watson består av 90 Power7 750-servere, som hver inneholder 4 POWER7 octa-core prosessorer. Watsons totale RAM er over 15 terabyte.

Systemet hadde tilgang til 200 millioner sider med strukturert og ustrukturert 4 terabyte informasjon, inkludert hele teksten til Wikipedia. Under spillet hadde ikke Watson tilgang til Internett.

Fremtiden til prosjektet

IBM samarbeider med Nuance Communications for å utvikle et produkt i løpet av de neste to årene for å hjelpe diagnostisere og behandle pasienter. Andre bruksområder vurderes også, som å vurdere forsikringer eller energieffektivitet.

Historien til Watson begynte i 2006 da David Ferucci, seniorleder for IBMs semantiske analyseavdeling, begynte å teste en av selskapets kraftigste superdatamaskiner, en av de 500 mest produktive maskinene i verden. Ferucci bestemte seg for å prøve hvor effektivt maskinen ville takle oppgavene "naturlig språk", og inviterte henne til å svare på 500 spørsmål stilt i de allerede avholdte Jeopardy-programmene! Resultatene viste seg å være katastrofale: sammenlignet med live-spillere "trykket ikke bilen" raskt nok på knappen (det vil si at den var klar til å svare), og i tilfelle den fortsatt kunne konkurrere med folk, antallet av riktige svar oversteg ikke 15 %

Ferucci ble interessert i årsakene til denne oppførselen til superdatamaskinen, og som et resultat klarte han i 2007 å overbevise IBM-ledelsen om å gi ham et team på 15 personer og fra 3 til 5 år til å lage et effektivt automatisk system som var i stand til å svare på ikke-formaliserte spørsmål. Et slikt system vil være nyttig for alle typer kundesentre, informasjonssentre og andre tjenester som betjener kunder. IBM har allerede hatt suksess med å bygge en maskin som konkurrerer med menneskelig intelligens - Deep Blue superdatamaskinen, som beseiret verdensmesteren i sjakk Garry Kasparov i 1997. Denne seieren gjorde stor publisitet for IBM, men et slikt oppsett ble aldri funnet kommersielt. Når det gjelder et system med automatisk svar på spørsmål, er det kommersielle potensialet ganske åpenbart.

Den grunnleggende forskjellen mellom Watson og Deep Blue er at hvis en sjakkmaskin tar for seg strengt logiske spilleregler, blir en maskin som gjenkjenner "naturlig tale" møtt med mye mer komplekse språkregler og mange forvrengninger og avvik fra dem. Men den største utfordringen er at mennesker, uten å være klar over det, kommuniserer innenfor sin kulturelle og sosiale kontekst. Samtale er full av hint, hentydninger og konnotasjoner, referanser til visse fakta, konsepter og fenomener som er felles for et bestemt sosialt miljø. Disse inkluderer religiøs tro, politisk tro og alle slags kunstverk – fra bøker og malerier til filmer og dataspill.

For effektiv behandling av slik informasjon brukes statistiske algoritmer som gjør det mulig, ved å analysere en lang rekke dokumenter, å etablere sammenhengen mellom ulike konsepter med hverandre. Enkelt sagt avgjør det hvilke ord som oftest brukes sammen. For eksempel er "Kremlin" oftere assosiert med ordene "Russland", "Moskva", litt sjeldnere med "Kazan", "Nizjnij Novgorod", enda sjeldnere med "katedralen", "ikon" "osv. Selv om disse algoritmene er kjent i lang tid, ble deres fulle bruk bare mulig i løpet av det siste tiåret - etter en dramatisk økning i datamaskinytelse og en reduksjon i kostnadene for stasjoner for lagring av store datamengder.

Feruccis team laster inn millioner av alle slags dokumenter i minnet til IBM Watson – lærebøker, oppslagsverk, oppslagsverk, skjønnlitteratur og religiøs litteratur. For å analysere spørsmål brukes mer enn hundre algoritmer samtidig, og tilbyr hundrevis av mulige løsninger. Deretter evaluerer andre algoritmer påliteligheten til potensielle svar, filtrerer ut de som er umulige på grunn av objektive årsaker (for eksempel et avvik mellom datoen for hendelsen og aktørenes leveår) og det usannsynlige. Jo flere identiske svar som mottas, desto større er sannsynligheten for at de er riktige - i løpet av spillet vises det en vurdering på resultattavlen fra flere av de mest sannsynlige svarene, i tillegg til de oftest møtte.

I 2008 hadde IBM Watson gått fra kategorien "tapere" til topplinjene i den såkalte "skyen av vinnere", bestående av personer som i 50 % av tilfellene har tid til å trykke på knappen først, og signalisere deres beredskap til å svare, og deretter i 85-95% av tilfellene, gi riktig svar. ... IBM har til og med forhandlet med Jeopardys produsenter om å være vertskap for en spesiell serie spill høsten 2010 med Watson og tidligere vinnere. For å forberede seg til disse spillene (det vil faktisk forbedre algoritmene), ble et omtrentlig interiør i quizstudioet gjenskapt og tester begynte med deltakelse av live-spillere og en programleder. Samtidig gir «Watson» som forventet svarene sine høyt med en syntetisert datastemme, noe som morer publikum mye.

Under "treningen" ble et interessant faktum avslørt: til tross for ikke alt potensialet til Watson, kan han ikke bare vinne de fleste spillene, men også tape mer enn halvparten av dem. Det er flere grunner: fra "hans tilfeldighets majestet" (situasjoner er mulige når en motstander kan vinne ganske enkelt ved å heve prisene, la bilen gå konkurs) til de spesifikke reglene. Merkelig nok, men en person er i stand til å trykke på en knapp raskere enn en bil, og dette er på grunn av spillereglene, som ikke kan endres.

Faktum er at hvert spørsmål vises på skjermen og leses opp av presentatøren, og du kan trykke på knappen først etter at spørsmålet er lest. Watson mottar teksten til spørsmålet i elektronisk form samtidig som den vises på skjermen, men likevel har han ikke tid til å komme til en ferdig løsning raskere enn en person. Mens programlederen leser spørsmålet, som tar seks til syv sekunder, kan en erfaren spiller allerede estimere sjansene sine for å gi riktig svar og er klar til å trykke på knappen i løpet av titalls millisekunder. Reglene gir ytterligere fem sekunder til neste svar.

Ved å trykke på knappen risikerer en person: hvis han ikke gir riktig svar på spørsmålet for 100 enheter, vil hans virtuelle konto være tom for samme beløp. Datamaskinen er ikke tilbøyelig til å ta risiko og gir svar først etter at alle beregninger er gjort og bare hvis den har nok informasjon til å vurdere påliteligheten og sannsynligheten for at dette svaret er riktig. Hvordan det ser ut under spillet kan du se på videoen. Med risiko kan en live-spiller vinne ved å huske det nødvendige svaret på 11-12 sekunder til disposisjon.

I en litt mer formalisert situasjon enn et quizprogram, er Watsons algoritmer i stand til å gi mye mer forutsigbare og nøyaktige svar. Spesielt har lederen for forskningsavdelingen til IBM John Kelly til hensikt å lage en medisinsk versjon av denne enheten under det uoffisielle navnet Watson M.D. Et slikt system vil hjelpe leger raskt å ta de riktige avgjørelsene, tatt i betraktning den enorme mengden pasientdata som er fysisk umulig å alltid ha i minnet. Watson kan godt erstatte direkte tellere innen data- og telefontjenester innen detaljhandel, bank og transport.

Kostnaden for et IBM Watson-system i dag kan være flere millioner dollar, siden det krever minst én IBM-superdatamaskin for en million dollar å kjøre. Kelly mener at i løpet av de neste ti årene kan slik teknologi implementeres på en mye billigere server, og i fremtiden vil et slikt program fungere på en datamaskin som ikke er dyrere enn en moderne bærbar PC.

Engelsktalende kan kjempe mot IBM Watson online på The New York Times.

Superdatamaskinen IBM Watson er planlagt brukt i tekniske støttetjenester i stedet for live-operatører. Imidlertid er alle disse oppgavene snarere knyttet til å finne riktig svar på brukerforespørsler basert på kjent informasjon. IBM mener at ekte kunstig intelligens skal kunne finne kreative løsninger, skape og finne opp nytt, og ikke bare analysere det gamle.

For å utvikle Watsons kreative evner, valgte skaperne den kulinariske kunsten. Dette er en veldig praktisk prøveplass: matlaging er en veldig "menneskelig", intuitiv prosess, dårlig mottagelig for algoritmer og standardisering. Og enhver person fra gaten er i stand til å vurdere resultatet. Sjokolade- og mandelkjeks i spansk stil, ecuadoriansk jordbærdessert, grillede tomater på toast med safran – disse og andre retter laget av Watson har allerede blitt tilberedt og spist med glede under eksperimentene. For et par uker siden ble det publisert et fortrykk av artikkelen som beskrev algoritmene og matematiske modellene som Watson bruker for å lage originale oppskrifter.

Enhver kreativ løsning må samtidig tilfredsstille to kriterier – være ny og ha høy kvalitet. Det er relativt enkelt å oppnå nyhet ved å kombinere ingredienser og prosessteknikker. Men med kvalitet er situasjonen mye mer komplisert. Det er ekstremt vanskelig å lære en datamaskin å forstå hva smaken, aromaen, teksturen og utseendet til en rett vil være.

De første dataene for Watson var flere millioner oppskrifter samlet på Internett. De ble kjørt gjennom velprøvde naturlig språkbehandlingsalgoritmer som ble brukt til å vinne quizen og lære Watson om medisin. Informasjon ble hentet fra Wikipedia om de typiske ingrediensene og bearbeidingsteknikkene som er typiske for kjøkkenet til forskjellige folkeslag i verden. Til slutt fikk Watson en grundig kunnskap om kjemien og fysiologien til menneskelig oppfatning av smak og lukt.

Nye oppskrifter ble generert på grunnlag av eksisterende ved hjelp av en genetisk algoritme, verdiene av nyhet, hyggelighet og kompatibilitet ble brukt som en treningsfunksjon.

Den matematiske modellen for å vurdere nyheten til en oppskrift er basert på Bayes' teorem, den såkalte "Bayesian surprise"-tilnærmingen ble brukt, opprinnelig utviklet for å simulere atferden til seeren når han ser på en video. I et nøtteskall er essensen av metoden at forskjellen mellom tidligere og posterior sannsynlighet for å møte en viss kombinasjon av produkter i oppskriftsrommet måles når en ny legges til den. Så kombinasjoner av nøtter med sjokolade eller sennep med pølser er helt vanlig og forårsaker nesten ingen endring i sannsynlighetene for forskjellige kombinasjoner. Men pølsene i sjokolade vil påvirke disse sannsynlighetene mye mer betydelig.

For det meste ble kjemi brukt for å vurdere hyggeligheten. Ved å vite den kjemiske sammensetningen av matvarer og rekkefølgen de ble blandet og behandlet i, beregnet datamaskinen hvilke stoffer som ville bestemme smaken og lukten av retten. Interessant nok viste lukten seg å være mye viktigere enn smaken på retten. Vår oppfatning av smak er veldig knyttet til lukt og aroma. En person skiller bare noen få grunnleggende smaker - surt, søtt, salt, bittert. I ulike kulturer finnes det flere grunnsmaker, for eksempel terte eller umami. Men variasjonen av lukter er mye større og de er ikke begrenset til enkle grunnleggende kombinasjoner.

Til slutt var vurderingen av matkompatibilitet også avhengig av et solid vitenskapelig grunnlag, spesielt på den felles studien av amerikanske og britiske forskere "Flavor Networks and Principles of Food Combination", som analyserte rundt 50 000 oppskrifter og bygde matkompatibilitetskart som er typiske for kjøkken. fra forskjellige regioner....

Som et resultat ble det opprettet en applikasjon der du kan angi et sett med produkter, nasjonal stil og variasjon av en rett, hvoretter Watson ga ut et sett med oppskrifter som kan sorteres i henhold til graden av nyhet, hyggelighet og kompatibilitet. I tillegg til individuelle retter, er Watson i stand til å lage hele menyer, oppnå variasjon og riktige kombinasjoner av retter gjennom bruk av tematisk modellering. Det er en måte å bygge en modell for en samling tekstdokumenter på som bryter samlingen inn i emner og bestemmer hvilket emne hvert dokument tilhører. Watson bruker denne modellen på oppskrifter – de enkelte ingrediensene fungerer som nøkkelord, selve oppskriftene fungerer som dokumenter.