Superdatorn IBM Watson vann Jeopardy TV-quizet (den ryska analogen är Own Game). IBM Watson: vad den mest kända superdatorn kan

3 september 2015 klockan 11:34

IBM Watson Cognitive System: Natural Language Principles

  • IBM blogg,
  • Algoritmer

IBM Watson är ett av de första kognitiva systemen i världen. Detta system kan göra mycket, tack vare vilket Watsons kapacitet används på många områden - från matlagning till att förutsäga olyckor i bosättningar. I allmänhet är de flesta funktionerna i Watson inte något unika, men i kombination är alla dessa funktioner väldigt kraftfullt verktyg att lösa olika problem.

Till exempel - naturligt språkigenkänning, dynamisk systeminlärning, konstruktion och utvärdering av hypoteser. Allt detta gjorde det möjligt för IBM Watson att lära sig att ge direkta korrekta svar (med en hög grad tillförlitlighet) till operatörens frågor. Samtidigt kan det kognitiva systemet använda stora mängder globala ostrukturerade data för arbete, big data. Vilka är de grundläggande principerna för hur IBM Watson arbetar med språk? Mer om detta i fortsättningen.

De största svårigheterna med naturligt språkigenkänning

För en person är språket ett sätt att uttrycka tankar. Vi använder språk för att förmedla vår åsikt, all data och information. Vi kan göra förutsägelser och bilda teorier. Det är språket grundsten vårt medvetande. Samtidigt, här är paradoxen, mänskligt språk är väldigt felaktigt.

Många termer är ologiska och det kan vara väldigt svårt för datorsystem att förstå oss. Till exempel, hur kan en röst vara tunn? Hur kan man brinna av skam? För en maskin är detta ett problem, men för en person är det en helt vanlig sak. Faktum är att för att korrekt svara på frågan är det i många fall nödvändigt att ta hänsyn till det befintliga sammanhanget. I avsaknad av tillräcklig faktainformation är det svårt att svara korrekt på frågan, även om du kan hitta det exakta svaret på frågans delar i bokstavlig mening.

Naturlig språkbehandling – Komma igång

Många datorsystem kunna analysera språket, men samtidigt genomförs en ytlig analys. Detta kan vara vettigt, till exempel för att göra en statistiskt giltig bedömning av trender i förändringar i känslor på stora mängder information. Här är noggrannheten i informationsöverföringen inte särskilt viktig, för även om vi antar att antalet falskt positiva resultat är ungefär lika med antalet falskt negativa resultat, så tar de bort varandra.

Men om alla fall spelar roll, då kan system som arbetar med en ytlig analys av språket inte längre göra sitt jobb normalt. Ett slående exempel på ovanstående kan vara uppgiften för röstassistent något av Mobil enheter. Om du säger "hitta mig en pizza", kommer assistenten att visa en lista över pizzerior. Om du till exempel säger "sök inte efter mig en pizza i Madrid", kommer systemet fortfarande att se ut. Sådana system fungerar genom att identifiera några nyckelord och använda viss uppsättning regler. Resultatet kan vara korrekt givet system regler, men fel.

Djup naturlig språkbehandling

För att lära systemet att analysera komplexa semantiska strukturer, med hänsyn till känslor och andra faktorer, använde experter djup naturlig språkbehandling. Nämligen ett frågesvarssystem för innehållsanalys (Deep Question*Answering, DeepQA). Om större noggrannhet krävs, är det nödvändigt att använda ytterligare metoder naturlig språkbehandling.
IBM Watson är ett djupt naturligt språkbehandlingssystem. När man analyserar en viss fråga, för att ge det korrekta svaret, försöker systemet utvärdera ett så vidast möjligt sammanhang. I det här fallet används inte bara informationen i frågan, utan också informationen i kunskapsbasen.
Skapandet av ett system som kan utföra djup naturlig språkbehandling tillät oss att lösa ett annat problem - analysen av en enorm mängd information som genereras dagligen. Detta är ostrukturerad information, som tweets, meddelanden sociala nätverk, rapporter, artiklar och mer. IBM Watson har lärt sig att använda allt detta för att lösa mänskliga problem.

IBM Watsons kognitiva system

Watson har redan en annan nivå av datorkraft. Systemet kan separera vissa yttranden i naturligt språk och hitta samband mellan dessa yttranden. Samtidigt klarar Watson uppgiften, i många fall till och med bättre än en man, medan databehandlingen är mycket snabbare, utförs arbetet med mycket stora volymer– en person är helt enkelt oförmögen till något sådant.

Huvudegenskaper hos det kognitiva systemet

Systemet fungerar i denna ordning:

1. Efter att ha fått en fråga utför Watson den analysera för att lyfta fram huvuddragen i frågan.

2. Systemet genererar ett antal hypoteser genom att titta igenom korpusen i jakt på fraser som med viss sannolikhet kan innehålla det önskade svaret. För att göra en effektiv sökning i strömmarna av ostrukturerad information behövs helt andra beräkningsmöjligheter * de kallas kognitiva system. (Jag förstår inte riktigt den sista meningen och asteriskens roll)

3. Systemet utför en djupgående jämförelse av språket i frågan och språket för vart och ett av de möjliga svaren, med tillämpning av olika algoritmer logisk slutledning.

Det här är ett svårt stadium. Det finns hundratals slutledningsalgoritmer, och de fungerar alla olika jämförelser. Vissa söker till exempel efter matchande termer och synonymer, andra tar hänsyn till tidsmässiga och rumsliga egenskaper, medan andra analyserar relevanta källor till kontextuell information.

4. Varje slutledningsalgoritm ger en eller flera poäng som indikerar i vilken utsträckning ett eventuellt svar följer av frågan inom det område som täcks av algoritmen.

5. Varje poäng viktas sedan av en statistisk modell som fångar hur väl algoritmen lyckades identifiera logiska samband mellan två liknande fraser från det området under Watsons "träningsperiod". Detta statistisk modell kan användas senare för att fastställa Watsons övergripande förtroende för att ett möjligt svar följer av frågan.

6. Watson upprepar processen för varje möjligt alternativ svara tills han hittar svar som är mer sannolikt att vara korrekta än de andra.

Som nämnts ovan, för rätt svar på frågan måste systemet referera till ytterligare källor data. Det kan vara läroböcker, manualer, FAQ, nyheter och allt annat. Watson bearbetar enorma mängder information på några sekunder för att få rätt svar. Samtidigt kontrolleras också det hittade innehållet, föråldrad och värdelös data filtreras bort.

Element i det kognitiva systemet

Watson härleder den allmänna innebörden av texten från den mottagna informationen, från den ytterligare basen. Detta använder titeln på dokumentet, en del av dokumentets text eller hela texten.

Kognitiva system, deras sätt att samla in, komma ihåg och hämta information liknar hur en person analyserar information. Samtidigt kan kognitiva system överföra information och agera. Här är exempel på beteendekonstruktioner som används i det här fallet:

Förmåga att skapa och testa hypoteser;
- förmågan att dela upp i komponenter och bygga logiska slutsatser om språket;
- förmåga att extrahera och utvärdera användbar information(såsom datum, platser och egenskaper).

Utan dessa förmågor kommer varken en dator eller en person att kunna avgöra det korrekta förhållandet mellan frågor och svar.
Kognitiva processer är fler hög order kan nå hög nivå förståelse, med fokus på de grundläggande beteendena. För att förstå något måste vi kunna bryta ner information i mindre element som är ganska välordnade på den aktuella nivån. Fysiska processer hos människor fortskrider på ett helt annat sätt än processer i kosmisk skala eller på nivå med elementarpartiklar. På liknande sätt är kognitiva system utformade för att fungera på mänsklig nivå, även om de representerar en stor variation av människor.

I detta avseende börjar förståelse av språket med att förstå mer enkla regler språk - inte bara formell grammatik, utan också informella konventioner som observeras i dagligt bruk.

Vad är allt detta till för?

Nu kan IBM Watsons kognitiva system, tack vare många års träning och förbättring, utföra arbete på det mesta olika områden. Här finns medicin, matlagning, och lingvistik, och att lösa affärsproblem med vetenskapliga problem.

Inledningsvis hade specialister ett val - att göra systemet universellt eller specialiserat. Vart och ett av alternativen har sina egna fördelar och nackdelar, men valet gjordes i riktning mot universalitet.

Företaget har många gånger varit övertygat om riktigheten av det perfekta valet - tidigare

) är en IBM-superdator utrustad med ett artificiell intelligenssystem, som skapades av en grupp forskare under ledning av David Ferrucci. Skapandet är en del av DeepQA-projektet. Watsons huvuduppgift är att förstå frågor formulerade i naturligt språk och hitta svar på dem i databasen. Uppkallad efter IBM-grundaren Thomas Watson.

Deltagande i Jeopardy!

I februari 2011, för att testa Watsons förmågor, deltog han i tv-programmet Jeopardy! (Rysk analog - Eget spel). Hans rivaler var Brad Rutter - ägaren till den största vinsten i programmet, och Ken Jennings - rekordhållaren för den längsta obesegrade serien. Watson vann med $1 miljon, medan Jennings och Rutter fick $300 000 respektive $200 000.

Plattform

Watson består av 90 Power7 750-servrar, som var och en innehåller 4 åttakärniga POWER7-processorer. Total Bagge Watson över 15 terabyte.

Systemet hade tillgång till 200 miljoner sidor med strukturerad och ostrukturerad information på 4 terabyte, bl.a. Full text Wikipedia. Under spelet hade Watson inte tillgång till Internet.

Framtiden för projektet

IBM arbetar med Nuance Communications för att utveckla en produkt under de kommande två åren för att hjälpa diagnostisera och behandla patienter. Andra användningsområden övervägs också, som att utvärdera försäkringar eller energieffektivitet.

Watsons historia började 2006, när David Ferrucci, senior manager för semantisk analys på IBM, började testa en av de mest kraftfulla superdatorer företag, som ockuperade en av topplinjerna av de 500 mest produktiva maskinerna i världen. Ferucci bestämde sig för att testa hur effektivt maskinen skulle klara av de uppgifter som "naturligt språk" ställer, och bjöd in henne att svara på 500 frågor som ställdes i den redan avslutade Jeopardy! Resultaten var katastrofala: jämfört med live-spelare, "tryckte maskinen inte på knappen" tillräckligt snabbt (det vill säga den var redo att svara), och i fallet när den fortfarande kunde konkurrera med människor, gjorde antalet korrekta svar inte överstiga 15 %

Ferrucci blev intresserad av orsakerna till detta beteende hos superdatorn, och som ett resultat kunde han 2007 övertyga IBM-ledningen att ge honom ett team på 15 personer och 3 till 5 år för att skapa en effektiv automatiskt system kan svara på informella frågor. Ett sådant system skulle vara användbart för alla typer av callcenter, helpdesk och andra tjänster som betjänar kunder. IBM har redan haft en framgångsrik meritlista med att bygga en maskin som kan konkurrera med mänsklig intelligens – vi pratar om superdatorn Deep Blue, som 1997 besegrade schackvärldsmästaren Garry Kasparov. Denna seger gjorde stor publicitet för IBM, men det var inte möjligt att hitta en kommersiell applikation för en sådan installation. När det gäller systemet med automatiska svar på frågor är den kommersiella potentialen ganska uppenbar.

Grundläggande skillnad Watson från Deep Blue ligger i det faktum att om schackmaskinen hanterar strikt logiska spelregler, så ställs maskinen som känner igen "naturligt tal" inför mycket mer komplexa regler för språket och många förvrängningar och avvikelser från dem. Men den största svårigheten ligger i att människor, utan att inse det, kommunicerar inom sitt kulturella och sociala sammanhang. Samtalstalet är fullt av antydningar, anspelningar och konnotationer, referenser till vissa fakta, begrepp och fenomen som är gemensamma för en viss social miljö. Bland dem finns religiösa idéer och politiska övertygelser och alla slags konstverk - från böcker och målningar till filmer och datorspel.

För effektiv bearbetning av sådan information används statistiska algoritmer som gör det möjligt att, genom att analysera en mängd olika dokument, upprätta en koppling olika begrepp tillsammans. Enkelt uttryckt avgör det vilka ord som oftast används tillsammans. Till exempel förknippas "Kremlin" oftare med orden "Ryssland", "Moskva", lite mindre ofta med "Kazan", "Nizjnij Novgorod", ännu mindre ofta med "katedral", "ikon" etc. Även om dessa algoritmer kända under en lång tid, blev det möjligt att fullt ut tillämpa dem först under det senaste decenniet - efter en dramatisk ökning av produktiviteten datavetenskap och minska kostnaderna för enheter för lagring av enorma mängder data.

Ferruccis team laddar ner miljontals alla typer av dokument till IBM Watsons minne - läroböcker, uppslagsverk, referensböcker, skönlitteratur och religiös litteratur. För att analysera frågor används mer än hundra algoritmer samtidigt som erbjuder hundratals möjliga lösningar. Sedan utvärderar andra algoritmer tillförlitligheten hos potentiella svar, filtrerar bort de som är omöjliga på grund av objektiva skäl (till exempel avvikelser mellan datumet för händelsen och skådespelarnas levnadsår) och de som är osannolika. Ju fler identiska svar som tas emot, desto större är sannolikheten att de är korrekta - under spelets gång visar resultattavlan ett betyg på flera av de mest sannolika svaren, förutom det vanligaste.

År 2008 hade IBM Watson flyttat från kategorin "förlorare" till topplinjerna i det så kallade "molnet av vinnare", bestående av personer som i 50 % av fallen var de första att trycka på knappen, vilket signalerade att beredskap att svara, och sedan gav de i 85-95% av fallen rätt svar . IBM kom till och med överens med tillverkarna av Jeopardy om att hålla en speciell serie spel hösten 2010 med deltagande av Watson och vinnarna från tidigare år. För att förbereda sig för dessa spel (det vill säga för att förbättra algoritmerna) återskapades en ungefärlig interiör av frågesportstudion och tester genomfördes med deltagande av livespelare och presentatören. Samtidigt ger "Watson" som väntat sina svar högt med en syntetiserad datorröst, vilket roar de närvarande mycket.

Under "träningen" visade det sig vara ett intressant faktum: trots inte all potential hos Watson kan han inte bara vinna de flesta matcher, utan också förlora mer än hälften av dem. Det finns flera skäl: från "hans majestät fallet" (det finns situationer när motståndaren kan vinna genom att helt enkelt höja insatserna, lämna bilen i konkurs) till reglernas detaljer. Konstigt nog, men en person kan trycka på en knapp snabbare än en maskin, och detta beror på spelets regler, som inte kan ändras.

Faktum är att varje fråga visas på skärmen och läses upp av presentatören, och du kan klicka på knappen först efter att du har läst frågan. Watson får in frågetext i elektroniskt format samtidigt med dess utdata till skärmen, men även då hinner den inte komma till en färdig lösning snabbare än en människa. Medan värden läser frågan, som tar sex till sju sekunder, kan en erfaren spelare redan uppskatta sina chanser att ge rätt svar och är redo att trycka på knappen inom några tiotals millisekunder. Reglerna tillåter ytterligare fem sekunder för nästa svar.

Genom att trycka på knappen riskerar en person: om han inte ger rätt svar på frågan för 100 enheter, kommer hans virtuella konto att vara tomt med samma belopp. Datorn är inte benägen att ta risker och ger svar först efter att alla beräkningar är gjorda och endast om den har tillräckligt med information för att bedöma tillförlitligheten och sannolikheten för att detta svar är korrekt. Hur det ser ut under spelets gång kan du se i videon. Genom att ta risker kan en livespelare vinna genom att komma ihåg det rätta svaret på de 11-12 sekunder som står till hans förfogande.

I en lite mer formaliserad situation än en frågesport kan Watsons algoritmer ge mycket mer förutsägbara och korrekta svar. I synnerhet har chefen för IBM:s forskningsavdelning, John Kelly, för avsikt att skapa en medicinsk version av denna enhet under det inofficiella namnet Watson M.D. Ett sådant system skulle hjälpa läkare att snabbt ta rätt beslut med hänsyn till den enorma mängden data om patienten, som är fysiskt omöjlig att alltid ha i minnet. "Watson" kan mycket väl ersätta live-operatörer i dator och telefontjänster v detaljhandeln, bank och transport.

Kostnaden för ett IBM Watson-klasssystem kan idag vara flera miljoner dollar, eftersom det kräver åtminstone en IBM superdator för en miljon dollar. Kelly tror att under de kommande tio åren kan sådan teknik implementeras på en mycket billigare server, och i framtiden kommer ett sådant program att fungera på en dator som inte är dyrare än modern bärbar dator.

Menande engelska språket kan ta sig an IBM Watson online på The New York Times.

Superdatorn IBM Watson är planerad att användas i tekniska supporttjänster istället för live-operatörer. Men alla dessa uppgifter är mer relaterade till att hitta rätt svar på användarförfrågningar baserat på känd information. IBM anser att den verkliga Artificiell intelligens ska kunna hitta kreativa lösningar, skapa och uppfinna nya saker, och inte bara analysera det gamla.

För att utveckla Watsons kreativa förmågor valde hans skapare de kulinariska konsterna. Detta är en mycket bekväm testplats: matlagning är en mycket "mänsklig", intuitiv process, som är dåligt mottaglig för algoritmisering och standardisering. Och vem som helst på gatan kan uppskatta resultatet. Mandelchokladkakor i spansk stil, ecuadoriansk jordgubbsdessert, grillade tomater på rostat bröd med saffran - dessa och andra rätter skapade av Watson har redan tillagats och ätits med nöje under experimenten. Och för ett par veckor sedan publicerades ett förtryck av en artikel som beskrev de algoritmer och matematiska modeller som Watson använder för att skapa originalrecept.

Varje kreativ lösning måste samtidigt uppfylla två kriterier - att vara ny och att hålla hög kvalitet. Nyhet är relativt lätt att uppnå, helt enkelt genom att kombinera ingredienser och bearbetningstekniker. Men med kvalitet är situationen mycket mer komplicerad. Att lära datorn att förstå vad som blir smak, arom, konsistens och utseende rätter är extremt svåra.

De första uppgifterna för Watson var flera miljoner recept som samlades in på Internet. De kördes genom beprövade naturliga språkbehandlingsalgoritmer som användes för att vinna frågesporten och lära Watson medicin. Från Wikipedia extraherades information om typiska ingredienser och bearbetningsmetoder som är karakteristiska för köken hos olika folk i världen. Slutligen fick Watson en grundlig kunskap om kemi och fysiologi hos människans uppfattning om smak och lukt.

Nya recept genererades på grundval av befintliga med en genetisk algoritm; värdena nyhet, behaglighet och kompatibilitet användes som fitnessfunktioner.

Matematisk modell Receptnyhetspoäng är baserade på Bayes teorem, med den så kallade "Bayesian surprise"-metoden, som ursprungligen utvecklades för att modellera tittarens beteende när de tittar på en video. I ett nötskal är essensen av metoden att skillnaden mellan a priori och posterior sannolikhet att möta en viss kombination av produkter i receptutrymmet mäts när en ny läggs till den. Således är kombinationer av nötter och choklad eller senap och korv helt banala och orsakar nästan ingen förändring av sannolikheterna för olika kombinationer. Men korvar i choklad kommer att påverka dessa sannolikheter mycket mer signifikant.

För att bedöma behagligheten användes främst kemi. Genom att känna till produkternas kemiska sammansättning och i vilken ordning de blandades och bearbetades, räknade datorn ut vilka ämnen som skulle avgöra rättens smak och lukt. Intressant nog visade sig lukten vara mycket viktigare än smaken på rätten. Vår uppfattning om smak är mycket starkt förknippad med lukt och arom. En person skiljer bara några få grundläggande smaker - surt, sött, salt, bittert. I olika kulturer urskiljs flera mer grundsmaker, till exempel tårta eller umami. Men variationen av dofter är mycket större och de är inte begränsade till enkla grundkombinationer.

Slutligen förlitade sig bedömningen av matparning också på en solid vetenskaplig grund, i synnerhet på den gemensamma studien av amerikanska och brittiska forskare "Fragrance Networks and Principles of Food Pairing", där cirka 50 000 recept analyserades och kartor över typiska matparningar. för kök byggdes. olika regioner.

Som ett resultat skapades en applikation där du kan ställa in en uppsättning produkter, en nationell stil och en typ av maträtt, varefter Watson utfärdade en uppsättning recept som kan sorteras efter graden av nyhet, behaglighet och kompatibilitet. Förutom enskilda rätter vet Watson hur man skapar hela menyer, uppnår variation och rätt kombinationer av rätter genom att använda tematisk modellering. Detta är sättet att bygga en samlingsmodell textdokument, som delar upp samlingen i ämnen och bestämmer vilket ämne varje dokument tillhör. Watson tillämpar denna modell på recept - som nyckelord individuella ingredienser fungerar som dokument - själva recepten.

Moderna superdatorer är flera serverdatorer ansluten till ett nätverk. Hastigheten för deras beräkningar mäts i petaflops.

  • 1 petaflops = 10 15 operationer per sekund

Den mänskliga hjärnans genomsnittliga prestanda är 20 petaflops. Endast ett fåtal superdatorer i världen har bra prestanda, men ingen av dem kan ersätta den mänskliga hjärnan.

För närvarande finns det flera hundra superdatorer i världen. De mest kraftfulla faller in i den årliga TOP-500-betyget. Under 2016 toppades denna ranking av kinesiska Sunway TaihuLight. Dessförinnan hade han även ledarskapet i tre år Kinesisk dator Tianhe-2. IBM har två superdatorer i denna klassificering: Mira och Sequoia. Den sistnämnde var ledare 2012, och ligger nu på fjärde plats.

Andrey Filatov ( generaldirektör IBM i Ryssland och OSS-länderna) om kognitiva teknologier

Dr. Watson är den mest kända superdatorn

Den största fördelen med Watson är att den förstår frågor på naturligt språk och besvarar dem genom att analysera data. 2011 slog Watson folket i frågesporten Jeopardy!(Rysk analog - "Eget spel").

Watson är en uppsättning applikationsteknologier som kallas " molntjänster". Watson används mest aktivt inom medicin och hjälper till att diagnostisera och behandla cancer. Dess minne innehåller mer än 600 000 medicinska rapporter. Den används även i finansiell sektor, juridik, gästfrihet och många andra branscher. Dessutom kan han till och med hålla en konversation med kändisar.

Ett fel uppstod under nedladdningen.

Watson kommunicerar med den amerikanska tennisspelaren Serena Williams

Ansökningar för IBM Watson

Utbildning. Skolor i USA testar Teacher Advisor med Watson, ett kognitivt verktyg som ger råd om hur man kan förbättra läroplaner och anpassa inlärningsprogram.

Vetenskapen. Johnson & Johnson använder Watson för att analysera vetenskaplig litteratur. Från en kolossal mängd material väljer han det nödvändiga för studien, och studien kan utföras mycket snabbare och mer effektivt.

Säkerhet. Valsståltillverkaren North Star BlueScope Steel kommer att använda Watsons Internet of Things-system för att skapa lösningar för att skydda arbetare i extrema situationer. Arbetare kommer också att bära enheter för att samla in och bearbeta data. Vid farliga förhållanden för människor kommer information omedelbart att skickas till North Stars ledning.

Cybersäkerhet. Cyberkriminella hackar Informationssystem företag och sedan sälja tillgång till dem på det "svarta" Internet. Om i en del Globen det var ett misslyckande eller bedrägeri, Watson system kommer att varna andra användare av detta system.

Medicinen. University of North Carolina och 12 andra cancercentra använder Watson för att analysera patienternas DNA för att utveckla personliga behandlingar.

Ingen läkare kan analysera ett så stort urval av information, bara en dator

En dator kan göra mycket, åtminstone vad gäller informationsbehandling. Men att lära honom naturligt språk är en extremt icke-trivial uppgift. Denna utmaning låg till grund för IBM DeepQA-projektet, som resulterade i födelsen av en kognitiv teknologi som heter IBM Watson, för att hedra Thomas Watson, som låg i spetsen för grundandet av IBM.

Det är inte svårt att förklara vad Watson är – det är ett kognitivt system som kan kommunicera med en person på naturligt språk. Det vill säga förstå skriftligt tal och svara på samma sätt. Och om IBM hade begränsat sig till detta skulle Watson inte ha förblivit något annat än en experimentell uppställning. Men ett jobb hittade han snabbt och för många företag blev han en verkligt oumbärlig anställd.

Det visade sig att detta kunnande kan appliceras varhelst det krävs för att bearbeta stora mängder ostrukturerad data. För kvalitet och snabba analyser sådana data måste de bearbetas med alla moderna tillgängliga verktyg datateknik: maskininlärning, beräkningslingvistik, ontologiska konstruktioner och högpresterande beräkningar. Det är vad IBM Watson är designad för.

IBM Watsons kärnkompetenser kan sammanfattas i fyra punkter:

  • Förstå naturligt språk.
  • Att bygga hypoteser utifrån bearbetad data.
  • Utbildning på arbetsplatsen.
  • Att göra en rekommendation, åtfölja den med de fakta som slutsatsen bygger på.

En person är inte kapabel att analysera en verkligt stor mängd data på en rimlig tid, och i alla fall måste han kassera det mesta av informationen och framhäva, enligt hans åsikt, det viktigaste. Fel är oundvikliga här, dessutom har kasserad data betydelse och bör påverka resultatet. Och i denna aspekt är Watson många gånger överlägsen en person: den tar hänsyn till allt, inte en enda känt faktum kommer inte att gå ouppskattat.

Det första offentliga testet av systemet var deltagandet i det amerikanska spelet Jeopardy! (Rysk analog - "Eget spel"). Utan internetanslutning, med hjälp av öppna källor information, såsom texten i hela Wikipedia, allmänna uppslagsverk och ordböcker, kunde Watson slå de två rekordhållarna i detta spel.

Vi bjuder in dig till IBM Client Center för ett seminarium Watson Analytics och Hi-tech i analys!