Суперкомпютърът IBM Watson спечели игровото шоу Jeopardy (руският му аналог - Own Game). IBM Watson: на какво е способен най-известният суперкомпютър

3 септември 2015 г. в 11:34 ч

Когнитивната система на IBM Watson: Принципи на работа с естествен език

  • блог на IBM,
  • Алгоритми

IBM Watson е една от първите когнитивни системи в света. Тази система е много способна, благодарение на което възможностите на Watson се използват в много области – от готвене до прогнозиране на аварии в населените места. Като цяло повечето от възможностите на Watson не са нещо уникално, но взети заедно, всички тези възможности представляват много мощен инструмент за решаване на различни проблеми.

Например - разпознаване на естествен език, динамично обучение на системата, изграждане и оценка на хипотези. Всичко това позволи на IBM Watson да се научи как да дава директни правилни отговори (с висока степен на надеждност) на въпроси на оператора. В същото време когнитивната система е в състояние да използва за работа големи масиви от глобални неструктурирани данни, Big Data. Какви са основните принципи за това как IBM Watson работи с езика? Повече за това в продължението.

Основните трудности при разпознаването на естествен език

За човек езикът е средство за изразяване на мисли. Ние използваме език, за да предадем нашето мнение, всякакви данни и информация. Можем да правим прогнози и да формираме теории. Именно езикът е крайъгълният камък на нашето съзнание. В същото време тук е парадоксът, човешкият език е много неточен.

Много термини са нелогични и може да бъде много трудно за компютърните системи да ни разберат. Например, как може да има тънък глас? Как можеш да изгориш от срам? За машина това е проблем, но за човек е съвсем обикновено нещо. Факт е, че за да се отговори правилно на въпрос, в много случаи е необходимо да се вземе предвид съществуващият контекст. При липса на достатъчно фактическа информация е трудно да се отговори правилно на въпроса, дори ако можете буквално да намерите точния отговор на елементите на въпроса.

Обработка на естествен език - Първи стъпки

Много компютърни системи са способни да анализират език, но правят повърхностен анализ. Това може да има смисъл, например, за да се предостави статистически валидна оценка на тенденциите в промените в емоциите върху големи количества информация. Тук точността на предаване на информация не е много важна, защото дори да приемем, че броят на фалшиво положителните резултати е приблизително равен на броя на фалшиво отрицателните резултати, тогава те се компенсират взаимно.

Но ако всички случаи имат значение, тогава системите, които работят с повърхностен анализ на езика, вече не могат да вършат нормално работата си. Ярък пример за горното може да бъде задача за гласов асистент на някое от мобилните устройства. Ако кажете „намери ми пица“, асистентът ще покаже списък с пицарии. Ако кажете „не ми търсете пица в Мадрид“, например, системата ще продължи да търси. Такива системи работят чрез идентифициране на определени ключови думи и използване на специфичен набор от правила. Резултатът може да е точен при дадената система от правила, но не и точен.

Дълбока обработка на естествен език

За да научат системата да анализира сложни семантични структури, като се вземат предвид емоциите и други фактори, специалистите използваха дълбока обработка на естествения език. А именно система въпроси-отговори за анализ на съдържанието (Deep Question * Answering, DeepQA). Ако се изисква по-голяма прецизност, тогава трябва да се използват допълнителни методи за обработка на естествен език.
IBM Watson е дълбока система за обработка на естествен език. Когато анализира конкретен въпрос, за да даде правилния отговор, системата се опитва да оцени възможно най-широк контекст. В този случай се използва не само информацията за въпроса, но и данните от базата знания.
Създаването на система, способна за дълбока обработка на естествения език, направи възможно решаването на друг проблем - анализа на огромно количество информация, която се генерира ежедневно. Това е неструктурирана информация като туитове, публикации в социалните медии, доклади, статии и др. IBM Watson се научи да използва всичко това за решаване на проблеми, определени от човека.

Когнитивна система IBM Watson

Watson извежда изчислителната мощност на друго ниво. Системата е в състояние да отдели определени твърдения на естествен език и да намери връзки между тези твърдения. В същото време Уотсън се справя със задачата, в много случаи дори по-добре от човек, докато обработката на данни е много по-бърза, работата се извършва с много по-големи обеми - човек просто не е в състояние да направи това.

Основните характеристики на когнитивната система

Системата работи в следния ред:

1. При получаване на въпрос Уотсън го анализира, за да подчертае основните характеристики на въпроса.

2. Системата генерира редица хипотези, като сканира корпуса в търсене на фрази, които с известна степен на вероятност може да съдържат искания отговор. За ефективно търсене в потоци от неструктурирана информация са необходими напълно различни изчислителни възможности * те се наричат ​​когнитивни системи. (Наистина не разбирам последното изречение и ролята на звездичката)

3. Системата извършва дълбоко сравнение на езика на въпроса и езика на всеки от възможните варианти за отговор, като използва различни алгоритми за извод.

Това е труден етап. Има стотици алгоритми за извод и всички те извършват различни сравнения. Например, някои търсят съвпадащи термини и синоними, някои разглеждат времеви и пространствени характеристики, докато други търсят подходящи източници на контекстуална информация.

4. Всеки алгоритъм за извод поставя една или повече марки, показващи степента, до която възможният отговор следва от въпроса, в областта, която се разглежда от този алгоритъм.

5. След това всеки получен резултат се претегля според статистически модел, който улавя колко добре се е представил алгоритъмът при идентифициране на логически връзки между две подобни фрази от този домейн по време на „периода на обучение“ на Уотсън. След това този статистически модел може да се използва за определяне на общото ниво на увереност на Уотсън, че възможен отговор следва от въпрос.

6. Watson повтаря процеса за всеки възможен отговор, докато не намери отговори, които е по-вероятно да бъдат правилни от другите.

Както бе споменато по-горе, за правилния отговор на въпроса, системата трябва да се позовава на допълнителни източници на данни. Това могат да бъдат учебници, ръководства, често задавани въпроси, новини и така нататък. Watson обработва огромни количества информация за броени секунди, за да получи правилния отговор. В същото време намереното съдържание също се проверява, елиминират се остарели и безполезни данни.

Елементи на когнитивната система

Уотсън извежда общото значение на текста от получената информация, от допълнителна база данни. Това използва заглавието на документа, част от текста в документа или целия текст.

Когнитивните системи, техните начини за събиране, запомняне и извличане на информация са подобни на това как човек анализира информация. В този случай когнитивните системи могат да предават информация и да действат. Ето примери за поведенчески конструкции, които се използват в този случай:

Умение за създаване и тестване на хипотези;
- способност за разбиване на компоненти и изграждане на логически изводи за езика;
- способността за извличане и оценка на полезна информация (като дати, местоположения и характеристики).

Без тези способности нито компютърът, нито човекът няма да могат да определят правилната връзка между въпросите и отговорите.
Когнитивните процеси от по-висок порядък могат да постигнат високо ниво на разбиране, като се фокусират върху основното поведение. За да разберем нещо, трябва да можем да разделяме информацията на по-малки елементи, които са разумно добре подредени на въпросното ниво. Физическите процеси при хората протичат по съвсем различен начин от процесите в космически мащаб или на ниво елементарни частици. По същия начин когнитивните системи са проектирани да работят на човешко ниво, въпреки че представляват огромно разнообразие от хора.

В тази връзка разбирането на езика започва с разбирането на по-простите правила на езика – не само формалната граматика, но и неформалните конвенции, които се спазват в ежедневната употреба.

за какво е всичко това?

Сега когнитивната система на IBM Watson, благодарение на дългогодишно обучение и усъвършенстване, може да извършва работа в голямо разнообразие от области. Тук има и медицина, и готварство, и лингвистика, и решаване на бизнес проблеми с научни проблеми.

Първоначално специалистите имаха избор - да направят системата универсална или специализирана. Всяка от опциите има своите предимства и недостатъци, но изборът беше направен към гъвкавост.

Компанията вече се е убеждавала в правилността на перфектния избор многократно – и преди

) е суперкомпютър на IBM, оборудван със система за изкуствен интелект, която е създадена от група изследователи, ръководени от Дейвид Феручи. Създаването му е част от проекта DeepQA. Основната работа на Watson е да разбира въпросите на естествения език и да намира отговори на тях в база данни. Кръстен на основателя на IBM Томас Уотсън.

Участие в "Jeopardy!"

През февруари 2011 г., за да тества възможностите на Уотсън, той участва в телевизионното шоу Jeopardy! (Руски аналог - Собствена игра). Негови съперници бяха Брад Рътър - победителят в най-голямата победа в програмата и Кен Дженингс - рекордьорът за най-дълго непобедено серия. Уотсън спечели, като получи 1 милион долара, докато Дженингс и Рътър получиха съответно 300 и 200 хиляди долара.

Платформа

Watson се състои от 90 сървъра Power7 750, всеки от които съдържа 4 осемядрени процесора POWER7. Общата RAM памет на Watson е над 15 терабайта.

Системата имаше достъп до 200 милиона страници структурирана и неструктурирана информация от 4 терабайта, включително пълния текст на Wikipedia. По време на играта Уотсън нямаше достъп до интернет.

Бъдещето на проекта

IBM работи с Nuance Communications, за да разработи продукт през следващите две години, който да помогне за диагностицирането и лечението на пациентите. Обмислят се и други употреби, като оценка на застрахователни полици или енергийна ефективност.

Историята на Watson започва през 2006 г., когато Дейвид Феручи, старши мениджър на отдела за семантичен анализ на IBM, започва да тества един от най-мощните суперкомпютри на компанията, една от 500-те най-продуктивни машини в света. Ferucci реши да опита колко ефективно машината ще се справи със задачите, поставени от „естествения език“, и я покани да отговори на 500 въпроса, зададени във вече провежданите програми за опасност! Резултатите се оказаха катастрофални: в сравнение с играчите на живо, колата не "натисна бутона" достатъчно бързо (тоест беше готова да отговори), а в случай, когато все още можеше да се конкурира с хората, броят верните отговори не надвишават 15%

Феручи се интересува от причините за това поведение на суперкомпютъра и в резултат на това през 2007 г. успява да убеди ръководството на IBM да му даде екип от 15 души и от 3 до 5 години да създаде ефективна автоматична система, способна да отговаряйки на неформализирани въпроси. Такава система би била полезна за всички видове кол центрове, информационни центрове и всякакви други услуги, обслужващи клиенти. IBM вече има успешен опит в изграждането на машина, която съперничи на човешкия интелект - суперкомпютърът Deep Blue, който победи световния шампион по шах Гари Каспаров през 1997 г. Тази победа направи голяма реклама за IBM, но такава настройка никога не беше намерена в търговската мрежа. В случай на система за автоматично отговаряне на въпроси търговският потенциал е доста очевиден.

Основната разлика между Watson и Deep Blue е, че ако шахматната машина се занимава със строго логически правила на играта, тогава машина, която разпознава „естествената реч“, е изправена пред много по-сложни езикови правила и многобройни изкривявания и отклонения от тях. Но най-голямото предизвикателство е, че хората, без да го осъзнават, общуват в рамките на своя културен и социален контекст. Разговорната реч е пълна с намеци, алюзии и конотации, препратки към определени факти, понятия и явления, общи за определена социална среда. Те включват религиозни вярвания, политически убеждения и всякакви произведения на изкуството – от книги и картини до филми и компютърни игри.

За ефективната обработка на такава информация се използват статистически алгоритми, които позволяват чрез анализ на голямо разнообразие от документи да се установи връзката на различни понятия помежду си. Просто казано, той определя кои думи се използват най-често заедно. Например „Кремъл“ по-често се свързва с думите „Русия“, „Москва“, малко по-рядко с „Казан“, „Нижни Новгород“, още по-рядко с „катедрала“, „икона“ и т.н. Въпреки че тези алгоритми са известни от дълго време, пълното им използване стана възможно едва през последното десетилетие - след драматично увеличение на производителността на компютъра и намаляване на цената на устройствата за съхранение на огромни количества данни.

Екипът на Феручи зарежда в паметта на IBM Watson милиони всякакви документи – учебници, енциклопедии, справочници, художествена и религиозна литература. За анализиране на въпроси се използват повече от сто алгоритма едновременно, предлагащи стотици възможни решения. След това други алгоритми оценяват надеждността на потенциалните отговори, като филтрират тези, които са невъзможни поради обективни причини (например несъответствие между датата на събитието и годините на живот на актьорите) и малко вероятните. Колкото повече еднакви отговори се получават, толкова по-голяма е вероятността те да са верни - в хода на играта на таблото се показва оценка от няколко от най-вероятните отговора, в допълнение към най-често срещаните.

До 2008 г. IBM Watson се премести от категорията на „губещи“ към горните редове на така наречения „облак от победители“, състоящ се от хора, които в 50% от случаите имат време да натиснат първо бутона, като сигнализират за своите готовност за отговор, а след това в 85-95% от случаите да дадете правилния отговор. ... IBM дори преговаря с продуцентите на Jeopardy да бъде домакин на специална серия от игри през есента на 2010 г. с участието на Watson и предишни победители. За да се подготвим за тези игри (тоест всъщност за подобряване на алгоритмите), беше пресъздаден приблизителен интериор на студиото за викторина и започнаха тестове с участието на играчи на живо и водещ. В същото време, както се очаква, "Уотсън" дава отговорите си на глас със синтезиран компютърен глас, което доста забавлява публиката.

По време на „тренировката“ беше разкрит интересен факт: въпреки не целия потенциал на Уотсън, той не само може да спечели повечето от игрите, но и да загуби повече от половината от тях. Има няколко причини: от „неговото величие на шанса“ (възможни са ситуации, когато опонентът може да спечели просто като вдигне лихвите, оставяйки колата в несъстоятелност) до спецификата на правилата. Колкото и да е странно, но човек може да натисне бутон по-бързо от кола и това се дължи на правилата на играта, които не могат да бъдат променени.

Факт е, че всеки въпрос се показва на екрана и се чете от водещия и можете да натиснете бутона само след като въпросът бъде прочетен. Уотсън получава текста на въпроса в електронен вид едновременно с извеждането му на екрана, но въпреки това той няма време да стигне до готово решение по-бързо от човек. Докато водещият чете въпроса, което отнема шест до седем секунди, опитен играч вече може да прецени шансовете си да даде правилния отговор и е готов да натисне бутона за десетки милисекунди. Правилата дават още пет секунди за следващия отговор.

С натискане на бутона човек рискува: ако не даде правилния отговор на въпроса за 100 единици, неговата виртуална сметка ще бъде празна за същата сума. Компютърът не е склонен да поема рискове и дава отговори само след като са направени всички изчисления и само ако разполага с достатъчно информация за оценка на надеждността и вероятността този отговор да е правилен. Как изглежда по време на мача може да видите на видеото. С риск играчът на живо може да спечели, като запомни необходимия отговор за 11-12 секунди на негово разположение.

В малко по-формализирана ситуация от викторина, алгоритмите на Уотсън са в състояние да предоставят много по-предвидими и точни отговори. По-специално, ръководителят на изследователския отдел на IBM Джон Кели възнамерява да създаде медицинска версия на това устройство под неофициалното име Watson M.D. Такава система би помогнала на лекарите бързо да вземат правилните решения, като вземат предвид огромното количество данни за пациентите, които е физически невъзможно да се съхраняват винаги в паметта. Watson може да замени касите на живо в компютърните и телефонните услуги в търговията на дребно, банкирането и транспорта.

Цената на системата от клас IBM Watson днес може да бъде няколко милиона долара, тъй като за работа е необходим поне един суперкомпютър на IBM за един милион долара. Кели смята, че през следващите десет години подобна технология може да бъде внедрена на много по-евтин сървър, а в бъдеще подобна програма ще работи на компютър, не по-скъп от модерен лаптоп.

Англоговорящите могат да се бият с IBM Watson онлайн в The New York Times.

Планира се суперкомпютърът IBM Watson да бъде използван в услугите за техническа поддръжка вместо на живи оператори. Всички тези задачи обаче са по-скоро свързани с намирането на правилния отговор на потребителските заявки въз основа на известна информация. IBM вярва, че истинският изкуствен интелект трябва да може да намира творчески решения, да създава и изобретява нови, а не само да анализира старото.

За да развият творческите способности на Уотсън, създателите му избраха кулинарното изкуство. Това е много удобен полигон: готвенето е много „човешки“, интуитивен процес, слабо податлив на алгоритми и стандартизация. И всеки човек от улицата е в състояние да оцени резултата. Бисквити с шоколад и бадеми по испански, десерт от еквадорски ягоди, домати на скара на тост с шафран – тези и други ястия, създадени от Уотсън, вече са приготвени и изядени с удоволствие по време на експериментите. Преди няколко седмици беше публикуван препринт на статията, описващ алгоритмите и математическите модели, които Уотсън използва за създаване на оригинални рецепти.

Всяко креативно решение трябва едновременно да отговаря на два критерия – да е ново и да е с високо качество. Сравнително лесно е да се постигне новост просто чрез комбиниране на съставки и техники за обработка. Но с качеството ситуацията е много по-сложна. Изключително трудно е да научите компютъра да разбере какъв ще бъде вкусът, ароматът, текстурата и външният вид на ястието.

Първоначалните данни за Уотсън бяха няколко милиона рецепти, събрани в интернет. Те бяха управлявани чрез доказани алгоритми за обработка на естествен език, които бяха използвани за спечелване на викторината и обучение на Уотсън за медицината. От Уикипедия е извлечена информация за типичните съставки и техники на обработка, които са характерни за кухните на различните народи по света. И накрая, Уотсън получи задълбочени познания за химията и физиологията на човешкото възприятие за вкус и мирис.

Нови рецепти бяха генерирани на базата на съществуващи с помощта на генетичен алгоритъм, като стойностите на новост, приятност и съвместимост бяха използвани като фитнес функция.

Математическият модел за оценка на новостта на рецепта се основава на теоремата на Байес, използван е т. нар. подход „Байесова изненада“, първоначално разработен за моделиране на поведението на зрителя при гледане на видео. Накратко, същността на метода е, че той измерва разликата между предходната и постериорната вероятност да се срещне определена комбинация от продукти в пространството за рецепти, когато към нея се добави нова. Така че комбинациите от ядки с шоколад или горчица с колбаси са напълно обичайни и не предизвикват почти никаква промяна в вероятностите за различни комбинации. Но наденичките в шоколада ще повлияят много по-значително на тези вероятности.

Използвана е предимно химия за оценка на приятността. Познавайки химичния състав на храните и реда, в който са смесени и обработени, компютърът изчисли кои вещества ще определят вкуса и миризмата на ястието. Интересното е, че миризмата се оказа много по-важна от вкуса на ястието. Нашето възприятие за вкус е много свързано с миризмата и аромата. Човек различава само няколко основни вкуса - кисело, сладко, солено, горчиво. В различните култури има още няколко основни вкуса, например тарт или умами. Но разнообразието от миризми е много по-голямо и те не се ограничават до прости основни комбинации.

И накрая, оценката на съвместимостта на храните се основава и на солидна научна база, по-специално на съвместно изследване на американски и британски учени „Flavor Networks and Food Combination Principles“, което анализира около 50 000 рецепти и изгражда карти за съвместимост на храни, типични за кухните на различни региони....

В резултат на това беше създадено приложение, в което можете да зададете набор от продукти, национален стил и разнообразие на ястие, след което Уотсън издаде набор от рецепти, които могат да бъдат сортирани според степента на новост, приятност и съвместимост. В допълнение към отделни ястия, Watson може да създава цели менюта, като постига разнообразие и правилни комбинации от ястия чрез използването на тематично моделиране. Това е начин за изграждане на модел за колекция от текстови документи, който разделя колекцията на теми и определя към коя тема принадлежи всеки документ. Watson прилага този модел към рецепти – отделните съставки действат като ключови думи, самите рецепти действат като документи.

Съвременните суперкомпютри са няколко сървърни компютъра, свързани към мрежа. Тяхната скорост на изчисление се измерва в петафлопс.

  • 1 петафлопс = 10 15 операции в секунда

Средната производителност на човешкия мозък е 20 петафлопса. Само няколко суперкомпютъра в света имат страхотна производителност, но нито един от тях не може да замени човешкия мозък.

В момента в света има няколкостотин суперкомпютри. Най-мощните са включени в годишния рейтинг TOP-500. През 2016 г. тази класация беше оглавена от китайския Sunway TaihuLight. Преди това китайският компютър Tianhe-2 също държеше лидерството в продължение на три години. IBM има два суперкомпютъра в тази класация: Mira и Sequoia. Последният беше лидер през 2012 г., а сега е на четвърто място.

Андрей Филатов (изпълнителен директор на IBM в Русия и страните от ОНД) за когнитивните технологии

д-р Watson е най-известният суперкомпютър

Основната сила на Watson е, че разбира въпросите на естествен език и отговаря на тях, като анализира данните. През 2011 г. Уотсън победи хората в игрово шоу Опасност!(Руски аналог - "Собствена игра").

Watson е колекция от приложни технологии, наречени "облачни услуги". Watson се използва най-активно в медицината, като помага за диагностициране и лечение на рак. В паметта си има над 600 000 медицински доклада. Използва се и във финансите, правото, хотелиерството и много други индустрии. Освен това дори е в състояние да поддържа разговор със знаменитости.

Възникна грешка по време на изтегляне.

Уотсън разговаря с американската тенисистка Серина Уилямс

Приложения на IBM Watson

Образование.Училищата в САЩ тестват Teacher Advisor с Watson, познавателен инструмент, който предлага съвети за подобряване на учебната програма и персонализиране на учебната програма.

Науката... Johnson & Johnson използва Watson за анализ на научна литература. От колосално количество материали той избира това, което е необходимо за изследване, и изследванията могат да се извършват много по-бързо и по-ефективно.

Безопасност.Производителят на валцувана стомана North Star BlueScope Steel ще използва Интернет на нещата на Watson, за да създаде решения за защита на работниците в екстремни ситуации. Също така работниците ще носят устройства за събиране и обработка на данни. В случай на опасни условия за хората, информацията ще бъде изпратена незабавно до ръководството на North Star.

Кибер защита... Киберпрестъпниците проникват в информационните системи на предприятията и след това продават достъп до тях в "черния" интернет. Ако има повреда или измама в една част на света, Watson може да предупреди други потребители на тази система.

Лекарство... Университетът на Северна Каролина и 12 други ракови центъра използват Watson, за да анализират ДНК на пациентите, за да разработят персонализирани лечения.

Никой лекар не е в състояние да анализира такъв огромен избор от информация, само компютър

Компютърът може да направи много, поне когато става въпрос за обработка на информация. Обучението му на естествен език обаче е изключително нетривиална задача. Това предизвикателство вдъхнови проекта на IBM DeepQA, който роди когнитивна технология, наречена IBM Watson, на името на Томас Уотсън, който е пионер в основаването на IBM.

Не е трудно да се обясни какво представлява Уотсън – това е когнитивна система, която може да комуникира с човек на естествен език. Тоест да разбират писмения език и да отговарят по същия начин. И ако IBM го беше ограничил, Watson щеше да остане малко повече от експериментална настройка. Но бързо се намери работа за него и за много компании той стана наистина незаменим служител.

Оказа се, че това ноу-хау може да се приложи навсякъде, където е необходимо да се обработват големи количества неструктурирани данни. За висококачествен и бърз анализ на такива данни те трябва да бъдат обработени с помощта на всички налични инструменти на съвременните компютърни технологии: машинно обучение, изчислителна лингвистика, онтологични конструкции и високопроизводителни изчисления. За това е IBM Watson.

Основните умения на IBM Watson могат да бъдат обобщени в четири области:

  • Разбиране на естествения език.
  • Изграждане на хипотези въз основа на обработени данни.
  • Учене в процеса.
  • Изготвяне на препоръка, придружаваща я с фактите, на които се основава заключението.

Човек не е в състояние да анализира наистина голямо количество данни за разумно време и във всеки случай ще трябва да изхвърли по-голямата част от информацията, подчертавайки, според него, основното. Тук грешките са неизбежни, освен това изхвърлените данни също имат значение и трябва да повлияят на резултата. И в този аспект Уотсън е многократно по-добър от човек: той взема предвид всичко, нито един известен факт няма да остане неоценен.

Първият публичен тест на системата беше участието в американската игра Jeopardy! (Руски аналог - "Собствена игра"). Без интернет връзка, използвайки отворени източници на информация като текста на цялата Уикипедия, общи енциклопедии и речници, Уотсън успя да победи двама рекордьори за тази игра.

Каним ви в клиентския център на IBM за семинар Watson Analytics и водещи аналитични технологии!