Методи за визуално представяне на данните. Методи за визуализация. Визуализация на данни в науката и технологиите

Компютърната графика е област на компютърните науки, която се занимава с алгоритми и технологии за визуализация на данни. Развитието на компютърната графика се определя основно от два фактора: реалните нужди на потенциалните потребители и възможностите на хардуера и софтуера. Нуждите на потребителите и възможностите на технологиите непрекъснато нарастват и днес компютърната графика се използва активно в различни области. Могат да се разграничат следните области на приложение на компютърната графика:

  1. Визуализация на информация.
  2. Моделиране на процеси и явления.
  3. Проектиране на технически обекти.
  4. Организация на потребителския интерфейс.

Визуализация на информация

Повечето научни статии и доклади не могат без визуализация на данните. Прилична форма на представяне на данни е добре структурирана таблица с точните стойности на функция в зависимост от някои променливи. Но често по-визуална и ефективна форма на визуализация на данни е графичната и, например, при моделиране и обработка на изображения, тя е единствената възможна. Някои видове информационен дисплей с различен произход са изброени в следната таблица:

Много програми за финансови, научни, технически изчисления използват тези и някои други методи за визуализация на данните. Визуалното представяне на информация е отличен инструмент за научни изследвания, ясен и убедителен аргумент в научни статии и дискусии.

Моделиране на процеси и явления

Съвременните графични системи са достатъчно мощни, за да създават сложни анимации и динамични изображения. Симулационните системи, наричани още симулатори, се опитват да получат и визуализират картина на процесите и явленията, които се случват или биха могли да възникнат в действителност. Най-известният и най-сложен пример за такава система е полетен симулатор, който се използва за симулиране на ситуацията и процеса на полета при обучение на пилоти. В оптиката симулаторите се използват за симулиране на сложни, скъпи или опасни явления. Например, симулация на изображения или симулация на процеси в лазерни резонатори.

Проектиране на технически обекти

Дизайнът е един от основните етапи в създаването на продукт в технологията. Съвременните графични системи ви позволяват да визуализирате визуално проектирания обект, което допринася за ранното идентифициране и решаване на много проблеми. Разработчикът преценява работата си не само по числа и косвени параметри, той вижда обекта на дизайна на собствения си екран. Компютърните системи позволяват да се организира интерактивно взаимодействие с проектирания обект и да се симулира производството на модел от пластмасов материал. CAD системите значително опростяват и ускоряват работата на инженера-конструктор, освобождавайки го от рутинния процес на изготвяне.

Организация на потребителския интерфейс

През последните 5-7 години доминира визуалната парадигма за организиране на интерфейса между компютъра и крайния потребител. Графичният интерфейс с прозорец е вграден в много съвременни операционни системи. Наборът от контроли, които се използват за изграждане на такъв интерфейс, вече е доста стандартизиран. Повечето потребители вече са свикнали с такава организация на интерфейса, която позволява на потребителите да се чувстват по-комфортно и да повишават ефективността на взаимодействието.

Всичко това предполага, че в самата операционна система вече трябва да бъдат внедрени достатъчно голям брой функции, за да се изобразят контролите. Например, операционната система Windows предоставя на разработчиците GDI (Graphics Device Interface). Както показва практиката, за някои приложения възможностите, предоставени от системния API, са напълно достатъчни за визуализиране на обработените данни (изграждане на най-прости графики, представящи моделирани обекти и явления). Но такива недостатъци като ниска скорост на дисплея, липса на поддръжка за 3D графики не допринасят за използването му за визуализиране на научни данни и компютърно моделиране. Някои научни и технически програми със сложен графичен изход изискват функции за по-бърза, по-мощна и гъвкава визуализация на изчислени данни, симулирани явления и проектирани обекти.

Компютърна графична технология

В съвременните научни и технически приложения сложното графично изобразяване се реализира с помощта на библиотеката OpenGL, която се превърна в де факто стандарт в областта на 3D изобразяването. Библиотеката OpenGL е високоефективен софтуерен интерфейс към графичния хардуер. Най-голямата производителност тази библиотека ви позволява да постигнете в хардуерни системи, работещи на базата на съвременни графични ускорители (хардуер, който освобождава процесора и извършва изчисленията, необходими за изобразяване).

Архитектурата и алгоритмите на библиотеката са разработени през 1992 г. от специалисти от Silicon Graphics, Inc. (SGI) за собствен хардуер за графична работна станция Iris. Няколко години по-късно библиотеката беше пренесена на много хардуерни и софтуерни платформи (включително Intel + Windows) и днес тя е надеждна мултиплатформена библиотека.

Библиотеката OpenGL се разпространява свободно, което е нейното несъмнено предимство и причината за толкова широко използване.

OpenGL не е обектно-ориентирана, а процедурна библиотека (около сто команди и функции), написана на C. От една страна, това е недостатък (компютърната графика е плодородна област за използване на обектно-ориентирано програмиране), но програмистите, работещи с OpenGL, могат да работят с C ++, Delphi, Fortran и дори Java и Python.

Във връзка с OpenGL обикновено се използват няколко помощни библиотеки, за да помогнат за персонализирането на библиотеката в дадена среда или за изпълнение на по-сложни, сложни функции за изобразяване, които се реализират чрез примитивни функции на OpenGL. Освен това има голям брой специализирани графични библиотеки, които използват библиотеката OpenGL като база от ниско ниво, един вид асемблер, на базата на който се изграждат сложни функции за изход на графика (OpenInventor, vtk, IFL и много други) . Потребителската общност на OpenGL може да бъде намерена на www.opengl.org

Microsoft също е разработила и предлага да използва DirectX мултимедийната библиотека за подобни цели. Тази библиотека се използва широко в приложения за игри и мултимедия, но не е получила широко разпространение в научни и технически приложения. Причината най-вероятно е, че DirectX работи само под Windows.

Тази статия е написана от представител на компанията DevExpress и публикувана в блог на HabraHabr.

Медицински изследователи са установили, че ако в инструкциите за лекарство има само текст, човек усвоява само 70% от информацията от него. Ако добавите снимки към инструкцията, човекът вече ще научи 95%.

Очевидно е, че човек е предразположен да обработва само визуална информация. Освен че се обработва отлично от нашия мозък, визуализацията на данните има няколко предимства:

  • Фокусиране върху различни аспекти на данните


С помощта на графики можете лесно да привлечете вниманието на читателя към червените индикатори.

  • Анализиране на голям набор от данни със сложна структура
  • Намаляване на информационното претоварване на човек и задържане на вниманието му
  • Недвусмисленост и яснота на изходните данни
  • Подчертаване на връзките и взаимоотношенията, съдържащи се в информацията


Важни данни могат лесно да се видят на графиката.

Естетична привлекателност


Естетически приятната графика прави представянето на данните ефективно и запомнящо се.

Едуард Тъфти, автор на някои от най-добрите книги за визуализация, го описва като инструмент за показване на данни; насърчаване на зрителя да мисли за същността, а не за методологията; избягвайте изкривяването на това, което данните трябва да кажат; показване на много числа в малко пространство; показване на голям набор от данни в последователно и съгласувано цяло; насърчаване на зрителя да сравнява части от данни; обслужващи достатъчно ясни цели: описание, изследване, поръчка или украса ().

Как да използваме правилно визуализацията на данните?

Успехът на визуализацията пряко зависи от правилността на нейното приложение, а именно от избора на типа диаграма, правилното й използване и дизайн.


60% от успеха на визуализацията зависи от избора на типа графика, 30% от правилното й използване и 10% от правилния дизайн.

Правилен тип графика

Графиката ви позволява да изразите идеята, която данните носят по най-пълния и точен начин, така че е много важно да изберете подходящия тип диаграма. Изборът може да се направи според алгоритъма:

Цели за визуализация- това е реализацията на основната идея на информацията, това е, което трябва да покажете избраните данни, какъв ефект трябва да постигнете - идентифициране на връзки в информацията, показване на разпределението на данните, състав или сравнение на данни.


Първият ред показва графики с целите за показване на връзките върху данните и разпределението на данните, а вторият ред показва целите за показване на състава и сравняване на данни.

Връзки с данни- така те зависят един от друг, връзката между тях. Използвайки връзки, можете да идентифицирате наличието или отсъствието на зависимости между променливите. Ако основната идея на информацията съдържа фразите "отнася се", "намалява / се увеличава с", тогава трябва да се стремите да покажете точно връзката в данните.
Разпределението на данните е как са разположени спрямо нещо, колко обекта попадат в определени последователни области на числови стойности. Основната идея в този случай ще съдържа фразите "в диапазона от x до y", "концентрация", "честота", "разпределение".

Състав на данни- комбиниране на данни с цел анализиране на цялостната картина като цяло, сравняване на компонентите, които съставляват процент от определено цяло. Ключови фрази за състава са "x%", "дял", "процент от цялото".

Сравнение на данни - комбиниране на данни с цел сравняване на някои показатели, разкриване на връзката на обектите един с друг. Това също е сравнение на компоненти, които се променят с течение на времето. Ключови фрази за една идея при сравняване са „повече/по-малко от“, „равно“, „промени“, „нагоре/надолу“.

След като определите целта на визуализацията, трябва да определите типа данни. Те могат да бъдат много разнородни по вид и структура, но в най-простия случай разграничават непрекъснати числови и времеви данни, дискретни данни, географски и логически данни. Непрекъснатите числови данни съдържат информация за зависимостта на една числова стойност от друга, например графики на функции като y = 2x. Непрекъснатите времеви рамки съдържат данни за събития, настъпили през определен период от време, като графика на температурата, измервана всеки ден. Дискретните данни могат да съдържат зависимости на категорични стойности, например графика на броя на продажбите на стоки в различни магазини. Географските данни съдържат различна информация, свързана с местоположението, геологията и други географски показатели, отличен пример е обикновена географска карта. Булевите данни показват логическото подреждане на компонентите един спрямо друг, като родословно дърво.


Графики на непрекъснати цифрови и времеви данни, дискретни данни, географски и логически данни.

В зависимост от целта и данните можете да изберете най-подходящия график за тях. Най-добре е да избягвате разнообразието в името на разнообразието и да изберете колкото по-просто, толкова по-добре. Само за конкретни данни използвайте специфични типове диаграми, в други случаи най-често срещаните диаграми са подходящи:

  • линеен (линия)
  • с площи
  • колони и хистограми (лента)
  • кръгова диаграма (пай, поничка)
  • полярна графика (радар)
  • разпръскване, балон
  • карти
  • дървета (дърво, ментална карта, дървовидна карта)
  • времеви диаграми (времева линия, Гант, водопад).

Линейните диаграми, областните диаграми и стълбовидни диаграми могат да съдържат няколко стойности в един аргумент за една категория, които могат да бъдат или абсолютни (след това подреденият префикс се добавя към тези типове диаграми) или относителен (пълно подреден).


Графика с подредени стойности и с пълен стек

Когато избирате подходящ график, можете да се ръководите от следната таблица, съставена от тази диаграма и:


Правилно използване на графиката

Важно е не само да изберете правилния тип диаграма, но и да я използвате правилно:

  • Не е нужно да зареждате графиката с много информация. Оптималният брой различни видове данни, категории е не повече от 4-5, в противен случай е по-целесъобразно да се раздели такава диаграма на няколко части.


Тази диаграма може да се сравни със спагети и е най-добре разделена на няколко диаграми.

Изберете правилния мащаб и мащаб за графиката. За хистограми и графики с площи е за предпочитане скалата на стойността да започне от нула. Опитайте се да не използвате обърнати скали - това много често подвежда зрителя относно данните.


Неправилната скала се отразява негативно на възприемането на данните. В първия случай мащабът е неправилно избран, във втория мащабът е обърнат.

  • За кръгови диаграми и графики, които показват процент от общата сума, сумата от стойностите винаги трябва да бъде 100%.
  • За по-добро възприемане на данните е по-добре информацията да се подреди по оста - или по стойности, или по азбучен ред, или по логическо значение.

Правилен дизайн на графика

Нищо не е по-приятно за окото от добре оформените графики и нищо не разваля диаграмите повече от наличието на графични боклуци. Основни принципи на проектиране:

  • използвайте палитри от подобни, не ярки цветове и се опитайте да се ограничите до набор от шест парчета
  • спомагателните и второстепенните линии трябва да са прости и да не се забелязват


Помощните линии на графиката не трябва да отвличат вниманието от основната идея на данните.

  • където е възможно, използвайте само етикети за хоризонтална ос;
  • за парцели с площи е за предпочитане да използвате цвят с прозрачност;
  • използвайте различен цвят за всяка категория в диаграмата.

заключения

Визуализация- мощен инструмент за комуникация на мисли и идеи до крайния потребител, помощник за възприемане и анализ на данни. Но както всички инструменти, той трябва да се прилага на точното време и място. В противен случай информацията може да бъде възприета бавно или дори неправилно.


Графиките показват едни и същи данни, основните грешки при визуализацията са показани вляво, а те са коригирани отдясно.

Когато се използва умело, визуализацията на данните може да направи съдържанието впечатляващо, забавно и запомнящо се.

През последните десетилетия настъпиха почти революционни промени в областта на предаването на визуална информация:

обемът и количеството на предаваната информация се е увеличил неимоверно;

са се развили нови видове визуална информация и методи за нейното предаване.

Техническият прогрес и формирането на нова визуална култура неизбежно оставя своя отпечатък върху набора от изисквания към дейността на учителите.

Едно от средствата за подобряване на професионалната подготовка на бъдещи учители, които са способни на педагогически иновации, за разработване на технологии за проектиране на ефективни образователни дейности на ученик в условията на доминиране на визуалната среда, е формирането на техните специални умения. при визуализиране на образователна информация. Терминът „визуализация” идва от латинското visualis – възприема се визуално, визуално. Информационна визуализация представяне на цифрова и текстова информация под формата на графики, диаграми, структурни диаграми, таблици, карти и др. Такова разбиране за визуализацията като процес на наблюдение обаче предполага минимална умствена и познавателна активност на учениците, а визуалните дидактически средства изпълняват само илюстративна функция. Различно определение на визуализацията е дадено в добре познатите педагогически концепции (теорията на схемите - Р. С. Андерсън, Ф. Бартлет; теорията на рамките - Ч. Волкер, М. Мински и др.), в които се интерпретира това явление. като преместване в процеса на познавателна дейност от вътрешния план към външния план на мисловни образи, чиято форма се определя спонтанно от механизма на асоциативната проекция.

По подобен начин понятието визуализация се разбира от А. Вербицки: „Процесът на визуализацията е сгъване на умствено съдържание във визуален образ; като се възприема, образът може да се разгърне и да служи като опора за адекватни умствени и практически действия." Това определение дава възможност да се отделят понятията "визуално", "визуално средство" от понятията "визуално", "визуално средство". В педагогическия смисъл понятието "визуално" винаги се основава на демонстрация на конкретни обекти, процеси, явления, представяне на завършен образ, даден отвън, а не роден и осъществен от вътрешния план на човешката дейност. Процесът на разгръщане на мисловен образ и "пренасянето" му от вътрешната плоскост във външната е проекция на менталния образ. Проекцията е вградена в процесите на взаимодействие между субекта и обектите на материалния свят, разчита се на механизмите на мислене, обхваща различни нива на рефлексия и рефлексия, проявява се в различни форми на образователна дейност.

Ако целенасочено разглеждаме продуктивната познавателна дейност като процес на взаимодействие между външния и вътрешния план, като прехвърляне на бъдещи продукти на дейност от вътрешния план към външния, като корекция и изпълнение във външния план на идеите, тогава визуализацията действа като основен механизъм, който осигурява диалог между външни и вътрешни планове за дейност. Следователно, в зависимост от свойствата на дидактическите визуални средства, зависи нивото на активиране на умствената и познавателната дейност на учениците.

В тази връзка нараства ролята на визуалните модели за представяне на образователна информация, които дават възможност за преодоляване на трудностите, свързани с ученето на базата на абстрактно логическо мислене. В зависимост от вида и съдържанието на образователната информация се използват методи за уплътняване или поетапно разгръщане с помощта на различни визуални средства. Понастоящем използването на когнитивна визуализация на дидактически обекти изглежда обещаващо в образованието. Това определение всъщност включва всички възможни видове визуализация на педагогически обекти, работещи на принципите на концентрация на знания, обобщаване на знанията, разширяване на ориентационните и презентационни функции на визуалните дидактически средства, алгоритмизиране на образователни и познавателни действия, реализирани във визуални средства.

На практика се използват повече от сто метода за визуално структуриране – от традиционни диаграми и графики до „стратегически“ карти (пътни карти), лъчеви паяци и причинно-следствени вериги. Това разнообразие се дължи на значителни различия в естеството, характеристиките и свойствата на знанието в различните предметни области. Най-големият информационен капацитет според нас е универсалността и интегрируемостта на структурните и логически схеми. Този метод на систематизиране и визуално изобразяване на образователната информация се основава на идентифицирането на съществени връзки между елементите на знанието и аналитично-синтетичната дейност при превод на вербална информация в невербална (образна), синтезираща цялостна система от елементи на знанието. Овладяването на изброените видове конкретизиращи значения, развиването на логическа верига на мислене, описване на образи и техните признаци на умствена дейност, както и операции, използващи словесни средства за обмен на информация, формира продуктивни начини на мислене, които са толкова необходими за специалистите в съвременния темп. на развитието на науката, технологиите и технологиите. Според постиженията на невропсихологията „ученето е ефективно, когато потенциалът на човешкия мозък се развива чрез преодоляване на интелектуалните трудности в търсенето на смисъл чрез установяване на модели“.

Структурните и логически диаграми създават специална яснота, като подреждат елементите на съдържанието в нелинейна форма и подчертават логическите и последователни връзки между тях. Тази видимост се основава на структурата и асоциативните връзки, характерни за дългосрочната памет на човек. В известен смисъл структурно-логическите схеми действат като междинно звено между външното линейно съдържание (текст на учебника) и вътрешното нелинейно съдържание (в съзнанието). Като едно от предимствата на структурните логически схеми A.V. Петров подчертава, че „той изпълнява функцията на съчетаване на понятия в определени системи“. Сами по себе си понятията не могат да кажат нищо за съдържанието на предмета на обучение, но бидейки свързани с определена система, те разкриват структурата на предмета, неговите задачи и пътища на развитие. Разбирането и разбирането на нова ситуация възниква, когато мозъкът намери подкрепа в предишни знания и идеи.

Това предполага значението на постоянното актуализиране на предишен опит за овладяване на нови знания. Процесът на усвояване на нов материал може да се представи като възприемане и преработка на нова информация, като се съпоставя с познатите на ученика понятия и методи на действие чрез използването на овладените от него интелектуални операции. Информацията, влизаща в мозъка по различни канали, се концептуализира и структурира, образувайки концептуални мрежи в съзнанието. Новата информация се вгражда в съществуващи когнитивни схеми, трансформира ги и формира нови когнитивни схеми и интелектуални операции. В същото време се установяват връзки между познатите понятия и методи на действие и новите знания и се появява структурата на новите знания.

Според психолозите новата информация се усвоява и запомня по-добре, когато знанията и уменията са "отпечатани" в системата на визуално-пространствената памет, следователно представянето на образователния материал в структурирана форма ви позволява бързо и по-добре да усвоявате нови системи от понятия , методи на действие. Пример е визуалната схема: "RGB цветен модел" (виж фиг. 2).



Ориз. 2.

Визуализацията на учебния материал отваря възможност не само да се съберат всички теоретични изчисления, което ще ви позволи бързо да възпроизведете материала, но и да приложите схеми за оценка на степента на овладяване на изучаваната тема. На практика широко се използва и методът за анализ на конкретна диаграма или таблица, при която се развиват умения за събиране и обработка на информация. Методът позволява на обучаемите да се включат активно в прилагането на теоретичната информация в практическата работа. Специално място е отделено на съвместната дискусия, по време на която има възможност да получите бърза обратна връзка, да разберете по-добре себе си и другите хора. Обобщавайки казаното, отбелязваме, че в зависимост от мястото и предназначението на нагледните дидактически материали в процеса на формиране на концепция (изучаване на теория, явление) трябва да бъдат представени различни психологически и педагогически изисквания към избора на определен структурен модел и визуално изобразяване на съдържанието на обучението.

Когато визуализирате образователен материал, трябва да се има предвид, че визуалните образи съкращават веригите на словесните разсъждения и могат да синтезират схематично изображение на по-голям „капацитет“, като по този начин кондензират информация. В процеса на разработване на учебни и методически материали е необходимо да се контролира степента на обобщаване на съдържанието на обучението, да се дублира словесната информация на образното и обратно, така че, ако е необходимо, връзките на логическата верига да бъдат напълно възстановен от учениците.

Друг важен аспект от използването на визуални учебни материали е да се определи оптималното съотношение на визуални образи и вербална, символична информация. Концептуалното и визуалното мислене на практика са в постоянно взаимодействие. Те се допълват взаимно и разкриват различни аспекти на изучаваното понятие, процес или явление. Словесно-логическото мислене ни дава по-точно и обобщено отражение на действителността, но това отражение е абстрактно. От своя страна визуалното мислене помага за организирането на образите, прави ги холистични, обобщени, завършени.

Визуализацията на образователната информация ви позволява да решите редица педагогически проблеми:

осигуряване на интензификация на обучението;

засилване на образователни и познавателни дейности;

формиране и развитие на критично и визуално мислене;

визуално възприемане;

образно представяне на знания и учебни дейности;

трансфер на знания и разпознаване на образи;

повишаване на визуалната грамотност и визуалната култура.

"Казват, че една рисунка струва хиляда думи и наистина е така, при условие че рисунката е добра." Боуман

С увеличаване на количеството натрупани данни, дори при използване на произволно мощни и гъвкави алгоритми за извличане на данни, става все по-трудно да се „усвояват“ и интерпретират получените резултати. И, както знаете, една от разпоредбите на Data Mining е търсенето на практически полезни модели. Един модел може да стане практически полезен само ако може да бъде разбран и разбран.

През 1987 г. по инициатива на Техническия комитет по компютърна графика на ACM SIGGRAPH IEEE Computer Society, във връзка с необходимостта от използване на нови методи, инструменти и технологии за данни, са формулирани съответните задачи на направлението за визуализация.

Методите за визуално или графично представяне на данни включват графики, диаграми, таблици, отчети, списъци, структурни диаграми, карти и др.

Традиционно визуализацията се разглежда като помощно средство при анализа на данни, но сега все повече изследвания говорят за нейната независима роля.

Традиционните техники за изобразяване могат да намерят следните приложения:

представяне на информация на потребителя във визуална форма;

компактно описват моделите, присъщи на оригиналния набор от данни;

намаляване на размерите или компресиране на информация;

поправете пропуски в набора от данни;

намиране на шум и отклонения в набор от данни.

Визуализация на инструмент за извличане на данни

Всеки от алгоритмите за извличане на данни използва специфичен подход за визуализация. В предишните лекции разгледахме редица методи за извличане на данни. В хода на използването на всеки един от методите, или по-точно на неговата софтуерна реализация, получихме някои визуализатори, с помощта на които успяхме да интерпретираме резултатите, получени в резултат на работата на съответните методи и алгоритми.

За дърветата на решенията това е визуализатор на дървото на решенията, списък с правила, таблица за непредвидени обстоятелства.

За невронни мрежи, в зависимост от инструмента, това може да бъде топологията на мрежата, графика на промяната в стойността на грешката, която демонстрира процеса на обучение.

За карти на Kohonen: карти на входове, изходи, други специфични карти.

За линейна регресия линията на регресия действа като визуализатор.

За групиране: дендрограми, диаграми на разсейване.

Диаграми на разсейване и диаграми често се използват за оценка на ефективността на конкретен метод.

Всички тези начини за визуализиране или показване на данни могат да изпълняват една от функциите:

са илюстрация на изграждане на модел (например, представящ структурата (графика) на невронна мрежа);

помагат за интерпретирането на получения резултат;

са средство за оценка на качеството на конструирания модел;

комбинирайте функциите, изброени по-горе (дърво на решенията, дендрограма).

Визуализация на модели за извличане на данни

Първата функция (илюстрация на изграждане на модел) всъщност е визуализация на модела за извличане на данни. Има много различни начини за представяне на модел, но изобразяването му дава на потребителя максимална "стойност". Потребителят в повечето случаи не е специалист по моделиране, най-често е експерт в своята предметна област. Следователно моделът за извличане на данни трябва да бъде представен на езика, който е най-естествен за него, или поне да съдържа минимален брой различни математически и технически елементи.

По този начин наличността е една от основните характеристики на модела за копаене на данни. Въпреки това, има и толкова широко разпространен и най-прост начин за представяне на модел като "черна кутия". В този случай потребителят не разбира поведението на модела, който използва. Въпреки недоразумението обаче той получава резултата – разкритите модели. Класически пример за такъв модел е моделът на невронната мрежа.

Друг начин да представите модел е да го представите по интуитивен, разбираем начин. В този случай потребителят може наистина да разбере какво се случва "вътре" в модела. По този начин е възможно да се осигури прякото му участие в процеса.

Такива модели предоставят на потребителя възможност да обсъжда или обяснява своята логика с колеги, клиенти и други потребители.

Разбирането на модела води до разбиране на неговото съдържание. В резултат на разбирането се повишава доверието в модела. Класически пример е дървото на решенията. Изграденото дърво на решения наистина подобрява разбирането на модела, т.е. използван инструмент за извличане на данни.

В допълнение към разбирането, такива модели предоставят на потребителя възможността да взаимодейства с модела, да й задава въпроси и да получава отговори. Пример за това взаимодействие е съоръжението какво-ако. Чрез диалоговия прозорец "система-потребител" потребителят може да придобие разбиране за модела.

Сега нека преминем към функциите, които помагат за тълкуването и оценката на резултатите от изграждането на модели за извличане на данни. Това са всякакви графики, диаграми, таблици, списъци и т.н.

Примери за инструменти за визуализация, които могат да се използват за оценка на качеството на модела, са диаграма на разсейване, таблица за непредвидени обстоятелства и графика на промяната в големината на грешката.

Диаграма на разпръскванее графика на отклонението на прогнозираните от модела стойности от реалните. Тези диаграми се използват за непрекъснати стойности. Визуална оценка на качеството на конструирания модел е възможна само в края на процеса на изграждане на модела.

Таблица за непредвидени обстоятелстваизползвани за оценка на резултатите от класификацията. Такива таблици се използват за различни методи за класификация. Вече ги използвахме в предишни лекции. Оценката на качеството на конструирания модел е възможна само в края на процеса на изграждане на модела.

Графиката на промяната в големината на грешката... Графиката показва промяната в големината на грешката в процеса на работа на модела. Например, в хода на работата на невронните мрежи, потребителят може да наблюдава промяната в грешката на обучаващите и тестовите набори и да спре обучението, за да предотврати „преобзавеждането“ на мрежата. Тук оценката на качеството на модела и неговите промени могат да бъдат оценени директно в процеса на изграждане на модела.

Примери за визуализатори, които могат да ви помогнат да интерпретирате резултата, са: линия на тренда в линейна регресия, карти на Кохонен, диаграма на разсейване в клъстерен анализ.

Техники за изобразяване

Методите за визуализация, в зависимост от броя на използваните измервания, обикновено се класифицират в две групи:

представяне на данни в едно, две и три измерения;

представяне на данни в четири или повече измерения.

Представяне на данни в едно, две и три измерения

Тази група методи включва добре познати методи за показване на информация, които са достъпни за възприемане от човешкото въображение. Почти всеки съвременен инструмент за извличане на данни включва методи за визуално представяне от тази група.

Според броя на измеренията на изгледа, това могат да бъдат следните начини:

едномерно (едномерно) измерение, или 1-D;

двуизмерно (двумерно) измерение, или 2-D;

3D или прожекционно измерване, или 3-D.

Трябва да се отбележи, че човешкото око най-естествено възприема двуизмерни представяния на информация.

При използване на дву- и триизмерно представяне на информация, потребителят има възможност да види моделите на набора от данни:

неговата клъстерна структура и разпределението на обектите в класове (например в диаграма на разсейване);

топологични характеристики;

наличие на тенденции;

информация за взаимното подреждане на данните;

наличието на други зависимости, присъщи на изследвания набор от данни.

Ако наборът от данни има повече от три измерения, тогава са възможни следните опции:

използването на многоизмерни методи за представяне на информация (те са разгледани по-долу);

намаляване на размерите доедно-, дву- или триизмерно представяне. Има различни начини за намаляване на измерението, един от тях - факторен анализ - беше обсъден в една от предишните лекции. Самоорганизиращите се карти на Кохонен се използват за намаляване на размерността и в същото време за визуализиране на информация на двуизмерна карта.

Представяне на данни в 4+ измерения

Представянето на информация в четири и повече измерения е недостъпно за човешкото възприятие. Въпреки това са разработени специални методи за възможността за показване и възприемане на такава информация от човек.

Най-известните методи за многоизмерно представяне на информация:

успоредни координати;

∙ "Лица на Чернов";

радарни карти.

Паралелни координати

В паралелни координати променливите са хоризонтално кодирани, с вертикална линия, определяща стойността на променливата. Пример за набор от данни, представен в декартови координати и паралелни координати, е показан на фиг. 16.1. Този метод за представяне на многоизмерни данни е изобретен от Алфред Инселбърг през 1985 г.

Визуализация на информация

Според вече установената традиция да започнем с определението.

Визуализация на информация- представяне на информация под формата на графики, диаграми, структурни диаграми, таблици, карти и др.

ecsocman.edu.ru

Защо да визуализираме информация? "Глупав въпрос!" – ще възкликне читателят. Разбира се, текстът с картинки се възприема по-добре от "сивия" текст, а снимките с текст се възприемат още по-добре. Не е напразно всички ние толкова много обичаме комиксите – в края на краищата те ни позволяват буквално да схващаме информация в движение, привидно без да прилагаме ни най-малко умствено усилие! И помнете колко добре си спомняте по време на обучението си материала от тези лекции, които бяха придружени от слайдове!

Първото нещо, което ни идва на ум, когато кажем „визуализация“, са ϶ᴛᴏ графики и диаграми (ето я, силата на асоциациите!). От друга страна, по този начин могат да се визуализират само цифрови данни, никой все още не е успял да изгради графика, базирана на съгласуван текст. За текста можем да изградим план, да подчертаем основните мисли (тези) - да направим кратко резюме. Ще говорим за недостатъците и опасностите от воденето на бележки малко по-късно, но сега ще кажем, че ако комбинирате плана и кратко резюме - „окачете“ тезите върху клоните на дърво, чиято структура съответства на структурата (плана) на текста - тогава ще получим отличен блокова схематекст͵ който ще се запомни много по-добре от всеки синопсис. В този случай клоновете ще играят ролята на онези "писти" - писти, свързващи понятия и тези, за които говорихме по-рано.

Спомняте ли си как изградихме UML диаграми въз основа на описанието на проектираната софтуерна система, получено от бъдещите потребители? Получените снимки бяха възприети както от клиенти, така и от разработчици много по-лесно и по-бързо от текстово описание. По същия начин можете да "изобразите" абсолютно всеки текст, а не само техническата задача за разработване на системата. Подходът, описан по-горе, ви позволява да представите визуално абсолютно всеки текст - било то приказка, техническа задача, лекция, фантастичен роман или резултатите от среща - под формата на удобно и лесно за разбиране дърво. Можете да го изградите както искате - само ако получите ясна и разбираема диаграма, която би било хубаво да илюстрирате с подходящи чертежи.

Такива схеми също са удобни за използване в комуникацията при обсъждане на всякакви въпроси и проблеми. Както показва практиката, липсата на ясни стандарти за нотация не създава абсолютно никакви комуникационни трудности за участниците в дискусиите. Напротив, използването на невербални форми на представяне на информация ви позволява да се съсредоточите върху ключовите точки на проблема. Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, визуализацията е една от най-обещаващите области за повишаване на ефективността на анализа, представянето, възприемането и разбирането на информацията.

Леле, най-накрая приключихме с досадното описание на научни теории, методи и техники, използвани за обработка, организиране и визуализиране на информация! Предишната част на главата силно умори както автора, така и читателите и въпреки това беше необходимо: в резултат видяхме, че характеристиките на нашия мозък вече се използват активно от учени в различни области на науката, много неща които ни изглеждат познати, - персонални компютри, потребителски интерфейси, бази от знания и т.н. - първоначално са изградени, като се вземе предвид асоциативният характер на човешкото мислене и неговата склонност към йерархично представяне и визуализиране на информацията. Но върхът и естественото графично изразяване на човешките мисловни процеси е картографирането на ума, което най-накрая обсъждаме. И в същото време ще се опитаме да разширим разбирането си за принципите на визуалното мислене.

Визуализация на информация – понятие и видове. Класификация и особености на категорията "Визуализация на информация" 2017, 2018.