Metoder för visuell presentation av data. Visualiseringsmetoder. Datavisualisering inom naturvetenskap och teknik

Datorgrafik är ett område inom datavetenskap som handlar om algoritmer och teknologier för datavisualisering. Utvecklingen av datorgrafik bestäms huvudsakligen av två faktorer: potentiella användares verkliga behov och kapaciteten hos hårdvara och mjukvara. Konsumenternas behov och teknikens kapacitet växer stadigt, och idag används datorgrafik aktivt inom olika områden. Följande användningsområden för datorgrafik kan särskiljas:

  1. Informationsvisualisering.
  2. Modellering av processer och fenomen.
  3. Design av tekniska objekt.
  4. Organisation av användargränssnittet.

Informationsvisualisering

De flesta vetenskapliga artiklar och rapporter klarar sig inte utan datavisualisering. En anständig form av datapresentation är en välstrukturerad tabell med de exakta värdena för en funktion beroende på vissa variabler. Men ofta är en mer visuell och effektiv form av datavisualisering en grafisk sådan, och till exempel inom modellering och bildbehandling är det den enda möjliga. Vissa typer av informationsvisning av olika ursprung listas i följande tabell:

Många program för ekonomiska, vetenskapliga, tekniska beräkningar använder dessa och några andra metoder för datavisualisering. Visuell presentation av information är ett utmärkt verktyg för vetenskaplig forskning, ett tydligt och övertygande argument i vetenskapliga artiklar och diskussioner.

Modellering av processer och fenomen

Moderna grafiksystem är kraftfulla nog att skapa komplexa animationer och dynamiska bilder. Simuleringssystem, även kallade simulatorer, försöker få och visualisera en bild av de processer och fenomen som uppstår eller kan inträffa i verkligheten. Det mest kända och mest komplexa exemplet på ett sådant system är en flygsimulator, som används för att simulera situationen och flygprocessen när man tränar piloter. Inom optik används simulatorer för att simulera komplexa, kostsamma eller farliga fenomen. Till exempel simulering av avbildning eller simulering av processer i laserresonatorer.

Design av tekniska objekt

Design är ett av huvudstadierna i skapandet av en produkt inom teknik. Moderna grafiska system låter dig visuellt visualisera det designade objektet, vilket bidrar till tidig identifiering och lösning av många problem. Utvecklaren bedömer sitt arbete inte bara efter siffror och indirekta parametrar, han ser designobjektet på sin egen skärm. Datorsystem gör det möjligt att organisera interaktiv interaktion med det designade objektet och simulera tillverkningen av en modell från ett plastmaterial. CAD-system förenklar och påskyndar konstruktionsingenjörens arbete avsevärt och befriar honom från den rutinmässiga ritprocessen.

Organisation av användargränssnittet

Under de senaste 5-7 åren har det visuella paradigmet för att organisera gränssnittet mellan datorn och slutanvändaren blivit dominerande. Det grafiska gränssnittet med fönster är inbyggt i många moderna operativsystem. Uppsättningen kontroller som används för att bygga ett sådant gränssnitt har redan blivit ganska standardiserade. De flesta användare är redan vana vid en sådan organisation av gränssnittet, vilket gör att användarna kan känna sig mer bekväma och öka effektiviteten i interaktionen.

Allt detta tyder på att i själva operativsystemet måste ett tillräckligt stort antal funktioner redan implementeras för att göra kontroller. Till exempel ger Windows-operativsystemet utvecklare en GDI (Graphics Device Interface). Som praxis visar, för vissa applikationer är funktionerna som tillhandahålls av systemets API tillräckligt för att visualisera bearbetade data (konstruera de enklaste graferna, representera simulerade objekt och fenomen). Men sådana nackdelar som låg visningshastighet, brist på stöd för 3D-grafik bidrar inte till dess användning för visualisering av vetenskapliga data och datormodellering. Vissa vetenskapliga och tekniska program med komplexa grafiska utdata kräver funktioner för snabbare, mer kraftfull och flexibel visualisering av beräknade data, simulerade fenomen och designade objekt.

Datorgrafikteknologier

I moderna vetenskapliga och tekniska applikationer implementeras komplex grafikrendering med hjälp av OpenGL-biblioteket, som har blivit de facto-standarden inom området 3D-rendering. OpenGL-biblioteket är ett mycket effektivt mjukvarugränssnitt till grafikhårdvara. Den största prestanda som detta bibliotek låter dig uppnå i hårdvarusystem som körs på basis av moderna grafikacceleratorer (hårdvara som frigör processorn och utför de beräkningar som krävs för rendering).

Bibliotekets arkitektur och algoritmer utvecklades 1992 av specialister från Silicon Graphics, Inc. (SGI) för egen Iris-grafikarbetsstationshårdvara. Några år senare portades biblioteket till många hårdvaru- och mjukvaruplattformar (inklusive Intel + Windows) och idag är det ett pålitligt multiplattformsbibliotek.

OpenGL-biblioteket är fritt omdistribuerbart, vilket är dess otvivelaktiga fördel och anledningen till så utbredd användning.

OpenGL är inte ett objektorienterat, utan ett procedurbibliotek (ett hundratal kommandon och funktioner), skrivet i C. Å ena sidan är detta en nackdel (datorgrafik är ett bördigt område för att använda objektorienterad programmering), men programmerare som arbetar med OpenGL kan arbeta med i C++, Delphi, Fortran och till och med Java och Python.

I samband med OpenGL används vanligtvis flera hjälpbibliotek för att hjälpa till att anpassa biblioteket i en given miljö eller för att utföra mer komplexa, komplexa renderingsfunktioner som implementeras genom primitiva OpenGL-funktioner. Dessutom finns det ett stort antal specialiserade grafikbibliotek som använder OpenGL-biblioteket som en lågnivåbas, en slags assembler, på basis av vilken komplexa grafikutdatafunktioner byggs (OpenInventor, vtk, IFL och många andra) . OpenGL-användargemenskapen finns på www.opengl.org

Microsoft har också utvecklat och föreslår att DirectX multimediabibliotek ska användas för liknande ändamål. Detta bibliotek används i stor utsträckning i spel- och multimediaapplikationer, men har inte fått någon stor spridning i vetenskapliga och tekniska applikationer. Anledningen är troligen att DirectX bara fungerar under Windows.

Den här artikeln skrevs av en representant för DevExpress-företaget och publicerades i en blogg på HabraHabr.

Medicinska forskare har funnit att om det bara finns text i instruktionerna för ett läkemedel, tillgodogör sig en person endast 70 % av informationen från den. Om du lägger till bilder i instruktionen lär personen redan 95%.

Det är uppenbart att en person är benägen att bearbeta bara visuell information. Förutom att vara utmärkt bearbetad av våra hjärnor, har datavisualisering flera fördelar:

  • Fokusera på olika aspekter av data


Med hjälp av grafer kan du enkelt uppmärksamma läsaren på de röda indikatorerna.

  • Analysera en stor datamängd med en komplex struktur
  • Minska informationsöverbelastning av en person och behålla hans uppmärksamhet
  • Entydighet och tydlighet i utdata
  • Att lyfta fram de relationer och relationer som finns i informationen


Viktig data kan enkelt ses på grafen.

Estetiskt tilltalande


Estetiskt tilltalande grafik gör presentationen av data effektiv och minnesvärd.

Edward Tufty, författare till några av de bästa böckerna om visualisering, beskriver det som ett verktyg för att visa data; uppmuntra tittaren att tänka på essensen, inte metodiken; undvika att förvränga vad uppgifterna ska säga; visa många siffror på ett litet utrymme; visar en stor datamängd i en sammanhängande och sammanhängande helhet; uppmuntra tittaren att jämföra data; tjänar tillräckligt tydliga mål: beskrivning, forskning, beställning eller dekoration ().

Hur använder man datavisualisering korrekt?

Framgången med visualisering beror direkt på korrektheten av dess tillämpning, nämligen på valet av typ av diagram, dess korrekta användning och design.


60 % av visualiseringens framgång beror på valet av graftyp, 30 % på korrekt användning och 10 % på korrekt design.

Rätt graftyp

Grafen låter dig uttrycka tanken att data bär på det mest kompletta och korrekta sättet, så det är mycket viktigt att välja rätt typ av diagram. Valet kan göras enligt algoritmen:

Visualiseringsmål- detta är implementeringen av huvudidén för information, det här är vad du behöver för att visa de valda data, vilken effekt du behöver uppnå - identifiera relationer i information, visa distributionen av data, sammansättning eller jämförelse av data.


Den första raden visar grafer med målen att visa relationer på data och fördelningen av data, och den andra raden visar målen att visa sammansättning och jämföra data.

Datarelationer– det är så de är beroende av varandra, kopplingen mellan dem. Med hjälp av relationer kan du identifiera närvaron eller frånvaron av beroenden mellan variabler. Om huvudidén med informationen innehåller fraserna "hänvisar till", "minskar / ökar med", måste du sträva efter att visa exakt förhållandet i data.
Fördelningen av data är hur den är placerad i förhållande till något, hur många objekt som faller in i vissa sekventiella områden med numeriska värden. Huvudidén i det här fallet kommer att innehålla fraserna "i intervallet från x till y", "koncentration", "frekvens", "fördelning".

Datasammansättning- kombinera data i syfte att analysera den övergripande bilden som helhet, jämföra de komponenter som utgör en procentandel av en viss helhet. Nyckelfraser för kompositionen är "x%", "andel", "procent av helheten".

Jämförelse av data - kombinera data för att jämföra vissa indikatorer, avslöja hur objekt relaterar till varandra. Det är också en jämförelse av komponenter som förändras över tiden. Nyckelfraser för en idé vid jämförelse är "mer / mindre än", "lika", "förändringar", "upp / ner".

Efter att ha bestämt syftet med visualiseringen måste du bestämma datatypen. De kan vara mycket heterogena till typ och struktur, men i det enklaste fallet särskiljer de kontinuerliga numeriska och tidsmässiga data, diskreta data, geografiska och logiska data. Kontinuerliga numeriska data innehåller information om ett numeriskt värdes beroende av ett annat, till exempel grafer för funktioner som y = 2x. Kontinuerliga tidsramar innehåller data om händelser som inträffar under en viss tidsperiod, som en graf över temperaturen som mäts varje dag. Diskreta data kan innehålla beroenden av kategorivärden, till exempel en graf över antalet försäljningar av varor i olika butiker. Geografiska data innehåller olika information relaterad till plats, geologi och andra geografiska indikatorer, ett utmärkt exempel är en vanlig geografisk karta. Booleska data visar det logiska arrangemanget av komponenter i förhållande till varandra, till exempel ett släktträd.


Grafer av kontinuerliga numeriska och tidsmässiga data, diskreta data, geografiska och logiska data.

Beroende på syfte och data kan du välja det mest lämpliga schemat för dem. Det är bäst att undvika variation för variationens skull och välja ju enklare desto bättre. Endast för specifika data, använd specifika typer av diagram, i andra fall är de vanligaste diagrammen väl lämpade:

  • linjär (linje)
  • med områden
  • kolumner och histogram (stapel)
  • cirkeldiagram (paj, munk)
  • polär graf (radar)
  • spridning, bubbla
  • Kartor
  • träd (träd, mental karta, trädkarta)
  • tidsdiagram (tidslinje, gantt, vattenfall).

Linjediagram, områdesdiagram och stapeldiagram kan innehålla flera värden i ett argument för en kategori, som kan vara antingen absolut (då läggs prefixet staplade till dessa typer av diagram) eller relativa (helstackade).


Graf med staplade värden och med fullt staplade

När du väljer ett lämpligt schema kan du vägledas av följande tabell sammanställd från detta diagram och:


Korrekt användning av grafen

Det är viktigt att inte bara välja rätt typ av diagram, utan också att använda det korrekt:

  • Du behöver inte ladda grafen med mycket information. Det optimala antalet olika typer av data, kategorier är inte mer än 4-5, annars är det mer ändamålsenligt att dela upp ett sådant diagram i flera delar.


Detta diagram kan jämföras med spagetti och är bäst uppdelat i flera diagram.

Välj rätt skala och skala för grafen. För histogram och plotter med ytor är det att föredra att starta värdeskalan på noll. Försök att inte använda inverterade skalor - detta vilseleder ofta tittaren om data.


En felaktig skala påverkar uppfattningen av data negativt. I det första fallet är skalan felaktigt vald, i det andra är skalan inverterad.

  • För cirkeldiagram och grafer som visar en procentandel av totalen ska summan av värdena alltid vara 100 %.
  • För en bättre uppfattning av data är det bättre att ordna informationen på axeln - antingen efter värden, eller alfabetiskt eller efter logisk betydelse.

Korrekt utformning av schemat

Ingenting är mer tilltalande för ögat än välformade grafer, och ingenting förstör diagrammen mer än förekomsten av grafiskt skräp. Grundläggande designprinciper:

  • använd paletter med liknande, inte ljusa färger, och försök begränsa dig till en uppsättning av sex delar
  • hjälp- och sekundärlinjer ska vara enkla och inte iögonfallande


Hjälplinjer på grafen bör inte distrahera från huvudidén med data.

  • Använd om möjligt endast etiketter med horisontella axlar.
  • för tomter med ytor är det att föredra att använda en färg med genomskinlighet;
  • använd olika färger för varje kategori i diagrammet.

Slutsatser

Visualisering- ett kraftfullt verktyg för att kommunicera tankar och idéer till slutanvändaren, en assistent för uppfattning och analys av data. Men som alla verktyg måste det appliceras vid rätt tid och plats. Annars kan information uppfattas långsamt, eller till och med felaktigt.


Graferna visar samma data, de huvudsakliga visualiseringsfelen visas till vänster och de korrigeras till höger.

När den används skickligt kan datavisualisering göra innehåll imponerande, roligt och minnesvärt.

Under de senaste decennierna har nästan revolutionerande förändringar skett inom området för överföring av visuell information:

volymen och kvantiteten av överförd information har ökat enormt;

nya typer av visuell information och metoder för dess överföring har utvecklats.

Tekniska framsteg och bildandet av en ny visuell kultur sätter oundvikligen sin prägel på kravuppsättningen för lärares verksamhet.

Ett av sätten att förbättra den professionella utbildningen för framtida lärare som är kapabla till pedagogiska innovationer, till utvecklingen av teknologier för att utforma effektiva utbildningsaktiviteter för en student under villkoren för dominansen av den visuella miljön, är bildandet av deras speciella färdigheter att visualisera utbildningsinformation. Begreppet "visualisering" kommer från latinets visualis - uppfattat visuellt, visuellt. Informationsvisualisering presentation av numerisk och textuell information i form av grafer, diagram, strukturdiagram, tabeller, kartor m.m. En sådan förståelse av visualisering som en observationsprocess förutsätter dock minimal mental och kognitiv aktivitet hos eleverna, och visuella didaktiska verktyg fyller endast en illustrativ funktion. En annan definition av visualisering ges i de välkända pedagogiska begreppen (teorin om scheman - RS Anderson, F. Bartlett; teorin om ramar - Ch. Volker, M. Minsky, etc.), där detta fenomen tolkas som avlägsnandet i processen för kognitiv aktivitet från den interna planen till det yttre planet av mentala bilder, vars form spontant bestäms av mekanismen för associativ projektion.

På liknande sätt förstås begreppet visualisering av A. Verbitsky: ”Visualiseringsprocessen är vikningen av mentalt innehåll till en visuell bild; När bilden uppfattas kan den användas och tjäna som ett stöd för adekvata mentala och praktiska handlingar." Denna definition gör det möjligt att skilja begreppen "visuella", "visuella medel" från begreppen "visuella", "visuella medel". I den pedagogiska innebörden av begreppet "visuell" är alltid baserad på demonstration av specifika objekt, processer, fenomen, presentationen av en färdig bild, given från utsidan, och inte född och utförd från den interna planen för mänsklig aktivitet. Processen att veckla ut en mental bild och "överföra" den från det inre planet till det yttre planet är en projektion av den mentala bilden. Projektion är inbyggd i processerna för interaktion mellan subjektet och föremålen i den materiella världen, den förlitar sig på tänkandets mekanismer, täcker olika nivåer av reflektion och reflektion, manifesterar sig i olika former av pedagogisk verksamhet.

Om vi ​​målmedvetet betraktar produktiv kognitiv aktivitet som en process av interaktion mellan externa och interna planer, som överföringen av framtida produkter av aktivitet från den interna planen till den externa, som en justering och implementering av idéer i den externa planen, så agerar visualisering som huvudmekanism som ger en dialog mellan externa och interna verksamhetsplaner. Följaktligen, beroende på egenskaperna hos didaktiska visuella hjälpmedel, beror nivån på aktiveringen av elevernas mentala och kognitiva aktivitet.

I detta avseende ökar rollen för visuella modeller för presentation av pedagogisk information, vilket gör det möjligt att övervinna svårigheterna i samband med lärande baserat på abstrakt logiskt tänkande. Beroende på typen och innehållet i utbildningsinformationen används metoder för komprimering eller steg-för-steg-utbyggnad med en mängd olika visuella metoder. För närvarande verkar användningen av kognitiv visualisering av didaktiska objekt vara lovande i utbildningen. Denna definition inkluderar faktiskt alla möjliga typer av visualisering av pedagogiska objekt, som arbetar på principerna om koncentration av kunskap, generalisering av kunskap, expansion av orientering och presentationsfunktioner av visuella didaktiska verktyg, algoritmisering av pedagogiska och kognitiva handlingar, implementerade i visuella medel.

I praktiken används mer än hundra metoder för visuell strukturering - från traditionella diagram och grafer till "strategiska" kartor (vägkartor), strålspindlar och orsakskedjor. Denna mångfald beror på betydande skillnader i kunskapens art, egenskaper och egenskaper inom olika ämnesområden. Den största informationskapaciteten, enligt vår mening, är universaliteten och integrerbarheten hos strukturella och logiska system. Denna metod för systematisering och visuell visning av pedagogisk information är baserad på identifieringen av betydande kopplingar mellan kunskapselementen och analytisk-syntetisk aktivitet vid översättning av verbal information till icke-verbal (figurativ), genom att syntetisera ett integrerat system av kunskapselement. Att bemästra de listade typerna av konkretiserande betydelser, utveckla en logisk kedja av tänkande, beskriva bilder och deras tecken på mental aktivitet, såväl som operationer som använder verbala metoder för att utbyta information, bildar produktiva sätt att tänka som är så nödvändiga för specialister i den nuvarande takten utveckling av vetenskap, teknik och teknik. Enligt neuropsykologins prestationer är "inlärning effektiv när potentialen hos den mänskliga hjärnan utvecklas genom att övervinna intellektuella svårigheter i sökandet efter mening genom att etablera mönster."

Strukturella och logiska diagram skapar speciell tydlighet genom att arrangera innehållselement i en icke-linjär form och framhäva logiska och successiva samband mellan dem. Denna synlighet är baserad på strukturen och associativa kopplingar som är karakteristiska för en persons långtidsminne. På ett sätt fungerar strukturellt-logiska scheman som en mellanlänk mellan det externa linjära innehållet (text i läroboken) och det inre icke-linjära innehållet (i sinnet). Som en av fördelarna med de strukturella logikkretsarna A.V. Petrov betonar att "det utför funktionen att kombinera koncept i vissa system." Begreppen kan i sig inte säga något om innehållet i undervisningsämnet, men genom att de är sammanlänkade av ett visst system avslöjar de ämnets struktur, dess uppgifter och utvecklingsvägar. Att förstå och förstå en ny situation uppstår när hjärnan finner stöd i tidigare kunskaper och idéer.

Detta innebär vikten av ständig uppdatering av tidigare erfarenheter för att bemästra ny kunskap. Processen att lära sig nytt material kan representeras som uppfattningen och bearbetningen av ny information genom att korrelera den med de begrepp och handlingsmetoder som eleven känner till, genom användning av de intellektuella operationer som han behärskar. Information som kommer in i hjärnan genom olika kanaler konceptualiseras och struktureras och bildar konceptuella nätverk i medvetandet. Ny information byggs in i befintliga kognitiva scheman, transformerar dem och bildar nya kognitiva scheman och intellektuella operationer. Samtidigt etableras kopplingar mellan kända begrepp och handlingsmetoder och ny kunskap och ny kunskaps struktur växer fram.

Enligt psykologer assimileras ny information och kommer ihåg bättre när kunskaper och färdigheter "inpräntas" i systemet med visuellt-spatialt minne, därför gör presentationen av utbildningsmaterial i en strukturerad form dig att snabbt och bättre assimilera nya begreppssystem. , handlingsmetoder. Ett exempel är det visuella schemat: "RGB-färgmodell" (se fig. 2).



Ris. 2.

Visualisering av utbildningsmaterial öppnar möjligheten att inte bara samla alla teoretiska beräkningar, vilket gör att du snabbt kan reproducera materialet, utan också att tillämpa scheman för att bedöma graden av behärskning av ämnet som studeras. I praktiken används också i stor utsträckning metoden att analysera ett specifikt diagram eller tabell, där färdigheter i att samla in och bearbeta information utvecklas. Metoden gör det möjligt för praktikanter att aktivt delta i tillämpningen av teoretisk information i praktiskt arbete. En särskild plats ges för gemensamma diskussioner, där det finns möjlighet att få snabb feedback, för att bättre förstå dig själv och andra människor. Sammanfattningsvis konstaterar vi att, beroende på plats och syfte med visuellt didaktiskt material i processen att forma ett koncept (att studera en teori, ett fenomen), bör olika psykologiska och pedagogiska krav ställas vid valet av en viss strukturell modell och visuell visning av utbildningens innehåll.

Vid visualisering av utbildningsmaterial bör man komma ihåg att visuella bilder förkortar kedjorna av verbala resonemang och kan syntetisera en schematisk bild av en större "kapacitet" och därigenom kondensera information. I processen med att utveckla utbildnings- och metodmaterial är det nödvändigt att kontrollera graden av generalisering av utbildningens innehåll, att duplicera den verbala informationen i figurativa och vice versa, så att länkarna i den logiska kedjan vid behov är helt återställd av eleverna.

En annan viktig aspekt av att använda visuellt läromedel är att fastställa det optimala förhållandet mellan visuella bilder och verbal, symbolisk information. Konceptuellt och visuellt tänkande i praktiken är i ständig interaktion. De kompletterar varandra och avslöjar olika aspekter av det studerade konceptet, processen eller fenomenet. Verbalt-logiskt tänkande ger oss en mer korrekt och generaliserad reflektion av verkligheten, men denna reflektion är abstrakt. Visuellt tänkande hjälper i sin tur till att organisera bilder, gör dem holistiska, generaliserade, kompletta.

Visualisering av pedagogisk information låter dig lösa ett antal pedagogiska problem:

tillhandahållande av intensifiering av utbildning;

förbättra pedagogiska och kognitiva aktiviteter;

bildande och utveckling av kritiskt och visuellt tänkande;

visuell uppfattning;

bildlig presentation av kunskap och lärandeaktiviteter;

kunskapsöverföring och mönsterigenkänning;

förbättra visuell läskunnighet och visuell kultur.

"De säger att en teckning är värd mer än tusen ord, och det är den verkligen, förutsatt att teckningen är bra." Bowman

Med en ökning av mängden ackumulerad data, även när man använder godtyckligt kraftfulla och mångsidiga Data Mining-algoritmer, blir det svårare och svårare att "smälta" och tolka de erhållna resultaten. Och, som ni vet, är en av bestämmelserna i Data Mining sökandet efter praktiskt användbara mönster. Ett mönster kan bli praktiskt användbart endast om det kan förstås och förstås.

1987, på initiativ av ACM SIGGRAPH IEEE Computer Society Technical Committee of Computer Graphics, i samband med behovet av att använda nya metoder, verktyg och datateknologier, formulerades motsvarande uppgifter för visualiseringsriktningen.

Metoder för visuell eller grafisk presentation av data inkluderar grafer, diagram, tabeller, rapporter, listor, strukturdiagram, kartor, etc.

Traditionellt sett har visualisering setts som ett hjälpmedel vid dataanalys, men nu talar mer och mer forskning om dess oberoende roll.

Traditionella bildtekniker kan hitta följande applikationer:

presentera information för användaren i en visuell form;

kompakt beskriva mönstren som är inneboende i den ursprungliga datamängden;

minska dimension eller komprimera information;

reparera luckor i datasetet;

hitta brus och extremvärden i en datauppsättning.

Visualisering av verktyg för datautvinning

Var och en av Data Mining-algoritmerna använder en specifik visualiseringsmetod. I tidigare föreläsningar har vi tagit upp ett antal Data Mining-metoder. Under loppet av att använda var och en av metoderna, eller snarare, dess mjukvaruimplementering, fick vi några visualiserare, med hjälp av vilka vi kunde tolka resultaten som erhölls som ett resultat av arbetet med motsvarande metoder och algoritmer.

För beslutsträd är detta ett beslutsträdsvisualiserare, en lista med regler, en beredskapstabell.

För neurala nätverk, beroende på verktyget, kan det vara nätverkstopologin, en graf över förändringen i felvärdet som visar inlärningsprocessen.

För Kohonen-kort: kort med ingångar, utgångar, andra specifika kort.

För linjär regression fungerar regressionslinjen som en visualisering.

För klustring: dendrogram, scatterplots.

Spridningsdiagram och plotter används ofta för att bedöma prestandan för en viss metod.

Alla dessa sätt att visualisera eller visa data kan utföra en av funktionerna:

är en illustration av att bygga en modell (till exempel representerar strukturen (grafen) av ett neuralt nätverk);

hjälpa till att tolka det erhållna resultatet;

är ett sätt att bedöma kvaliteten på den konstruerade modellen;

kombinera funktionerna ovan (beslutsträd, dendrogram).

Visualisering av Data Mining-modeller

Den första funktionen (illustration av att bygga en modell) är faktiskt en visualisering av Data Mining-modellen. Det finns många olika sätt att presentera en modell, men att rita den ger användaren maximalt "värde". Användaren är i de flesta fall inte specialist på modellering, oftast är han expert inom sitt ämnesområde. Därför bör Data Mining-modellen presenteras på det språk som är mest naturligt för den, eller åtminstone innehålla ett minsta antal olika matematiska och tekniska element.

Tillgänglighet är alltså en av de viktigaste egenskaperna hos Data Mining-modellen. Trots detta finns det också ett så utbrett och enklaste sätt att representera en modell som en "svart låda". I det här fallet förstår inte användaren beteendet hos modellen han använder. Men trots missförståndet får han resultatet – de avslöjade mönstren. Ett klassiskt exempel på en sådan modell är den neurala nätverksmodellen.

Ett annat sätt att representera en modell är att presentera den på ett intuitivt och begripligt sätt. I det här fallet kan användaren verkligen förstå vad som händer "inuti" modellen. Således är det möjligt att säkerställa hans direkta deltagande i processen.

Sådana modeller ger användaren möjlighet att diskutera eller förklara sin logik med kollegor, kunder och andra användare.

Att förstå modellen leder till att man förstår dess innehåll. Som ett resultat av förståelsen ökar förtroendet för modellen. Ett klassiskt exempel är ett beslutsträd. Det konstruerade beslutsträdet förbättrar verkligen förståelsen av modellen, d.v.s. använt Data Mining-verktyg.

Förutom förståelse ger sådana modeller användaren möjlighet att interagera med modellen, ställa frågor till henne och få svar. Ett exempel på denna interaktion är vad-om-anläggningen. Genom dialogen "system-användare" kan användaren få en förståelse för modellen.

Låt oss nu gå vidare till funktionerna som hjälper till att tolka och utvärdera resultaten av att bygga Data Mining-modeller. Dessa är alla typer av grafer, diagram, tabeller, listor, etc.

Exempel på visualiseringsverktyg som kan användas för att bedöma kvaliteten på en modell är ett spridningsdiagram, en beredskapstabell och en graf över förändringen i felets storlek.

Scatter plotär en graf över avvikelsen mellan de värden som modellen förutspått från de verkliga. Dessa diagram används för kontinuerliga värden. Visuell bedömning av kvaliteten på den konstruerade modellen är möjlig endast i slutet av processen att bygga modellen.

Beredskapstabell används för att utvärdera klassificeringsresultaten. Sådana tabeller används för olika klassificeringsmetoder. Vi har redan använt dem i tidigare föreläsningar. Bedömning av kvaliteten på den konstruerade modellen är endast möjlig i slutet av processen att bygga modellen.

Grafen över förändringen i felets storlek... Grafen visar förändringen i storleken av felet i processen för modelldrift. Till exempel, under driften av neurala nätverk, kan användaren observera förändringen i felet på tränings- och testseten och stoppa träningen för att förhindra att nätverket "överanpassas". Här kan bedömningen av modellens kvalitet och dess förändringar bedömas direkt i processen att bygga modellen.

Exempel på visualisatorer som kan hjälpa dig att tolka resultatet är: trendlinje i linjär regression, Kohonen-kartor, scatterplot i klusteranalys.

Bildtekniker

Visualiseringsmetoder, beroende på antalet mätningar som används, klassificeras vanligtvis i två grupper:

presentation av data i en, två och tre dimensioner;

presentation av data i fyra eller flera dimensioner.

Presentation av data i en, två och tre dimensioner

Denna grupp av metoder inkluderar välkända metoder för att visa information som är tillgänglig för uppfattning av den mänskliga fantasin. Nästan alla moderna Data Mining-verktyg inkluderar visuella presentationsmetoder från denna grupp.

Beroende på antalet dimensioner av vyn kan dessa vara på följande sätt:

endimensionell (univariat) dimension, eller 1-D;

en tvådimensionell (bivariat) dimension, eller 2-D;

3D eller projektionsmätning, eller 3-D.

Det bör noteras att det mänskliga ögat mest naturligt uppfattar tvådimensionella representationer av information.

När du använder två- och tredimensionell presentation av information har användaren möjlighet att se mönstren för datamängden:

dess klusterstruktur och fördelningen av objekt i klasser (till exempel i ett spridningsdiagram);

topologiska egenskaper;

närvaro av trender;

information om det ömsesidiga arrangemanget av data;

förekomsten av andra beroenden som är inneboende i den studerade datamängden.

Om datasetet har fler än tre dimensioner är följande alternativ möjliga:

användningen av flerdimensionella metoder för att presentera information (de diskuteras nedan);

minskning i dimension till en-, två- eller tredimensionell presentation. Det finns olika sätt att reducera dimensionen, ett av dem - faktoranalys - diskuterades i en av de tidigare föreläsningarna. Självorganiserande Kohonen-kartor används för att reducera dimensionalitet och samtidigt visualisera information på en tvådimensionell karta.

Presentation av data i 4+ dimensioner

Representationer av information i fyrdimensionella och fler dimensioner är otillgängliga för människans uppfattning. Särskilda metoder har dock utvecklats för möjligheten att visa och uppfatta sådan information av en person.

De mest kända metoderna för multidimensionell informationspresentation:

parallella koordinater;

∙ "Chernovs ansikten";

radardiagram.

Parallella koordinater

I parallella koordinater kodas variabler horisontellt, med en vertikal linje som definierar variabelns värde. Ett exempel på en datauppsättning presenterad i kartesiska koordinater och parallella koordinater visas i fig. 16.1. Denna metod för att representera flerdimensionell data uppfanns av Alfred Inselberg 1985.

Informationsvisualisering

Enligt den redan etablerade traditionen, låt oss börja med definitionen.

Informationsvisualisering- presentation av information i form av grafer, diagram, strukturdiagram, tabeller, kartor m.m.

ecsocman.edu.ru

Varför visualisera information? "Dum fråga!" – kommer läsaren att utbrista. Naturligtvis uppfattas text med bilder bättre än "grå" text, och bilder med text uppfattas ännu bättre. Det är inte för inte som vi alla älskar serier så mycket - trots allt låter de oss bokstavligen ta tag i information i farten, till synes utan att anstränga oss det minsta! Och kom ihåg hur väl du minns under dina studier materialet från de föreläsningarna, som åtföljdes av bilder!

Det första vi tänker på när vi säger "visualisering" är ϶ᴛᴏ grafer och diagram (här är det, associationernas kraft!). Å andra sidan kan endast numeriska data visualiseras på detta sätt, ingen har ännu lyckats bygga en graf baserad på sammanhängande text. Till texten kan vi bygga en plan, lyfta fram huvudtankarna (uppsatserna) - göra en kort sammanfattning. Vi kommer att prata om nackdelarna och farorna med att göra anteckningar lite senare, men nu kommer vi att säga att om du kombinerar planen och en kort sammanfattning - "häng" teserna på grenarna av ett träd, vars struktur motsvarar strukturen (planen) av texten - då får vi ett utmärkt blockdiagram text͵ som kommer att komma ihåg mycket bättre än någon synopsis. I det här fallet kommer grenarna att spela rollen som de där "spåren" - spår som förbinder koncept och teser som vi pratade om tidigare.

Kommer du ihåg hur vi byggde UML-diagram baserat på beskrivningen av det designade mjukvarusystemet som vi fått från framtida användare? De resulterande bilderna uppfattades av både kunder och utvecklare mycket enklare och snabbare än en textbeskrivning. På samma sätt kan du "avbilda" absolut vilken text som helst, inte bara den tekniska uppgiften för utvecklingen av systemet. Tillvägagångssättet som beskrivs ovan låter dig visuellt presentera absolut vilken text som helst - vare sig det är en saga, en teknisk uppgift, en föreläsning, en fantasyroman eller resultatet av ett möte - i form av ett bekvämt och lättförståeligt träd. Du kan bygga det som du vill - om du bara får ett tydligt och begripligt diagram, som skulle vara trevligt att illustrera med lämpliga ritningar.

Sådana system är också bekväma att använda i kommunikation när man diskuterar eventuella frågor och problem. Som praxis visar skapar frånvaron av tydliga notationsstandarder inte absolut några kommunikationssvårigheter för deltagarna i diskussionerna. Tvärtom låter användningen av icke-verbala former av informationspresentation dig fokusera på problemets nyckelpunkter. Τᴀᴋᴎᴍ ᴏϬᴩᴀᴈᴏᴍ, visualisering är ett av de mest lovande områdena för att öka effektiviteten i analys, presentation, perception och förståelse av information.

Wow, äntligen är vi klara med den tråkiga beskrivningen av vetenskapliga teorier, metoder och tekniker som används för att bearbeta, organisera och visualisera information! Den föregående delen av kapitlet tröttade mycket både författaren och läsarna, och ändå var det nödvändigt: som ett resultat såg vi att funktionerna i vår hjärna redan används aktivt av forskare inom olika vetenskapsområden, många saker som verkar bekanta för oss, - persondatorer, användargränssnitt, kunskapsbaser, etc. - byggdes ursprungligen med hänsyn till mänskligt tänkandes associativa natur och dess tendens till hierarkisk representation och visualisering av information. Men toppen och det naturliga grafiska uttrycket av mänskliga tankeprocesser är mindmapping, som vi äntligen diskuterar. Och samtidigt kommer vi att försöka utöka vår förståelse av principerna för visuellt tänkande.

Informationsvisualisering - koncept och typer. Klassificering och funktioner i kategorin "Informationsvisualisering" 2017, 2018.