Methoden voor visuele presentatie van gegevens. Visualisatie methoden. Datavisualisatie in wetenschap en technologie

Computergraphics is een gebied van de informatica dat zich bezighoudt met algoritmen en technologieën voor datavisualisatie. De ontwikkeling van computergraphics wordt voornamelijk bepaald door twee factoren: de werkelijke behoeften van potentiële gebruikers en de mogelijkheden van hardware en software. De behoeften van consumenten en de mogelijkheden van technologie groeien gestaag en tegenwoordig worden computergraphics actief gebruikt op verschillende gebieden. De volgende toepassingsgebieden van computergraphics kunnen worden onderscheiden:

  1. Informatie visualisatie.
  2. Modellering van processen en fenomenen.
  3. Ontwerp van technische objecten.
  4. Organisatie van de gebruikersinterface.

Informatie visualisatie

De meeste wetenschappelijke artikelen en rapporten kunnen niet zonder datavisualisatie. Een behoorlijke vorm van datapresentatie is een goed gestructureerde tabel met de exacte waarden van een functie afhankelijk van enkele variabelen. Maar vaak is een meer visuele en effectieve vorm van datavisualisatie een grafische, en bijvoorbeeld bij modellering en beeldverwerking de enige mogelijke. Sommige soorten informatieweergave van verschillende oorsprong worden in de volgende tabel vermeld:

Veel programma's voor financiële, wetenschappelijke, technische berekeningen gebruiken deze en enkele andere methoden voor datavisualisatie. Visuele presentatie van informatie is een uitstekend hulpmiddel voor wetenschappelijk onderzoek, een helder en overtuigend argument in wetenschappelijke artikelen en discussies.

Modellering van processen en fenomenen

Moderne grafische systemen zijn krachtig genoeg om complexe animaties en dynamische afbeeldingen te maken. Simulatiesystemen, ook wel simulatoren genoemd, proberen een beeld te krijgen en te visualiseren van de processen en fenomenen die zich in de werkelijkheid voordoen of zouden kunnen voordoen. Het bekendste en meest complexe voorbeeld van een dergelijk systeem is een vluchtsimulator, die wordt gebruikt om de situatie en het vluchtproces te simuleren bij het trainen van piloten. In de optica worden simulators gebruikt om complexe, kostbare of gevaarlijke verschijnselen te simuleren. Bijvoorbeeld simulatie van beeldvorming of simulatie van processen in laserresonatoren.

Ontwerp van technische objecten

Design is een van de belangrijkste fasen in het creëren van een product in technologie. Met moderne grafische systemen kunt u het ontworpen object visueel visualiseren, wat bijdraagt ​​aan de vroege identificatie en oplossing van veel problemen. De ontwikkelaar beoordeelt zijn werk niet alleen op cijfers en indirecte parameters, hij ziet het ontwerpobject op zijn eigen scherm. Computersystemen maken het mogelijk om interactieve interactie met het ontworpen object te organiseren en de vervaardiging van een model uit een kunststof materiaal te simuleren. CAD-systemen vereenvoudigen en versnellen het werk van de ontwerpingenieur aanzienlijk en bevrijden hem van het routinematige tekenproces.

Organisatie van de gebruikersinterface

In de afgelopen 5-7 jaar is het visuele paradigma voor het organiseren van de interface tussen de computer en de eindgebruiker dominant geworden. Een grafische interface met venster is ingebouwd in veel moderne besturingssystemen. De set bedieningselementen die worden gebruikt om zo'n interface te bouwen, is al redelijk gestandaardiseerd. De meeste gebruikers zijn al gewend aan een dergelijke organisatie van de interface, waardoor gebruikers zich meer op hun gemak voelen en de efficiëntie van de interactie verhogen.

Dit alles suggereert dat in het besturingssysteem zelf al een voldoende groot aantal functies moet zijn geïmplementeerd om besturingen weer te geven. Het Windows-besturingssysteem biedt ontwikkelaars bijvoorbeeld een GDI (Graphics Device Interface). Zoals de praktijk laat zien, zijn de mogelijkheden van de systeem-API voor sommige toepassingen voldoende om de verwerkte gegevens te visualiseren (de eenvoudigste grafieken maken, die gemodelleerde objecten en verschijnselen vertegenwoordigen). Maar nadelen zoals lage weergavesnelheid, gebrek aan ondersteuning voor 3D-graphics dragen niet bij aan het gebruik ervan voor visualisatie van wetenschappelijke gegevens en computermodellering. Sommige wetenschappelijke en technische programma's met complexe grafische uitvoer vereisen functies voor snellere, krachtigere en flexibelere visualisatie van berekende gegevens, gesimuleerde verschijnselen en ontworpen objecten.

Computer grafische technologieën

In moderne wetenschappelijke en technische toepassingen wordt complexe grafische weergave geïmplementeerd met behulp van de OpenGL-bibliotheek, die de de facto standaard is geworden op het gebied van 3D-weergave. De OpenGL-bibliotheek is een zeer efficiënte software-interface voor grafische hardware. Deze bibliotheek kan de hoogste prestaties leveren in hardwaresystemen die draaien op moderne grafische versnellers (hardware die de processor vrijmaakt en berekeningen uitvoert die nodig zijn voor weergave).

De architectuur en algoritmen van de bibliotheek zijn in 1992 ontwikkeld door specialisten van Silicon Graphics, Inc. (SGI) voor eigen Iris grafische werkstationhardware. Een paar jaar later werd de bibliotheek geport naar vele hardware- en softwareplatforms (inclusief Intel + Windows) en tegenwoordig is het een betrouwbare multi-platformbibliotheek.

De OpenGL-bibliotheek is vrij herdistribueerbaar, wat het onbetwistbare voordeel is en de reden voor zo'n wijdverbreid gebruik.

OpenGL is geen objectgeoriënteerde, maar een procedurele bibliotheek (ongeveer honderd commando's en functies), geschreven in C. Aan de ene kant is dit een nadeel (computergraphics zijn een vruchtbaar gebied voor het gebruik van objectgeoriënteerd programmeren), maar programmeurs die met OpenGL werken kunnen werken met C++, Delphi, Fortran en zelfs Java en Python.

Verschillende helperbibliotheken worden vaak gebruikt in combinatie met OpenGL om de bibliotheek in een bepaalde omgeving aan te passen of om meer complexe, complexe weergavefuncties uit te voeren die worden geïmplementeerd via primitieve OpenGL-functies. Daarnaast is er een groot aantal gespecialiseerde grafische bibliotheken die de OpenGL-bibliotheek gebruiken als een low-level basis, een soort assembler, op basis waarvan complexe grafische uitvoerfuncties worden gebouwd (OpenInventor, vtk, IFL en vele anderen) . De OpenGL-gebruikersgemeenschap is te vinden op www.opengl.org

Microsoft heeft ook de DirectX-multimediabibliotheek ontwikkeld en stelt voor deze voor soortgelijke doeleinden te gebruiken. Deze bibliotheek wordt veel gebruikt in gaming- en multimediatoepassingen, maar is nog niet wijdverbreid verspreid in wetenschappelijke en technische toepassingen. De reden is hoogstwaarschijnlijk dat DirectX alleen onder Windows werkt.

Dit artikel is geschreven door een vertegenwoordiger van het bedrijf DevExpress en gepubliceerd in een blog op HabraHabr.

Medische onderzoekers hebben ontdekt dat als er alleen tekst in de instructies voor een medicijn staat, een persoon slechts 70% van de informatie ervan opneemt. Als je foto's toevoegt aan de instructie, leert de persoon al 95%.

Het is duidelijk dat een persoon aanleg heeft om alleen visuele informatie te verwerken. Behalve dat het uitstekend wordt verwerkt door onze hersenen, heeft datavisualisatie verschillende voordelen:

  • Focussen op verschillende aspecten van data


Met behulp van grafieken kunt u de aandacht van de lezer eenvoudig op de rode indicatoren vestigen.

  • Analyseren van een grote dataset met een complexe structuur
  • De informatie-overload van een persoon verminderen en zijn aandacht vasthouden
  • Eenduidigheid en duidelijkheid van outputgegevens
  • De relaties en relaties in de informatie benadrukken


Belangrijke gegevens zijn gemakkelijk te zien in de grafiek.

Esthetische aantrekkingskracht


Esthetisch aantrekkelijke graphics maken de presentatie van gegevens effectief en gedenkwaardig.

Edward Tufty, auteur van enkele van de beste boeken over visualisatie, beschrijft het als een hulpmiddel voor het weergeven van gegevens; de kijker aanmoedigen om na te denken over de essentie, niet over de methodologie; vermijd het vervormen van wat de gegevens zouden moeten zeggen; het weergeven van veel getallen in een kleine ruimte; het tonen van een grote dataset in een samenhangend en coherent geheel; de kijker aanmoedigen om stukjes gegevens te vergelijken; het dienen van voldoende duidelijke doelen: beschrijving, onderzoek, bestelling of decoratie ().

Hoe datavisualisatie correct gebruiken?

Het succes van visualisatie hangt rechtstreeks af van de juistheid van de toepassing, namelijk van de keuze van het type kaart, het juiste gebruik en ontwerp.


60% van het visualisatiesucces hangt af van de keuze van het type grafiek, 30% van het juiste gebruik en 10% van het juiste ontwerp.

Correct grafiektype

Met de grafiek kunt u het idee dat de gegevens bevatten op de meest volledige en nauwkeurige manier weergeven, dus het is erg belangrijk om het juiste type diagram te kiezen. De keuze kan worden gemaakt volgens het algoritme:

Visualisatie doelen- dit is de implementatie van het hoofdidee van informatie, dit is wat je nodig hebt om de geselecteerde gegevens te tonen, welk effect je moet bereiken - het identificeren van relaties in informatie, het tonen van de distributie van gegevens, samenstelling of vergelijking van gegevens.


De eerste rij toont grafieken met de doelen om relaties met de gegevens en de distributie van de gegevens weer te geven, en de tweede rij toont de doelen voor het weergeven van samenstelling en het vergelijken van gegevens.

Gegevensrelaties- dit is hoe ze van elkaar afhankelijk zijn, de verbinding tussen hen. Met behulp van relaties kunt u de aan- of afwezigheid van afhankelijkheden tussen variabelen identificeren. Als het hoofdidee van de informatie de uitdrukkingen "verwijst naar", "verlaagt / stijgt met", bevat, moet u ernaar streven om precies de relatie in de gegevens weer te geven.
De distributie van gegevens is hoe het zich ten opzichte van iets bevindt, hoeveel objecten in bepaalde opeenvolgende gebieden van numerieke waarden vallen. Het hoofdidee in dit geval zal de uitdrukkingen "in het bereik van x tot y", "concentratie", "frequentie", "verdeling" bevatten.

Gegevenssamenstelling- het combineren van gegevens om het totaalbeeld te analyseren, het vergelijken van de componenten die een percentage van een bepaald geheel vormen. Sleutelzinnen voor de compositie zijn "x%", "aandeel", "procent van het geheel".

Vergelijking van gegevens - het combineren van gegevens om enkele indicatoren te vergelijken, waardoor wordt onthuld hoe objecten zich tot elkaar verhouden. Het is ook een vergelijking van componenten die in de loop van de tijd veranderen. Sleutelzinnen voor een idee bij het vergelijken zijn "meer / minder dan", "gelijk", "verandert", "omhoog / omlaag".

Nadat u het doel van de visualisatie heeft bepaald, moet u het gegevenstype bepalen. Ze kunnen zeer heterogeen zijn in type en structuur, maar in het eenvoudigste geval onderscheiden ze continue numerieke en temporele gegevens, discrete gegevens, geografische en logische gegevens. Continue numerieke gegevens bevatten informatie over de afhankelijkheid van de ene numerieke waarde van de andere, bijvoorbeeld grafieken van functies zoals y = 2x. Doorlopende tijdframes bevatten gegevens over gebeurtenissen die zich gedurende een bepaalde periode hebben voorgedaan, zoals een grafiek van de dagelijks gemeten temperatuur. Discrete gegevens kunnen afhankelijkheden van categorische waarden bevatten, bijvoorbeeld een grafiek van het aantal verkopen van goederen in verschillende winkels. Geografische gegevens bevatten verschillende informatie met betrekking tot locatie, geologie en andere geografische indicatoren, een goed voorbeeld is een gewone geografische kaart. Booleaanse gegevens tonen de logische rangschikking van componenten ten opzichte van elkaar, zoals een stamboom.


Grafieken van continue numerieke en temporele gegevens, discrete gegevens, geografische en logische gegevens.

Afhankelijk van het doel en de gegevens kunt u het meest geschikte schema voor hen kiezen. Het is het beste om variatie te vermijden omwille van de variatie en kies hoe eenvoudiger hoe beter. Gebruik alleen voor specifieke gegevens specifieke soorten grafieken, in andere gevallen zijn de meest voorkomende grafieken zeer geschikt:

  • lineair (lijn)
  • met gebieden
  • kolommen en histogrammen (balk)
  • cirkeldiagram (taart, donut)
  • polaire grafiek (radar)
  • verstrooien, bellen
  • kaarten
  • bomen (boom, mentale kaart, boomkaart)
  • tijddiagrammen (tijdlijn, gantt, waterval).

Lijndiagrammen, vlakdiagrammen en histogrammen kunnen meerdere waarden in één argument voor één categorie bevatten, die ofwel absoluut (dan wordt het voorvoegsel gestapeld toegevoegd aan dit soort grafieken) of relatief (volledig gestapeld) kunnen zijn.


Grafiek met gestapelde waarden en met volledig gestapeld

Bij het kiezen van een geschikt schema kunt u zich laten leiden door de volgende tabel die is samengesteld uit dit diagram en:


Correct gebruik van de grafiek

Het is niet alleen belangrijk om het juiste type diagram te kiezen, maar ook om het correct te gebruiken:

  • U hoeft de grafiek niet met veel informatie te laden. Het optimale aantal verschillende soorten gegevens, categorieën is niet meer dan 4-5, anders is het handiger om zo'n diagram in verschillende stukken te verdelen.


Deze grafiek is te vergelijken met spaghetti en is het beste in te delen in meerdere grafieken.

Selecteer de juiste schaal en schaal voor de grafiek. Voor histogrammen en plots met vlakken verdient het de voorkeur om de waardeschaal op nul te laten beginnen. Probeer geen omgekeerde schalen te gebruiken - dit misleidt de kijker vaak over de gegevens.


Een onjuiste schaal heeft een negatief effect op de perceptie van de gegevens. In het eerste geval is de schaal verkeerd geselecteerd, in het tweede geval wordt de schaal omgekeerd.

  • Voor cirkeldiagrammen en grafieken die een percentage van het totaal weergeven, moet de som van de waarden altijd 100% zijn.
  • Voor een betere perceptie van de gegevens is het beter om de informatie op de as te rangschikken - hetzij op waarden, hetzij alfabetisch, of op logische betekenis.

Correct ontwerp van het schema

Niets is mooier voor het oog dan goed gevormde grafieken, en niets bederft de diagrammen meer dan de aanwezigheid van grafische rommel. Basis ontwerpprincipes:

  • gebruik paletten van vergelijkbare, niet felle kleuren, en probeer jezelf te beperken tot een set van zes stuks
  • hulp- en secundaire lijnen moeten eenvoudig en niet opvallend zijn


Hulplijnen op de grafiek mogen niet afleiden van het hoofdidee van de gegevens.

  • gebruik waar mogelijk alleen labels voor horizontale assen;
  • voor plots met vlakken verdient het de voorkeur om een ​​kleur met transparantie te gebruiken;
  • gebruik voor elke categorie op de kaart een andere kleur.

conclusies

visualisatie- een krachtig hulpmiddel voor het communiceren van gedachten en ideeën naar de eindgebruiker, een assistent voor de perceptie en analyse van gegevens. Maar zoals alle tools, moet het op het juiste moment en op de juiste plaats worden toegepast. Anders kan informatie langzaam of zelfs onjuist worden waargenomen.


De grafieken tonen dezelfde gegevens, de belangrijkste visualisatiefouten worden aan de linkerkant getoond en ze worden aan de rechterkant gecorrigeerd.

Bij vakkundig gebruik kan datavisualisatie inhoud indrukwekkend, leuk en gedenkwaardig maken.

De afgelopen decennia hebben er bijna revolutionaire veranderingen plaatsgevonden op het gebied van overdracht van visuele informatie:

het volume en de hoeveelheid verzonden informatie is enorm toegenomen;

nieuwe soorten visuele informatie en methoden voor de overdracht ervan zijn ontwikkeld.

Technische vooruitgang en de vorming van een nieuwe beeldcultuur drukken onvermijdelijk hun stempel op het eisenpakket van de activiteiten van leraren.

Een van de middelen om de professionele opleiding van toekomstige leraren die in staat zijn tot pedagogische innovaties te verbeteren, tot de ontwikkeling van technologieën voor het ontwerpen van effectieve educatieve activiteiten van een student in de omstandigheden van de dominantie van de visuele omgeving, is de vorming van hun speciale vaardigheden in visualiseren educatieve informatie. De term "visualisatie" komt van het Latijnse visualis - visueel waargenomen, visueel. Informatievisualisatie presentatie van numerieke en tekstuele informatie in de vorm van grafieken, diagrammen, structurele diagrammen, tabellen, kaarten, enz. Een dergelijk begrip van visualisatie als een observatieproces veronderstelt echter minimale mentale en cognitieve activiteit van studenten, en visuele didactische hulpmiddelen vervullen slechts een illustratieve functie. Een andere definitie van visualisatie wordt gegeven in de bekende pedagogische concepten (de theorie van schema's - RS Anderson, F. Bartlett; de theorie van frames - Ch. Volker, M. Minsky, enz.), waarin dit fenomeen wordt geïnterpreteerd als de verwijdering in het proces van cognitieve activiteit van het interne plan naar het externe vlak van mentale beelden, waarvan de vorm spontaan wordt bepaald door het mechanisme van associatieve projectie.

Evenzo wordt het concept van visualisatie begrepen door A. Verbitsky: “Het proces van visualisatie is het vouwen van mentale inhoud in een visueel beeld; waargenomen, kan het beeld worden ingezet en dienen als ondersteuning voor adequaat mentaal en praktisch handelen." Deze definitie maakt het mogelijk om de begrippen "visueel", "visuele middelen" te scheiden van de begrippen "visueel", "visuele middelen". In de pedagogische betekenis van het concept "visueel" is altijd gebaseerd op de demonstratie van specifieke objecten, processen, verschijnselen, de presentatie van een voltooid beeld, gegeven van buitenaf, en niet geboren en uitgevoerd vanuit het interne plan van menselijke activiteit. Het proces van het ontvouwen van een mentaal beeld en het 'overbrengen' van het interne naar het externe niveau is een projectie van het mentale beeld. Projectie is ingebouwd in de processen van interactie tussen het subject en de objecten van de materiële wereld, het steunt op de mechanismen van denken, omvat verschillende niveaus van reflectie en reflectie, en manifesteert zich in verschillende vormen van educatieve activiteit.

Als we productieve cognitieve activiteit doelbewust beschouwen als een proces van interactie tussen de externe en interne plannen, als de overdracht van toekomstige producten van activiteit van het interne plan naar het externe plan, als een aanpassing en implementatie in het externe plan van ideeën, dan is visualisatie fungeert als het belangrijkste mechanisme dat zorgt voor een dialoog tussen externe en interne activiteitenplannen. Bijgevolg hangt, afhankelijk van de eigenschappen van didactische visuele hulpmiddelen, het niveau van activering van de mentale en cognitieve activiteit van studenten af.

In dit opzicht neemt de rol van visuele modellen voor de presentatie van educatieve informatie toe, wat het mogelijk maakt om de moeilijkheden te overwinnen die gepaard gaan met leren op basis van abstract logisch denken. Afhankelijk van het type en de inhoud van de educatieve informatie, worden methoden van verdichting of stapsgewijze implementatie met behulp van verschillende visuele middelen gebruikt. Op dit moment lijkt het gebruik van cognitieve visualisatie van didactische objecten kansrijk in het onderwijs. Deze definitie omvat eigenlijk alle mogelijke soorten visualisatie van pedagogische objecten, werkend op de principes van concentratie van kennis, generalisatie van kennis, uitbreiding van oriëntatie- en presentatiefuncties van visuele didactische hulpmiddelen, algoritmisering van educatieve en cognitieve acties, geïmplementeerd in visuele middelen.

In de praktijk worden meer dan honderd methoden van visuele structurering gebruikt - van traditionele diagrammen en grafieken tot "strategische" kaarten (roadmaps), ray spiders en causale ketens. Deze diversiteit wordt veroorzaakt door grote verschillen in de aard, kenmerken en eigenschappen van kennis op verschillende vakgebieden. De grootste informatiecapaciteit is naar onze mening de universaliteit en integreerbaarheid van structurele en logische schema's. Deze methode van systematisering en visuele weergave van educatieve informatie is gebaseerd op de identificatie van significante verbanden tussen de elementen van kennis en analytisch-synthetische activiteit bij het vertalen van verbale informatie in non-verbale (figuratieve) synthese van een integraal systeem van kenniselementen. Het beheersen van de opgesomde soorten concretisering van betekenissen, het ontwikkelen van een logische gedachteketen, het beschrijven van beelden en hun tekenen van mentale activiteit, evenals operaties met behulp van verbale middelen om informatie uit te wisselen, vormt productieve manieren van denken die zo noodzakelijk zijn voor specialisten in het moderne tempo van de ontwikkeling van wetenschap, technologie en technologie. Volgens de prestaties van de neuropsychologie is "leren effectief wanneer het potentieel van het menselijk brein zich ontwikkelt door het overwinnen van intellectuele moeilijkheden bij het zoeken naar betekenis door het vaststellen van patronen."

Structurele en logische diagrammen creëren bijzondere duidelijkheid door inhoudselementen in een niet-lineaire vorm te rangschikken en logische en opeenvolgende verbanden daartussen te benadrukken. Deze zichtbaarheid is gebaseerd op de structuur en associatieve verbanden die kenmerkend zijn voor het langetermijngeheugen van een persoon. In zekere zin fungeren structureel-logische schema's als een tussenschakel tussen de externe lineaire inhoud (tekst van het leerboek) en de interne niet-lineaire inhoud (in de geest). Als een van de voordelen van de structurele logische schakelingen A.V. Petrov benadrukt dat "het de functie vervult van het combineren van concepten in bepaalde systemen." Op zichzelf kunnen concepten niets zeggen over de inhoud van het leeronderwerp, maar doordat ze verbonden zijn door een bepaald systeem, onthullen ze de structuur van het onderwerp, zijn taken en ontwikkelingspaden. Het begrijpen en begrijpen van een nieuwe situatie ontstaat wanneer de hersenen steun vinden in eerdere kennis en ideeën.

Dit impliceert het belang van constante actualisering van eerdere ervaringen voor het beheersen van nieuwe kennis. Het proces van het leren van nieuw materiaal kan worden weergegeven als de waarneming en verwerking van nieuwe informatie door deze te correleren met de concepten en handelingsmethoden die de student kent, door het gebruik van de intellectuele operaties die hij beheerst. Informatie die via verschillende kanalen de hersenen binnenkomt, wordt geconceptualiseerd en gestructureerd en vormt conceptuele netwerken in het bewustzijn. Nieuwe informatie wordt ingebouwd in bestaande cognitieve schema's, transformeert ze en vormt nieuwe cognitieve schema's en intellectuele operaties. Tegelijkertijd worden verbindingen gelegd tussen bekende concepten en werkwijzen en nieuwe kennis en ontstaat de structuur van nieuwe kennis.

Volgens psychologen wordt nieuwe informatie beter geassimileerd en onthouden wanneer kennis en vaardigheden worden "ingeprint" in het systeem van visueel-ruimtelijk geheugen, daarom stelt de presentatie van educatief materiaal in een gestructureerde vorm u in staat om nieuwe systemen van concepten snel en beter te assimileren , werkwijzen. Een voorbeeld is het visuele schema: "RGB-kleurmodel" (zie Fig. 2).



Rijst. 2.

Visualisatie van educatief materiaal biedt niet alleen de mogelijkheid om alle theoretische berekeningen samen te brengen, waardoor u het materiaal snel kunt reproduceren, maar ook om schema's toe te passen om de mate van beheersing van het bestudeerde onderwerp te beoordelen. In de praktijk wordt ook de methode van het analyseren van een specifiek diagram of tabel veel gebruikt, waarbij vaardigheden in het verzamelen en verwerken van informatie worden ontwikkeld. De methode stelt cursisten in staat actief betrokken te zijn bij de toepassing van theoretische informatie in praktisch werk. Een speciale plaats wordt gegeven aan gezamenlijke discussie, waarbij gelegenheid is om snel feedback te krijgen, om jezelf en andere mensen beter te begrijpen. Samenvattend wat is gezegd, merken we op dat, afhankelijk van de plaats en het doel van visueel didactisch materiaal in het proces van conceptvorming (het bestuderen van een theorie, een fenomeen), verschillende psychologische en pedagogische vereisten moeten worden gesteld aan de keuze van een bepaald structureel model en visuele weergave van de inhoud van het onderwijs.

Bij het visualiseren van educatief materiaal moet er rekening mee worden gehouden dat visuele beelden de ketens van verbaal redeneren verkorten en een schematisch beeld van een grotere "capaciteit" kunnen synthetiseren, waardoor informatie wordt gecondenseerd. Bij het ontwikkelen van educatief en methodologisch materiaal, is het noodzakelijk om de mate van generalisatie van de inhoud van de training te beheersen, de verbale informatie van het figuratieve te dupliceren en vice versa, zodat, indien nodig, de schakels van de logische keten zijn volledig gerestaureerd door de studenten.

Een ander belangrijk aspect van het gebruik van visueel lesmateriaal is het bepalen van de optimale verhouding tussen visuele beelden en verbale, symbolische informatie. Conceptueel en visueel denken in de praktijk zijn voortdurend in wisselwerking. Ze vullen elkaar aan en onthullen verschillende aspecten van het bestudeerde concept, proces of fenomeen. Verbaal-logisch denken geeft ons een meer accurate en algemene weerspiegeling van de werkelijkheid, maar deze reflectie is abstract. Visueel denken helpt op zijn beurt om beelden te ordenen, maakt ze holistisch, algemeen en compleet.

Visualisatie van educatieve informatie stelt u in staat een aantal pedagogische problemen op te lossen:

verzorgen van intensivering van opleidingen;

het verbeteren van educatieve en cognitieve activiteiten;

vorming en ontwikkeling van kritisch en visueel denken;

visuele perceptie;

figuurlijke presentatie van kennis en leeractiviteiten;

kennisoverdracht en patroonherkenning;

het versterken van visuele geletterdheid en beeldcultuur.

"Ze zeggen dat één tekening meer zegt dan duizend woorden, en dat is het ook, op voorwaarde dat de tekening goed is." Bowman

Met een toename van de hoeveelheid verzamelde gegevens, zelfs bij het gebruik van willekeurig krachtige en veelzijdige datamining-algoritmen, wordt het steeds moeilijker om de verkregen resultaten te "verteren" en te interpreteren. En, zoals u weet, is een van de voorzieningen van Data Mining het zoeken naar praktisch bruikbare patronen. Een patroon kan alleen praktisch bruikbaar worden als het kan worden begrepen en begrepen.

In 1987 werden op initiatief van de ACM SIGGRAPH IEEE Computer Society Technical Committee of Computer Graphics, in verband met de noodzaak om nieuwe methoden, tools en datatechnologieën te gebruiken, de bijbehorende taken van de visualisatierichting geformuleerd.

Methoden voor visuele of grafische presentatie van gegevens omvatten grafieken, grafieken, tabellen, rapporten, lijsten, structurele diagrammen, kaarten, enz.

Van oudsher werd visualisatie gezien als een hulpmiddel bij data-analyse, maar nu wordt in steeds meer onderzoek gesproken over de onafhankelijke rol ervan.

Traditionele beeldvormingstechnieken kunnen de volgende toepassingen vinden:

informatie in een visuele vorm aan de gebruiker presenteren;

de patronen die inherent zijn aan de oorspronkelijke dataset compact beschrijven;

afmetingen verkleinen of informatie comprimeren;

hiaten in de dataset repareren;

vind ruis en uitbijters in een dataset.

Visualisatie van dataminingtool

Elk van de Data Mining-algoritmen maakt gebruik van een specifieke visualisatie-aanpak. In eerdere colleges hebben we een aantal dataminingmethoden behandeld. Tijdens het gebruik van elk van de methoden, of beter gezegd, de software-implementatie ervan, ontvingen we enkele visualizers, met behulp waarvan we de resultaten konden interpreteren die zijn verkregen als resultaat van het werk van de overeenkomstige methoden en algoritmen.

Voor beslisbomen is dit een beslisboomvisualisatie, een lijst met regels, een contingentietabel.

Voor neurale netwerken kan dit, afhankelijk van de tool, de netwerktopologie zijn, een grafiek van de verandering in de foutwaarde die het leerproces laat zien.

Voor Kohonen-kaarten: kaarten van ingangen, uitgangen, andere specifieke kaarten.

Voor lineaire regressie fungeert de regressielijn als een visualizer.

Voor clustering: dendrogrammen, scatterplots.

Scatterplots en plots worden vaak gebruikt om de prestaties van een bepaalde methode te beoordelen.

Al deze manieren om gegevens te visualiseren of weer te geven, kunnen een van de volgende functies vervullen:

zijn een illustratie van het bouwen van een model (bijvoorbeeld een weergave van de structuur (grafiek) van een neuraal netwerk);

helpen bij het interpreteren van het verkregen resultaat;

zijn een middel om de kwaliteit van het geconstrueerde model te beoordelen;

combineer bovenstaande functies (beslissingsboom, dendrogram).

Visualisatie van dataminingmodellen

De eerste functie (illustratie van het bouwen van een model) is in feite een visualisatie van het Data Mining-model. Er zijn veel verschillende manieren om een ​​model te presenteren, maar door het in een grafiek te zetten, krijgt de gebruiker maximale "waarde". De gebruiker is in de meeste gevallen geen specialist in modelleren, meestal is hij een expert op zijn vakgebied. Daarom moet het dataminingmodel worden gepresenteerd in de taal die er het meest natuurlijk voor is, of in ieder geval een minimum aantal verschillende wiskundige en technische elementen bevatten.

Beschikbaarheid is dus een van de belangrijkste kenmerken van het dataminingmodel. Desondanks is er ook zo'n wijdverbreide en eenvoudigste manier om een ​​model als een "zwarte doos" weer te geven. In dit geval begrijpt de gebruiker het gedrag van het model dat hij gebruikt niet. Ondanks het misverstand krijgt hij echter het resultaat - de onthulde patronen. Een klassiek voorbeeld van zo'n model is het neurale netwerkmodel.

Een andere manier om een ​​model weer te geven, is door het op een intuïtieve, begrijpelijke manier te presenteren. In dit geval kan de gebruiker echt begrijpen wat er "binnen" het model gebeurt. Zo is het mogelijk om zijn directe deelname aan het proces te verzekeren.

Dergelijke modellen bieden de gebruiker de mogelijkheid om de logica ervan te bespreken of toe te lichten met collega's, klanten en andere gebruikers.

Inzicht in het model leidt tot inzicht in de inhoud ervan. Door inzicht neemt het vertrouwen in het model toe. Een klassiek voorbeeld is een beslisboom. De geconstrueerde beslisboom verbetert echt het begrip van het model, d.w.z. gebruikte dataminingtool.

Naast begrip bieden dergelijke modellen de gebruiker de mogelijkheid om met het model te communiceren, haar vragen te stellen en antwoorden te krijgen. Een voorbeeld van deze interactie is de what-if-faciliteit. Via het dialoogvenster "systeemgebruiker" kan de gebruiker inzicht krijgen in het model.

Laten we nu verder gaan met de functies die helpen bij het interpreteren en evalueren van de resultaten van het bouwen van Data Mining-modellen. Dit zijn allerlei soorten grafieken, grafieken, tabellen, lijsten, etc.

Voorbeelden van visualisatietools die kunnen worden gebruikt om de kwaliteit van een model te beoordelen, zijn een scatterplot, een contingentietabel en een grafiek van de verandering in de grootte van de fout.

Scatterplot is een grafiek van de afwijking van de door het model voorspelde waarden van de echte. Deze grafieken worden gebruikt voor continue waarden. Visuele beoordeling van de kwaliteit van het geconstrueerde model is alleen mogelijk aan het einde van het proces van het bouwen van het model.

Contingentietabel gebruikt om de classificatieresultaten te evalueren. Dergelijke tabellen worden gebruikt voor verschillende classificatiemethoden. We hebben ze al gebruikt in eerdere colleges. Beoordeling van de kwaliteit van het geconstrueerde model is alleen mogelijk aan het einde van het proces van het bouwen van het model.

De grafiek van de verandering in de grootte van de fout... De grafiek toont de verandering in de grootte van de fout in het proces van modelbewerking. Tijdens de werking van neurale netwerken kan de gebruiker bijvoorbeeld de verandering in de fout op de trainings- en testsets observeren en de training stoppen om "overfitting" van het netwerk te voorkomen. Hier kan de beoordeling van de kwaliteit van het model en de wijzigingen ervan direct in het proces van het bouwen van het model worden beoordeeld.

Voorbeelden van visualizers die u kunnen helpen bij het interpreteren van het resultaat zijn: trendlijn in lineaire regressie, Kohonen-kaarten, scatterplot in clusteranalyse.

beeldtechnieken

Visualisatiemethoden worden, afhankelijk van het aantal gebruikte metingen, meestal ingedeeld in twee groepen:

presentatie van gegevens in één, twee en drie dimensies;

presentatie van gegevens in vier of meer dimensies.

Presentatie van gegevens in één, twee en drie dimensies

Deze groep methoden omvat bekende methoden voor het weergeven van informatie die beschikbaar is voor waarneming door de menselijke verbeelding. Bijna elke moderne tool voor datamining bevat visuele presentatiemethoden uit deze groep.

Afhankelijk van het aantal dimensies van het aanzicht, kunnen dit de volgende manieren zijn:

eendimensionale (univariate) dimensie, of 1-D;

een tweedimensionale (bivariate) dimensie, of 2-D;

3D- of projectiemeting, of 3-D.

Opgemerkt moet worden dat het menselijk oog het meest natuurlijk tweedimensionale representaties van informatie waarneemt.

Bij gebruik van twee- en driedimensionale presentatie van informatie heeft de gebruiker de mogelijkheid om de patronen van de dataset te zien:

de clusterstructuur en de verdeling van objecten in klassen (bijvoorbeeld in een spreidingsdiagram);

topologische kenmerken;

aanwezigheid van trends;

informatie over de onderlinge rangschikking van gegevens;

het bestaan ​​van andere afhankelijkheden die inherent zijn aan de bestudeerde dataset.

Als de dataset meer dan drie dimensies heeft, zijn de volgende opties mogelijk:

het gebruik van multidimensionale methoden voor het presenteren van informatie (deze worden hieronder besproken);

verkleining tot een-, twee- of driedimensionale presentatie. Er zijn verschillende manieren om de dimensie te verkleinen, een ervan - factoranalyse - werd besproken in een van de vorige colleges. Zelforganiserende Kohonen-kaarten worden gebruikt om de dimensionaliteit te verminderen en tegelijkertijd informatie te visualiseren op een tweedimensionale kaart.

Presentatie van gegevens in 4+ dimensies

Representaties van informatie in vierdimensionale en meer dimensies zijn ontoegankelijk voor menselijke waarneming. Er zijn echter speciale methoden ontwikkeld om dergelijke informatie door een persoon te kunnen weergeven en waarnemen.

De meest bekende methoden voor multidimensionale informatiepresentatie:

parallelle coördinaten;

∙ "De gezichten van Tsjernov";

radarkaarten.

Parallelle coördinaten

In parallelle coördinaten worden variabelen horizontaal gecodeerd, waarbij een verticale lijn de waarde van de variabele definieert. Een voorbeeld van een dataset gepresenteerd in Cartesiaanse coördinaten en parallelle coördinaten wordt getoond in Fig. 16.1. Deze methode om multidimensionale gegevens weer te geven is uitgevonden door Alfred Inselberg in 1985.

Informatie visualisatie

Laten we, volgens de reeds gevestigde traditie, beginnen met de definitie.

Informatie visualisatie- presentatie van informatie in de vorm van grafieken, diagrammen, structurele diagrammen, tabellen, kaarten, enz.

ecsocman.edu.ru

Waarom informatie visualiseren? "Stomme vraag!" - zal de lezer uitroepen. Natuurlijk wordt tekst met afbeeldingen beter waargenomen dan "grijze" tekst, en afbeeldingen met tekst nog beter. Het is niet voor niets dat we allemaal zo dol zijn op strips - ze stellen ons tenslotte in staat om letterlijk informatie direct te begrijpen, schijnbaar zonder de minste mentale inspanning! En weet je nog hoe goed je je tijdens je studie de stof herinnert van die colleges, die vergezeld gingen van dia's!

Het eerste dat in ons opkomt als we zeggen "visualisatie" zijn ϶ᴛᴏ grafieken en diagrammen (hier is het, de kracht van associaties!). Aan de andere kant kunnen alleen numerieke gegevens op deze manier worden gevisualiseerd; het is nog niemand gelukt om een ​​grafiek te bouwen op basis van coherente tekst. Voor de tekst kunnen we een plan maken, de belangrijkste gedachten (stellingen) markeren - een korte samenvatting maken. We zullen later praten over de nadelen en gevaren van het maken van aantekeningen, maar nu zullen we zeggen dat als je het plan en een korte samenvatting combineert - de stellingen "hangt" aan de takken van een boom, waarvan de structuur overeenkomt met de structuur (plan) van de tekst - dan krijgen we een excellent blokdiagram tekst͵ die veel beter zal worden onthouden dan welke synopsis dan ook. In dit geval zullen de takken de rol spelen van die "sporen" - sporen die concepten en stellingen verbinden waar we het eerder over hadden.

Weet je nog hoe we UML-diagrammen hebben gebouwd op basis van de beschrijving van het ontworpen softwaresysteem dat we van toekomstige gebruikers hebben ontvangen? De resulterende afbeeldingen werden door zowel klanten als ontwikkelaars veel gemakkelijker en sneller waargenomen dan een tekstbeschrijving. Op dezelfde manier kunt u absoluut elke tekst "afbeelden", niet alleen de technische taak voor de ontwikkeling van het systeem. Met de hierboven beschreven aanpak kunt u absoluut elke tekst visueel presenteren - of het nu een sprookje, een technische taak, een lezing, een fantasieroman of de resultaten van een vergadering is - in de vorm van een handige en gemakkelijk te begrijpen boom. Je kunt het bouwen zoals je wilt - als je maar een duidelijk en begrijpelijk diagram krijgt, dat leuk zou zijn om te illustreren met passende tekeningen.

Dergelijke schema's zijn ook handig om te gebruiken in communicatie bij het bespreken van problemen en problemen. Zoals de praktijk laat zien, levert het ontbreken van duidelijke notatiestandaarden absoluut geen communicatieproblemen op voor de deelnemers aan de discussies. Integendeel, door het gebruik van non-verbale vormen van informatiepresentatie kunt u zich concentreren op de belangrijkste punten van het probleem. Bovendien is visualisatie een van de meest veelbelovende gebieden om de efficiëntie van analyse, presentatie, perceptie en begrip van informatie te vergroten.

Wow, eindelijk zijn we klaar met de vervelende beschrijving van wetenschappelijke theorieën, methoden en technieken die worden gebruikt om informatie te verwerken, organiseren en visualiseren! Het vorige deel van het hoofdstuk vermoeide zowel de auteur als de lezers enorm, en toch was het nodig: als gevolg hiervan zagen we dat de functies van onze hersenen al actief worden gebruikt door wetenschappers op verschillende wetenschapsgebieden, veel dingen die ons bekend voorkomen, - personal computers, gebruikersinterfaces, kennisbanken, enz. - werden oorspronkelijk gebouwd rekening houdend met de associatieve aard van het menselijk denken en zijn neiging tot hiërarchische representatie en visualisatie van informatie. Maar het toppunt en de natuurlijke grafische uitdrukking van menselijke denkprocessen is mindmapping, waar we het nu eindelijk over hebben. En tegelijkertijd zullen we proberen ons begrip van de principes van visueel denken uit te breiden.

Informatievisualisatie - concept en typen. Classificatie en kenmerken van de categorie "Informatievisualisatie" 2017, 2018.