Informasjonskoding. Generell informasjon om informasjonskoding Generell informasjon om informasjonskoding Numerisk informasjonskoding Tekstkoding. Koding av informasjon i en datamaskin

Alfabetisk tegnkoding

Forelesning 8. Datarepresentasjon av tekst

Datarepresentasjonen av tekst er assosiert med kodesystemet, som begynte å utvikle seg lenge før datamaskinens bruk. I utviklingen av tekstkodingssystemet kan følgende funksjoner bemerkes.

1. Informasjon vises aldri i sin rene form, den er alltid på en eller annen måte presentert, på en eller annen måte kodet. Menneskeheten begynte å løse problemet med koding av informasjon lenge før datamaskinen kom. Som et resultat av å løse denne skremmende oppgaven, skrift - som talekodesystem og regning - som tallkodesystem.

2. En person uttrykker tankene sine i form av setninger som består av ord. Ord på sin side er bygd opp av bokstaver. Bokstavene er kombinert til et alfabet. Grunnlaget for språket er alfabet - et begrenset sett med forskjellige tegn (symboler) av enhver art, som en melding er sammensatt av.

3. En og samme oppføring kan ha ulike betydninger. For eksempel kan et sett med tall 251299 bety: massen til et objekt; lengden på objektet; avstand mellom objekter; telefonnummer; datoopptak osv. En post er data som kun kan konverteres til informasjon som følge av dekoding. Og dermed, for å presentere informasjon må du kjenne til kodings- og dekodingssystemet eller visse regler for å skrive koder.

Koding- dette er prosessen med å presentere informasjon i form av en kode, eller overgangen fra ett format til et annet, mer praktisk for lagring, overføring eller behandling av informasjon.

Kode et sett med konvensjoner for å representere informasjon.

Dekoding - innhenting av informasjon ved hjelp av en kode (omvendt transformasjon).

Kryptering - koding utført med sikte på å klassifisere en melding, kalles resultatet av kryptering kryptogram eller kryptering.

4. Informasjon kan kodes på ulike måter: muntlig, skriftlig, ved bevegelser eller signaler av annen art (trafikksignaler, telefonsamtaler). Oftest er tekster på naturlig språk kodet. Det finnes ulike kodemetoder for naturlige språk, la oss dvele ved de mest typiske og mye brukte metodene.

1. Grafisk - basert på bruk av spesialtegninger eller skilt. Grafisk koding beskrives for eksempel i Conan Doyles litterære verk «Dancing Men», hvor en sekvens av menneskelige figurer ble brukt til å kryptere meldinger. Et annet eksempel på grafisk koding er morsekode, laget av den amerikanske oppfinneren Samuel Morse i 1837 for å kode meldinger telegrafisk. I morsekode er hver bokstav eller tegn representert av en kombinasjon av prikker og bindestreker, eller en serie med korte og lange pip. Til nå er morsesignaler brukt i nautisk praksis, for eksempel nødsignalet - SOS (redd våre sjeler).



2. Karakter basert på tegn (bokstaver) i samme alfabet som originalteksten. Metoden brukes for eksempel i kryptografi ved oppretting av krypterte meldinger. En av de første anvendelsene av metoden var kodingen av det engelske alfabetet, foreslått i 1580 av Francis Bacon. Bacons chiffer (tabell 8.1) er basert på en binær 5-sifret kode eller et to-tegns alfabet bestående av bokstavene A og B.

Tabell 8.1

Engelsk alfabetkoding

en AAAAA g AABBA n ABBAA t BAABA
b AAAAB h ABBB j ABBAB v BAABB
c AAABA Jeg ABAAA s ABBBA w BABAA
d AAABB k ABAAB q ABBBB x BABAB
e AABAA l ABABA r BAAAA y BABBA
f AABAB m ABABB s BAAAB z BABBB

For å lage meldinger basert på systemet foreslått av Bacon, kreves et alfabet med to tegn, men lengden på selve meldingen øker med 5 ganger, siden hver bokstav erstattes av et sett med 5 tegn.

3. Numerisk - basert på koding av tegn ved hjelp av tall. Metoden ble utbredt takket være utviklingen av datamaskiner. I en datamaskin brukes to tall for å kode bokstaver: 0 og 1. I motsetning til Bacon-chifferet, hvor en 5-bits representasjon er tilstrekkelig, aksepteres i datateknologi en 8-bits eller 8-bits representasjon av tegn. En sekvens på 8 biter danner 1 byte, en byte brukes til å kode ett tegn. Antall mulige kombinasjoner av 0 og 1 i en byte beregnes ved hjelp av formelen 2 8 = 256. Dette betyr at 256 forskjellige tegn kan kodes med én byte ved å endre rekkefølgen for å skrive nuller og enere.

Det numeriske kodesystemet for datategn bør betraktes som et vanlig system. Når man lager et slikt kodesystem, brukes velkjente tilnærminger og prinsipper. La oss vurdere hvordan den numeriske metoden er implementert for å kode datamaskintekst.

1.2 Informasjonskoding

Informasjon presenteres i ulike former under oppfatningen av miljøet av levende organismer og mennesker, i utveksling av informasjon mellom mennesker og mennesker, mennesker og datamaskiner, datamaskiner og datamaskiner, og så videre. Å konvertere informasjon fra en representasjonsform (tegnsystem) til en annen kalles koding.

Kodemidlet er en samsvarstabell for skiltsystemer, som etablerer en en-til-en-korrespondanse mellom tegn eller grupper av tegn for to forskjellige skiltsystemer.

I prosessen med å utveksle informasjon er det ofte nødvendig å utføre operasjoner med koding og dekoding av informasjon. Når du skriver inn et alfabettegn i en datamaskin ved å trykke på den tilsvarende tasten på tastaturet, blir tegnet kodet, det vil si at datamaskinkoden konverteres. Når et tegn vises på skjermen til en skjerm eller skriver, skjer den omvendte prosessen - dekoding, når tegnet konverteres fra en datamaskinkode til dets grafiske bilde.

Med bruken av språk, og deretter tegnsystemer, utvidet mulighetene for kommunikasjon mellom mennesker. Dette gjorde det mulig å lagre ideer, oppnådd kunnskap og eventuelle data, overføre dem på ulike måter over avstand og til andre tider – ikke bare til deres samtid, men også til fremtidige generasjoner. Skapelsene til forfedre har overlevd til i dag, som ved hjelp av forskjellige symboler foreviget seg selv og sine gjerninger i monumenter og inskripsjoner. Bergmalerier (petroglyfer) er fortsatt et mysterium for forskere. Kanskje ville de gamle menneskene på denne måten komme i kontakt med oss, de fremtidige innbyggerne på planeten og rapportere om hendelsene i deres liv.

Hver nasjon har sitt eget språk, bestående av et sett med tegn (bokstaver): russisk, engelsk, japansk og mange andre. Du har allerede blitt kjent med språket i matematikk, fysikk, kjemi.

Representasjon av informasjon ved hjelp av et språk kalles ofte koding.

Kode - et sett med symboler (konvensjoner) for å representere informasjon. Koding er prosessen med å representere informasjon i form av en kode.

Føreren sender et signal med et pip eller blinkende frontlykter. Koden er tilstedeværelse eller fravær av et pip, og i tilfelle lyssignalering, blinking av frontlykter eller fravær.

Du står overfor koding av informasjon når du krysser veien i henhold til trafikksignaler. Koden bestemmer fargene på trafikklyset - rødt, gult, grønt.

Det naturlige språket folk kommuniserer på er også basert på kode. Bare i dette tilfellet kalles det alfabetet. Når du snakker, overføres denne koden med lyder, når du skriver - med bokstaver. Den samme informasjonen kan representeres ved hjelp av forskjellige koder. For eksempel kan et opptak av en samtale tas opp ved hjelp av russiske bokstaver eller spesielle ordrettssymboler.

Etter hvert som teknologien utviklet seg, dukket det opp forskjellige måter å kode informasjon på. I andre halvdel av 1800-tallet oppfant den amerikanske oppfinneren Samuel Morse en fantastisk kode som fortsatt tjener menneskeheten i dag. Informasjonen er kodet med tre "bokstaver": et langt signal (strek), et kort signal (punkt) og ingen signal (pause) for å skille bokstaver. Dermed reduseres kodingen til å bruke et sett med tegn arrangert i en strengt definert rekkefølge.

1.3 Representasjon av informasjon i binær kode

Folk har alltid lett etter måter å raskt utveksle meldinger på. Til dette ble det sendt bud, brevduer ble brukt. Folkene hadde ulike metoder for å varsle om en forestående fare: tromming, røyk fra bål, flagg osv. Bruk av en slik presentasjon av informasjon krever imidlertid en foreløpig avtale om forståelsen av det mottatte budskapet.

Den berømte tyske vitenskapsmannen Gottfried Wilhelm Leibniz foreslo et unikt og enkelt system for å representere tall tilbake på 1600-tallet. "Beregning ved å bruke toer ... er grunnleggende for vitenskapen og genererer nye oppdagelser ... når tallene reduseres til den enkleste begynnelsen, som er 0 og 1, vises en fantastisk rekkefølge overalt."

I dag er denne metoden for å presentere informasjon ved å bruke et språk som inneholder bare to bokstaver i alfabetet - 0 og 1, mye brukt i tekniske enheter, inkludert datamaskiner. Disse to tegnene 0 og 1 kalles vanligvis binære sifre eller bits (fra engelsk bit - BinaryDigit - binært tegn).

All informasjon som datamaskinen behandler må representeres i binær kode ved bruk av to sifre 0 og 1. Disse to tegnene kalles vanligvis binære sifre eller biter. Enhver melding kan kodes med to sifre 0 og 1. Dette var grunnen til at to viktige prosesser må organiseres i en datamaskin: koding og dekoding.

Koding som konverterer inndatainformasjon til en datamaskinlesbar form, dvs. binær kode.

Dekoding er transformasjon av data fra binær kode til en menneskelig lesbar form.

Fra et synspunkt av teknisk implementering viste bruken av et binært tallsystem for koding av informasjon å være mye enklere enn bruken av andre metoder. Faktisk er det praktisk å kode informasjon i form av en sekvens av nuller og enere, hvis disse verdiene presenteres som to mulige stabile tilstander til et elektronisk element:

Mangel på elektrisk signal;

Tilstedeværelsen av et elektrisk signal.

Disse forholdene er enkle å skille. Ulempen med binær koding er lange koder. Men i teknologi er det lettere å håndtere et stort antall enkle elementer enn med et lite antall komplekse.

Du må hele tiden møte en enhet som bare kan være i to stabile tilstander: på/av. Selvfølgelig er dette en velkjent bryter. Men det viste seg å være umulig å komme opp med en bryter som stabilt og raskt kunne bytte til noen av de 10 tilstandene. Som et resultat, etter en rekke mislykkede forsøk, kom utviklerne til den konklusjon at det var umulig å bygge en datamaskin basert på desimaltallsystemet. Og det binære tallsystemet var grunnlaget for representasjonen av tall i en datamaskin.

Metoder for koding og dekoding av informasjon på en datamaskin avhenger først og fremst av typen ;, informasjon, nemlig hva som skal kodes: tall, tekst, grafikk eller lyd.

Representasjon (koding) av tall

Tall brukes til å registrere informasjon om antall objekter. Tall skrives med et sett med spesialtegn.

Et tallsystem er en måte å skrive tall ved å bruke et sett med spesialtegn kalt tall.

Tallsystemer er delt inn i posisjonelle og ikke-posisjonelle.

I posisjonstallsystemer avhenger verdien angitt med et siffer i nummerposten av dens posisjon i tallet (posisjonen).

Fargebilder genereres i henhold til den binære koden til fargen til hvert punkt lagret i videominnet. Fargebilder kan ha forskjellige fargedybder, som er spesifisert av antall biter som brukes til å kode fargen til et punkt. De vanligste fargedybdeverdiene er 8,16, 24 eller 32 biter.

Et fargebilde på en skjerm dannes ved å blande tre grunnleggende farger: rød, grønn og blå. Denne fargemodellen kalles RGB-modell etter de første bokstavene i de engelske fargenavnene (Rød, Grønn, Blå).


Konklusjon

Informasjon kan klassifiseres på mange forskjellige måter, og ulike vitenskaper gjør dette på forskjellige måter. For eksempel, i filosofi er det et skille mellom objektiv og subjektiv informasjon. Objektiv informasjon gjenspeiler fenomenene natur og menneskelig samfunn. Subjektiv informasjon skapes av mennesker og gjenspeiler deres syn på objektive fenomener.

I informatikk vurderes analog informasjon og digital informasjon separat. Dette er viktig, siden en person, takket være sansene, er vant til å håndtere analog informasjon, mens datateknologi tvert imot hovedsakelig jobber med digital informasjon.

En person oppfatter informasjon ved hjelp av sansene. Lys, lyd, varme er energiske signaler, og smak og lukt er et resultat av virkningen av kjemiske forbindelser, som også er basert på energetisk natur. En person opplever energetisk påvirkning kontinuerlig og vil kanskje aldri møte den samme kombinasjonen av dem to ganger. Det er ikke to identiske grønne blader på ett tre og to helt identiske lyder - denne informasjonen er analog. Hvis forskjellige farger er gitt tall, og forskjellige lyder - notater, kan analog informasjon konverteres til digital.

Informasjonskoding. Informasjonskoding er prosessen med å danne en spesifikk representasjon av informasjon.

I en snevrere forstand blir begrepet "koding" ofte forstått som en overgang fra en form for informasjonspresentasjon til en annen, mer praktisk for lagring, overføring eller behandling.

En datamaskin kan kun behandle informasjon presentert i numerisk form. All annen informasjon (lyder, bilder, instrumentavlesninger osv.) for behandling på en datamaskin må konverteres til numerisk form. For å digitalisere en musikalsk lyd kan du for eksempel måle intensiteten til lyden ved spesifikke frekvenser med korte intervaller, og presentere resultatene av hver måling i numerisk form. Ved hjelp av dataprogrammer kan du transformere informasjonen som mottas, for eksempel "overlagre" lyder fra forskjellige kilder oppå hverandre.

På samme måte kan tekstinformasjon behandles på en datamaskin. Når den legges inn i en datamaskin, er hver bokstav kodet med et visst tall, og når de sendes ut til eksterne enheter (skjerm eller utskrift), blir bilder av bokstaver konstruert for menneskelig oppfatning ved hjelp av disse tallene. Korrespondansen mellom et sett med bokstaver og tall kalles tegnkoding.

Som regel er alle tall i en datamaskin representert ved hjelp av nuller og enere (og ikke ti sifre, slik det er vanlig for mennesker). Med andre ord, datamaskiner fungerer vanligvis i et binært tallsystem, siden enhetene for deres behandling er mye enklere.


Liste over brukt litteratur

1. Agaltsov V.P., Titov V.M. Informatikk for økonomer: Lærebok. - M .: ID "FORUM": INFRA-M, 2006. - 448 s.

2. Informatikk for økonomer: Lærebok / Under totalt. utg. V.M. Matyushka. - M .: INFRA-M, 2007 .-- 880-tallet.

3. Informatikk. Generelt kurs: Lærebok / Red. I OG. Kolesnikov. - M .: Publishing and Trade Corporation "Dashkov and K ◦"; Rostov n/a: Nauka-Press, 2008 .-- 400 s.

Den utfører sine aktiviteter, jo flere forsyninger som leveres til bedriften, desto mer stabil er bedriften. Når du utfører forsyninger til bedriften, behandles og lagres en stor mengde informasjon relatert til forsyninger, som inkluderer: rettidig og riktig papirarbeid og kontroll over hver operasjon av varemottak fra ...

Informasjonsegenskaper

Informasjon har følgende egenskaper:

  • troverdighet
  • fylde
  • nøyaktighet
  • verdi
  • aktualitet
  • forståelighet
  • tilgjengelighet
  • korthet osv.

4) Klassifisering- et system for fordeling av objekter (objekter, fenomener, prosesser, konsepter) i klasser i samsvar med et spesifikt trekk.

1. Informasjon kan deles inn i 2 typer i henhold til presentasjonsformen:
- diskret form for informasjonspresentasjon - analog eller kontinuerlig form for informasjonspresentasjon

2. I henhold til opprinnelsesområdet kan informasjon skilles:
- elementær - biologisk - sosial

3. I henhold til metoden for overføring og persepsjon skilles følgende typer informasjon:
- visuell - auditiv - taktil - organoleptisk - maskin

4. Informasjon opprettet og brukt av en person til offentlige formål kan deles inn i tre typer:
- personlig - masse - spesiell

5. Ved hjelp av kodingsmetoder skilles følgende typer informasjon:
- symbolsk - tekstlig - grafisk.

5) En meningsfull tilnærming til å måle informasjon. Melding er en informativ strøm som, i prosessen med å overføre informasjon, kommer til mottakeren. En melding bærer informasjon for en person hvis informasjonen i den er ny og forståelig for ham Informasjon - menneskelig kunnskap? meldingen skal være informativ. Hvis meldingen ikke er informativ, så er mengden informasjon fra en persons synspunkt = 0. (Eksempel: en universitetslærebok i høyere matematikk inneholder kunnskap, men den er ikke tilgjengelig for en 1. klasse student)

Alfabetisk tilnærming til å måle informasjon knytter ikke informasjonsmengden til innholdet i meldingen. Den alfabetiske tilnærmingen er en objektiv tilnærming til å måle informasjon. Det er praktisk når man bruker tekniske virkemidler for å jobbe med informasjon, fordi avhenger ikke av innholdet i meldingen. Mengden informasjon avhenger av tekstvolumet og kraften til alfabetet. Det er ingen begrensninger på den maksimale kardinaliteten til alfabetet, men det er et tilstrekkelig alfabet med en kardinalitet på 256 tegn. Dette alfabetet brukes til å representere tekster på en datamaskin. Siden 256 = 2 8, har 1 tegn 8 biter med informasjon i teksten.



En probabilistisk tilnærming til å måle informasjon. Alle hendelser skjer med forskjellige sannsynligheter, men forholdet mellom sannsynligheten for hendelser og mengden informasjon som innhentes når en hendelse inntreffer kan uttrykkes med formelen som Shannon foreslo i 1948.

6) Mengde informasjon- i informasjonsteori er dette mengden informasjon i ett tilfeldig objekt i forhold til et annet

Mengde informasjon kan betraktes som et tiltak for å redusere kunnskapsusikkerheten ved mottak av informasjonsmeldinger.

Med all mangfoldet av tilnærminger til definisjonen av begrepet informasjon, fra synspunktet om å måle informasjon, skilles to av dem: definisjonen av K. Shannon, brukt i matematisk informasjonsteori (meningsfull tilnærming), og definisjonen av AN Kolmogorov, brukt innen informatikk knyttet til bruk av datamaskiner (alfabetisk tilnærming).


  1. Innholdstilnærming. Ifølge Shannon er informativiteten til en melding preget av den nyttige informasjonen den inneholder – den delen av meldingen som fullstendig fjerner eller reduserer tvetydigheten i en situasjon. Ifølge Shannon er informasjon en reduksjon i usikkerheten til vår kunnskap.

Men hvis antallet utfall ikke avhenger av folks vurderinger (saken med å kaste en terning eller en mynt), så er informasjon om forekomsten av et av de mulige utfallene objektiv.

Hvis meldingen har redusert kunnskapsusikkerheten nøyaktig to ganger, så sier de at meldingen inneholder 1 bit informasjon.

1 bit er mengden informasjon i en slik melding som halverer usikkerheten til kunnskap.


  1. Alfabetisk tilnærming. Den alfabetiske tilnærmingen er basert på det faktum at enhver melding kan kodes ved hjelp av en begrenset sekvens av tegn i et eller annet alfabet.

Et alfabet er et ordnet sett med tegn som brukes til å kode meldinger på et bestemt språk.

I - mengde informasjon

N er antall forskjellige hendelser.

Invers formel N = 2 I

7) Som allerede nevnt er den grunnleggende måleenheten for informasjon litt. 8 biter er 1 byte.

Sammen med bytes brukes større enheter for å måle mengden informasjon:

1 KB (én kilobyte) = 210 byte = 1024 byte;

1 MB (én megabyte) = 210 KB = 1024 KB;

1 GB (én gigabyte) = 210 MB = 1024 MB.

Nylig, i forbindelse med økningen i mengden behandlet informasjon, ble slike avledede enheter som:

1 terabyte (TB) = 1024 GB = 240 byte,

1 Petabyte (PB) = 1024 TB = 250 byte.

1 byte = 8 biter;

1 kilobyte (KB) = 2 10 byte

1 MegaByte (MB) = 2 10 KB eller 2 20 byte

1 Gigabyte (GB) = 2 10 MB eller 2 30 byte

1 Terabyte (TB) = 2 10 GB eller 2 40 byte

  • 9) 2 - binær (i diskret matematikk, informatikk, programmering);
  • 3 - ternær;
  • 8 - oktal;
  • 10 - desimal (brukes overalt);
  • 12 - duodesimal (teller i dusinvis);
  • 13 - tri-desimal;
  • 16 - heksadesimal (brukt i programmering, informatikk);
  • 60 - sexagesimal (enheter for måling av tid, måling av vinkler og spesielt koordinater, lengde- og breddegrad).

9) Tallsystem- en symbolsk metode for å skrive tall, som representerer tall ved å bruke skriftlige tegn.

Notasjon:

· Gir representasjoner av et sett med tall (heltall og/eller reelle);

· Gir hvert tall en unik representasjon (eller i det minste en standardrepresentasjon);

· Gjenspeiler den algebraiske og aritmetiske strukturen til tall.

10) addisjon, subtraksjon, divisjon, multiplikasjon av ikke-desimale tall.

11) dette er en oversettelse fra ett tallsystem til et annet

Metoder for koding av informasjon.

Den samme informasjonen kan presenteres (kodes) i flere former. Med fremkomsten av datamaskiner ble det nødvendig å kode alle typer informasjon som både en enkelt person og menneskeheten som helhet forholder seg til. Men menneskeheten begynte å løse problemet med koding av informasjon lenge før fremkomsten av datamaskiner. Menneskehetens enorme prestasjoner - skriving og regning - er ikke annet enn et system for koding av tale og numerisk informasjon. Informasjon vises aldri i sin rene form, den er alltid på en eller annen måte presentert, på en eller annen måte kodet.

Binær koding- en av de vanligste måtene å presentere informasjon på. I datamaskiner, roboter og numerisk styrte maskinverktøy er som regel all informasjon som enheten omhandler kodet i form av ord i et binært alfabet.

Kode - (1) en regel som beskriver korrespondansen mellom tegn eller deres kombinasjoner av ett alfabet til tegn eller deres kombinasjoner av et annet alfabet; - (2) sekundære alfabettegn som brukes til å representere tegn eller kombinasjoner av primæralfabetet.

Koding er oversettelsen av informasjon representert av det primære alfabetet til en sekvens av koder.

Dekoding er omvendt operasjon av koding, dvs. gjenoppretting av informasjon i det primære alfabetet i henhold til den mottatte sekvensen av koder.

Operasjonskoding og dekoding kalles reversible hvis deres sekvensielle applikasjon gir en retur til den opprinnelige informasjonen uten tap.

13) Binært system - grunnlaget for informasjonskoding for datamaskiner

14) Det er to måter å representere tall i datamaskinens minne. De heter slik: fast punktform og flytende punktform. Fastpunktformen gjelder for heltall, og flyttallformen gjelder reelle tall (heltall og brøker). Punktet her betyr fortegnseparatoren til heltalls- og brøkdelene av et tall.

15) Dermed går koding før overføring og lagring av informasjon. I dette tilfellet, som nevnt tidligere, er lagring assosiert med å fikse en viss tilstand av informasjonsbæreren, og overføring - med en endring i tilstand over tid (dvs. en prosess). Disse tilstandene eller signalene vil bli kalt elementære signaler - det er deres kombinasjon som utgjør det sekundære alfabetet.

Uten de tekniske aspektene ved overføring og lagring av en melding (dvs. hvordan overføring og mottak av en sekvens av signaler eller låsing av tilstander faktisk implementeres), er den matematiske formuleringen av kodingsproblemet gitt som følger.

Etter type kommunikasjonslinjer: kablet; kabel; fiberoptisk;

strømledninger; radiokanaler osv.

2... Etter karakteren av signalene: kontinuerlige; diskret; diskret-kontinuerlig (signaler ved inngangen til systemet er diskrete, og ved utgangen er kontinuerlige, og omvendt).

3... For støyimmunitet: kanaler uten forstyrrelser; med forstyrrelser.

18) Eller kortere: en algoritme er en strengt definert sekvens av handlinger som kreves for å løse et gitt problem

19) I praksis er følgende former for presentasjon av algoritmer vanlige:


  • verbal(opptak på naturlig språk);

  • grafikk(bilder fra grafiske symboler);

  • pseudokoder(semi-formaliserte beskrivelser av algoritmer i et betinget algoritmisk språk, inkludert både programmeringsspråkelementer og naturlige språkfraser, generelt akseptert matematisk notasjon, etc.);

  • programmatisk(tekster på programmeringsspråk).

20) Komprimering av informasjon er prosessen med å konvertere informasjon som er lagret i en fil, som et resultat av at redundansen reduseres, og følgelig kreves mindre minne for lagring.

En arkivfil er en spesielt organisert fil som inneholder en eller flere filer i komprimert eller ukomprimert form og tjenesteinformasjon om filnavn, dato og klokkeslett for opprettelse eller endring, størrelser osv.

Arkivering (pakking) - plassere (laste) kildefiler i en arkivfil i komprimert eller ukomprimert form.

22) Kode- et sett med symboler (symboler) for å representere informasjon. Koding- prosessen med å presentere informasjon i form av en kode.

Vektor- og fraktalbilder.

Vektorbilde er et grafisk objekt som består av elementære linjer og buer. Grunnelementet i bildet er en linje. Som ethvert objekt har det egenskaper: form (rett, kurve), tykkelse., Farge, stil (stiplet, solid). Lukkede linjer har egenskapen å fylle (enten med andre objekter, eller med en valgt farge). Alle andre vektorgrafikkobjekter er sammensatt av linjer. Siden en linje beskrives matematisk som et enkelt objekt, er datamengden for å vise et objekt ved hjelp av vektorgrafikk mye mindre enn i rastergrafikk. Informasjon om et vektorbilde er kodet som vanlig alfanumerisk og behandlet av spesielle programmer.

Programvareverktøyene for å lage og behandle vektorgrafikk inkluderer følgende GR: CorelDraw, Adobe Illustrator, samt vectorizers (tracer) - spesialiserte pakker for konvertering av rasterbilder til vektorer.

Fraktal grafikk er basert på matematiske beregninger, som vektor. Men i motsetning til vektoren, er dens grunnleggende element selve den matematiske formelen. Dette fører til at ingen objekter er lagret i datamaskinens minne og bildet bygges kun av ligninger. Ved å bruke denne metoden kan du bygge de enkleste vanlige strukturene, samt komplekse illustrasjoner som imiterer landskap.

Oppgaver.

Det er kjent at videominnet til en datamaskin er 512 KB. Skjermoppløsning 640 x 200
a) med 8 farger;
b) 16 farger;
c) 256 farger?

Hvor mange bits tar det for å kode 130 skyggeinformasjon? Det er lett å beregne at 8 (det vil si 1 byte), fordi med 7 biter kan du lagre skyggenummeret fra 0 til 127, og 8 bits lagre fra 0 til 255. Det er lett å se at denne kodemetoden ikke er optimalt: 130 er merkbart mindre enn 255. Tenk på hvordan du kan kondensere informasjon om en tegning når du skriver den til en fil, hvis det er kjent at
a) tegningen inneholder samtidig kun 16 fargenyanser av 138 mulige;
b) alle 130 nyanser er tilstede på tegningen samtidig, men antall prikker malt i forskjellige nyanser er svært forskjellig.

A) det er åpenbart at 4 bits (en halv byte) er nok til å lagre informasjon om 16 nyanser. Men siden disse 16 nyansene er valgt fra 130, kan de ha tall som ikke passer i 4 bits. Derfor vil vi bruke palettmetoden. La oss tilordne våre "lokale" tall fra 1 til 15 til de 16 nyansene som brukes i tegningen vår og kode hele tegningen med en hastighet på 2 poeng per byte. Og legg deretter til denne informasjonen (på slutten av filen som inneholder den) en oppslagstabell som består av 16 par byte med skyggenummer: 1 byte er vårt "lokale" nummer i denne figuren, den andre er det reelle tallet til denne fargen. . (når, i stedet for sistnevnte, kodet informasjon om selve skyggen brukes, for eksempel informasjon om lysstyrken til gløden til "elektronkanonene" Rød, Grønn, Blå i et katodestrålerør, vil en slik tabell representerer en palett av farger). Hvis tegningen er stor nok, vil gevinsten i størrelsen på den resulterende filen være betydelig;
b) vi skal prøve å implementere den enkleste algoritmen for å arkivere informasjon om figuren. La oss tildele de tre nyansene, som fyller minimum antall prikker, koder 128 - 130, og resten av nyansene - koder 1 - 127. Vi vil skrive til en fil (som i dette tilfellet ikke er en sekvens av bytes, men en kontinuerlig bitstrøm) syv-bits koder for nyanser med tall fra 1 til 127. etterfulgt av et to-bits "lokalt" nummer, og kl. på slutten av filen legger du til en korrespondansetabell mellom "lokale" og reelle tall. Siden nyanser med kodene 128 - 130 er sjeldne, vil det være få sju-bits nuller.

Merk at å stille spørsmål i denne oppgaven ikke utelukker andre løsninger, uten referanse til fargekomposisjonen til bildet - arkivering:
a) på grunnlag av å fremheve en sekvens av prikker, malt over med de samme nyanser og erstatte hver av disse sekvensene med et par tall (farge), (antall) (dette prinsippet er grunnlaget for PCX-grafikkformatet);
b) ved å sammenligne piksellinjer (ta opp antall nyanser av punkter på den første siden som helhet, og for påfølgende linjer registrere antall nyanser av bare de punktene hvis nyanser er forskjellige fra nyansene av punkter i samme posisjon i forrige linje - dette er grunnlaget for GIF-formatet);
c) ved å bruke en fraktal bildepakkealgoritme (YPEG-format). (IO 6,1999)

Verden er fylt med et bredt utvalg av lyder: tikk av klokker og summing av motorer, hylende vind og rasling av løv, fuglesang og menneskers stemmer. Folk begynte å gjette om hvordan lyder blir født og hva de er i veldig lang tid. Til og med den gamle greske filosofen og vitenskapsmannen - leksikonet Aristoteles, basert på observasjoner, forklarte lydens natur, og mente at en klingende kropp skaper vekslende kompresjon og sjeldne luft. Så noen ganger tømmes en oscillerende streng, for så å kondensere luften, og på grunn av luftens elastisitet blir disse vekslende påvirkningene overført videre ut i rommet - fra lag til lag oppstår elastiske bølger. Når de når øret vårt, virker de på trommehinnene og produserer følelsen av lyd.

Ved øret oppfatter en person elastiske bølger med en frekvens et sted i området fra 16 Hz til 20 kHz (1 Hz - 1 vibrasjon per sekund). I samsvar med dette kalles elastiske bølger i ethvert medium, hvis frekvenser ligger innenfor de angitte grensene, lydbølger eller ganske enkelt lyd. I studiet av lyd kan begreper som f.eks tone og klang lyd. Enhver ekte lyd, enten det er spill av musikkinstrumenter eller stemmen til en person, er en slags blanding av mange harmoniske vibrasjoner med et visst sett med frekvenser.

Oscillasjonen som har lavest frekvens kalles grunnleggende tone, annet - overtoner.

Timbre- et annet antall overtoner som er iboende i en bestemt lyd, noe som gir den en spesiell farge. Forskjellen mellom en klang fra en annen skyldes ikke bare tallet, men også intensiteten til overtonene som følger med lyden til hovedtonen. Det er ved klangen vi lett kan skille mellom lydene til et piano og en fiolin, en gitar og en fløyte, og gjenkjenne stemmen til en kjent person.

Musikalsk lyd kan karakteriseres av tre kvaliteter: klang, det vil si fargen på lyden, som avhenger av formen på vibrasjoner, høyden, som bestemmes av antall vibrasjoner per sekund (frekvens), og lydstyrke, som avhenger på intensiteten til vibrasjonene.

Datamaskinen er nå mye brukt på ulike felt. Behandling av lydinformasjon og musikk var intet unntak. Frem til 1983 ble alle innspillinger av musikk gitt ut på vinylplater og kompaktkassetter. For tiden er CD-er mye brukt. Hvis du har en datamaskin der det er installert et studiolydkort, med MIDI-keyboard og mikrofon koblet til, kan du jobbe med spesialisert musikkprogramvare.

Konvensjonelt kan det deles inn i flere typer:

1) alle slags verktøy og drivere designet for å fungere med spesifikke lydkort og eksterne enheter;
2) lydredigerere, som er designet for å fungere med lydfiler, lar deg utføre alle operasjoner med dem - fra oppdeling i deler til behandling med effekter;
3) programvaresynthesizere, som dukket opp relativt nylig og fungerer riktig bare på kraftige datamaskiner. De lar deg eksperimentere med å lage forskjellige lyder;
annen.

Den første gruppen inkluderer alle operativsystemverktøy. Win 95 og 98 har for eksempel sine egne miksere og verktøy for lydavspilling/opptak, CD-avspilling og standard MIDI-filer. Etter å ha installert et lydkort, kan du bruke disse programmene til å sjekke ytelsen. For eksempel er Phonograph-programmet utviklet for å fungere med wave-filer (lydopptaksfiler i Windows-format). Disse filene har filtypen .WAV. Dette programmet gir muligheten til å spille, ta opp og redigere lydopptaksteknikker som ligner på teknikkene for å jobbe med en båndopptaker. Det anbefales å koble en mikrofon til en datamaskin for å jobbe med Phonograph. Hvis du trenger å gjøre et lydopptak, må du bestemme deg for lydkvaliteten, siden varigheten av lyden avhenger av den. Den mulige varigheten av lyden er jo kortere, jo høyere opptakskvalitet. Med gjennomsnittlig opptakskvalitet kan tale tas opp tilfredsstillende, og produsere filer på opptil 60 sekunder. Omtrent 6 sekunder vil være et opptak av musikk-CD-kvalitet.

Men hvordan skjer lydkoding? Siden barndommen står vi overfor opptak av musikk på forskjellige medier: grammofonplater, kassetter, CD-er, etc. For øyeblikket er det to hovedmåter å ta opp lyd på: analog og digital. Men for å ta opp lyd på et eller annet medium, må det konverteres til et elektrisk signal.

Dette gjøres ved hjelp av en mikrofon. De enkleste mikrofonene har en membran som vibrerer med lydbølger. En spole er festet til membranen og beveger seg synkront med membranen i et magnetfelt. En elektrisk vekselstrøm genereres i spolen. Spenningsvariasjoner reflekterer lydbølger nøyaktig.

En elektrisk vekselstrøm som vises ved utgangen av en mikrofon kalles analog signal. Når det brukes på et elektrisk signal, betyr "analog" at signalet er kontinuerlig i tid og amplitude. Den reflekterer nøyaktig formen på lydbølgen som beveger seg gjennom luften.

Lydinformasjon kan presenteres i diskret eller analog form. Forskjellen deres er at med en diskret presentasjon av informasjon, endres en fysisk mengde brått ("stige"), og får et begrenset sett med verdier. Hvis informasjon presenteres i analog form, kan en fysisk mengde ta på seg et uendelig antall verdier som er i kontinuerlig endring.

Vinylplaten er et eksempel på analog lagring av lydinformasjon, siden lydsporet kontinuerlig endrer form. Men analoge båndopptak har en stor ulempe – aldringen av mediet. I løpet av et år kan et fonogram som hadde et normalt nivå av høye frekvenser miste dem. Vinylplater mister kvalitet flere ganger når de spilles. Derfor foretrekkes digitalt opptak.

På begynnelsen av 1980-tallet dukket det opp CD-er. De er et eksempel på diskret lagring av lydinformasjon, siden lydsporet på en CD inneholder områder med ulik reflektivitet. I teorien kan disse digitale platene vare evig hvis de ikke blir ripet opp, dvs. deres fordeler er holdbarhet og motstand mot mekanisk aldring. En annen fordel er at det ikke er noe tap av lydkvalitet med digital dubbing.

På multimedia lydkort finner du analog mikrofon forforsterker og mikser.

Digital-til-analog og analog-til-digital konvertering av lydinformasjon.

La oss ta en rask titt på prosessene for å konvertere lyd fra analog til digital og omvendt. En grov ide om hva som skjer i lydkortet kan bidra til å unngå noen feil når du arbeider med lyd.

Lydbølger konverteres til et analogt vekslende elektrisk signal ved hjelp av en mikrofon. Den går gjennom lydbanen (se vedlegg figur 1.11, skjema 1) og går inn i analog-til-digital-omformeren (ADC) - en enhet som konverterer signalet til digital form.

I en forenklet form er prinsippet for drift av ADC som følger: den måler signalamplituden med jevne mellomrom og sender videre, allerede gjennom den digitale banen, en tallsekvens som bærer informasjon om amplitudeendringene (se vedlegg figur 1.11, Skjema 2).

Under analog-til-digital konvertering skjer ingen fysisk konvertering. Et avtrykk eller prøve fjernes så å si fra det elektriske signalet, som er en digital modell av spenningssvingninger i lydbanen. Hvis dette er avbildet i form av et diagram, presenteres denne modellen i form av en sekvens av kolonner, som hver tilsvarer en bestemt numerisk verdi. Det digitale signalet er diskret i naturen - det vil si diskontinuerlig, så den digitale modellen samsvarer ikke nøyaktig med den analoge bølgeformen.

Prøve er tidsintervallet mellom to målinger av den analoge signalamplituden.

Sample oversettes bokstavelig talt fra engelsk som "sample". I multimedia og profesjonell lydterminologi har dette ordet flere betydninger. I tillegg til en tidsperiode, kalles en prøve også en hvilken som helst sekvens av digitale data som ble oppnådd ved analog-til-digital konvertering. Selve transformasjonsprosessen kalles prøvetaking. På russisk fagspråk kaller de det prøvetaking.

Den digitale lyden sendes ut ved hjelp av en digital-til-analog-omformer (DAC), som, basert på de innkommende digitale dataene, til de riktige tidspunktene, genererer et elektrisk signal med nødvendig amplitude (se vedlegg figur 1.11, skjema 3).

Alternativer prøvetaking

Viktige parametere prøvetaking er frekvens og bitdybde.
Frekvens- antall målinger av den analoge signalamplituden per sekund.

Hvis samplingsfrekvensen ikke er mer enn det dobbelte av frekvensen til den øvre grensen til lydområdet, vil tap oppstå ved høye frekvenser. Dette forklarer hvorfor standard lyd-CD-frekvens er 44,1 kHz. Siden svingningsområdet til lydbølger er i området fra 20 Hz til 20 kHz, bør antall signalmålinger per sekund være større enn antall svingninger over samme tidsperiode. Hvis samplingshastigheten er betydelig lavere enn frekvensen til lydbølgen, har signalamplituden tid til å endre seg flere ganger i løpet av tiden mellom målingene, og dette fører til at det digitale fingeravtrykket bærer et kaotisk datasett. Med digital-til-analog konvertering overfører ikke en slik prøve hovedsignalet, men produserer bare støy.

I det nye CD-formatet Audio DVD måles signalet 96 000 ganger på ett sekund, d.v.s. bruk en samplingshastighet på 96 kHz. For å spare plass på harddisken i multimedieapplikasjoner brukes ofte lavere frekvenser: 11, 22, 32 kHz. Dette fører til en nedgang i det hørbare frekvensområdet, noe som betyr at det er en sterk forvrengning av det som høres.

Hvis vi i form av en graf representerer den samme lyden med en høyde på 1 kHz (en tone opp til den syvende oktav på pianoet tilsvarer omtrent denne frekvensen), men samplet med en annen frekvens (den nedre delen av sinusformen er ikke vist i alle grafer), vil forskjellene være synlige. En deling på den horisontale aksen, som viser tiden, tilsvarer 10 prøver. Skalaen er tatt på samme måte (se vedlegg figur 1.13). Du kan se at ved 11 kHz er det omtrent fem svingninger av lydbølgen for hver 50 sampler, det vil si at en periode av sinusbølgen vises med bare 10 verdier. Dette er en ganske upresis overføring. På samme tid, hvis vi vurderer samplingsfrekvensen på 44 kHz, er det allerede nesten 50 prøver for hver periode av sinusoiden. Dette lar deg få et signal av god kvalitet.

Litt dybde indikerer nøyaktigheten som amplituden til det analoge signalet endres med. Nøyaktigheten som verdien av signalamplituden på hvert tidspunkt sendes med under digitalisering bestemmer kvaliteten på signalet etter digital-til-analog-konverteringen. Det er på bitdybden at påliteligheten til bølgeformrekonstruksjonen avhenger.

Amplitudeverdien er kodet ved hjelp av det binære kodingsprinsippet. Lydsignalet skal presenteres som en sekvens av elektriske impulser (binære nuller og enere). Vanligvis brukes 8, 16-bits eller 20-bits representasjoner av amplitudeverdiene. Når et kontinuerlig lydsignal er binærkodet, erstattes det av en sekvens av diskrete signalnivåer. Kodekvaliteten avhenger av samplingshastigheten (antall målinger av signalnivået per tidsenhet). Med en økning i samplingshastigheten øker nøyaktigheten til den binære representasjonen av informasjon. Ved en frekvens på 8 kHz (antall målinger per sekund er 8000), tilsvarer kvaliteten på det samplede lydsignalet kvaliteten på en radiosending, og ved en frekvens på 48 kHz (antall målinger per sekund er 48000) - til lydkvaliteten til en lyd-CD.

Hvis du bruker 8-bits koding, kan du oppnå en nøyaktighet ved å endre amplituden til et analogt signal opp til 1/256 av det dynamiske området til en digital enhet (2 8 = 256).

Hvis du bruker 16-bits koding for å representere verdiene til amplituden til lydsignalet, vil målenøyaktigheten øke 256 ganger.

I moderne omformere er det vanlig å bruke 20-bits signalkoding, som tillater høykvalitets lyddigitalisering.

Husk formelen K = 2 a. Her er K antallet forskjellige lyder (antall forskjellige signalnivåer eller tilstander) som kan oppnås ved å kode lyd med biter

I utviklingsprosessen har menneskeheten innsett behovet for å lagre og overføre denne eller den informasjonen over en avstand. I sistnevnte tilfelle var det påkrevd å konvertere det til signaler. Denne prosessen kalles datakoding. Tekstinformasjon så vel som grafiske bilder kan konverteres til tall. Vår artikkel vil fortelle deg hvordan dette kan gjøres.

Fjernoverføring av informasjon

  • kurer og postkontor;
  • akustisk (for eksempel gjennom en høyttaler);
  • på grunnlag av en eller annen metode for telekommunikasjon (kablet, radio, optisk, radiorelé, satellitt, fiberoptisk).

De vanligste for øyeblikket er overføringssystemene av sistnevnte type. Men for å bruke dem må du først bruke en eller annen metode for å kode informasjon. Det er ekstremt vanskelig å gjøre dette ved hjelp av tall i desimalberegningen som er kjent for en moderne person.

Kryptering

Binært tallsystem

Ved begynnelsen av datatiden var forskerne opptatt av å finne en enhet som ville gjøre det mulig å representere tall i en datamaskin så enkelt som mulig. Problemet ble løst da Claude Chenon foreslo å bruke det binære tallsystemet. Det har vært kjent siden 1600-tallet, og implementeringen krevde en enhet med 2 stabile tilstander, tilsvarende logisk "1" og logisk "0". Det var nok av dem på den tiden - fra en kjerne, som enten kunne magnetiseres eller avmagnetiseres, til en transistor som kan være enten i åpen eller lukket tilstand.

Representasjon av fargebilder

Metoden for å kode informasjon ved hjelp av tall for slike bilder er noe mer komplisert. For dette formålet er det først nødvendig å dekomponere bildet i 3 primærfarger (grønn, rød og blå), siden som et resultat av å blande dem i visse proporsjoner, kan enhver nyanse som oppfattes av det menneskelige øyet oppnås. Denne metoden for å kode et bilde ved å bruke tall ved å bruke 24 binære biter kalles RGB, eller True Color.

Når det kommer til utskrift brukes CMYK-systemet. Den er basert på ideen om at hver av de grunnleggende RGB-komponentene kan kartlegges til en komplementær farge til hvit. Disse er cyan, magenta og gul. Selv om det er nok av dem, for å redusere utskriftskostnadene, er det også lagt til en fjerde komponent - svart. For å representere grafikk i CMYK-systemet kreves det således 32 binære biter, og selve modusen kalles vanligvis fullfarge.

Representasjon av lyder

På spørsmål om det er en måte å kode informasjon ved hjelp av tall, bør svaret være ja. Imidlertid anses slike metoder for øyeblikket ikke som perfekte. Disse inkluderer:

  • FM-metoden. Den er basert på dekomponering av enhver kompleks lyd til en sekvens av elementære harmoniske signaler med forskjellige frekvenser, som kan beskrives med en kode.
  • Tabell-bølge metode. Prøver er lagret i forhåndskompilerte tabeller - prøver av lyder for ulike musikkinstrumenter. Numeriske koder uttrykker instrumentets type og modellnummer, tonehøyde, intensitet og varighet av lyden osv.

Nå vet du at binær koding er en av de vanlige måtene å representere informasjon på, som spilte en stor rolle i utviklingen av datateknologi.