Typer av textformat. Textfiltillägg: typer och huvudaspekter för att fastställa programmedlemskap

Den vanligaste datatypen i datorvärlden och på Internet – text. Videorna och grafiken är mycket mer färgglada och i allmänhet är det bättre att se en gång än att höra hundra gånger. Tja, det är också bra att höra - för det här fallet finns det ljuddataformat. Men fula och blygsamma bokstäver och siffror styr datorshowen. Du kan inte gå någonstans utan dem, du kan inte ens ge en annan fil ett namn. Textdata är viktig och varierad - den inkluderar böcker, dokument och programkod. Och för varje ändamål finns det sina egna formatalternativ. Det är dessa som kommer att diskuteras i den här artikeln. Det är sant att en varning bör göras omedelbart - in denna recension E-boksformat kommer inte att påverkas; de förtjänar en separat diskussion. Här kommer vi att prata om dokumentformat.

Textformat – TXT (PlainText)

Så – det enklaste möjliga, TXT-formatet. Detta är texten i dess väsentligen rena och okomplicerade form. Innehåller endast innehållet i texten och det absoluta minimum av servicedata - symboler för början och slutet av texten, vagnreturer och liknande.

Trots sin närmast spartanska enkelhet är formatet inte utan variationer och olikheter. För det första finns det vissa skillnader mellan Windows, Unix och MacOS-versioner där de används olika symboler slutet av raden. Skillnader kan också bero på användningen av 8-bitars (ASCII) eller 16-bitars (UNICODE) teckentabeller.

Men trots detta är TXT-formatet extremt mångsidigt, för vilket det är mycket älskat av programmerare och systemadministratörer.

MS Office-dokumentformat och analoger – DOC, DOCX, RTF, ODT

Trots all sin mångsidighet och enkelhet är TXT absolut olämpligt för att skapa faktiska dokument - texter avsedda för utskrift i enlighet med vissa regler och designstandarder. Eftersom sådana dokument utöver själva texten också måste innehålla mycket information om textens utformning och formatering. Och även om formatet och storleken på pappersarket där de ska placeras.

För dessa ändamål har ganska många format av olika kontorspaket skapats. De mest populära och faktiskt nära universella formaten kan betraktas som MS Word – doc och docx. Den första är ett speciellt slutet format skapat av Microsoft för din textredigerare (mer exakt, en hel rad format - under dess existens har den förbättrats flera gånger). Tillsammans med det, i början av företagets utveckling, skapades det i samarbete med Adobe Corporation RTF-format(Rich Text Format). Till skillnad från DOC är strukturen för detta format tillgänglig och det stöds framgångsrikt av nästan alla befintliga textredigerare. Även om det är något sämre än DOC när det gäller utbudet av tillgängliga funktioner.

Sekretessen för Microsofts utveckling ledde till skapandet av en öppen kontorssvitÖppet kontor. För vilket det egna formatet ODT (OpenDocument Text Format) utvecklades. Formatet stöds inte väl av kommersiella redaktörer, inklusive MS Word och kan öppnas med fel.

Äntligen 2007 år Microsoft bestämde sig för att överge sin satsning på DOC-formatet och utvecklade en familj av format Kontor öppet XML, som inkluderar DOCX, som har blivit huvudformatet för nya versioner av MS Word.

PDF-format

Efter att ha vägrat att samarbeta med Microsoft gick Adobe sin egen väg. Hon utvecklade PDF-formatet, som var ett format inte så mycket för att utveckla dokument som för att visa och skriva ut dem. Till skillnad från den tidigare gruppen, som är formaterad text, vars utseende ändå kan ändras beroende på vilken specifik maskin den visas eller skrivs ut på, är PDF ett dokumentformat som i grunden är oförändrat och behåller sitt utseende och layout under alla förhållanden. Den stöder också ett ganska brett utbud av både tryckelement och ytterligare service(Till exempel lösenordsskydd för dokument från redigering eller utskrift och så vidare). Allt detta gör PDF till ett mer av ett format för att distribuera komplexa och professionellt utförda dokument och till och med böcker.

Programvara för bearbetning av text och grafiska data.

En av de vanligaste funktionerna hos en modern persondator är att förbereda en mängd olika textdokument.

Det finns två huvudgrupper av program för att förbereda textdokument: textredigerare och ordbehandlare.

Textredigerare, i grund och botten, är program som skapar textfiler utan formateringselement (det vill säga de tillåter inte att delar av texten markeras med olika typsnitt och typsnitt). Redaktörer av detta slag är oumbärliga när man skapar texter till datorprogram.

Ordbehandlare veta hur man formaterar text, infogar grafik och andra objekt i ett dokument som inte är relaterade till det klassiska konceptet "text". Det bör noteras att denna uppdelning är villkorad - mängden textbehandlingsprogram gör att du kan hitta en redaktör med vilken uppsättning funktioner som helst.

Vissa ordbehandlare är så kallade WYSIWYG-redigerare. Namnet kommer från de första bokstäverna i frasen What You See Is What You Get - what you see is what you get. När de säger att detta är en WYSIWYG-redigerare, garanterar de full överensstämmelse med utseendet på dokumentet på datorskärmen och dess utskrivna kopia. Dessa typer av redigerare inkluderar Word och StarWriter.

Vissa moderna redaktörer stöder "nästan" WYSIWYG-konceptet. Utseendet på dokumentet på skärmen skiljer sig något från hur det utskrivna dokumentet kommer att se ut, men detta görs specifikt i syfte att effektiv användning arbetsdokument fönster. Exempel på "nästan" WYSIWYG-redigerare är Netscape Composer och KLyX.

Format textfiler

Textfiler- den vanligaste datatypen i datorvärlden. Det finns flera problem förknippade med textfiler. Den första är extremt Ett stort antal tecken som krävs för att stödja olika språk. Amerikanska programmerare använder den amerikanska ASCII-teckenuppsättningen för att fungera med 128 tecken. standardkod för informationsutbyte). För att stödja andra språk räcker det ofta inte med 256 tecken, så nu sker en gradvis övergång till Unicode-kodningen, där två byte redan är tilldelade för att lagra ett tecken (dvs. det är möjligt att koda 65 536 olika tecken).

Det andra problemet är att folk vill att utskrivna dokument ska innehålla grafer, diagram, anteckningar, rubriker och att använda olika typsnitt. Dokument som distribueras på Internet (onlinedokument) kan innehålla animationer, länkar till olika nätverksresurser och ljudspår.

Många textfiler överförs som oformatterad text(oformatterad text). Enkel text är svår att göra attraktiv och lätt att läsa, eftersom den inte har olika teckensnitt, grafik, rubriker, underrubriker, etc. Ytterligare egenskaper kallas textmarkering.

På tal om textuppmärkning skiljer man åt begreppen fysisk och logisk uppmärkning. När du använder fysisk textmarkering anges det exakta utseendet för varje fragment. Till exempel "centrerad text, 14 punkter, fetstil, Times-typsnitt." Med logisk markering anges det logiska värdet av ett givet fragment, till exempel "det här är rubriken på kapitlet." Dessa två märkningsmetoder är i allmänhet avsedda att användas i olika situationer. För att skriva ut text på en skrivare måste du använda fysisk uppmärkning. Beslut ska fattas om marginalstorlekar och styckeindrag. Tidiga versioner ordbehandlare endast används fysisk typ markeringar. Samtidigt angavs teckensnitt, storlek och stil för varje fragment.

När man utbyter information med andra personer medför textens fysiska utseende ett antal begränsningar, särskilt för onlinedokument. Skärmstorlek, upplösning, typsnitt är olika för olika system. Av dessa skäl används logisk textformatering alltmer. I vissa fall är logisk design praktiskt taget nödvändig: när du skapar elektroniska dokument typ WWW-sidor eller när du skapar och publicerar långa verk som böcker.

För att spara markeringen av dokument under överföring textinformation tillämpas från maskin till maskin olika sätt. Ordbehandlare och publiceringssystem använder specialdesignade filformat som innehåller inte bara texten, utan även information om hur den ska formateras. Det största problemet här är inkompatibiliteten hos sådana format, även om det är mest komplexa program kan vanligtvis läsa filer i konkurrerande programformat. Exempel på detta tillvägagångssätt är ordbehandlare Word och StarWriter.

I ett annat tillvägagångssätt infogas följande direkt i dokumentets text: specialteam markeringar. Även om du inte har programvara, som stöder detta format, kommer du fortfarande att kunna förstå det. Det finns många sätt att representera textuppmärkning på det här sättet, inklusive:

HyperText Markup Language (HTML), används i World Wide Webb;

TeX och LaTeX, populära bland många akademiska publikationer, såväl som matematiker, fysiker, kemister och till och med musiker.

Exempel på program som låter dig markera text på detta sätt är Netscape Composer och LyX (KLyX).

Filer skapade av olika redaktörer, har ofta unika tillägg som låter dig gissa hur du markerar texten utan att titta inuti dokumentet. Således har filer som skapats av rentextredigerare ofta tillägget .txt, och de som förbereds i Lyx-redigeraren - .lyx. Ordbehandlaren skapar som standard filer i MS Word-formatet (.doc-tillägg), men stöder även andra format, såsom RTF (.rtf-tillägg). Dokument som innehåller HTML-markeringskommandon har tillägget .html eller .htm.

Uppenbarligen är det omöjligt att lista alla textredigerare. Många av dem är "skräddarsydda" för en eller annan specifik aktivitet. Listan som diskuteras nedan representerar bara en liten del av textredigerare.

Rå textredigerare

NotePad - inbyggt i Windows operativsystem, tydligt och lätt att använda;

McEdit - liknar redigeringsredigeraren från MS DOS, en komponent filhanterare mc ( Midnattschef) Linux OS;

KEdit är en enkel textredigerare som ingår i KDE Linux;

KWrite är en textredigerare som har ett antal ytterligare inställningar jämfört med andra enkla textredigerare;

Emacs - kombinerar funktionerna i en filhanterare och en textredigerare; en av särdragär förmågan att skapa makrokommandon (makron); tillgänglig i alla Unix-kloner, inklusive Linux; Emacs kan också användas på MS Windows.

Redaktörer som skapar text med uppmärkningselement

Word - används för att skapa en mängd olika tryckta dokument, är en komponent kontorsapplikationer i MS Windows;

StarWriter - en del av StarOffice-programmet, utseende och funktionaliteten liknar Word, fungerar lika bra i både MS Windows och Linux OS;

LyX (KLyX i KDE) är en modern textredigerare designad för personer som vill ha ett proffsigt dokument på minimal tid; editorn infogar TeX- och LaTeX-markeringskommandon i texten;

Netscape Composer - infogar HTML-markeringskommandon i texten det finns versioner för både Linux och MS Windows.

Vid bearbetning av information relaterad till bilden på monitorn är det vanligt att särskilja tre huvudområden: mönsterigenkänning, bildbehandling och datorgrafik.

Huvuduppgiften för bildigenkänning grunderna är att förvandla en befintlig bild till en formell tydligt språk tecken. Mönsterigenkänning eller ett datorseendesystem (COMPUTER VISION) är en uppsättning metoder som gör det möjligt att få en beskrivning av en bild som skickas in som indata, eller att tilldela en given bild till en viss klass (detta görs t.ex. när sortering av post). En av uppgifterna för COMPUTER VISION är den så kallade skelettiseringen av objekt, där en viss grund för objektet, dess "skelett", återställs.

Bildbehandling(BILDBEHANDLING) tar hänsyn till uppgifter där både in- och utdata är bilder. Till exempel bildöverföring med brusborttagning och datakomprimering, övergång från en typ av bild till en annan (från färg till svartvitt) etc. Bildbehandling avser alltså aktiviteter på bilder (bildtransformation). Uppgiften med bildbehandling kan vara antingen förbättring beroende på ett visst kriterium (restaurering, restaurering), eller en speciell transformation som radikalt förändrar bilden.

När du bearbetar bilder finns det följande grupper av uppgifter:

Låt oss begränsa oss till att bara arbeta med digital bild. Digital transformation Beroende på syftet med omvandlingen kan den delas in i två typer:

Bildåterställning - kompensation av befintlig distorsion (till exempel dåliga fotografiska förhållanden);

Bildförbättring är förvrängning av en bild för att förbättra visuell uppfattning eller för att omvandla den till en form som lämpar sig för vidare bearbetning.

Datorgrafik (maskin).(DATORGRAFIK) återger en bild när källinformationen är av icke-grafisk karaktär. Till exempel visualisering av experimentella data i form av grafer, histogram eller diagram, visning av information på skärmen datorspel, syntes av scener på simulatorer.

Datorgrafik har nu dykt upp som vetenskapen om hårdvara och mjukvara för en mängd olika bilder från enkla ritningar till realistiska bilder av naturliga objekt. Datorgrafik används i nästan alla vetenskapliga och tekniska discipliner för klarhet, uppfattning och överföring av information. Används inom medicin, reklambranschen, underhållningsindustrin etc. Utan Datorgrafik det räcker inte med en enda modernt program. Att arbeta med grafik tar upp till 90 % av arbetstiden för programmeringsteam som producerar program för massbruk.

Slutprodukten av datorgrafik är en bild. Denna bild kan användas i olika områden Det kan till exempel vara en teknisk ritning, en illustration av en del i en bruksanvisning, ett enkelt diagram, en arkitektonisk vy av en föreslagen struktur eller designspecifikation, en reklamillustration eller en stillbild från en tecknad serie.

Datorgrafik är en vetenskap vars studieämne är skapande, lagring och bearbetning av modeller och deras bilder med hjälp av en dator, d.v.s. Detta är en gren av datavetenskap som behandlar problemen med att få fram olika bilder (ritningar, ritningar, animationer) på en dator.

Följande uppgifter beaktas i datorgrafik:

Representation av en bild i datorgrafik;

Förbereda bilden för visualisering;

Skapa en bild;

Utföra åtgärder med bilden.

Datorgrafik hänvisar vanligtvis till automatisering av processerna för att förbereda, konvertera, lagra och reproducera grafisk information med hjälp av en dator. Under grafisk information modeller av föremål och deras bilder förstås.

Om användaren kan kontrollera objektens egenskaper, då talar de om interaktiv datorgrafik, d.v.s. förmåga datorsystem skapa grafik och föra en dialog med en person. Nuförtiden kan nästan alla program betraktas som ett interaktivt datorgrafiksystem.

Interaktiv datorgrafik– detta är också användningen av datorer för att förbereda och återge bilder, men samtidigt har användaren möjlighet att snabbt göra ändringar i bilden direkt under dess reproduktion, d.v.s. antar förmågan att arbeta med grafik i dialogläge i verklig skala tid.

Interaktiv grafik representerar en viktig gren av datorgrafik där användaren har förmågan att dynamiskt styra innehållet i en bild, dess form, storlek och färg på displayytan med hjälp av interaktiva kontrollenheter.

Historiskt sett anses de första interaktiva systemen vara system datorstödd design(CAD), som dök upp på 60-talet. De utgör ett viktigt steg i utvecklingen av datorer och programvara. I ett interaktivt datorgrafiksystem uppfattar användaren en bild på displayen som representerar några komplext objekt, och kan göra ändringar i beskrivningen (modellen) av objektet. Sådana ändringar kan vara som inmatning och redigering enskilda element, såväl som att ställa in numeriska värden för alla parametrar, såväl som andra operationer för att ange information baserad på bilduppfattning.

Rastergrafik, allmän information

En datorrasterbild representeras som rektangulär matris, vars varje cell representeras av en färgad prick.

Grunden för rastergrafikrepresentation är pixel(prick) som indikerar dess färg. När man till exempel beskriver en röd ellips på en vit bakgrund är det nödvändigt att ange färgen på varje punkt på ellipsen och bakgrunden. Bilden presenteras i form av ett stort antal prickar - ju fler av dem, desto visuellt bättre bildkvalitet Och större storlek fil. De där. en och även en bild kan presenteras med de bästa eller sämsta kvalitet i enlighet med antalet punkter per längdenhet - upplösning (vanligtvis punkter per tum - dpi eller pixlar per tum - ppi).

Rasterbilder liknar ett rutigt papper på vilket valfri cell är målad antingen svart eller vit, tillsammans bildar ett mönster. Pixel är huvudelementet i rasterbilder. Det är dessa element som utgör en rasterbild, d.v.s. rastergrafik beskriver bilder med hjälp av färgade punkter (pixlar) arrangerade på ett rutnät.

När du redigerar rastergrafik, redigerar du pixlar, inte linjer. Rastergrafik är upplösningsberoende eftersom information som beskriver bilden är kopplad till ett rutnät viss storlek. När du redigerar rastergrafik kan kvaliteten på presentationen ändras. I synnerhet kan storleksändring av rastergrafik göra att kanterna på bilden blir slitna när pixlarna omfördelas i rutnätet. Att mata ut rastergrafik till enheter med en lägre upplösning än själva bildens upplösning kommer att minska kvaliteten.

Kvaliteten kännetecknas dessutom av det antal färger och nyanser som varje punkt i bilden kan anta. Hur stor mängd nyanser kännetecknas av bilder, desto fler siffror krävs för att beskriva dem. Rött kan vara färgnummer 001, eller det kan vara färgnummer 00000001. Alltså, ju högre bildkvalitet desto större filstorlek.

Rasterrepresentation används vanligtvis för fotografiska bilder med mycket detaljer eller skuggning. Tyvärr försämrar kvaliteten vanligtvis att skala sådana bilder åt valfri riktning. När antalet punkter minskar försvinner små detaljer och inskriptionerna deformeras (även om detta kanske inte är så märkbart om den visuella storleken på själva bilden minskas - d.v.s. upplösningen bibehålls). Att lägga till pixlar leder till en försämring av bildens skärpa och ljusstyrka, eftersom nya punkter måste ges nyanser som är genomsnittliga mellan två eller flera intilliggande färger.

Med hjälp av rastergrafik kan du reflektera och förmedla hela skalan av nyanser och subtila effekter som är inneboende i verklig bild. En rasterbild är närmare ett fotografi, den gör att du kan återge ett fotografi mer exakt: belysning, transparens och skärpedjup.

Oftast erhålls rasterbilder genom att skanna fotografier och andra bilder, använda en digitalkamera eller genom att "fånga" en ram från en video. Rasterbilder kan även erhållas direkt i raster eller vektorgrafik genom att konvertera vektorbilder.

Vanliga format är .tif, .gif, .jpg, .png, .bmp, .pcx, etc.

Vektorgrafik, allmän information

Vektorgrafik beskriver bilder med raka och böjda linjer som kallas vektorer, samt parametrar som beskriver färger och layout. Till exempel beskrivs bilden av ett trädblad (se fig. 1.) av punkter genom vilka en linje passerar och därigenom skapar bladets kontur. Bladfärgen bestäms av färgen på konturen och området inom den konturen.

Till skillnad från rastergrafik, i vektorgrafik är en bild konstruerad med hjälp av matematiska beskrivningar av objekt, cirklar och linjer. Även om detta vid första anblicken kan verka mer komplicerat än att använda rastermatriser, är det för vissa typer av bilder att använda matematiska beskrivningar ett enklare sätt.

Nyckeln till vektorgrafik är att de använder en kombination datorkommandon och matematiska formler för objektet. Det här tillåter datorenheter beräkna och placera riktiga poäng på rätt plats när du ritar dessa objekt. Denna egenskap hos vektorgrafik ger den ett antal fördelar jämfört med rastergrafik, men det är samtidigt orsaken till dess nackdelar.

Vektorgrafik kallas ofta objektorienterad grafik eller rita grafik. Enkla föremål cirklar, linjer, sfärer, kuber och liknande kallas primitiver och används för att skapa fler komplexa objekt. I vektorgrafik skapas objekt genom att kombinera olika objekt.

För att skapa vektor ritningar du måste använda ett av de många illustrationspaketen. Fördelen med vektorgrafik är att beskrivningen är enkel och tar upp lite datorminne. Nackdelen är dock att ett detaljerat vektorobjekt kan vara för komplext, kanske inte skrivas ut som användaren förväntar sig, eller kanske inte skriver ut alls om skrivaren inte tolkar eller förstår vektorkommandona korrekt.

När du redigerar vektorgrafikelement ändras parametrarna för raka och böjda linjer som beskriver formen på dessa element. Du kan flytta element, ändra deras storlek, form och färg, men detta påverkar inte deras kvalitet visuell representation. Vektorgrafik är oberoende av upplösning, d.v.s. kan visas i en mängd olika utenheter med olika upplösningar utan kvalitetsförlust.

Vektorrepresentation består av att beskriva bildelement med matematiska kurvor, som indikerar deras färger och beläggning.

En annan fördel är högkvalitativ skalning i valfri riktning. Att öka eller minska objekt görs genom att öka eller minska motsvarande koefficienter i matematiska formler. Tyvärr, vektorformat blir ofördelaktigt vid överföring av bilder med ett stort antal nyanser eller fina detaljer (till exempel fotografier). När allt kommer omkring kommer varje minsta höjdpunkt i det här fallet inte att visas som en samling enfärgade prickar, utan som en komplex matematisk formel eller en uppsättning grafiska primitiver, som var och en är en formel. Detta gör filen tyngre. Dessutom kan du konvertera en bild från raster- till vektorformat (t.ex. Adobe programmet Streme Line eller Corel OCR-TRACE) leder till att den senare ärver oförmågan att skala upp korrekt. När linjära dimensioner ökar, ökar inte antalet detaljer eller nyanser per ytenhet. Denna begränsning åläggs av upplösningen hos inmatningsenheter (skannrar, digital kameror och så vidare.).

Element (objekt) av vektorgrafik. Objekt och deras attribut

Main logiskt element vektorgrafik är ett geometriskt objekt. De föremål som accepteras är enkla geometriska former (så kallade primitiver - rektangel, cirkel, ellips, linje), sammansatta former eller former byggda av primitiver, färgfyllningar, inklusive gradienter.

Ett viktigt objekt i vektorgrafik är spline. En spline är en kurva med vilken en eller annan beskrivs geometrisk figur. Byggd på splines moderna typsnitt TryType och PostScript.

Vektorgrafikobjekt är lätta att transformera och modifiera, vilket praktiskt taget inte har någon effekt på bildkvaliteten. Skalning, rotation, krökning kan reduceras till ett par tre elementära transformationeröver vektorer.

Om i rastergrafik grundläggande element En bild är en punkt, men i vektorgrafik är det en linje. En linje beskrivs matematiskt som ett enda objekt, och därför är mängden data för att visa ett objekt med vektorgrafik betydligt mindre än i rastergrafik.

Linje är ett elementärt objekt för vektorgrafik. Liksom alla objekt har en linje egenskaper: form (rak, kurva), tjocklek, färg, stil (heldragen, prickad). Stängda linjer förvärvar egenskapen att fylla. Utrymmet som de täcker kan fyllas med andra objekt (texturer, kartor) eller en vald färg. Den enklaste öppna linjen avgränsas av två punkter som kallas noder. Noder har också egenskaper vars parametrar påverkar formen på slutet av linjen och arten av dess koppling till andra objekt. Alla andra vektorgrafikobjekt består av linjer. Till exempel kan en kub bestå av sex sammankopplade rektanglar, som var och en i sin tur är bildad av fyra sammankopplade linjer.

Varje PC-användare stöter ständigt på olika textfilformat, men tänker knappt på hur rik historien om dessa format och program är som gav en person möjlighet att läsa böcker, arbeta med text och skapa all nödvändig dokumentation direkt på datorn.

Textfilernas historia är inte mycket yngre än de själva personliga datorer- deras mästerverk var redan skrivna i de första analogerna av den moderna "anteckningsboken". Så vad finns det för olika textfilformat och program för att arbeta med dem? Först måste du förstå vad textfiler är till för, vad skillnaderna är mellan dem och vad de har gemensamt. Absolut alla textformat har gemensamt sin huvudsakliga uppgift - att spara textinformation. De skiljer sig i bearbetningsförmåga och även i tillgång till information lagrad i filer när det gäller kompatibilitet med andra program.

Det enklaste textformatet är traditionellt TXT-formatet. Det är också det mest blygsamma i kapacitet och det äldsta textformatet. På grund av dess enkelhet (TXT:s möjligheter är begränsade till att skriva text och dela upp den i stycken), används detta format ofta av ett stort antal applikationer och program olika plattformar.

Med spridningen av persondatorer och ökningen av deras försäljning skapar Microsoft ett annat populärt format som kallas Rich Text Format (eller helt enkelt RTF). Det är text som är markerad med hjälp av vissa "kontrollord" som låter dig inte bara producera, utan också spara komplexa formateringselement och infoga formler, tabeller, figurer, sidhuvuden och sidfötter i texten.

RTF är dock ganska sämre i kapacitet än DOC-formatet, även skapat av Microsoft speciellt för ett programpaket som heter Microsoft Office. DOC skapades för mer än femton år sedan och innehåller ett stort antal funktioner för att formatera och bearbeta text, skapa, redigera och placera bilder, diagram, tabeller och andra element. Det bör noteras att dessa funktioner fungerar mest korrekt endast i MS Word. Detta beror främst på att Microsoft inte har aktuella specifikationer DOC-format och tillåter inte sina konkurrenter och oberoende utvecklare att fullt ut använda funktionerna i detta format. Detta faktum är en av huvudorsakerna till att, förutom DOC-formatet, andra textfilformat används i stor utsträckning i vår tid.

Den största skillnaden mellan DOC-formatet och text- och TXT-format är dess binära karaktär, vilket gör det oläsligt i så enkla format som Wordpad, Lexicon, Atlantis. Dessutom kan man i vissa fall observera inkompatibilitet hos DOC-filer skapade i olika versioner MS Word-program.

Textfilformat kan öppnas och redigeras i ett stort antal program. Förutom det tidigare nämnda MS Word är de vanligaste av dem StarOffice producerat av Sun Microsystems, WordPerfect från Corel och gratis paket OpenOffice.org.

Med spridningen av elektroniska läsanordningar vinner även andra textfilformat i popularitet, till exempel FB2 och LRF.

För att kunna använda olika textformat på olika plattformar har ett stort antal program som kallas omvandlare skapats. Textfilkonverterare låter dig spara original text från ett format till ett annat och använd det senare olika enheter och plattformar.

Konverterare används inte bara för att spara text från ett format till ett annat, utan också för att skapa filer som, till skillnad från sina källor, kan användas på enheter som inte kan "läsa" originalfiler. Till exempel några e-böcker, som inte stöder populära textfilformat, kan enkelt känna igen LRF- eller FB2-format som härrör från källfiler använda omvandlingsprogram.

Vi stöter på textfiler (dokument) nästan varje dag. Dock i denna fråga Blanda inte ihop textfiltillägget och textdataformatet, det är olika saker. Låt oss försöka avgöra vilka filer av denna typ är och vad de är.

Textfiltillägg: vad är det?

Låt oss börja med det faktum att de flesta filer av denna typ som regel har en förlängning på tre bokstäver efter avgränsaren (punkten). Den enklaste och vanligaste typen är filer med filtillägget .txt, öppnade i samma Windows-system med standardanteckningar.

Men trots de allmänt accepterade reglerna kan filtillägg för textdokument inte innehålla tre tecken, utan fler (deras antal kan nå tolv, men inte fler), till exempel e-bok files.djvu. Dessutom kan anknytningen innehålla nummer.

Vad ger oss när det gäller klassificeringen av en textfil (dokument) när det gäller deras identifiering? Och det faktum att en blick låter dig bestämma dig direkt viktig fråga: vilken filändelse textfiler än har, så är programmet associerat med dem för att öppna eller redigera. I många fall är det nästan alltid möjligt att fastställa i vilket ursprungsprogram en sådan fil skapades.


Glöm dock inte att du idag kan hitta ett ganska stort antal filer med samma tillägg, men skapade i andra applikationer eller matchade olika program. Det verkar som om en vanlig fil med filtillägget .doc (.docx) initialt motsvarar en textfil Microsoft editor Ord. Men du kan öppna den eller spara den i det här formuläret på annat sätt, även på Apple-datorer. Hit hör också så att säga blandad typ- filer i .pdf-format som innehåller inte bara text utan även grafik. Men Word-dokument kan också innehålla infogade bilder.

Det är just detta som fungerar som en indikator på att förlängningen av en textfil indikerar universaliteten hos själva formatet, vilket är det mest "läsbara" oavsett vilket operativsystem som används. Detsamma gäller för vilken typ som helst.

Filtilläggstyper: text

I allmänhet finns det idag ett så stort antal textformat och deras tillägg kända att förmodligen nästan ingen specialist kommer att åta sig att räkna deras totala antal.


Ja, naturligtvis är universaliteten av sådana dokument utom tvivel, särskilt om de använder de enklaste. Men ibland kan problemet vara att inte varje kodning stöds av ett visst system eller program. Det är därför en uppsättning symboler visas på skärmen istället för de vanliga bokstäverna.

När det gäller typerna av textfiler är det omöjligt att lista dem alla. De vanligaste är följande: .txt, .doc, .tex, .text, .pdf, .log, .apt, .ttf, .err, .sub, .djvu, .odt, .rtf och många andra. Denna lista kan fortsätta på obestämd tid.

Det som är mest intressant är att många filer av den här typen har olika roller i systemet. Till exempel, utom vanlig fil subtitles.sub, en vanlig text document.txt kan vara ansvarig för att se dem när du öppnar en video, och i detta avseende är många format utbytbara.


Notera till och med körbara filer kan ha text som innehåll. Det enklaste exemplet- en .bat-fil skapad i ett vanligt anteckningsblock och som innehåller text i form av en uppsättning kommandon. När den startas exekveras kommandon och menyn "Öppna med..." används för redigering, såvida inte en annan åtgärd initialt är associerad med denna process.


En liknande situation observeras med dokument som använder uppmärknings- eller programmeringsspråk, till exempel .html-, .htm-, .xml-filer, etc. Även webbsidor kan öppnas i många redaktörer initialt som textfiler som innehåller tredjepartselement.

Ändra textfiltillägg

När det gäller att ändra tillägget kan det ibland ändras, till exempel .txt till .doc och vice versa. Word editor kommer att öppna vilken typ som helst. Detsamma gäller för .txt - .bat-paret när det öppnas i Anteckningar. Men i andra fall är det bättre att inte utföra sådana manipulationer, det leder helt enkelt till ingenting, och en annan applikation kommer inte att kunna öppna den omdöpta filen. Ändring av formatet måste göras med hjälp av speciella omvandlingsprogram.

Istället för ett efterord

Som redan är klart kan förlängningen av en textfil ha många variationer, beroende på vilket program dokumentet skapades i. Men som i andra fall är det nästan alltid möjligt att avgöra vilket program som ursprungligen var associerat med det, i extrema fall, öppna det med något annat program som stöder att arbeta med denna typ av data, även om originalet programmet finns inte på datorn. Och som förmodligen redan är klart, är textfiler faktiskt de vanligaste och mest universella i datorvärlden, oavsett vilka som används mjukvarupaket och operativsystem.

Uppsättningen regler enligt vilka data lagras i en fil kallas ett filformat. Olika typer filer, såsom textfiler, rastergrafik, etc., använda olika format. I allmänhet kan flera filtyper definieras. olika format, även om filtyp och format ofta uppfattas som samma sak. Ett filformat identifieras av filnamnstillägget som läggs till i filnamnet när det sparas i ett specifikt format, såsom DOC, GIF, etc.

Vanligtvis skapas filformat för användning i en strikt definierad applikationsprogram. Till exempel sparas grafiska objekt skapade i det välkända vektorgrafikpaketet CorelDRAW som filer med CDR-förlängning, och bilder som genereras av ett annat grafikpaket, CorelXara, skrivs till disken som filer med XAR-tillägget. Vissa format kommunicerar inte med specifika applikationer, det vill säga de är universella. En av de mest kända universella formatär TXT-format (DOS-textfilformat).

Komprimering av datorfiler används ofta för att spara lagringsutrymme. Det finns många sätt att komprimera filer. Dessa metoder beror på originalformat filer. I allmänhet gäller att ju högre komprimeringsförhållandet är, desto långsammare är läs- och skrivoperationerna.

När det gäller komprimeringsalgoritmer finns det både komprimeringsalgoritmer utan dataförlust och algoritmer som kan resultera i dataförlust.



Förlustfri komprimering säkerställer att all data som fanns i filen före komprimeringen kommer att finnas efter att filen har dekomprimerats. Förlustfria komprimeringsmekanismer används vid lagring av text eller numerisk data, t.ex. kalkylblad eller dokumentfiler. Exempel på förlustfria komprimeringsalgoritmer inkluderar de välkända algoritmerna ZIP, ARJ och andra.

Låt oss ge kort beskrivning huvudsakliga format som används:

§ Amerikansk standard Kod för informationsutbyte ASCII (TXT). Textfilformat utvecklat av American National Standards Institute. Stöttas av alla operativsystem och alla program. Det är en textfil i DOS-kodning, det finns ingen funktion för att infoga en bild, det finns ingen formatering, den fungerar på alla maskiner, det går att skapa endast små filer.

§ ANSI (TXT). Textfilformat i ANSI-kodning(för kod Microsoft sidor Windows)

§ MsWord för DOS, Windows (.DOC). Dokumentformat utvecklat Microsoft Corporation, stöds av MS-DOS-program och de flesta ordbehandlare. Den bevarar originalformateringen av dokument, såväl som teckenstilar. Förutom textinformation kan filer i detta format innehålla grafiska bilder Med olika parametrar. Stöder 256 färger. Stöder inte kompression. Används främst för att utbyta formaterad textdata mellan olika plattformar och applikationer.

§ Hypertext Markup Language HTML (HTM, HTML). Markup language hypertextdokument. Alla sidor som finns på Internet skapas med detta speciellt språk. HTML-dokument är ASCII-filer som kan visas och redigeras i alla textredigerare. Skillnaden mot en vanlig textfil är att HTML-dokument innehåller speciella taggkommandon som definierar dokumentformateringsregeln. Om du lyckades bemästra HTML-språk, då kan du skapa sidor för Internet. Genom att lägga till taggar (etiketter) till vanlig text tvingar du tittaren att visa den texten på ett visst sätt och placera bilder på sidan. Om du har lärt dig Java och JavaScript, vet du hur du utökar HTML genom att placera kommandon skrivna i ett skriptspråk inuti taggar.

§ Portabelt dokumentformat PDF (.PDF). Detta dokumentlagringsformat, utvecklat av Adobe, påstår sig vara en öppen typografisk standard för webben. Det ses som ett alternativ till HTML. Nackdelen med HTML är att dokument som översätts till HTML vanligtvis inte behåller originalformatet, och HTML erbjuder ett mycket begränsat antal teckensnitt när de visas. Tvärtom, användare Acrobat-program och PDF-verktyg för att skapa, distribuera och visa dokument i originalformat, vet att läsarna kommer att se publikationen exakt som den gjordes. PDF-formatet är oumbärligt om du behöver få en exakt kopia krävs dokument. Som ett exempel på en framgångsrik PDF-applikationer För dokument på ryska kommer vi att tillhandahålla Moscow News-servern på Internet. Presenteras på den i i elektroniskt format materialen replikerar fullständigt det tryckta pappersoriginalet.

§ Standard Generalized Markup Language (SGML). HTML utvecklingöversatt till Standard Generic Markup Language. Det är en verktygslåda med mekanismer för att skapa strukturerade dokument markerade med deskriptorer (taggar). Jämfört med HTML ger den mer flexibla och mångsidiga formateringsalternativ på webben. Men SGML är annorlunda och ökad hastighet, så PDF används som ett enklare verktyg. Kraften med SGML ligger i dess plattformsoberoende strukturerade metod för att beskriva innehållet i dokument. SGML är egentligen ett metaspråk, d.v.s. är avsedd att beskriva märkningsspråk som används för att skapa dokument.