Soorten formaten van elektronische documenten. Formaten van elektronische documenten die worden gebruikt bij beheeractiviteiten

Ekaterina Kolesnikova, Adviseur van de Staatsambtenaren van de Russische Federatie, 3e klasse.

Zeker voor het bedrijf Taxcom.

Elektronische formaten van facturen, een logboek van ontvangen en uitgegeven facturen, boeken van aankopen en verkoopboeken, aanvullende bladen zijn bij ons bekend vanaf het moment dat de beschikking van de federale belastingdienst van Rusland van 05.03.2012 nr. ММВ-7- 6 / [e-mail beveiligd], die werd toegepast vanaf 23.05.2012 en ongeldig werd op 13.04.2015 in verband met de publicatie van het besluit van de federale belastingdienst van Rusland van 04.03.2015 nr. ММВ-7-6 / [e-mail beveiligd]

De formaten van primaire documenten zijn bij ons ingediend sinds 21 maart 2012, in overeenstemming met het besluit van de federale belastingdienst van Rusland van 21 maart 2012 nr. ММВ-7-6 / [e-mail beveiligd](gewijzigd zoals gewijzigd op 02.02.2015). Deze bestelling keurde de formaten van de elektronische vrachtbrief (TORG-12) en het acceptatiecertificaat voor werk (diensten) goed. Het is echter algemeen bekend dat sinds 2013 door federale wet nr. 402-FZ van 6 december 2011, de definitie van de naam en samenstelling van indicatoren van primaire boekhouddocumenten, evenals de vormen van hun presentatie, is toevertrouwd aan het hoofd van een economische entiteit. In verband met wijzigingen in de wetgeving is de goedkeuring door de Russische federale belastingdienst van formaten en formulieren van primaire boekhouddocumenten uit albums met uniforme formulieren die hun verplichte toepassing hebben verloren, irrelevant geworden.

Op wetgevend niveau is er al lang gewerkt aan het brengen van de formaten elektronische documenten in lijn met moderne eisen... "Gemoderniseerde" formaten van TORG-12-facturen en acceptatiecertificaten werden eind 2015 aan ons gepresenteerd in overeenstemming met de orders van de federale belastingdienst van Rusland nr. ММВ-7-10 / gedateerd 30.11.2015 [e-mail beveiligd] en gedateerd 30.11.2015 nr. ММВ-7-10 / [e-mail beveiligd]

Zoals vermeld in de federale belastingdienst van Rusland, zullen de oude formaten van TORG-12-facturen en acceptatiecertificaten het hele jaar 2016 geldig zijn. Zo hebben de deelnemers elektronisch documentbeheer er zal voldoende tijd zijn om nieuwe formaten onder de knie te krijgen en informatiesystemen van bedrijven opnieuw te configureren om ermee te werken.

Nieuwe formaten voor het indienen van documenten over de overdracht van goederen, werken, diensten, van kracht vanaf 01.01.2016

Beschikkingen van de Russische federale belastingdienst van 30 november 2015 nr. ММВ-7-10 / [e-mail beveiligd] en gedateerd 30.11.2015 nr. ММВ-7-10 / [e-mail beveiligd] dat goedgekeurde nieuwe documentformaten (hierna nieuwe formaten genoemd) bedoeld zijn om de reikwijdte van elektronisch documentbeheer uit te breiden. Nu een lijst van documenten die belastingplichtigen in overeenstemming met paragraaf 7 van art. 80 en clausule 2 van art. 93 van de belastingwet van de Russische Federatie kan worden ingediend bij de belastingdienst op de TCS als onderdeel van de terugvorderingsprocedures of samen met de belastingaangifte, aanzienlijk verhoogd.

Het formaat goedgekeurd door de Orde van de Federale Belastingdienst van Rusland van 30 november 2015 nr. ММВ-7-10 / [e-mail beveiligd], beschrijft de vereisten voor de xml-bestanden van de verzending via de TCS van het primaire boekhouddocument dat de acceptatie en overdracht van goederen formaliseert bij de uitvoering van contracten in het kader van relaties geregeld door hoofdstuk 30 van het burgerlijk wetboek van de Russische Federatie " Aan- en verkoop". Een dergelijke elektronische "vrachtbrief" kan worden opgesteld voor de overdracht van alle soorten kostbaarheden van de ene economische entiteit naar de andere. Het goederenoverslagdocument bestaat uit twee bestanden. De ene bevat de informatie van de verkoper over de transactie en de elektronische handtekening van de bevoegde persoon. De tweede is de identificatie-informatie over het eerste bestand, informatie over de transactie van de kant van de koper, evenals de elektronische handtekening van de bevoegde persoon.

Op zijn beurt is het formaat goedgekeurd door de orde van de federale belastingdienst van Rusland van 30.11.2015 nr. ММВ-7-10 / [e-mail beveiligd], beschrijft de vereisten voor de xml-bestanden van de verzending via de TCS van het primaire document in elektronisch formulier, die de aanvaarding en overdracht van de resultaten van de verrichte werkzaamheden (verleende diensten) opstelt. Het bestaat ook uit twee bestanden. De ene bevat de informatie van de uitvoerder: informatie van de overdragende partij over de transactie en een elektronische handtekening. In de andere - identificatie-informatie over het dossier van de uitvoerder, gegevens over de transactie van de kant van de klant en zijn elektronische handtekening. Tegelijkertijd voorziet het nieuwe format in een situatie waarin de noodzaak ontstaat op basis van de voorwaarden van de transactie, of vanwege een procedure met de tegenpartij tot een eenzijdige handeling. In dit geval bevat het elektronische document slechts één bestand met een gekwalificeerde elektronische handtekening de zendende kant.

De nieuwe formaten bevatten de details die in de eerder aanbevolen formaten waren en voldoen aan de vereisten die zijn vastgesteld door de federale wet van 06.12.2011 nr. 402-FZ voor primaire documenten. Tegelijkertijd zijn de nieuwe formaten flexibel in gebruik door de aanwezigheid van vrije informatievelden die de organisatie naar eigen inzicht kan invullen.

De zogenaamde vrije velden kunnen door organisaties worden ingevuld met eventuele aanvullende details (50 tekens), zodat rekening kan worden gehouden met de bijzonderheden van de uitgevoerde bewerking, evenals met de waarden van deze details (2000 tekens). Daarnaast krijgen belastingplichtigen de mogelijkheid om in het primaire boekhoudingsdocument een apart bestand elke structuur en type waarmee u meer in het document kunt reflecteren volledige informatie over het feit van het economische leven.

Daarnaast kunnen nieuwe formaten worden gebruikt om verschillende versies van het document, rekening houdend met de aangebrachte correcties. En nog een pluspunt van de nieuwe formulieren is de mogelijkheid om de naam van een elektronisch documenttype te wijzigen. In plaats van "Certificaat van voltooiing" kunt u bijvoorbeeld het documenttype "Certificaat van acceptatie en overdracht van het resultaat van het werk" schrijven, waarvan de vorm in de organisatie is ontwikkeld.

Net als de eerdere formaten die zijn vastgesteld voor primaire documenten (TORG-12-facturen en acceptatiecertificaten), worden de nieuwe formaten ons alleen aanbevolen voor gebruik in het werk, en hun goedkeuring vereist ze niet verplicht gebruik... Met andere woorden, organisaties kunnen documenten in elk formaat uitwisselen, ook die welke onafhankelijk zijn ontwikkeld. Maar nogmaals, ik wil opmerken dat het handiger is om de formaten te gebruiken die worden aanbevolen door de federale belastingdienst van Rusland, aangezien dergelijke elektronische documenten op verzoek kunnen worden overgedragen aan het belastingkantoor voor indiening van documenten zonder onnodige arbeidskosten.

Nieuw formaat van het primaire document, inclusief de factuur

Op bevel van de federale belastingdienst van Rusland van 24 maart 2016 nr. ММВ-7-15 / [e-mail beveiligd] het formaat van de factuur en het formaat voor het indienen van het document over de verzending van goederen (uitvoering van werk), overdracht van eigendomsrechten (document over het verlenen van diensten), inclusief de factuur, in elektronische vorm werden goedgekeurd.

Tegelijkertijd heeft het goedgekeurde formaat verschillende opties. documenteren het feit van het financiële en economische leven van de organisatie:

Optie nummer 1.
Factuur met Extra informatie met de functie van een factuur die wordt gebruikt bij het berekenen van de belasting over de toegevoegde waarde, is een uitwisselingsbestand van de verkoper en bevat de informatie die voor facturen wordt verstrekt door de relevante regelgevende documenten. Het bestand is ondertekend met een verbeterde gekwalificeerde elektronische handtekening van de persoon die bevoegd is om facturen te ondertekenen.

Optie nummer 2.
Een factuur met aanvullende informatie met de functie van een factuur die wordt gebruikt bij de berekening van de btw, en een document over de verzending van goederen (uitvoering van werkzaamheden), overdracht van eigendomsrechten (document over de levering van diensten), waarvan het resultaat is een verandering in de financiële toestand van de verzendende en ontvangende partijen. Het document bevat:

  • een uitwisselingsbestand voor het presenteren van de informatie van de verkoper, inclusief een factuur die wordt gebruikt in btw-berekeningen, en Extra informatie de overdragende partij over de economische entiteiten die deelnemen aan de transactie, het onderwerp van de transactie en andere materiële omstandigheden van de transactie die wordt opgesteld. Het bestand is ondertekend met een verbeterde gekwalificeerde elektronische handtekening van de persoon die gemachtigd is om facturen te ondertekenen, evenals de elektronische handtekening van de persoon die verantwoordelijk is voor het registreren van het feit van economische activiteit door de overdragende entiteit;
  • een uitwisselingsbestand voor het presenteren van aanvullende informatie op de factuur van de koper in de vorm van informatie van de ontvangende partij over de transactie die wordt opgesteld. Het bestand wordt ondertekend met een elektronische handtekening van de persoon die verantwoordelijk is voor de registratie van het feit van economische activiteit door de ontvangende entiteit.

Optie nummer 3.
Een factuur met aanvullende informatie met de functie van een document over de verzending van goederen (uitvoering van werk), overdracht van eigendomsrechten (document over de levering van diensten), met als resultaat een verandering in de financiële toestand van de verzendende en ontvangende partijen. Het document bevat:

  • een uitwisselingsbestand voor het weergeven van de informatie van de verkoper, waaronder informatie van de overdragende partij over de economische entiteiten die deelnemen aan de transactie, het onderwerp van de transactie en andere materiële omstandigheden van de transactie die worden opgesteld in de structuur van het factuuruitwisselingsbestand (verkoper informatie). Het bestand wordt ondertekend met de elektronische handtekening van de persoon die verantwoordelijk is voor de registratie van het economische leven door de verzendende entiteit;
  • een uitwisselingsbestand voor het presenteren van informatie van de koper, naast de informatie van de verkoper, in de vorm van informatie van de ontvangende partij over de transactie die wordt opgesteld. Het bestand wordt ondertekend met een elektronische handtekening van de persoon die verantwoordelijk is voor de registratie van het economisch leven door de ontvangende entiteit. Dit bestand kan afwezig zijn indien, in overeenstemming met het burgerlijk recht, het opmaken van een bilateraal document niet vereist is.

Daarom zal, afhankelijk van het doel, de reeks vereiste details van het xml-bestand van het document over de overdracht van goederen (werken, diensten, eigendomsrechten) anders zijn.

Om een ​​factuur op te stellen, is dit een uitwisselingsbestand met de informatie voorzien door het regeringsbesluit van 26 december 2011 nr. 1137 en art. 169 van het belastingwetboek van de Russische Federatie, ondertekend door een bevoegde persoon. Tegelijkertijd zijn er tastbare verschillen met degene die van kracht is in overeenstemming met het besluit van de federale belastingdienst van Rusland van 03/04/2015. Nee. ММВ-7-6 / [e-mail beveiligd] formaat van de factuur in in elektronisch formaat Nee.

Om het primaire document samen te stellen, zal het bestand de details bevatten die zijn gespecificeerd door de vereisten van federale wet nr. 402-FZ van 06.12.2011, en zal het bestaan ​​uit twee uitwisselingsbestanden met informatie over de economische entiteiten die eraan deelnemen en het onderwerp van de transactie. Eén titel wordt ondertekend door de persoon die verantwoordelijk is voor het registreren van het feit van economische activiteit van de verzendende kant, de andere - door de verantwoordelijke persoon van de ontvangende kant.

Om zo'n universeel document op te stellen, dat de functies van een factuur en een primair document combineert, moet het dossier bestaan ​​uit twee uitwisselingsbestanden en de verplichte gegevens van beide documenten bevatten.

Zo heeft de organisatie tot op heden volledige set formaten van documenten voor elektronische verwerking van elke situatie van zijn financiële en economische activiteiten met betrekking tot de overdracht van goederen, werken, diensten, eigendomsrechten van de ene economische entiteit naar de andere. De formaten zijn ontworpen voor alle documenten die de Belastingdienst het meest opvraagt ​​bij belastingplichtigen, wat uiteindelijk leidt tot een optimalisatie van het onderlinge werkproces.

Het is veel sneller om elektronische documenten uit te wisselen met tegenpartijen dan papieren documenten. Het is handig om ze op verzoek van de federale belastingdienst op te slaan, te zoeken en te presenteren. Lees meer over de voordelen van het gebruik van elektronisch documentbeheer voor uw bedrijf.

Datum van publicatie: 24.05.2016

Dat wil zeggen, formaten voor het opslaan van tekstbestanden. Nu is het belangrijkste hulpmiddel, bijna een monopolie in de voorbereiding van standaard tekstdocumenten, het Microsoft Word-programma, daarom zal er meer aandacht worden besteed aan de formaten die voor dit programma zijn bedoeld.

een)Doc... Formaten met de extensie . doc Dit is de gebruikelijke manier om tekst in Microsoft Word te presenteren. Tekst met de extensie .doc bevat informatie over waar en wat voor soort uitsplitsing in regels en alinea's wordt uitgevoerd, methoden voor tekstuitlijning, opvulling tussen regels en alinea's, type en stijl van lettertypen, enzovoort. Dit alles heet tekst opmaken... Tekstopmaak en bestandsindeling zijn totaal verschillende concepten, hoewel ze in vergelijkbare woorden worden uitgedrukt.

Niet altijd oude versie Microsoft Word kan niet lezen wat er in een recentere versie is gemaakt. Of bij het overschakelen naar een oudere versie of een ander programma gaat er iets verloren bij de opmaak van het document. Maar nieuwere versies kunnen altijd volledig lezen wat in eerdere versies is gemaakt.

FormaatDoc stelt u in staat tekstopmaak van de hoogste kwaliteit te maken, maar de gegenereerde tekst kan niet altijd op een andere computer worden afgespeeld.

B)RTF... Rtf-extensie staat voor Rechtsaftekstformaat, Wat betekent juiste tekstformaat... De formaten van de rtf-familie zijn zeer breed compatibel en worden begrepen door alle tekstverwerkers, oud en nieuw. Maar niet alle teksteditors, aangezien editors primitievere middelen zijn om met tekst te werken. Veel niet-tekstuele (bijv. grafische) programma's presteren significant beter met rtf dan met doc. Compatibiliteit wordt bereikt doordat de rtf-opmaak wordt vertaald in programmeerinstructies waarmee u het document op verschillende manieren kunt openen en bekijken.

Als u tekst op een andere computer moet herschrijven met behulp van een diskette, en u weet niet welk programma voor het werken met tekst erop staat, dan is de veiligste manier om het op te slaan in rtf-formaat. Het rtf-bestand is iets groter dan het doc-bestand, maar er is een garantie dat de andere computer deze tekst zal begrijpen.

FormaatRTFstelt u in staat om de gemaakte tekst in elke versie te reproducerenMicrosoftWoorden in veel niet tekst programma's Oh.

v)tekst... Het is een primitief tekstformaat zonder complexe opmaak. Van de opmaak blijft hier alleen alinea-indeling behouden, en elke regel verandert in een alinea. Het txt-formaat wordt door programmeurs gebruikt om programmacode te schrijven. een computer heeft geen tekstopmaak nodig die in menselijke termen 'mooi' is. Het txt-formaat wordt ook gebruikt wanneer de tekst begrepen moet worden door gebruikers met verschillende software, wanneer het uiteindelijke programma andere bestandsformaten niet herkent.

Windows heeft een .txt-opmaaktool Kladblok(Notitieboekje), met zijn hulp is het handig om te bekijken verschillende programma's en elektronische documenten die niet bedoeld zijn om af te drukken.

Berichten E-mail hebben ook geen geavanceerde opmaak. Als u daarom een ​​document in de vorm van een e-mailbericht verzendt, verliest het zijn uiterlijk. Als het nodig is om niet alleen de inhoud, maar ook het uiterlijk van de tekst per post te verzenden, dan moet het als een doc-bestand worden verzonden als bijlage bij het e-mailbericht.

Er zijn veel andere tekstformaten... 10 en meer jaren geleden waren, naast Word, verschillende andere tekstprogramma's populair, bijvoorbeeld het Russische programma "Lexicon". Voor de programma's die zijn vervangen door Microsoft Word, hun eigen, originele tekstformaten, die je misschien nodig hebt bij het lezen van de teksten van die tijd.

Ten slotte kan tekst worden opgeslagen en tot op zekere hoogte worden bewerkt in tientallen andere formaten die niet bedoeld zijn voor het maken van tekstdocumenten, maar voor andere doeleinden. Voorbeelden zijn het formaat . html websites te maken, . xlx voor spreadsheet-editor Excel, populair PostScript-formaat . pdf en vele anderen.

Tekstbestanden zijn het meest voorkomende gegevenstype in computer wereld... Er zijn verschillende problemen met tekstbestanden. De eerste is extreem een groot aantal van tekens die nodig zijn om verschillende talen te ondersteunen. Amerikaanse programmeurs gebruiken de Amerikaanse ASCII-tekenset om met 128 tekens te werken. standaardcode: voor informatie-uitwisseling). Om andere talen te ondersteunen, zijn 256 tekens vaak niet genoeg, dus nu is er een geleidelijke overgang naar de Unicode-codering, waarbij al twee bytes zijn toegewezen om één teken op te slaan (dat wil zeggen, het is mogelijk om 65.536 verschillende tekens te coderen).

Het tweede probleem is dat mensen willen dat afgedrukte documenten grafieken, diagrammen, notities en koppen bevatten, en om te gebruiken verschillende lettertypen... Documenten verspreid op internet ( online documenten), kan animatie, links naar verschillende netwerkbronnen en geluidsband.

Veel tekstbestanden verzonden als platte tekst(platte tekst). Het is moeilijk om platte tekst aantrekkelijk en gemakkelijk leesbaar te maken, omdat deze geen lettertypen met verschillende gewichten, afbeeldingen, koppen, subkoppen, enz. bevat. extra kenmerken de naam dragen opmaaktekst(opmaak).

Over tekstopmaak gesproken, concepten zijn gemarkeerd fysiek en logisch opmaak. Bij gebruik van fysieke tekstopmaak wordt het exacte uiterlijk van elk fragment aangegeven. Bijvoorbeeld "gecentreerde tekst, 14 punten, vet, Times". Met booleaanse opmaak wordt de booleaanse betekenis van het gegeven fragment aangegeven, bijvoorbeeld "dit is de kop van het hoofdstuk". Deze twee opmaakmethoden zijn meestal bedoeld voor gebruik in verschillende situaties... Om tekst op een printer af te drukken, moet u fysieke opmaak gebruiken. Er moeten beslissingen worden genomen over de grootte van de velden en alinea-inspringingen. vroege versies alleen tekstverwerkers gebruikt fysiek type opmaak. Tegelijkertijd werden voor elk fragment het lettertype, de grootte en de stijl aangegeven.

Bij het uitwisselen van informatie met anderen legt de fysieke opmaak van de tekst een aantal beperkingen op, vooral voor online documenten. Schermgrootte, resolutie, lettertypen zijn verschillend voor verschillende systemen... Om deze redenen wordt steeds vaker gebruik gemaakt van logisch tekstontwerp. In sommige gevallen is logisch ontwerp praktisch noodzakelijk: ​​bij het maken van elektronische documenten zoals: WWW-pagina's of bij het maken en publiceren van omvangrijke werken zoals boeken.

Om de opmaak van documenten te behouden bij het overbrengen van tekstinformatie van machine naar machine, gebruik verschillende manieren... Tekstverwerkers en publicatiesystemen gebruiken speciaal ontworpen bestandsindelingen die niet alleen tekst bevatten, maar ook informatie over hoe deze moet worden opgemaakt. Het grootste probleem hier is de incompatibiliteit van dergelijke formaten, hoewel de meest complexe programma's kan meestal bestanden in concurrerende softwareformaten lezen. Voorbeelden van deze aanpak zijn de tekstverwerkers Word en StarWriter.

In een andere benadering worden rechtstreeks in de tekst van het document ingevoegd speciale teams opmaak. Zelfs als je geen software hebt die dit formaat ondersteunt, kun je er nog steeds achter komen. Er zijn veel manieren om tekstopmaak op deze manier weer te geven, waaronder:

  • HyperText Markup Language (HTML) gebruikt in Wereldwijd Web;
  • TeX en LaTeX, populair bij veel academische publicaties, maar ook bij wiskundigen, natuurkundigen, scheikundigen en zelfs muzikanten.

Voorbeelden van programma's die op deze manier tekst kunnen markeren zijn Netscape Composer en LyX (KLyX).

Bestanden aangemaakt door verschillende redacteuren, hebben vaak unieke extensies die het mogelijk maken, zonder in het document te kijken, te raden naar manieren om tekst te markeren. Bestanden die door redacteuren zijn gemaakt voor het voorbereiden van platte tekst hebben bijvoorbeeld vaak de extensie .txt en bestanden die zijn voorbereid in Lyx - .lyx. Tekstverwerker Word maakt standaard bestanden aan in MS Word-formaat (extensie .doc), maar ondersteunt ook andere formaten, zoals RTF (extensie .rtf). Documenten met opmaakopdrachten HTML-taal, de extensie .html of .htm hebben.

Het is natuurlijk onmogelijk om alle tekstverwerkers op te sommen. Velen van hen zijn "geslepen" voor een of andere specifieke activiteit. De onderstaande lijst toont slechts een kleine selectie van teksteditors.

Bewerkers van platte tekst

Kladblok ingebouwd in de operatiekamer Windows-systeem, duidelijk en eenvoudig en gemakkelijk te gebruiken; McEdit lijkt op de MS DOS Edit, component bestandsbeheer mc (middernacht commandant) Linux-besturingssysteem; KBewerken eenvoudigste tekstverwerker, meegeleverd met KDE Linux; KWrite een teksteditor met een serie aanvullende instellingen vergeleken met andere standaard teksteditors; Emacs combineert de functies van een bestandsbeheerder en een teksteditor; een van de onderscheidende kenmerken is de mogelijkheid om macro's (macro's) te maken; is beschikbaar in alle klonen van Unix, inclusief Linux; Emacs kan ook op MS Windows worden gebruikt.

Editors die tekst maken met opmaakelementen

Woord dient om een ​​verscheidenheid aan afgedrukte documenten te maken, is een onderdeel kantoortoepassingen in MS-Windows; StarWriter maakt deel uit van het StarOffice-programma, verschijning en qua functionaliteit is het vergelijkbaar met Word, het werkt even goed in MS Windows als in Linux OS; LyX(KLyX in KDE) een moderne teksteditor ontworpen voor mensen die een professioneel ogend document willen, maar een minimum aan tijd besteden aan het maken ervan; de editor voegt TeX- en LaTeX-opmaakopdrachten in de tekst in; Netscape-componist voegt HTML-opmaak in de opdrachttekst in; er zijn versies voor zowel Linux als MS Windows.

Elektronische documenten zijn een even belangrijk onderdeel van archieven geworden als de printer op het bureau van de secretaresse. Teksten, foto's, tekeningen, databases, audio- en videobestanden worden in hoog tempo digitaal, waardoor discussies ontstaan ​​over welke formaten het meest geschikt zijn voor permanente opslag van elektronische documenten. Gelukkig hebben Russische archivarissen iemand tot wie ze zich kunnen wenden voor hulp.

Er wordt steeds luider over elektronische documenten gepraat. In de Verenigde Staten hebben archivarissen een volwaardig professionele vakantie- Electronic Records Day, die wordt gevierd op 10 oktober. Op deze dag komen wetenschappers en praktijkmensen samen om actuele kwesties van de veiligheid van elektronische documenten te bespreken.

De Russische wetenschappelijke gemeenschap staat ook niet afzijdig van het oplossen van praktische problemen, zij het niet getimed om samen te vallen met de rode dagen van de kalender. Vorig jaar voerden wetenschappers van de Russische Staatsuniversiteit voor Geesteswetenschappen (RSUH) grootschalige studie verschillende formaten bestanden van elektronische documenten met gedetailleerde beschrijving de nuances van elk van hen.

Conclusies, belangrijkste trends worden gepresenteerd in het wetenschappelijk rapport van de RSUH “ Vergelijkende analyse bestandsformaten van elektronische documenten van permanente (langdurige) opslag.” optimaal formaat permanente (langdurige) opslag van elektronische documenten.

Enkele vereisten voor de opslag van elektronische documenten

Al in de ontwerpfase van het EDMS is het systeem zo gebouwd dat de authenticiteit, betrouwbaarheid en geschiktheid van het document gedurende de gehele opslagperiode wordt gegarandeerd, ongeacht wijzigingen in het systeem2. Dergelijke wijzigingen kunnen onder andere worden veroorzaakt door formaatconversie, migratie3 tussen technisch materiaal, besturingssystemen of software applicaties... Opgemerkt moet worden dat bij het converteren van formaten informatie over de voltooide conversie moet worden opgeslagen als onderdeel van de besturingsinformatie4. Belangrijk om te weten is dat naast het originele elektronische document gedurende de gehele bewaartermijn het metadatadocument (documentbeschrijving) 5 moet worden bewaard, dat alle metadata over het elektronische document bevat. Als de bewaartermijn van een elektronisch document de verwachte levensduur van de opslagsystemen overschrijdt, moeten plannen voor migratie naar nieuwe systemen worden gedocumenteerd6.

Leesbaarheid is een essentieel kenmerk van een elektronisch document. Het wordt verzekerd door de correspondentie technische eigenschappen document en software beschikbaar voor archiefmedewerkers. Het opgegeven bestandsformaat voor permanente (langdurige) opslag moet voldoen aan: technische mogelijkheden overheidsinstanties, staats- en gemeentearchieven, niet-gouvernementele organisaties, enz. over de reproductie van informatie op lange termijn7. Bovendien is wettelijk bepaald dat elektronische documenten worden geaccepteerd voor opslag, vergezeld van software waarmee ze kunnen worden gereproduceerd, en een set bijbehorende documentatie8.

Er is geen exacte uniformiteit over de bestandsformaten die moeten worden weergegeven in elektronische documentbeheersystemen. De huidige regelgevende rechtshandelingen verschillen enigszins in hun visie op de definitieve lijst. Volgens de aanbevelingen voor het opstellen van documentenlijsten door federale autoriteiten, waarvan het aanmaken, opslaan en gebruiken moet gebeuren in de vorm van elektronische documenten bij het organiseren van interne activiteiten (goedgekeurd op bevel van Rosarkhiv nr. 32 d.d. 29 april 2011), is de aanwezigheid van elektronische documenten in het EDMS van het federale uitvoerende orgaan adviserend in PDF-, DOC-, RTF-, TXT-, XML-formaten.

In overeenstemming met de vereisten voor: informatie Systemen elektronische documentenstroom van federale uitvoeringsorganen, onder meer rekening houdend met de noodzaak om dienstinformatie via deze systemen te verwerken beperkte distributie(goedgekeurd door de Orde van het Ministerie van Telecom en Massacommunicatie van de Russische Federatie van 02.09.2011 nr. 221), zijn de volgende vier formaten verplicht: PDF, RTF, DOC, TIFF. Ander voorschriften geef de mogelijkheid toe om aanwezig te zijn in elektronische systemen overheidsinstanties van andere formaten van elektronische documentenbestanden.

In september 2014 gebruikte de raad van deskundigen van het ministerie van Telecom en Massacommunicatie PDF/A als een formaat voor interactie tussen instanties in EDMS en langdurige opslag van elektronische documenten. Samen met PDF/A wordt voorgesteld om een ​​XML-bestand met de details van een elektronisch document over te dragen. Het is bekend dat er samen met de FSO een passende order wordt opgesteld met de eisen voor documentenstroom.

Aanbevelingen voor het kiezen van een opslagformaat voor elektronische documenten

De keuze van het optimale opslagformaat wordt bepaald door het type informatie, kenmerken technische middelen opslag (magnetisch, optisch, solid state media elektronische gegevens), kenmerken van gebruikerstoegang tot gegevens en software... In verband met de verlaging van de kosten van opslagmedia en de vergroting van hun capaciteit, worden de beschikbaarheid van software en de leesbaarheid van het bestandsformaat op lange termijn erkend als de belangrijkste factoren bij het kiezen van een coderingsmethode. Bij de vergelijkende analyse van de formaten van elektronische documenten (tekst, grafische afbeeldingen, audio- en videobestanden, databases, presentaties), uitgevoerd door het personeel van de Russian State Humanitarian University, werd rekening gehouden met de volgende criteria:

  • ontwikkelaar en eigendomsrechten;
  • jaar van ontwikkeling van het bestandsformaat;
  • het jaar van de laatste modernisering;
  • frequentie van updates van programmacodes;
  • beschikbaarheid van versies;
  • open of gesloten programmacode:;
  • beschrijving en vergelijking wiskundige algoritmen compressie;
  • het doel van het bestandsformaat;
  • beschikbaarheid en beschikbaarheid van converters;
  • veerkracht met meerdere replicaties 9.

Tekstformaten

Tekst is de belangrijkste reeks informatie die in archieven is opgeslagen. Het omvat zowel teksten in de talen van menselijke communicatie (met uitzondering van hiërogliefenschrift, dicht bij de grafische vorm), als programmeertalen. Vaak bevatten tekstbestanden stukjes grafische informatie. In tegenstelling tot illustraties, audio- en video-opnamen, lenen tekstgegevens zich voor aanzienlijke compressie met behulp van speciale archiveringsprogramma's.

Volgens de aanbevelingen van de Russian State Humanitarian University is het beter om bestanden in niet-versleutelde vorm te archiveren met ZIP (* .zip), en tekst informatie het is handiger om in de volgende formaten te schrijven: XML (inclusief XSD / XSL / XHTML), PDF / A-1 (ISO 19005-1) (* .pdf), PDF / A-2 (ISO 19005-2: 2011 ) (* .pdf ). Tekstformaten kunnen onder bepaalde voorwaarden worden gebruikt: Platte tekst (ISO 8859-1-codering), PDF (* .pdf) (embedded fonts), Rich Text Format 1.x (* .rtf), HTML (inclusief een DOCTYPE-declaratie), SGML (* .sgml), Open kantoor(* .sxw / *.odt), OOXML (ISO / IEC DIS 29500) (* .docx), EPUB (niet-versleuteld) (* .epub). De grootste stabiliteit bij het migreren van het ene formaat naar het geselecteerde software de formaten * .doc en * .xml gedragen zich in de andere. Tabel 1 toont de resultaten van veranderingen in de hoeveelheid informatie tijdens de migratie.

Tabel 1. Matrix van veranderingen in de hoeveelheid informatie tijdens migratie (hoe vaak)

Bronbestandsindelingen /
Migratie bestandsformaten
* .doc
Microsoft Word 97-2003
* .odt* .xml* .rtf* .pdf* .pdf (PDF / A)
* .doc
Microsoft Word 97-2003
origineel<3,3 >2,2 >2,7 >3,2 >3,7
* .odt>3,4 origineel>8,4 >7,7 >10 >18,4
* .xml<2,2 <8,2 origineel>1,04 >1,4 >2,6

Let daar op kantoor ruimte OpenOffice, dat dankzij een gratis licentie is verspreid, kent een aantal beperkingen, bijvoorbeeld in vergelijking met Microsoft Word 2007. Om bijvoorbeeld een bestand in XML-formaat in OpenOffice 4 (Writer) te maken, zijn aanvullende technische systeeminstellingen vereist (Java-omgeving (JRE) geïnstalleerd. hetzelfde XML-indeling OpenOffice 4 * .stw is nog niet ontvangen zinvolle ondersteuning en beschrijvingen. Microsoft Word 2007 geeft geen informatie weer in deze indeling en opent het als een leeg document.

Grafische formaten

Grafische informatie met hoge resolutie, met name polychrome en grijswaardenafbeeldingen, leent zich praktisch niet voor archiefcompressie. In de regel worden voor de opslag ervan gebruikt bitmapformaten die zorgen voor opslag van realistische scènes met een hoge kleurdiepte. Op basis van de resultaten van een vergelijkende analyse bleken slechts drie formaten het meest geschikt voor langdurige opslag. bitmaps: TIFF (ongecomprimeerd), JPEG2000 (lossless) (* .jp2), PNG (* .png).

Voor vectorafbeeldingen het aanbevolen formaat is SVG (geen Java-scriptbinding) (* .svg). blauwdrukken, structurele diagrammen, grafisch gepresenteerde algoritmen, bestaande uit grafische primitieven (segmenten en onderbroken lijnen, polygonen, cirkels en ellipsen), worden het meest effectief geïmplementeerd in vectorformaten zoals SWG, WMF, CGM en dergelijke. Dat mogen we echter niet vergeten vectorformaten meestal vervormen kleurenschema complexe afbeelding.

Voor het coderen van 3D-beelden (virtuele dataformaten) is het acceptabel om het X3D-formaat (* .x3d) te gebruiken.

Audio- en videoformaten

Ook grafische informatie, audio- en video-informatie leent zich nauwelijks voor efficiënte archivering: hun compressie bedraagt ​​gemiddeld niet meer dan 5%. Keuze verschillende soorten De codering van dergelijke gegevens heeft een aanzienlijke invloed op het volume van het opgeslagen bestand, daarom hangt de voorkeur van het ene of het andere formaat af van de vereiste afspeelkwaliteit en, als gevolg daarvan, het beschikbare volume aan archiefopslag. Aanbevolen opslagformaten voor audio-informatie: AIFF (PCM) (* .aif, * .aiff), WAV (PCM) (* .wav), AES3 (LPCM) (* .aes). topscores na de vergelijking werden voor de veiligheid van videogegevens de volgende formaten getoond: Motion JPEG 2000 (ISO / IEC 15444-4) (*.mj2), AVI (ongecomprimeerd, motion JPEG) (* .avi), QuickTime Movie ( ongecomprimeerd, motion JPEG) (*.mov).

Databases en databanken

De keuze van het opslagformaat voor de database hangt voornamelijk af van de structuur ervan. Als de basis een enkel bestand is, is het raadzaam om het op te slaan in de codering die overeenkomt met dit type bestand. Bij het opslaan van een database, waarvan de records bestaan ​​uit velden met verschillende structuren, worden meestal RTF- en PDF-coderingen gebruikt, maar alleen als er geen audio- en videofragmenten in de database zijn. Meest universele formaten voor langdurige opslag van databases zijn Comma Separated Values ​​(* .csv), Delimited Text (* .txt), SQL DDL. In zeldzame gevallen kunnen de volgende formaten worden gebruikt: DBF (* .dbf), OpenOffice (* .sxc / *. Ods), OOXML (ISO / IEC 29500) (*. Xlsx).

Presentaties

Geen van beide bestaande formaten voorziet niet hoge graad betrouwbaarheid van de veiligheid van de presentatie. Met enig voorbehoud raden we de formaten OpenOffice (* .sxi / *. Odp) en OOXML (ISO / IEC DIS 29500) (* .pptx) aan. PowerPoint (* .ppt) en andere bestandsindelingen voor presentaties voldoen niet aan de opslagvereisten voor de lange termijn.

Hybride informatie

Voor het opslaan van complexe documenten, waarvan de structuur fragmenten van verschillende aard bevat (tekst, foto, tekening, enz.), zijn moderne tekstformaten zoals MS WORD, RTF het meest geschikt. Ze stellen u in staat om op te nemen: grafische afbeeldingen in rastercoderingen. Als er veel illustraties zijn, is het raadzaam om een ​​dergelijk document in de vorm van een enkele afbeelding op te slaan - in dit geval hebben grafische formaten de voorkeur.

Opmerkingen:

  1. Onderzoekswerk werd uitgevoerd onder het staatscontract nr. 016-3 van 31 mei 2013 "Onderzoek" moderne processen documentatie ondersteuning beheer en ontwikkeling van elektronisch documentbeheer. " Wetenschappelijk rapport"Vergelijkende analyse van de bestandsformaten van elektronische documenten voor permanente (langdurige) opslag" (als onderdeel van de uitvoering van maatregelen van het federale doelprogramma "Cultuur van Rusland" (2012-2018).
  2. GOST R ISO 15489-1-2007 "Nationale norm" Russische Federatie... Systeem van standaarden voor informatie, bibliotheken en publicaties. Document beheer. Algemene vereisten"(Goedgekeurd door de Orde van Rostekhregulirovaniya van 12.03.2007 nr. 28-st).
  3. Migratie van elektronische documenten is het verplaatsen van records van het ene systeem naar het andere met behoud van hun authenticiteit, integriteit, betrouwbaarheid en gebruiksgemak.
  4. De structuur van de documentbeschrijving bestaat uit een beschrijving van de fysieke of technische structuur: en zijn logische structuur, dat wil zeggen, de relatie tussen de gegevenselementen waaruit het document bestaat. Voor details over het aanmaken, beheren en gebruiken van metadata, zie GOST R ISO 23081-1-2008. Systeem van standaarden voor informatie, bibliotheken en publicaties. Documentbeheer processen. Metagegevens voor documenten. Deel 1. Principes (goedgekeurd door de Orde van Rostekhregulirovanie van 13.11.2008 nr. 310-st).
  5. GOST R 54471-2011 “Elektronische documentbeheersystemen. Document beheer. Informatie elektronisch opgeslagen. Aanbevelingen voor het waarborgen van betrouwbaarheid en betrouwbaarheid ”.
  6. Regels voor de organisatie van opslag, verwerving, boekhouding en gebruik van documenten van het Archieffonds van de Russische Federatie en andere archiefdocumenten in staats- en gemeentelijke archieven, musea en bibliotheken, organisaties van de Russische Academie van Wetenschappen (goedgekeurd in opdracht van het ministerie van cultuur en massacommunicatie RF gedateerd 18 januari 2007 nr. 19).
  7. Zie dezelfde paragraaf 4.4.3.
  8. Replicatie is een persistentiemethode digitale informatie door een of meer volledige exemplaren(klonen) van digitaal materiaal. Replicatie vereist speciale maatregelen om alle kopieën up-to-date te houden.