Mis on RTF-vorming ja mille poolest see DOC-st erineb? Kuidas töötada RTF- ja TXT-failidega: märkmik ja keerulisemad programmid

RTF-failivorming on tuttav paljudele dokumentidega tegelevatele kasutajatele. Palju äridokumente, e-raamatuid ja brošüüre, erinevat tüüpi ja sisuga tekste – need kõik on olemas, ka rtf-failidena. Kui tekib vajadus selliste dokumentide sisu vaadata, tuleb appi tuntud tekstiredaktor MS Word, mis seda tüüpi faile lihtsalt avab. Kuid kas see on ainus alternatiiv? Muidugi mitte. Selles artiklis räägin teile, kuidas RTF-faili avada, millised programmid meid selles aitavad ja kuidas neid kasutada.

Nagu teada," .rtf" on üks tekstifaili laiendi vorme. See tähekombinatsioon on lühend sõnadest " Rikasteksti vorming» (rikastekstivorming). Selles vormingus dokument toetab nn rikasteksti (rikasteksti), mis võimaldab dokumendi redigeerimisel opereerida mitme tekstivormingu valiku, erinevate fontide ja nende suurustega, paigutada teksti sisse JPG ja PNG pilte, toetada kohandatud vahekaardi seaded ja nii edasi.

Vormingu lõi Microsoft 1987. aastal, see läbis 20 aasta jooksul mitmeid muudatusi ja 2008. aastal teatas Microsoft, et ei toeta seda enam. Kuid "rtf" on nüüd üks populaarsemaid tekstivorminguid.

Tavaliselt avatakse RTF-tekstivorming peaaegu iga kasutaja arvutis (tavaliselt installitud MS Wordi tekstiredaktoriga). Kui teil pole seda tüüpi failide vaatamiseks juurdepääsu, soovitan installida ja kasutada mõnda allpool loetletud programmidest.

Parimad programmid RTF-failide avamiseks

Seal on piisavalt palju programme, mis võimaldavad avada rtf-laiendiga tekstifaile. Selliste failide avamise algoritm on standardne: käivitate vastava programmi, klõpsate selles vahekaarti "Fail", valite seal "Ava" ja suunate programmi arvuti kettal soovitud rtf-faili teele.

RTF-vaaturi tarkvaratoodetest võin soovitada järgmisi valikuid:

  • Microsoft WordPad on Microsofti lihtsustatud tekstiredaktor, mis tavaliselt sisaldub Windowsi operatsioonisüsteemis alates Windows 95-st. Võimaldab vaadata, redigeerida ja salvestada tekstifaile rtf-vormingus;

  • Microsoft Word, populaarne tekstiredaktor, mida ma juba mainisin, on osa Microsoft Office'i rakenduste komplektist. Toote praegune versioon on Microsoft Office Word 2016;
  • Microsoft Works on koduseks kasutamiseks mõeldud kontorirakenduste lihtsustatud komplekt. Selle paketi tekstiredaktor on oma funktsionaalsuselt midagi juba mainitud WordPadi ja MS Wordi vahepealset, pakkudes tõhusat tuge rtf-vormingule;
  • Atlantis Word Processor on Windows OS-i jagamisvara tekstiredaktor. Selle eeliste hulgas on kompaktsus (mahutab vaid 3 megabaiti) ja RTF-failide töötlemise kiirus;
  • TextMaker Viewer on Windows OS-i tasuta rakendus, mis suudab avada ja vaadata enamikku tekstidokumente, sealhulgas meile vajalikku rtf-vormingut;
  • Corel WordPerfect Office X6 on Corelilt tuntud kontoritarkvarapakett, mis sisaldab WordPerfect X3 tekstiredaktorit ja toetab rtf-vormingut. Toode on tasutud;
  • Apache OpenOffice on tasuta kontoriprogrammide komplekt, suurepärane alternatiiv tasulisele Microsoft Office'ile. Selles paketis sisalduv tekstiredaktor (Writer) toetab tõhusalt rtf-failidega töötamist;
  • AbiSource AbiWord on tasuta tekstiredaktor, mis on funktsionaalsuselt sarnane MS Wordiga ja võib olla tõhus vastus küsimusele "kuidas avada rtf";
  • TextMaker on SoftMaker Office'i kontorikomplekti kuuluv tekstiredaktor. Samuti toetab see rtf-vormingut.

Selle vormingu faili toetavad teised tekstiredaktorid, mis võivad töötada vormindatud tekstiga.

Kuidas avada rtf-faili võrgus

Samuti on mitu võrgutööriista, mis võimaldavad teil RTF-i võrgus vaadata ja redigeerida. Tahaksin märkida Google Docsi teenust, mis võimaldab teil rtf-dokumente Internetis vaadata.

Samuti saate installida Google Chrome'i jaoks sobiva laienduse (Docs Online Viewer) või Mozilla Firefoxi analoogi, mis võimaldab avada rtf-faile, kasutades määratud brauserite funktsioone.

Lisaks saate kasutada võrgumuundureid (näiteks Zamzar), mis võimaldavad teil teisendada RTF-dokumendi teile mugavamasse tekstivormingusse (näiteks sama populaarseks dokumendiks).


Järeldus

Eespool loetletud programmid aitavad teil RTF-laiendite redigeerimise probleemi lahendada. Soovitan pöörata tähelepanu tasuta alternatiividele, eriti OpenOffice'i kontorikomplektile, mis võimaldab teil seda tüüpi failidega täiesti tasuta töötada. Konservatiividele võin soovitada malli Microsoft Wordpad ja Microsoft Word – paljud kasutajad valivad need, mida iganes öeldakse.

Kokkupuutel

Laiendused on mõned failid, mis on seotud või mida saab Microsoft WordPadi abil avada. RTF-failid on tekstidokumendid, mida saab luua, avada, vaadata, redigeerida või muuta nii Maci kui ka Microsoft Windowsi põhiste arvutite tekstitöötlusrakenduste (nt Microsoft WordPad for Windows ja Microsoft Word 2011 for Mac) abil. See pakub kasutajatele laialdast ristühilduvuse tuge, mis oli Rich Text Format tehnoloogia täiustamise keskne eesmärk, ning neid .rtf-faile saab isegi andmebaasirakendustega avada, vaadata ja kasutada. OpenBSD Unixi platvormi kasutatakse sageli arvutites, mis töötavad turvalise võrgu veebiserveritena. OpenBSD-faile saab salvestada OpenBSD-süsteemi kataloogidesse, mis loodi tarkvararakenduste installimisel. Laiendiga .openbsd faile saab avada standardsete tekstiredaktorite abil, eriti tuntud nagu Microsoft Notepad, ning seda tekstiredaktorit saab kasutada ka OPENBSD-failide loomiseks ja redigeerimiseks. Laiendiga .readme failid on tekstidokumendid, mille eesmärk on anda kasutajatele kasulikku teavet ja konkreetseid üksikasju teatud süsteemi installitud rakenduste kohta. Neid faile saab avada, vaadata ja redigeerida tekstiredaktorite valikuga, sealhulgas Microsoft Notepad ja Microsoft WordPad.

Microsoft Word

Microsoft Word on tekstitöötlusprogramm, mis on pakitud Microsoft Office Suite'i. Selle on välja töötanud Microsoft Corporation, mis loob faili salvestamisel .doc-faililaiendi. Dokumendifailivorming (.doc) on teksti- või kahendfailivorming dokumentide salvestamiseks andmekandjale, peamiselt arvutikasutuseks, näiteks teksti, diagrammide, tabelite, lehtede vormindamise, graafikute, piltide ja muude dokumentide tippimiseks, mille sisu luuakse ja toimetatud. Nende dokumentide sisu on prinditav mis tahes suuruses ja neid saab avada ka teistes seadmetes, eeldusel, et selle operatsioonisüsteem suudab lugeda DOC-faile. See .doc-faililaiend on muutunud kontoridokumentide jaoks ulatuslikuks de facto standardiks, kuid see on omandatud vorming ja teised tekstitöötlusprogrammid ei toeta seda alati täielikult. Mitmesugused programmid, mis suudavad seda tüüpi faile avada, ja erinevad operatsioonisüsteemid ning installitud programmid, mis suudavad avada 1ST-faili, on järgmised: Microsoft Word, Microsoft Notepad, Microsoft Word, IBM Lotus WordPro ja Corel WordPerfect.

Microsoft Notepad

Microsoft Notepad

Notepad on tavaline tekstiredaktor, mida kasutatakse tavaliste dokumentide loomiseks. Seda kasutatakse tavaliselt tekstifailide (.txt) vaatamiseks või redigeerimiseks ning see on lihtne tööriist veebilehtede loomiseks ning toetab ainult HTML-dokumentide põhivormingut. Sellel on ka lihtne sisseehitatud logimisfunktsioon. Iga kord, kui faili, mis initsialiseeritakse .log-iga, avatakse, lisab programm faili viimasele reale teksti ajatempli. See võtab vastu teksti Windowsi lõikelaualt. See on abiks manustatud fonditüübi- ja stiilikoodide eemaldamisel vormindatud tekstist, näiteks teksti kopeerimisel veebilehelt ja kleepimisel meilisõnumisse või muusse "What You See Is What You Getâ" Â tekstiredaktor. Vormindatud tekst kleebitakse ajutiselt Notepadi ja seejärel kopeeritakse kohe uuesti eemaldatud vormingus, et kleepida teise programmi. Lihtsaid tekstiredaktoreid, nagu Notepad, saab kasutada teksti muutmiseks märgistuse abil (nt HTML). Notepadi varasemad versioonid pakkusid ainult kõige elementaarsemaid funktsioone, näiteks teksti otsimist. Windowsi uuemad versioonid sisaldavad Notepadi uuendatud versiooni otsingu ja asendamise funktsiooniga (Ctrl + H), samuti Ctrl + F otsingu ja sarnaste kiirklahvide jaoks. See kasutab sisseehitatud aknaklassi nimega redigeerimine. Vanemates versioonides, nagu Windows 95, Windows 98, Windows Me ja Windows 3.1, on redigeeritava faili suuruse piirang 64k, mis on klassi EDIT operatsioonisüsteemi limiit.


Microsoft töötab

Microsoft töötab

Microsoft Works on integreeritud paketttarkvara, mille töötas välja Microsoft. See on odavam, väiksem ja sellel on vähem funktsioone kui Microsoft Office või muud kontorikomplektid. Selle kesksed funktsioonid hõlmavad tekstitöötlusprogrammi, arvutustabelit ja andmebaasihaldussüsteemi. Uuematel versioonidel on kalendrirakendus ja sõnastik, samas kui vanemad versioonid sisaldasid terminali emulaatorit. WPS-laiendiga faile kasutatakse Microsoft Worksi tekstitöötlusrakenduse väljundfailide jaoks. Need failid liigitatakse tekstidokumentideks, mida saab Microsoft Worksi programmi abil luua, salvestada, vaadata ja redigeerida. Microsoft Word 2010, Microsoft Publisher 2010, Planamesa NeoOffice ja OxygenOffice Professional on mõned rakendused, mis suudavad avada ja vaadata nende WPS-failide sisu. Nende WPS-failide sisu saab eksportida ka muudesse ühilduvatesse Wordi dokumendivormingutesse. See soodustab mugavust ja tõhusat dokumendiesitlust, grupikoostööd ja jagamist erinevate süsteemide ja tekstitöötlusrakenduste kasutajate vahel; aga WPS-dokumenti ei saa rakendada makrode ja muude Microsoft Wordis saadaolevate vormindamisvalikutega; seega lõpetas Microsoft Microsoft Worksi rakenduse toe ja arendamise koos selle versiooniga 9 ja Microsoft Word 2010 väljalaskmisega.

Märkmik2

Notepad2 rakendus on Windowsi jaoks täiustatud tekstiredaktor, mille on välja töötanud Florian Balmer. See programm pärineb algsest sisseehitatud Microsoft Notepadist, mistõttu on see tõhus ja kiire ka siis, kui see on väike. Notepad2-l on ka palju funktsioone, näiteks süntaksi esiletõstmine, mis võimaldab teksti või lähtekoodi kuvada erinevate fontide ja värvidega. See notepad2 süntaksi esiletõstmise funktsioon võimaldab kasutajatel programmeerimiskeelt lihtsalt ja selgelt kirjutada. See Notepad2 hämmastav funktsioon on tingitud ka mitmetest muudest funktsioonidest, mis sellel on, nagu automaatne taane, regulaarne ja avaldisepõhine otsimise ja asendamise funktsioon, sulgude sobitamine, reavahetuse teisendamine, kodeeringu teisendamine ning mitmed tagasivõtmise ja uuesti tegemise funktsioonid. Need funktsioonid muudavad lihtsa Notepadi funktsiooni täiustatud ja muudab Notepadi kasutamise huvitavamaks kas .txt-vormingus failide avamiseks või HTML-koodide kirjutamiseks. Notepad2 toetab ka paljusid programmeerimiskeeli nagu ASP, C++, Perl, Java jne. - Laiend (vorming) on ​​märgid faili lõpus pärast viimast punkti.
- Arvuti määrab failitüübi laienduse järgi.
- Vaikimisi ei näita Windows failinimelaiendeid.
- Mõnda tähemärki ei saa failinimes ja laiendis kasutada.
- Kõik vormingud ei ole seotud sama programmiga.
- Allpool on kõik programmid, mida saab kasutada RTF-faili avamiseks.

Caliberi lihtsalt kasutatav tarkvara muudab raamatukogu haldamise tõeliselt mugavaks. Caliber aitab teil korraldada kõik olemasolevad raamatud organiseeritud raamatukogusse. Programm võimaldab teil neid toiminguid teha pingevabalt suhteliselt lühikese aja jooksul. Programm on varustatud ka kasuliku konverteerimisfunktsiooniga e-raamatutes kõige sagedamini kasutatavate tekstivormingute jaoks. Lisaks programmis sisalduvatele erinevatele utiliitidele, mis on mõeldud vormingute teisendamiseks, sisaldab see ka uudiste integraatorit ja funktsiooni, mis võimaldab teil andmeid elektroonilise lugejaga sünkroonida...

LibreOffice on tasuta tarkvarapakett teksti, tabelite, andmebaaside jms töötamiseks. Oma olemuselt on see tuntud Microsoft Office'i tasuta analoog, millele on lisatud uusi funktsioone, mida sarnases tasulises paketis pole. Selle paketi liides sarnaneb Office'i vanemate versioonidega, nii et peaaegu iga kasutaja saab rakendusest aru. Eriti kui ta on kunagi kontorirakendustega töötanud. Pakett sisaldab mitmeid rakendusi, mis täidavad samu funktsioone kui nende Microsoft Office'i kolleegid. Näiteks programm Writer on peaaegu täielik Wordi koopia, mis toetab kõiki populaarseid failivorminguid, sealhulgas...

NI Transliterator on huvitav programm, mis aitab teksti transliteratsioonist teisendada. Töötab vene ja inglise keelega. Pakub minimaalset tekstivormingut. Võimaldab dokumente RTF-vormingus alla laadida ja pärast töötlemist salvestada. Toetab populaarseid transliteratsioonisüsteeme ja kasutaja määratud tabeleid. Töötab GOST 16876-71 ja vene-inglise süsteemiga. NI Transliterator toetab tekstis olevate märkide teisendamist suur- või väiketähtedeks. Utiliit töötab venekeelsete sõnade kodeeringu muutmise funktsiooniga ja aitab lugeda märkide arvu mis tahes tekstis. Loendamise funktsioon...

Cool Reader on veel üks hea programm e-raamatute lugemiseks, mis ühendab mitte ainult multifunktsionaalse failivaaturi, vaid ka "rääkija". Üldiselt on see programm nägemise säilitamisel palju abiks, sest kohandab teksti lugemise maksimaalselt teie silmadele ja muudab selle sujuvamaks. Programm mõistab lõike, pealkirju, oskab muuta fonti, kasutada sujuvaid üleminekuid jne. Programmi teine ​​omadus on süntesaatorite tugi. Need. Programm Cool Reader võib kasutada raamatu lugemiseks mingit süntesaatorit, sel juhul saab üldiselt oma asja ajada ja mitte...

WindowsOffice on mugav ja väikesemahuline analoog tavalisele kontorikomplektile. Sisaldab tekstidokumentide ja tabelitega töötamiseks vajalikke programme. Võimaldab teil redigeerida kõiki dokumente, isegi MSWordi varasemaid versioone. Sobib igapäevaseks kasutamiseks, ei vaja aktiveerimist. See töötab palju kiiremini, salvestades dokumente külmutamata. Toetab mallide kogumit. WindowsOffice'i abil saab kasutaja teha samu toiminguid nagu tema analoograkendus. Võimaldab sisestada dokumenti erinevaid pilte. Sellel on tahvelarvutite jaoks mõeldud versioon. Iseloomustab kerge kaal, kiire...

Balabolka on programm paljudes DOCX-, RTF-, PDF-, ODT-, FB2- ja HTML-vormingutes tekstifailide valjuhäälseks lugemiseks. Nüüd ei pea te seda või teist raamatut lugedes oma nägemist kahjustama. Balabolka loeb mis tahes teksti valjusti, ükskõik mis keeles. Kuulmistaju, nagu teada, võimaldab omastada ja meelde jätta palju suuremat hulka informatsiooni kui tavaline lugemine. Ja mis kõige tähtsam – kiiremini. Balabolka loeb teie eest kõike, kui te vaikselt midagi muud teete. Iga raamat loob lugedes teatud meeleolu, kuid nüüd saate seda luua Balabolka abiga. Taasesituse ajal saate...

Calligra on ainulaadne rakendus, mis pakub kasulikke utiliite erinevate dokumentidega suhtlemiseks. Sisaldab mitmeid kasulikke programme mis tahes teksti, andmebaaside, arvutustabelite ja esitlusfailidega töötamiseks. Rakendusel on vooredaktor vooskeemide ja diagrammide loomiseks ja redigeerimiseks. Keerulise vektorgraafikaga töötamiseks on olemas ka Carboni programm, mis pole valikute poolest teistest toimetajatest madalam. Calligra sisaldab spetsiaalset autorirakendust oma raamatute kirjutamiseks. Üks pakettprogrammidest vastutab piltide loomise ja redigeerimise eest (Krita). See on suurepärane asendus...

Üks populaarsemaid kontoripakette, mida iseloomustab paljude funktsioonide, sealhulgas õigekirja kontrollimise võimalus. Esiteks on see pakett tähelepanuväärne selle poolest, et see on täiesti tasuta, mis võimaldab seda kasutada igas arvutis. Võimaldab teil täita kõiki tavalisi ülesandeid. Seega sisaldab see tekstiredaktorit, tabeliredaktorit ja programmi mallide või esitluste ning slaidide loomiseks. Lisaks on see avatud lähtekoodiga, mis võimaldab vajadusel selles muudatusi teha. Lisaks saab rakenduse installida peaaegu igale operatsioonisüsteemile...

WPS Office on veel üks pakett kontoridokumentidega töötamiseks, mis on alternatiiv Microsofti tuntud rakendusele. See pakett sisaldab peaaegu kõiki tööriistu, mida võib vaja minna failide redigeerimiseks. Näiteks WPS Office'i pakett sisaldab mugavat tekstiredaktorit, mis suudab avada peaaegu kõiki kontorirakenduste vorminguid, näiteks doc. Samuti saab see programm töötada html-lehtedega ja avada muid tekstifaile. Esitluste loomiseks on olemas rakendus, mis sarnaneb samuti populaarse Microsofti paketiga. See sisaldab vajalikke funktsioone, mida iga sugu võib vajada...

Tasuta avaja on üsna funktsionaalne kõige populaarsemate failide vaataja, sealhulgas Winrari arhiivid, Microsoft Office'i dokumendid, PDF, Photoshopi dokumendid, torrent-failid, ikoonid, veebilehed, tekstidokumendid, heli- ja videofailid, graafilised failid, sealhulgas Flash ja palju muud. Toetatud failide arv ületab seitsekümmend. Programmil pole tavalisi sätteid ja valikuid peale kujunduse muutmise. Samuti on vaja märkida, et vene keelt pole, kuid lihtsust arvestades ärge alahinnake programmi. Free Opener on universaalne ja väga mugav programm erinevat tüüpi failide lugemiseks.

Noh, jätkame oma uurimistööd, et saada teksti erinevatest andmevormingutest. Mitte kaua aega tagasi õppisime, kuidas ekstraktida teksti zipped-xml-põhistest failidest (odt ja docx) ning selle nädala alguses ka pdf-failist. Täna jätkame lubatud rtf-ga.

Rikastekstivorming (teise nimega rtf), võite arvata, on üsna unustatud, kuigi mitte väga keeruline vorming tekstiandmete esitamiseks. Noh, teksti hankimine on suhteliselt lihtne, kuid selle ajaloo jooksul: alates esimesest versioonist kuni praeguse versioonini 1.9.1 - see on omandanud umbes 300 lehekülge ametlikku dokumentatsiooni ja tohutul hulgal lisandmooduleid, mis segavad meid lihtteksti saamisel proovime neist mööda hiilida...

Mis sees on?

Nagu tavaliselt, vaatame rtf-faili ja vaatame, mis seal sees on:

Mida me näeme? Näen meie lemmikluuletust "Purje". Näeme algselt teksti 8-bitist andmevormingut. See on juba julgustav – kui lähteandmed sisaldavad teksti, on toimuvast palju lihtsam aru saada. Nüüd mõtleme välja, kuidas neid andmeid lugeda. Selleks räägin teile selle teema kohta väikese teooria.

Eeldame, et rtf koosneb kontrollsõnad, mis võib olla rühmitatud pesastatud komplektidesse. Kontrollsõna algab kaldkriipsuga (\), rühm mähitakse lokkis sulgudesse (( ja )).

Kontrollsõna koosneb ingliskeelse tähestiku tähtedest (a-st z-ni) ja seda saab täiendada numbrilise parameetriga (võimalik, et see on negatiivne). Teise võimalusena võib sõna sisaldada üht mittetähestikulist ascii-märki. Kõik, mis nende reeglite alla ei kuulu, ei kuulu kontrollsõna alla. Seega on jada kujul \rtf1\ansi\ansicpg1251 kergesti jagatud kolmeks sõnaks rtf parameetriga 1 (vormingu põhiversioon), ansi (praegune kodeering) ja ansicpg parameetriga 1251 (praegune koodileht numbriga 1251 – st Windows -1251).

Rühmitatud komplektid määravad juhtsõnade ulatuse. Seega töötavad lokkis sulgudes kirjeldatud juhtsõnad ainult nende ja kõigi alamhulkade sees. Selleks et õigesti välja selgitada, millised sõnad praegu on, peate säilitama kontrollsõnade virna. Kui avate lokkis sulgu, looge virnale uus massiivi element, millele lisate sulu sulgemisel kohe andmed virna eelmisest kihist, kustutage ülemine kiht.

Samuti väärib märkimist, et mõne juhtsõna saab sulgeda nullparameetri lisamisega, mitte uue alamrühma loomisega. Näiteks on samaväärsed järgmised valikud: See on (\b paksus kirjas) tekst , See on \b paksus kirjas \b0 tekst = See on julge tekst .

Kust saada teksti?

Tutvusime meie jaoks uue formaadi seadmega, nüüd küsime endalt, kust teksti saada. Siin pole kõik nii keeruline, kui võib tunduda – teksti tuleb võtta sealt, kus praegune järgnevus pole kontrollsõnana tuvastatud. Paari erandiga muidugi.

Esiteks väärib märkimist, et rtf-faili algne kodeering on ANSI, nii et ilma igasuguste viperusteta salvestatakse ainult ingliskeelne tekst. Meid huvitab vähemalt venekeelne tekst ja veelgi parem Unicode, eks? Mis on tõsi, see on tõsi – rtf, kuigi vana formaat, sobib mõlema salvestamiseks.

Seega on rtf"-s võimalik kasutada ASCII tabeli teist poolt ehk alates 128-st ja kõrgemast. Võttes muidugi arvesse praegust kodeeringut (kontrollsõna \ansicpg kohal). Selleks on jada vorm \"hh võeti kasutusele RTF-is, kus hh on märgi binaarne kuueteistkümnendkood ASCII tabelist.

Noh, teine, huvitavam variant on unicode-kodeeritud andmed. Nende jaoks sisaldab vorming kokkuvõtlikult lühikest märksõna \uABCD digitaalse parameetriga ABCD. ABCD on antud juhul unicode märgi kood kümnendarvusüsteemis. Kõik on jälle lihtne, nagu olete märganud.

Lihtne, aga mitte väga hea. RTF-is on veel üks märksõna \ucN, mis on Unicode'iga tihedalt seotud. Fakt on see, et RTF-vorming säilitab väga innukalt ühilduvust vanemate seadmetega, milles peate võib-olla selle faili avama. Teise võimalusena ei saa selline seade (näiteks Windows 3.11:) Unicode'i lugeda, mida see peaks tegema? Selleks saab pärast iga märksõnaga \u krüpteeritud unicode-tähemärki määrata nullist mitme märgini, mida tuleb kuvada juhul, kui rtf-vaatur ei saa jooksvaid andmeid kuvada või sõeluda (dokumentatsiooni kohaselt, kui vaataja ei saa andmeid õigesti kuvada, peab ta need vahele jätma).

Sellega seoses paneb enamik kaasaegseid toimetajaid unicode'i juhtsõna järele küsimärgi märgiks, et neid soovitakse näidata praeguse tähemärgi asemel. Kuid võimalikud on ka valikud, näiteks: Lab\u915GValue . Küsigem endalt, mitu tähemärki tuleb kuvada, kui Unicode'i näitamiseks pole võimalust. Jällegi, kõik pole väga keeruline – ülaltoodud märksõna \ucN parameetrina N annab selle väärtuse. Need. Midagi nagu \uc1 ilmub kindlasti enne Unicode'i andmeid, mis käsib meil Unicode'i järel ühe märgi vahele jätta.

Loeme!

Näib, et kogutud andmetest piisab meie esimeste rtf-failide lugemiseks. Mine:
  1. funktsioon rtf_isPlainText($s) (
  2. $failAt = massiiv ("*" , "fonttbl" , "colortbl" , "datastore" , "themedata" ) ;
  3. jaoks ($i = 0; $i< count ($failAt ) ; $i ++ )
  4. if (! tühi ($s [ $failAt [ $i ] ]) ) return false ;
  5. tagasta tõene ;
  6. funktsioon rtf2text($ failinimi) (
  7. $tekst = faili_hangi_sisu($failinimi);
  8. if (! strlen ($text ) )
  9. tagasta "" ;
  10. $dokument = "" ;
  11. $pinn = massiiv () ;
  12. $j = -1;
  13. jaoks ($i = 0; $i< strlen ($text ) ; $i ++ ) {
  14. $c = $tekst [ $i ] ;
  15. lüliti ($c) (
  16. juhtum " \\ " :
  17. $nc = $tekst [ $i + 1 ] ;
  18. if ($nc == "\\" && rtf_isPlainText($pinn [ $j ] ) ) $document .= "\\" ;
  19. elseif ($nc == "~" && rtf_isPlainText($pinn [ $j ] ) ) $document .= " " ;
  20. elseif ($nc == "_" && rtf_isPlainText($pinn [ $j ] ) ) $document .= "-" ;
  21. elseif ($nc == "*" ) $pinn [ $j ] [ "*" ] = true ;
  22. elseif ($nc == """ ) (
  23. $hex = alamstr ($tekst, $i + 2, 2);
  24. $document .= html_entity_decode ("" . hexdec ($hex ) . ";" ) ;
  25. $i += 2;
  26. ) elseif ($nc >= "a" && $nc<= "z" || $nc >= "A" && $nc<= "Z" ) {
  27. $word = "" ;
  28. $param = null ;
  29. jaoks ($k = $i + 1, $m = 0; $k< strlen ($text ) ; $k ++, $m ++ ) {
  30. $nc = $tekst [ $k ] ;
  31. if ($nc >= "a" && $nc<= "z" || $nc >= "A" && $nc<= "Z" ) {
  32. kui (tühi ($param) )
  33. $sõna .= $nc ;
  34. muidu
  35. murda ;
  36. ) elseif ($nc >= "0" && $nc<= "9" )
  37. $param .= $nc ;
  38. elseif ($nc == "-" ) (
  39. kui (tühi ($param) )
  40. $param .= $nc ;
  41. muidu
  42. murda ;
  43. ) muidu
  44. murda ;
  45. $i += $m - 1;
  46. $toText = "" ;
  47. switch(strtolower($word)) (
  48. täht "u":
  49. $toText .= html_entity_decode ("" . dechex ($param ) . ";" ) ;
  50. $ucDelta = @ $stack [ $j ] [ "uc" ] ;
  51. kui ($ucDelta > 0)
  52. $i += $ucDelta ;
  53. murda ;
  54. tähis "par" : juhtum "leht" : juhtum "veerg" : suurjuhtum "rida" : juhtum "lbr":
  55. $toText .= " \n";
  56. murda ;
  57. suurtäht "emspace" : suurtäht "enspace" : suurtäht "qmspace":
  58. $toText .= " " ;
  59. murda ;
  60. suurtäht "tab" : $toText .= " \t"; murda ;
  61. case "chdate" : $toText .= kuupäev ("m.d.Y" ) ; murda ;
  62. suurtäht "chdpl" : $toText .= kuupäev ("l, j F Y" ) ; murda ;
  63. suurtäht "chdpa" : $toText .= kuupäev ( "D, j M Y" ) ; murda ;
  64. case "chtime" : $toText .= kuupäev ( "H:i:s" ) ; murda ;
  65. suurtäht "emdash" : $toText .= html_entity_decode ("—" ) ; murda ;
  66. suurtäht "endash" : $toText .= html_entity_decode ("-" ) ; murda ;
  67. suurtäht "täpp" : $toText .= html_entity_decode ("" ) ; murda ;
  68. suurtäht "lquote" : $toText .= html_entity_decode ("‘" ) ; murda ;
  69. suurtäht "rquote" : $toText .= html_entity_decode ("'" ) ; murda ;
  70. suurtäht "ldblquote" : $toText .= html_entity_decode (""" ) ; murda ;
  71. suurtäht "rdblquote" : $toText .= html_entity_decode (""" ) ; murda ;
  72. vaikimisi:
  73. $stack [ $j ] [ strtolower ($word ) ] = tühi ($param ) ? tõsi : $param ;
  74. murda ;
  75. if (rtf_isPlainText($stack [ $j ] ) )
  76. $dokument .= $teksti ;
  77. $i++;
  78. murda ;
  79. juhtum "(" :
  80. massiiv_tõuge ($pinn, $pink [ $j++ ]) ;
  81. murda ;
  82. juhtum ")" :
  83. massiiv_pop ($pinn) ;
  84. $j --;
  85. murda ;
  86. tähis "\0" : juhtum "\r" : juhtum "\f" : juhtum "\n" : katkestus ;
  87. vaikimisi:
  88. if (rtf_isPlainText($stack [ $j ] ) )
  89. $dokument .= $c ;
  90. murda ;
  91. tagasta $dokument ;
Koodi koos kommentaaridega saate aadressilt