Hypertext opmaaktalen SGML. xml. HTML-code.
SGML(English Standard Generalized Markup Language - een standaard gegeneraliseerde opmaaktaal; uitgesproken als [es-ji-em-el]) is een metataal waarin u een opmaaktaal voor documenten kunt definiëren. SGML is de opvolger van IBM's Generalized Markup Language (GML) uit 1969 en moet niet worden verward met de Geography Markup Language die is ontwikkeld door het Open GIS Consortium.
SGML is oorspronkelijk ontworpen voor het delen van machineleesbare documenten in grote overheids- en ruimtevaartprojecten. Het werd veel gebruikt in print en uitgeverijen, maar de complexiteit ervan maakte het moeilijk om algemeen te worden toegepast voor dagelijks gebruik.
De belangrijkste onderdelen van een SGML-document zijn:
SGML-declaratie - definieert welke tekens en scheidingstekens in de toepassing kunnen verschijnen;
Definitie documenttype - definieert de syntaxis van opmaakconstructies. De DTD kan aanvullende definities bevatten, zoals symbolische geheugensteuntjes;
De semantiekspecificatie, die verwijst naar opmaak, biedt ook syntaxisbeperkingen die niet binnen een DTD kunnen worden uitgedrukt;
De inhoud van een SGML-document - moet minimaal een root-element zijn.
SGML biedt veel opties voor syntactische opmaak voor gebruik door verschillende toepassingen. Door de SGML-declaratie te wijzigen, kunt u zelfs het gebruik van punthaken elimineren, hoewel deze syntaxis als standaard wordt beschouwd, de zogenaamde concrete referentiesyntaxis.
Voorbeeld SGML-syntaxis:
typisch zoiets als
SGML is gestandaardiseerd door ISO: "ISO 8879: 1986 Informatieverwerking-Tekst- en kantoorsystemen-Standard Generalized Markup Language (SGML)"
HTML en XML zijn afgeleid van SGML. HTML is een SGML-toepassing en XML is een subset van SGML die is ontworpen om het machinaal ontleden van een document te vereenvoudigen. Andere SGML-applicaties zijn het SGML Docbook (documentatie) en "Z Format" (typografie en documentatie).
XML- De Extensible Markup Language, oftewel de Extensible Markup Language, is ontstaan als resultaat van de ontwikkeling van de HTML (HyperText Markup Language) taal. Het zou echter een grove vergissing zijn om het te zien als slechts een verbeterde versie van de HTML-taal. XML is in wezen de volgende generatie opmaaktalen. Er zijn 3 punten om in gedachten te houden die XML fundamenteel onderscheiden van HTML en zijn voorgangers (GML - Generalized Markup Language, SGML - Standard General Markup Language):
XML HEEFT, in tegenstelling tot HTML, GEEN GEDEFINIEERDE TAGS - meer precies, elke ontwikkelaar kan EIGEN XML-tags maken - zoveel als nodig is. Het aantal van dergelijke tags is praktisch onbeperkt. XML is dus een metataal waarmee je andere opmaaktalen zoals HTML kunt maken.
Naarmate de HTML-taal zich ontwikkelde, nam het aantal tags snel toe. Uiteindelijk bereikte hun aantal de "kritieke waarde" - het werd voor webdocumentontwikkelaars moeilijk om steeds meer tags te onthouden, maar browserontwikkelaars bevonden zich in een nog slechtere positie - ze moesten nieuwe versies van browsers maken die nieuwe tags zouden "begrijpen". Slimmere browsers worden steeds groter en stellen steeds hogere eisen aan de computers waarop ze worden gebruikt. De zaak wordt verergerd door het feit dat zaktoestellen de laatste jaren steeds populairder zijn geworden (ze worden met name steeds vaker gebruikt in e-commerce), met een beperkte hoeveelheid geheugen en "zwakke" schermen, en daarom de browsers die op ze hebben slechts zeer beperkte mogelijkheden. XML, dat geen vooraf gedefinieerd tagging-systeem heeft, lost dit probleem op. De "prijs" voor de veelzijdigheid is de grotere nauwkeurigheid bij het ontwerpen van webdocumenten. De regels voor het opmaken van XML-documenten zijn eenvoudig:
niet-gesloten containertags zijn niet toegestaan (maar u kunt wel openings- en sluitingstags in één combineren, bijvoorbeeld:
)
"geneste" containers kunnen niet "overlappen"
kleine letters en hoofdletters worden gezien als verschillende karakters
trefwoorden kunnen niet worden gebruikt als tagnamen
spaties, leestekens, haakjes, vierkante haken en accolades kunnen niet worden gebruikt in tagnamen
onderstrepingsteken (_) en cijfers kunnen in tagnamen voorkomen, maar een getal mag niet het eerste teken van een tagnaam zijn
(Als u meerdere woorden als tagnaam moet gebruiken, moeten ze samen worden geschreven, waarbij elk woord met een hoofdletter begint.)
Documenten die aan deze regels voldoen, worden welgevormde documenten genoemd.
XML dient om GEGEVENSSTRUCTUUR TE BESCHRIJVEN, voornamelijk HIERARCHISCHE STRUCTUREN.
Een van de belangrijkste trends in de ontwikkeling van webtechnologieën is GEGEVENSSCHEIDING, DOCUMENTSTRUCTUUR EN HAAR STIJLONTWERP. Zoals u weet, is een van de manieren om gegevens uit de structuur van het document te isoleren, het dynamisch koppelen van het DBMS aan webdocumenten via de ODBC-interface (Open DataBase Connectivity). De isolatie van stijlen wordt bereikt door het gebruik van trapsgewijze stylesheets. Met XML kunt u niet-relationele databases beschrijven. Omdat tags door de ontwikkelaar kunnen worden gemaakt, karakteriseren hun namen meestal de betekenis van de gegevens.
XML, als een middel om de datastructuur te beschrijven, zorgt voor GEGEVENSUITWISSELING tussen verschillende applicaties, en werkt zo als een soort "lijm".
De waarde van deze "bridging" XML-functie kan niet genoeg worden benadrukt. Dankzij de mogelijkheid om gegevens uit te wisselen tussen verschillende applicaties, "gaan" webtechnologieën naar een kwalitatief nieuw niveau.
Hypertext Markup Language (HTML) het is een eenvoudig systeem voor het maken van hypertext-documenten die overdraagbaar zijn van het ene platform naar het andere. In principe zijn HTML-documenten SGML-documenten met een gemeenschappelijke semantiek die geschikt zijn voor het weergeven van informatie in een breed scala aan toepassingen. HTML kan worden gebruikt om het volgende weer te geven:
Hypertext nieuws, mail, documentatie en hypermedia
Optiemenu
Resultaten databasequery
Eenvoudige documenten met ingesloten afbeeldingen
En ook voor hypertext-weergave van bestaande arrays van informatie
Het World Wide Web (WWW)-project brengt informatie samen die over de hele wereld verspreid is. Het WWW maakt hiervoor gebruik van het Internet HyperText Transfer Protocol (HTTP) - het Hypertext Transfer Protocol, waarmee u afspraken kunt maken over hoe gegevens worden gepresenteerd in de interactie tussen de client en de server.
De gegevens worden verzonden in de hoofdtekst van het bericht in overeenstemming met de MIME-standaard. HTML is een van de representaties van informatie op het WWW. Er wordt aangenomen dat HTML overeenkomt met een van de MIME-typen, namelijk tekst / html. Bovendien is HTML een ontwikkeling die voldoet aan de internationale norm ISO 8879 - Standard Generalized Markup Language (SGML), een systeem voor het definiëren van gestructureerde documenttypen.
HTML-document
Een HTML-document lijkt op een tekstbestand, behalve dat sommige tekens (strings) controletekens zijn. Deze symbolen worden tags genoemd en bepalen de structuur van het document.
HTML-documenten moeten beginnen met een tag aan het begin van het bestand en eindigen met de tag... Tussen deze tags is het HTML-document georganiseerd als de HEAD en BODY van het document, net als een e-mailbericht. Binnen het HEAD-gedeelte worden de TITEL en andere informatie over het document als geheel aangegeven. Binnen het BODY-gedeelte wordt de tekst, met behulp van HTML-tags, gestructureerd in alinea's, lijsten, enz. met de mogelijkheid om afzonderlijke woorden en hele zinnen op te maken en koppelingen naar delen hiervan en externe documenten te maken. Technisch gezien kunnen de openings- en sluitingstags voor HTML-, HEAD- en BODY-elementen worden weggelaten. Dit wordt echter niet aanbevolen, aangezien de HEAD / BODY-structuur toepassingen in staat stelt om kenmerken van documenten te definiëren (bijvoorbeeld de titel) zonder naar het hele document te kijken.
Structuur van HTML-elementen
In een HTML-document definiëren tags het begin en einde van koppen, alinea's, lijsten, markering van tekens en koppelingen. De meeste HTML-elementen in een document worden gedefinieerd als een openingstag, die de naam en attributen van het element specificeert, gevolgd door de hoofdtekst van het element, gevolgd door een slottag. De scheidingstekens voor de starttag zijn "<" и ">"; voor de afsluitende -"" и ">". Bijvoorbeeld:
Dit is de kop
Dit is een alinea.
Sommige elementen verschijnen alleen als een starttag. Als u bijvoorbeeld een scheidingslijn wilt maken, gebruikt u de tag
... Bovendien kunnen de afsluitende tags voor sommige elementen (P, LI, DT, DD) worden weggelaten. Een elementlichaam is een reeks tekens en geneste elementen. Sommige elementen, zoals elementen die koppelingen definiëren, kunnen niet in elkaar worden genest. Tegelijkertijd kunnen elementen die koppelingen definiëren en karakteraccentuering binnen andere structuren worden geplaatst.
Documentweergave
De specifieke weergave van het document kan per klant verschillen. HTML-tags definiëren alleen de algemene weergavestijl van het document. Wat bijvoorbeeld betekent dat HTML de kop op het eerste niveau alleen als kop op het eerste niveau behandelt, maar niet specificeert dat de kop op het eerste niveau in het lettertype Times size 24 in het midden van de bovenkant van de pagina moet worden weergegeven. Het voordeel van deze benadering is dat als de gebruiker besluit om de kop op het eerste niveau te wijzigen in Helvetica-lettergrootte 20 links uitgelijnd, hij alleen de definitie van de kop op het eerste niveau in zijn WWW-viewer hoeft te wijzigen. Zo wordt de specifieke presentatie van het document op het beeldscherm bepaald door de gebruiker van een bepaalde cliënt.
De belangrijkste kracht van HTML ligt in het vermogen om tekstgebieden (evenals afbeeldingen) te associëren met andere documenten. Kijkers markeren deze gebieden (meestal met kleur en/of onderstreping) om aan te geven dat dit hyperlinks zijn. Anker is een stukje tekst dat het begin en/of einde van een hyperlink markeert. De tekst tussen de openings- en sluitingstags is het startpunt of de bestemming van de hypertekstlink. De kenmerken van deze tag zijn als volgt: HREF
Optioneel. Als het HREF-attribuut aanwezig is, is Anchor gevoelige tekst: het startpunt voor de link. Als de lezer deze tekst selecteert, krijgt hij een ander document te zien waarvan het netwerkadres is opgegeven in de waarde van het HREF-attribuut. Het formaat van het netwerkadres is hetzelfde als de URL. Hierdoor kan de HREF = "# identifier"-structuur verwijzen naar een ander anker in het huidige document, of in een verwijderd document door het adres vooraf te laten gaan door het "#"-teken.
Optioneel. Indien aanwezig, kan het anker worden gebruikt als de linkbestemming. De attribuutwaarde is de anker-ID "a. Een tekenreeks in platte tekst kan worden gebruikt als de identifier-waarde, behalve dat al dergelijke identifiers uniek moeten zijn binnen hetzelfde document.
Optioneel. Hiermee kunt u de relatie specificeren tussen het document waaruit de koppeling is gemaakt en het document waarnaar de koppeling is gemaakt.
In 1989 presenteerde hypertext een veelbelovende nieuwe technologie die een relatief groot aantal implementaties kende enerzijds, en anderzijds werden pogingen ondernomen om formele modellen van hypertextsystemen te bouwen die meer beschrijvend van aard waren en geïnspireerd waren door de succes van de relationele benadering van het beschrijven van gegevens.
HTML is een hypertext-opmaaktaal die wordt gebruikt om documenten te coderen. HTML-taal is een reeks commando's volgens welke de browser de inhoud van het document weergeeft, HTML-commando's worden niet weergegeven. De HTML-taal implementeert het mechanisme van hypertext-links, die een link tussen het ene document en het andere verschaffen. Deze documenten kunnen zich op dezelfde server bevinden als de pagina van waaruit ze zijn gelinkt, of ze kunnen op een andere server worden gehost.
Het idee achter HTML is een voorbeeld van een uiterst succesvolle oplossing voor het probleem van het bouwen van een hypertekstsysteem met een speciale displaybesturing.
Contextuele hypertekstkoppelingen werden erkend als de meest effectieve vorm van het organiseren van hypertekst, en bovendien werd de indeling in koppelingen herkend die verband hielden met het hele document als geheel en met de afzonderlijke delen ervan.
Alle HTML-documenten hebben dezelfde structuur, gedefinieerd door een vaste set structuurtags. HTML-document moet altijd beginnen met een tag< HTML >en eindig met de bijbehorende eindtag ( HTML>). Binnen een document zijn er twee hoofdsecties, de kopsectie en de hoofdtekst van het document, in die volgorde. De sectie kopjes bevat informatie die het document als geheel beschrijft en is beperkt tot tags<НЕАD>enНЕАD>... In het bijzonder moet de rubriek koppen de algemene kop van het document bevatten, afgebakend door de gepaarde tag<ТITLE>.
ТITLE>). Het wordt echter niet aanbevolen om structuurtags weg te laten bij het maken van een HTML-document. Het eenvoudigste correcte HTML-document dat alle tags bevat die de structuur definiëren, kan er als volgt uitzien:
< TITLE >Document titel< /TITLE >Documenttekst
HTML-elementen.
Voor tagparen wordt het bereik bepaald door het gedeelte van het document tussen de begin- en eindtags. Dit deel van het document wordt beschouwd als een HTML-element. We kunnen dus praten over een "BODY-element" dat de tag bevat, de hoofdinhoud van het document en de afsluitende tag BODY >... Het hele HTML-document. kan worden gezien als een 'HTML-element'. Voor ongepaarde tags komt het element overeen met de tag die het definieert.
De meeste elementen van de HTML-taal. beschrijft delen van de inhoud van het document en wordt tussen tags geplaatst
... en, dat wil zeggen, binnen het structurele element BODY. Dergelijke elementen zijn onderverdeeld in blok en tekst. Blokelementen verwijzen naar gedeelten van tekst op alineaniveau. Tekstelementen beschrijven de eigenschappen van individuele zinnen en zelfs pijnen van kleine delen van de tekst.Nu kunt u de regels voor het nesten van elementen formuleren.
Elementen mogen elkaar niet overlappen. Met andere woorden, als de openingstag zich binnen een element bevindt, dan moet de corresponderende sluitingstag zich binnen hetzelfde element bevinden.
Blokelementen kunnen geneste blok- en tekstelementen bevatten.
Tekstelementen kunnen geneste tekstelementen bevatten.
Tekstelementen kunnen geen geneste blokelementen bevatten.
Functionele blokelementen.
In de meeste documenten zijn de belangrijkste functionele elementen koppen en alinea's. HTML-taal. ondersteunt zes niveaus van koppen. Ze worden gespecificeerd met behulp van gepaarde tags van<Н1>voordat<Н6>... Wanneer ze worden weergegeven, worden webdocumenten op deze manier weergegeven; tag (document op een computerscherm, deze elementen worden weergegeven met lettertypen van verschillende groottes.
Reguliere alinea's worden gespecificeerd met behulp van een paartag<Р>... HTML-taal. bevat geen hulpmiddelen voor het maken van alinea-inspringing ("rode lijn"), daarom worden alinea's, wanneer ze op een computerscherm worden weergegeven, gescheiden door een lege regel. EindtagР>als optioneel beschouwd. Er wordt aangenomen dat het vóór de tag komt die het begin van de volgende alinea in het document instelt. Bijvoorbeeld:
rubriek
<Р>Eerste paragraaf<Р>Tweede paragraaf
Koers op het tweede niveauН2>
Een gevolg van de aanwezigheid van een speciale tag die een alinea definieert, is dat het gebruikelijke einde-van-regelteken, ingevoerd door op de ENTER-toets te drukken, niet voldoende is om alinea-inspringing te creëren. HTML-taal. behandelt end-of-line tekens en spaties op een speciale manier. Elke volgorde; die alleen uit spaties en einde-regeltekens bestaat, wordt behandeld als een enkele spatie bij het weergeven van het document. Dit betekent in het bijzonder dat het end-of-line-teken niet eens een nieuwe regel uitvoert (voor dit doel wordt het tekstelement gespecificeerd door de ongepaarde tag
.
Een horizontale liniaal kan ook als alinea-onderbreker worden gebruikt. Dit element wordt gespecificeerd door een ongepaarde tag
... Wanneer het document op het scherm wordt weergegeven, scheidt de liniaal delen van de tekst van elkaar. De lengte en dikte worden gespecificeerd door de attributen van de tag
.
Deze tag maakt een horizontale liniaal van 10 pixels breed, de helft van de breedte van het venster en aan de rechterkant gepositioneerd.
Website-ontwikkeling is een van de algemeen beschikbare kansen in de moderne internetindustrie. Het daadwerkelijk maken van sites is in principe niet veel ingewikkelder dan het maken van persoonlijke e-mailboxen en elektronische visitekaartjes.
Om een site te maken heb je allereerst een met internet verbonden server nodig waarop je de nodige hypertext kunt plaatsen. Bovendien is het noodzakelijk om de naam van de saiga te registreren bij de provider die de geselecteerde server bedient.
Op internet kunt u aanbieders vinden die gratis sites op hun servers openen. Gratis sites kunnen worden geopend op binnenlandse servers narod.ru, boom.ru, hotmail.ru en op buitenlandse servers, bijvoorbeeld geocities.com, tripod.com.
Domeinnamen van de volgende vorm kunnen worden geregistreerd op de opgegeven servers:
<имя>... narod.ru
naam> .boom.ru,
Voorbeelden van geregistreerde domeinnamen:
wdu.da.ru - site van de elektronische universiteit;
wduniv.newmail.ru - site van een gedistribueerde universiteit.
Nadat u de domeinnaam van de site heeft geregistreerd, kunt u er hypertext op plaatsen. De plaatsing van hypertekst op de site wordt uitgevoerd met behulp van speciale programma's waarmee u een verscheidenheid aan hypertekst kunt maken, bewerken, accumuleren en kopiëren. Onmiddellijk na het plaatsen van de allereerste (hoofd)hypertextpagina, kan de informatie worden gelezen met een browser in elk land vanaf elke computer die is aangesloten op internet. Hiervoor wordt in het browservenster het websiteadres op internet aangegeven. Bijvoorbeeld: http://bak.boom.ru
Alle geplaatste bestanden moeten hypertext zijn, geschreven in HTML-formaat en identifiers van het formulier hebben<имя>.html.
HTML is een hypertext opmaaktaal.
Door structuur is hypertekst tekst met links naar andere hypertekst die zich op deze server of op andere servers bevindt. Wanneer u op zo'n link klikt, laadt de browser automatisch een hypertext-pagina op het computerscherm, ongeacht op welke server en in welk land deze zich bevindt.
Met behulp van deze tools en programma's kan een grote verscheidenheid aan informatiesites en -systemen op internet worden gecreëerd - persoonlijke sites, bedrijfssites, elektronische kranten, tijdschriften, elektronische boeken, encyclopedieën, evenals elektronische archieven en bibliotheken.
Het verschil tussen de sites zit in de hoeveelheid informatie, hun structuur en de procedures voor actualisering. Over het algemeen kunnen we voor sites op internet, zoals voor elke organisatie, praten over de levenscycli van hun oprichting, ontwikkeling, modernisering en liquidatie.
De hoeveelheid informatie wordt bepaald door de eigenaren - de mensen of organisaties die de sites hebben gemaakt en hun informatie erop hebben geplaatst. De hoeveelheid informatie op sites kan variëren van enkele kilobytes tot enkele gigabytes (miljoen kilobytes).
De structuur van sites kan heel divers zijn. De eenvoudigste structuur is de hoofdpagina met links naar een reeks teksten. Deze links zijn te vinden in de tekst van de hoofdpagina of gemarkeerd in de inhoudsopgave aan het begin van de pagina.
Elke pagina van de site kan worden voorzien van een titel die op de bovenste regel van het scherm verschijnt wanneer de site door de browser wordt geladen.
Bovendien kunt u op de startpagina van de site een lijst met trefwoorden voor zoekmachines opgeven.
Zoekmachines crawlen wekelijks alle servers op internet en registreren de adressen van alle gevonden sites en hypertekst, samen met de daarin gemarkeerde trefwoorden. Om deze redenen kan uiterlijk een week later alle informatie die op internet is gepubliceerd, worden gevonden met de trefwoorden die erin staan.
Moderne informatiewebtechnologieën veranderen onze wereld snel en hebben een directe invloed op de ontwikkeling van webtechnologieën. Deze technologische revolutie heeft niet alleen grote gevolgen gehad voor het zakenleven, maar ook voor het privé- en beroepsleven. De nieuwste webtechnologieën dringen door in alle sferen van de samenleving, veranderen de manieren van communicatie en de principes van het uitvoeren van webprojecten van moderne bedrijven en bepalen het lot van de laatste. De intrinsieke complexiteit en het extreme gebruiksgemak van moderne informatiewebtechnologieën maakt ze beschikbaar voor iedereen die in hun professionele activiteiten wordt geconfronteerd met hun dagelijks gebruik.
Zowel in het dagelijks leven als in het zakenleven, in correspondentie en handel, gebruiken mensen en organisaties het web, creëren hun eigen websites, waar ze informatie, goederen en diensten aanbieden. Tools voor het maken van webbronnen ontwikkelen zich snel en non-stop. Ze stellen u in staat om complexe webdocumenten te creëren zonder dat u speciale kennis over hun structuur en uiterlijk nodig heeft, waardoor er tijd vrijkomt voor productieve creatieve activiteiten. Het belangrijkste voordeel van webtechnologieën in moderne omstandigheden ligt in hun eenvoud en bijgevolg in het verhogen van de efficiëntie van hun toepassing.
Hypertext Markup Language HTML
De populariteit van internet wordt grotendeels gedreven door de opkomst van het World Wide Web (WWW), aangezien het de eerste netwerktechnologie was die de gebruiker een eenvoudige, moderne interface bood om toegang te krijgen tot een verscheidenheid aan netwerkbronnen. Eenvoud en gebruiksgemak hebben geleid tot een toename van het aantal WWW-gebruikers en hebben de aandacht getrokken van commerciële structuren. Verder werd het groeiproces van het aantal gebruikers een lawine, en dit gaat tot op de dag van vandaag door. Op basis van de noodzaak om de hele set informatiebronnen te combineren, begon technologie zich te ontwikkelen met behulp waarvan het hypertext-navigatiesysteem wordt gedefinieerd. Deze technologie werd de HTML-taal. HTML-technologie was in de beginfase uiterst eenvoudig en bijna alle internetgebruikers kregen tegelijkertijd de kans om zichzelf uit te proberen als makers en lezers van informatiemateriaal dat op het World Wide Web werd gepubliceerd. Het feit is dat bij de ontwikkeling van verschillende componenten van de technologie werd aangenomen dat de kwalificaties van de auteurs van informatiebronnen en hun apparatuur met computertechnologie minimaal zouden zijn.
HTML (HyperText Markup Language) is een van de zogenaamde opmaaktalen. De term "opmaak" betekent algemene service-informatie die niet bij het document wordt weergegeven, maar definieert; hoe bepaalde fragmenten van het document eruit moeten zien. U kunt bijvoorbeeld eisen dat een woord vet of cursief wordt weergegeven, een afzonderlijke alinea in een speciaal lettertype weergeeft of koppen in een vergroot lettertype opmaakt.
Er zijn tegenwoordig veel verschillende opmaaktalen. In communicatieprogramma's definieert een speciale vorm van opmaak bijvoorbeeld de betekenis van elk pakket met nullen en enen dat naar internet wordt verzonden. Elke opmaaktaal moet echter twee dingen doen:
1) de taal definieert de syntaxis van de opmaak;
2) de taal bepaalt de betekenis van de opmaak.
De meest gebruikte opmaaktaal voor webpagina's is HTML. Deze opmaaktaal is gemaakt en geadverteerd als een van de SGML-concreties. Voor het eerst voorgesteld in 1974 door Charles Goldfarb en later aangenomen als een officiële ISO-standaard, is SGML (Standard Generalized Markup Language) een metataal - een systeem voor het beschrijven van andere talen.
De opkomst van de SGML-standaard werd gedreven door de noodzaak om gegevens te delen tussen verschillende applicaties en besturingssystemen. Zelfs in de verre jaren 60 hadden computergebruikers veel compatibiliteitsproblemen. Na analyse van de tekortkomingen van veel niet-standaard opmaaktalen, hebben drie IBM-wetenschappers - Charles Goldfarb, Ed Mosher en Ray Lorie - drie algemene principes geformuleerd om ervoor te zorgen dat documenten kunnen worden samengewerkt over meerdere besturingssystemen.
1) Het gebruik van uniforme opmaakprincipes in alle programma's die documenten verwerken. Het is een vrij logische vereiste - we weten allemaal heel goed hoe moeilijk het is voor mensen die verschillende talen spreken om tot overeenstemming te komen. De aanwezigheid van een enkele set syntactische structuren en gemeenschappelijke semantiek vereenvoudigt de interactie tussen programma's aanzienlijk.
2) Specialisatie van opmaaktalen. Door de mogelijkheid om een gespecialiseerde taal te bouwen op basis van een reeks standaardregels, is de programmeur niet langer afhankelijk van externe implementaties en hun ideeën over de behoeften van de eindgebruiker
3) Duidelijke definitie van het formaat van het document. De regels voor het formaat van het document bepalen het aantal en de etikettering van taalconstructies die in het document worden gebruikt. Het gebruik van een standaardformaat zorgt ervoor dat de gebruiker precies de structuur van de inhoud van het document kent. Let op: we hebben het niet over het weergaveformaat van het document, maar over het structurele formaat. De set regels die dit formaat beschrijft, wordt een documenttypedefinitie (DTD) genoemd.
Deze drie regels vormden de basis voor de voorloper van SGML - GML (Generalized Markup Language). Het onderzoek en de ontwikkeling van GML duurde ongeveer tien jaar totdat de SGML-standaard ontstond als resultaat van een overeenkomst die werd bereikt door een internationale groep ontwikkelaars.
HTML (Hypertext Markup Language) is de computertaal in het hart van het World Wide Web. HTML is gebaseerd op de SGML-standaard, een hypertext-opmaaktaal voor documenten voor presentatie op het web. HTML, een van de belangrijkste webstandaarden, wordt ontwikkeld en onderhouden door het W3C. De oprichter van dit internationale consortium is Tim Berners-Lee. Het consortium is, naast het creëren van opmaakstandaarden, het centrum voor de ontwikkeling van het Semantic Web (Semantic Web). Door middel van de HTML-taal wordt opgemaakte opmaak van documenten voorzien, hyperlinks tussen documenten en/of hun fragmenten bepaald.
Als basis voor het schrijven van HTML-code is gekozen voor een gewoon tekstbestand. Een hypertext-database in het WWW-concept is dus een set tekstbestanden die zijn gemarkeerd in HTML, die de vorm van informatiepresentatie (markup) en de structuur van koppelingen tussen deze bestanden en andere informatiebronnen (hypertextkoppelingen) bepalen.
De HTML-ontwikkelaars konden twee problemen oplossen:
· Ontwerpers van hypertext-databases voorzien van een eenvoudig hulpmiddel voor het maken van documenten;
· Maak de tool krachtig genoeg om te weerspiegelen wat destijds het begrip was van de gebruikersinterface van hypertext-databases.
De eerste taak werd opgelost door een gelabeld documentbeschrijvingsmodel te kiezen. Met de HTML-taal kunt u een elektronisch document markeren dat op een scherm wordt weergegeven met een polygrafisch ontwerpniveau; het resulterende document kan een grote verscheidenheid aan labels, illustraties, audio- en videoclips, enzovoort bevatten. De taal bevat geavanceerde hulpmiddelen voor het maken van verschillende niveaus van koppen, nadruk op lettertypen, verschillende lijsten, tabellen en nog veel meer.
Het tweede belangrijke punt dat het lot van HTML beïnvloedde, was het feit dat als basis werd gekozen voor een regulier tekstbestand. De HTML-bewerkingsomgeving is het midden tussen een eenvoudig tekstbestand en een WYSIWYG-toepassing (wat u ziet is wat u krijgt). Als u een bewerkingsomgeving kiest, profiteert u van alle voordelen van tekstbewerking.
Hypertext-links die koppelingen tussen tekstdocumenten tot stand brachten, begonnen geleidelijk een verscheidenheid aan informatiebronnen te combineren, waaronder geluid en video. Het systeem van HTML-hyperlinks stelt u in staat om een systeem van onderling verbonden documenten op te bouwen volgens verschillende criteria. De HTML-taal bevat opdrachten (tags) waarmee u de vorm en grootte van lettertypen, de grootte en positie van illustraties kunt regelen, waarmee u van een tekstfragment of illustraties naar een ander html - document - de zogenaamde hypertext-link kunt gaan . Een document in html - formaat is een tekstbestand dat alle benodigde informatie bevat over de informatie die op het scherm wordt weergegeven. U kunt scripttalen zoals JavaScript, Java en VBScript gebruiken om de scripts te beheren voor het browsen op de pagina's van de website (hypertextdatabase gebouwd op het World Wide Web). Formulieren voor gebruikersinvoer van gegevens die later worden verwerkt en andere informatie kunnen worden verwerkt met behulp van speciale serverprogramma's (bijvoorbeeld in PHP of Perl). Met HTML kunt u hyperlinks en klikbare knoppen plaatsen op pagina's die uw webpagina's verbinden met andere pagina's op dezelfde website, evenals met andere websites over de hele wereld.
HTML is een opmaaktaal voor tekst, geen programmeertaal, die slechts een van de hulpmiddelen is (meer bepaald een taal voor paginabeschrijvingen) die wordt gebruikt om webpagina's te maken. HTML heeft beperkte tekstopmaakmogelijkheden in vergelijking met publicatieprogramma's, vooral bij het publiceren van tekst die rijk is aan complexe elementen.
Tot nu toe zijn er geen HTML-editors die handig genoeg zijn om te doen zonder een teksteditor en handmatige tagging. Dit bemoeilijkt het werk met de taal, waardoor het noodzakelijk is om ze volledig ongebruikelijke functies onder de knie te krijgen.
Door de eigenaardigheden van de HTML-taal te analyseren en het niveau van de uitwerking ervan te beoordelen, kan men tot de conclusie komen dat we de komende jaren het verschijnen van meer perfecte aanpassingen, nieuwe talen en toepassingspakketten voor het werken met webpagina's mogen verwachten.
Dynamische en statische HTML-documenten
Er zijn twee soorten html-documenten: statisch en dynamisch. Statische documenten worden opgeslagen in bestanden van hetzelfde bestandssysteem dat wordt gebruikt door een webserver of browser bij het bekijken van lokale bestanden. Wanneer u informatie op een webserver plaatst, kunt u dynamische documenten gebruiken - documenten die niet permanent in de vorm van bestanden bestaan, maar worden gegenereerd op het moment van verzoek van de klant. Bovendien maakt voor de eindgebruiker de dynamische of statische manier van presenteren van documenten niet uit.
Om een dynamisch HTML-document te genereren, is een speciaal geschreven programma nodig volgens de regels die door de webserver zijn bepaald. Bij het plannen van de plaatsing van informatie op een webserver, om het gebruik van elk type documenten correct te bepalen, moet rekening worden gehouden met de mate van gegevensupdate, hun volume en circulatiefrequentie.
De dynamische methode definieert de opslag van gegevens in een geformaliseerde vorm, bijvoorbeeld in een database.
Als de gegevens in een geformaliseerde vorm worden opgeslagen, worden met behulp van de documentsjablonen waarin de wijzigingen zijn aangebracht, statische documenten gegenereerd. Om statische documenten te genereren, kunt u alle rapportagetools gebruiken die beschikbaar zijn in het databasebeheersysteem (DBMS), dat de gegevens heeft verwerkt en geformaliseerd.
HTML-perspectieven
Er komen geen nieuwe versies van HTML, maar er is een verdere ontwikkeling van HTML genaamd XHTML (English Extensible Hypertext Markup Language). Hoewel XHTML qua mogelijkheden vergelijkbaar is met HTML, heeft het strengere syntaxisvereisten. Net als HTML is XHTML een subset van SGML, maar XHTML voldoet, in tegenstelling tot zijn voorganger, aan de XML-specificatie. XHTML 1.0 werd op 26 januari 2000 goedgekeurd als aanbeveling van het World Wide Web Consortium (W3C). Het is echter noodzakelijk om met één serieus detail rekening te houden - een groot aantal informatiebronnen is in dit formaat gemaakt, zodat ze nog lang door webbrowsers zullen worden "begrepen" en in hun oorspronkelijke vorm zullen worden gebruikt. Daarnaast zullen alle nieuwe formaten worden ontwikkeld (en worden deze al ontwikkeld - bijvoorbeeld XML) met ondersteuning voor HTML-technologieën.
De manier van werken verandert, net als de manier om toegang te krijgen tot content. HTML is oorspronkelijk gemaakt als een platformonafhankelijke taal. Nieuwe technologieën worden bijna overal gebruikt en vrij snel zal de World Wide Web-ruimte niet langer alleen beschikbaar zijn voor gebruikers van desktop-pc's, nu al gebruiken sommige gebruikers actief spraakbrowsers voor blinden of browsers die het alfabet van Broglie gebruiken, vaak wordt de inhoud weergegeven niet op een computermonitor, maar op een tv, wanneer settopboxen worden gebruikt met toegang tot het netwerk of tot een telex, of tot monochrome displays van verschillende organizers-pagers en anderen.
Internet Engineering Task Force) een concept van het HTML-standaardvoorstel gepostHTML-documentstructuur
Een HTML 4-document bestaat uit drie delen:
- een tekenreeks met informatie over de HTML-versie,
- een header / header-sectie declareren (begrensd door het HEAD-element),
- een lichaam dat het eigenlijke document zelf bevat.
Het lichaam kan worden opgenomen in BODY- of FRAMESET-elementen. Witruimte tekens(spaties, nieuwe regel tekens, tabbladen en opmerkingen) kunnen voor of na deze sectie verschijnen.
Hallo Wereld!
Document begint met element type document of doctype. Het beschrijft welk type HTML zal worden gebruikt - zodat de clienttoepassing van de gebruiker kan bepalen hoe het document moet worden geïnterpreteerd en kan beslissen of het de regels volgt die het in zijn verklaring wilde volgen.
Daarna kunt u de openingstag van het html-element zien. Het is een wikkel om het hele document. De afsluitende html-tag is het laatste object in elk HTML-document.
Binnen het html-element bevindt zich een head-element. Het bevat informatie over het document (metadata). In de kop bevindt zich een titelelement, dat de titel "Eenvoudige pagina" in de menubalk definieert.
Het head-element wordt gevolgd door een body-element, wat een wrapper is die de feitelijke inhoud van de pagina bevat - in dit geval alleen een header-element op het eerste niveau (h1) dat de tekst "Hallo wereld!" ...
Items bevatten vaak andere items. De hoofdtekst van het document zal altijd veel geneste elementen bevatten.
Secties op een pagina vormen de algemene structuur van een document en kunnen subsecties bevatten. Ze kunnen ook koppen, alinea's, lijsten, enz. bevatten. Alinea's kunnen elementen bevatten die koppelingen maken naar andere elementen, aanhalingstekens, markeringen, enz.
Syntaxis van HTML-elementen
Een basiselement in HTML bestaat uit twee tags rond een blok tekst. Er zijn elementen die geen tekst laten teruglopen, en in bijna alle gevallen kunnen elementen subelementen bevatten (zoals html head en body bevat in het bovenstaande voorbeeld).
Items kunnen ook hebben: attributen die het gedrag van het element kunnen wijzigen en toegevoegde waarde kunnen introduceren.
De basis HTML
In dit voorbeeld heeft het div-element (paginasectie, een manier om documenten in logische blokken te verdelen) een toegevoegd id-attribuut dat is ingesteld op toppunt... Het div-element bevat een h1-element (de kop van het eerste of belangrijkste niveau), dat op zijn beurt weer wat tekst bevat. Een deel van deze tekst is verpakt in een element afgekort(die wordt gebruikt om de afkorting-extensie te definiëren), waarvoor een titelattribuut is ingesteld op Hypertext-opmaaktaal.
Veel attributen in HTML zijn gemeenschappelijk voor alle elementen, maar sommige zijn specifiek voor een bepaald element of bepaalde elementen. Ze hebben allemaal de vorm:
trefwoord = "waarde"
De waarde moet tussen enkele of dubbele aanhalingstekens staan (in sommige situaties kunnen aanhalingstekens ontbreken, maar dit is niet erg goed vanuit het oogpunt van voorspelbaarheid, begrip).
Attributen en hun mogelijke waarden worden voornamelijk bepaald door de HTML-specificaties (http://www.w3.org/TR/html401/index/attributes.html), dus je kunt geen eigen attributen maken. De enige echte uitzonderingen zijn de id- en class-attributen, waarvan de waarden volledig bedoeld zijn om uw eigen betekenis en semantiek aan documenten toe te voegen.
Een element binnen een ander element heet "afstammeling" van dit artikel. In het bovenstaande voorbeeld afgekort is een kind van h1, dat op zijn beurt een kind is van een div. Omgekeerd is div de "voorouder" van het h1-element.
Blokniveau en inline-elementen
Er zijn twee hoofdcategorieën elementen in HTML, die overeenkomen met de soorten inhoud en de structuur die deze elementen vertegenwoordigen: blokniveau en inline-elementen.
Blokniveau geeft een hoger niveau van een element aan en geeft meestal informatie over de structuur van een document. Je kunt elementen op blokniveau zien als beginnend op een nieuwe regel, loskomen van wat er eerder was. Gemeenschappelijk blok elementen zijn alinea's, lijstitems, koppen en tabellen.
String elementen zijn opgenomen in structurele elementen op blokniveau en beslaan slechts delen van de documenttekst, niet hele gebieden. Een inline element zorgt er niet voor dat er een nieuwe regel in het document verschijnt, aangezien het zijn elementen die in een alinea met tekst voorkomen. Gemeenschappelijk string elementen zijn hyperlinks, gemarkeerde woorden of woordgroepen en korte aanhalingstekens.
rubriek
De kop van het HTML-document is een optioneel opmaakelement. Oorspronkelijk werd het bestaan van de titel bepaald door de behoefte naamgeving browservenster... Dit werd bereikt door opmaakelement TITEL:
Een andere functie van de HTML-documentkop is om de HTTP-uitwisseling te besturen via: opmaakelement META. Met de huidige praktijk van het hosten van websites van bedrijven op de servers van providers, is het mogelijk dat de beheerders van deze sites het serverprogramma niet kunnen beheren. In dit geval is er nog maar één optie over om de uitwisseling te regelen - via de header van het HTML-document.
De header van het HTML-document is ook bedoeld om de zoekafbeelding van het document te beschrijven, die nodig is voor het indexeren van het document door de robots van de zoekmachine. Met het META-element kunt u lijsten met trefwoorden en documentbeschrijvingen opslaan die worden gebruikt om de index van de zoekmachine samen te stellen en die als een beschrijving van het document worden weergegeven als er een link ernaar wordt gevonden tijdens een zoekopdracht op trefwoord.
Basic header-tags zijn HTML-opmaakelementen die het meest voorkomen in de header van een HTML-document, d.w.z. binnen opmaakelement HOOFD:
- TITEL (titel van het document);
- BASE (basis-URL);
- ISINDEX (zoekpatroon);
- META (meta-informatie);
- LINK (algemene links);
- STIJL (stijlbeschrijvingen);
- SCRIPT (scripts).
De meest gebruikte elementen zijn TITLE, SCRIPT, STYLE. Het gebruik van het META-element geeft aan dat de auteur op de hoogte is van de regels voor het indexeren van documenten in zoekmachines en de mogelijkheid om HTTP-gegevensuitwisseling te controleren. BASE en ISINDEX worden de laatste tijd praktisch niet gebruikt. LINK wordt alleen gespecificeerd bij gebruik van opmaakmodellen die extern zijn aan dit document.
Markup-element HEAD bevat de kop van het HTML-document. De opmaakelement is optioneel. Als er een starttag is opmaakelement het is wenselijk om ook de eindtag te gebruiken opmaakelement... Standaard wordt het HEAD-element gesloten wanneer de BODY-containerstarttag of de FRAMESET-containerstarttag wordt aangetroffen.
De headercontainer wordt gebruikt om informatie te bevatten die betrekking heeft op het hele document als geheel.
Markup-element TITLE wordt gebruikt om een document een naam te geven op het World Wide Web. Houd er bij het kiezen van tekst voor de inhoud van de TITLE-container rekening mee dat deze wordt weergegeven systeemlettertype omdat het de titel van het browservenster is.
De algemene syntaxis voor de TITLE-container is als volgt:
De koptekst is niet vereist als container voor het document. Het kan worden weggelaten. Veel robots van zoekmachines gebruiken de inhoud van het TITLE-element om een zoekafbeelding van een document te maken. Woorden uit TITLE gaan naar de index van de zoekmachine. Om deze redenen wordt het TITLE-element altijd aanbevolen voor gebruik op sitepagina's.
Markup-element BASE wordt gebruikt om de basis-URL te bepalen voor hypertext-links van het document, gegeven in onvolledige (gedeeltelijke) vorm. Bovendien kunt u met BASE het standaardvenster voor het laden van documenten definiëren wanneer u de hyperlink van het huidige document selecteert. Meestal is BASE te vinden op sitepagina's die "spiegels" hebben. Om verschillende redenen worden sommige documenten op de hoofdserver niet overgebracht naar de "spiegel"-server. In dit geval zal het document met de geforceerde basis-URL altijd linken naar de hoofdserver.
De containerstarttag bevat één vereist HREF-kenmerk en kan één optioneel TARGET-kenmerk bevatten. De syntaxis voor een BASE-container is over het algemeen als volgt:
Markup-element ISINDEX wordt gebruikt om een zoekpatroon op te geven en is overgenomen van eerdere versies van HTML. Deze container is niet gedefinieerd in HTML 4.0.
META-opmaakelement
META bevat besturingsinformatie die de browser gebruikt om de inhoud van de hoofdtekst van het document correct weer te geven en te verwerken. U kunt bijvoorbeeld met het kenmerk Content-type de transcodering van het document aan de clientzijde specificeren.
Met META kunnen ook andere operators worden gespecificeerd. Schakel bijvoorbeeld het cachen van het document uit. Om caching uit te schakelen, volstaat het om in de META-header een tag van het formulier in te voegen:
In de nieuwe versie van het HTTP-protocol (HTTP 1.1) wordt caching beheerd via de Cache-Control-operator. Om hetzelfde resultaat te krijgen als met Pragma, in de kop van het HTML-document, volstaat het om te specificeren:
U kunt voorkomen dat het document wordt opgeslagen nadat het is verzonden.
HyperText-opmaaktaal(HTML) - Hypertext Markup Language - ontworpen voor het schrijven van hypertext-documenten die op het World Wide Web zijn gepubliceerd.
Hypertext-document Is een tekstbestand met speciale labels, tags genaamd, die vervolgens door de browser worden herkend en door de browser worden gebruikt om de inhoud van het bestand op het computerscherm weer te geven. Met deze labels kunt u de titels van het document markeren, de kleur, grootte en stijl van letters wijzigen, afbeeldingen en tabellen invoegen. Maar het belangrijkste voordeel van hypertext ten opzichte van gewone tekst is de mogelijkheid om iets toe te voegen aan de inhoud van het document hyperlinks- speciale constructies van de HTML-taal, waarmee u met een muisklik kunt overschakelen naar het bekijken van een ander document.
Er zijn twee manieren om hypertext-documenten te maken. U kunt een van de WYSIWYG HTML-editors gebruiken (bijvoorbeeld Microsoft FrontPage of andere), waarvoor geen speciale kennis vereist is over de interne structuur van het document dat wordt gemaakt. Met deze methode kunt u documenten voor het WWW maken zonder de HTML-taal te kennen. HTML-editors automatiseren het maken van hypertext-documenten en elimineren routinewerk. Hun mogelijkheden zijn echter beperkt, ze vergroten de grootte van het resulterende bestand aanzienlijk en het resultaat dat met hun hulp wordt verkregen, voldoet niet altijd aan de verwachtingen van de ontwikkelaar. Maar deze methode is natuurlijk onmisbaar voor beginners bij het opstellen van hypertext-documenten.
Een alternatief is om een document te maken en te markeren met een gewone teksteditor (NotePad). Deze methode voegt handmatig HTML-commando's in de tekst in. Door op deze manier documenten te maken, weet u precies wat u doet.
Zoals opgemerkt, bevat een HTML-document symbolische informatie. Een deel ervan is de tekst zelf, dat wil zeggen de gegevens die de inhoud van het document vormen. Een ander - tags(markup-tags), ook wel vlaggen markeren, - speciale constructies van de HTML-taal die wordt gebruikt om een document te markeren en de weergave ervan te regelen. Het zijn de tags van de HTML-taal die bepalen in welke vorm de tekst zal worden gepresenteerd, welke van zijn componenten de rol zullen spelen van hypertekstlinks, welke grafische of multimedia-objecten in het document moeten worden opgenomen. De grafische en geluidsinformatie in het HTML-document wordt opgeslagen in afzonderlijke bestanden. HTML-documentviewers (browsers) interpreteren de markup-vlaggen en rangschikken tekst en afbeeldingen op het scherm dienovereenkomstig. Voor bestanden die HTML-documenten bevatten, worden de .htm- of .html-extensies geaccepteerd.
Hoofdletters en kleine letters worden niet onderscheiden bij het schrijven van tags. In de meeste gevallen worden tags in paren gebruikt. Een paar bestaat uit een starttag en een eindtag. Syntaxis van openingstag:
<имя_тега [атрибуты]>
Haakjes die in syntaxisbeschrijvingen worden gebruikt, geven aan dat het element mogelijk ontbreekt. De naam van de eindtag verschilt alleen van de naam van de openingstag doordat deze wordt voorafgegaan door een schuine streep:
имя_тега>
Tagkenmerken worden in de volgende indeling geschreven:
naam [= "waarde"]
Aanhalingstekens bij het specificeren van een argumentwaarde zijn optioneel en kunnen worden weggelaten. Voor sommige attributen is het mogelijk dat er geen waarde is opgegeven. De eindtag heeft geen attributen.
Elke gepaarde tag begint waar de starttag wordt aangetroffen en eindigt wanneer de bijbehorende eindtag wordt aangetroffen. Vaak wordt een paar begin- en eindtags genoemd container, en het deel van de tekst, begrensd door de openings- en sluitingstags, is element.
De reeks tekens waaruit de tekst bestaat, kan bestaan uit spaties, tabs, regelterugloop, regelterugloop, letters, leestekens, cijfers en speciale tekens (bijvoorbeeld +, #, $, @), met uitzondering van de volgende vier tekens die een speciale betekenis hebben in HTML:< (меньше), >(groter dan), & (ampersand) en "(dubbele aanhalingstekens). Als u een van deze tekens in de tekst moet opnemen, moet u deze coderen met een speciale reeks tekens.
HTML-documentstructuur
De belangrijkste van de HTML-tags is de tag met dezelfde naam - ... Het zou uw document altijd moeten openen, net als de tag moet zeker in de laatste regel staan. Deze tags geven aan dat de regels ertussen een enkel hypertextdocument vertegenwoordigen. Zonder deze tags kan de browser of andere kijker het documentformaat niet identificeren en correct interpreteren.
De afsluitende tag is net zo belangrijk als de openingstag. Als er bijvoorbeeld een document in een e-mail is opgenomen, wordt de tag