HTML on dokumentin muodon määrittelykieli (DTD Document Type Definition). HTML kuvaa dokumentin esitysmuodon (ulkoasun). Tämä tarkoittaa esimerkiksi sitä, että dokumentin kirjoittaja voi määritellä, mikä osa dokumetista esitetään listana (muotoilu) tai korostaa sanoja (tyyli). Tämän lisäksi dokumentin kirjoittaja voi määritellä dokumenttiin siirtymiä (linkkejä) toisiin dokumentteihin tai toisiin kohtiin samassa dokumentissa (ankkureita).
Tekstiä muotoillaan pelkästään HTML-kielen komennoilla (tag), on aivan sama, miten tekstiä kirjoitetaan esim. tyhjät rivit ja enter-näppäimen painallukset ohitetaan tekstiä tulkittaessa. Komentojen yleinen muoto on
<KOMENTO> </KOMENTO>
eli <KOMENTO> ilmaisee komennon vaikutuksen aloituskohdan ja </KOMENTO> ilmaisee lopetuskohdan. Lisäksi on joukko komentoja, joilla ei ole lopetuskohtaa, esimerkiksi kappalejaon ilmaiseva <P> (ts. tämä näkyy tavallisesti tyhjänä rivinä).
HTML-dokumentin yleinen rakenne on
<HTML> <HEAD> <TITLE> Ikkunaan </TITLE> </HEAD> <BODY> Esitettävä asia </BODY> </HTML>
<HTML> ja </HTML> ilmaisevat dokumentin alun ja lopun. Dokumentti koostuu kahdesta osasta alku- (<HEAD>) ja loppuosasta (<BODY>). Tämä jako on thety siitä syystä, että tulevaisuudessa HTML-näyttimet tunnistavat dokumentin alku- ja loppuosan, ja käyttäjä voi halutessaan lukea esimerkiksi pelkästään alkuosan.
Alkuosassa voidaan kertoa dokumentin tyyppi (esim. hakukelpoinen tietokanta), dokumentin tiedostonimi (jotta voidaan tehdä suhteellisia viittauksia ilman täydellisiä hakupolkuja) tai määritellä dokumentin suhde toisiin dokumentteihin (ylläpitotarkoituksissa).
Tavallisten dokumenttien kannalta tärkein alkuosan komento on <TITLE> -komento, jolla määritellään HTML-näyttimen ikkunassaan esittämä dokumentin nimi. Tämä nimi ei siis näy varsinaisessa tekstissä vaan näyttimen ikkunan otsikkona. Useat näyttimet käyttävät tätä nimeä oletusarvonimenä dokumettia tallennettaessa.
Loppuosassa esitetään varsinainen esitettävä asia. Se voi sisältää
ä = ä Ä = Ä ö = ö Ö = Ö å = å Å = ÅTekstiä voidaan muotoilla useilla keinoilla. HTML-kieli sisältää
<H1> Otsikko </H1> Pääotsikko <H2> Aliotsikko </H2> Aliotsikko ... jne <H6> Aliali...otsikko </H6> Alimman tason otsikko
SGML-kielen idea on siinä, että dokumenteissa tulee erottaa sisältö ja muoto. Esimerkiksi pääotsikot ilmoitetaan merkitsemällä ne ensimmäisen tason otsikoiksi, ei sanomalla, että ne ovat 18 pisteen lihavoitua Timesia keskitettynä riville alkaen aina uudelta sivulta. Tämän ajattelutavan etuna on se, että näin muotoiltua tekstiä voidaan esittää hyvinkin erilaisilla välineillä, kukin väline käyttää niitä muotoilukeinoja, jotka ovat mahdollisia. Toisaalta huono puoli on se, ettei kirjoittaja voi olla koskaan varma, miltä teksti näyttää kaikilla mahdollisilla välineillä.
Listoja on useampaa tyyppiä, tyypit vaihtelevat esim. sen mukaan numeroidaanko listan alkiot vai ei. Listojen yleinen muoto on seuraava:
<xL> Listan alku (x kertoo listan tyypin) <LI> listan ensimmäinen alkio ... <LI> listan viimeinen alkio </xL> Listan loppuMäärittelylistan tapauksessa listan alkio sisältää kaksi osaa, määriteltävän asian ja varsinainen määrittelyn, tällöin muoto on:
<DL> Listan alku (x kertoo listan tyypin) <DT> listan ensimmäinen määriteltävä asia (T=term) <DD> listan ensimmäinen määrittely (D=definition) ... <DT> listan viimeinen määriteltävä asia (T=term) <DD> listan viimeinen määrittely (D=definition) </DL> Listan loppu
sijoittelu voi olla top, middle tai bottom, se kertoo, kuinka kuva sijoitetaan suhteessa kuvatekstiin.
linkki on teksti, joka näytetään korostetusti, jotta lukija huomaa mitkä sanat tekstissä ovat hypertekstilinkkeja toisiin dokumentteihin tai kohtiin tekstissä.
Sisäiset linkit määritellään seuraavasti: <A HREF="#ankkuri"> linkki </A> eli #-merkki kertoo että kyseessä on dokumentin sisäinen linkki.
Ankkurit osoittavat siirtymäkohdan dokumentissa: <A NAME="ankkuri"></A>