Структура HTML-документов
Web-страницы описываются на специальном языке, называемом HTML (HyperText
Markup Language, Язык разметки гипертекстовой информации), который позволяет
осуществлять простое форматирование текста, вставку графики, а также
составление таблиц и цветовое оформление документов.
Будучи подмножеством языка SGML, HTML имеет теговую структуру. Это означает, что в тексте встречаются комманды, изменяющие интерпретацию
информации. Например, слово, напечатанное курсивом, в исходном
тексте выглядит так:
слово, напечатанное <I>курсивом</I>.
Теги записываются в угловых скобках и могут содержать дополнительные
параметры. Большинство тегов располагается в виде ``скобок'' вокруг текста (как теги
<I> и </I> вокруг слова ``курсивом'' в приведенном выше примере).
Благодаря этому свойству, теги можно подразделить на открывающие и
закрывающие. Не у всех тегов существуют соответствующие им закрывающие,
такие теги иногда называют ``пустыми''(empty). Общую структуру открывающего тега можно записать так:
<NNNNN Name="Value" .....>
Соответствующий закрывающий тег быдет иметь вид
</NNNNN>
Далее под словом ``тег'' мы будем понимать совокупность открывающего
и соответствующего ему закрывающего (если таковой существует) элементов.