XML

XML

XML (англ. eXtensible Markup Language) — расширяемый язык разметки.

XML разрабатывался как язык с простым формальным синтаксисом, удобный для создания и обработки документов программами. Также XML удобный для чтения и создания документов человеком. Этот язык разметки ориентирован на использование в Интернете. Язык называется расширяемым, поскольку он не фиксирует разметку, используемую в документах: разработчик волен создать разметку в соответствии с потребностями к конкретной области, будучи ограниченным лишь синтаксическими правилами языка. Сочетание простого формального синтаксиса, удобства для человека, расширяемости, а также базирование на кодировках Юникод для представления содержания документов привело к широкому использованию как собственно XML, так и множества производных специализированных языков на базе XML в. самых разнообразных программных средствах.

Физическая и логическая структуры документа XML

С физической точки зрения документ состоит из сущностей (англ. entities), из которых каждая может отсылать на другую сущность. Единственный корневой элемент — документная сущность. Содержание сущностей — символы.

С логической точки зрения документ состоит из комментариев, объявлений, элементов, ссылок на сущности и инструкций обработки. Всё это в документе структурируется разметкой.

Физическая структура XML

Сущность — мельчайшая часть в документе. Все сущности что-нибудь содержат, и у всех них есть имя (существуют исключения, напр. документная сущность). Проще говоря, термин «сущность» описывает «сущую вещь», «что-то».

Документ состоит из сущностей, содержание которых — символы. Все они разделены на два типа: символьных данных и разметки. К разметке принадлежат: теги, обозначающие границы элементов, объявления и инструкции обработки, включая их атрибуты, ссылки на сущности, комментарии, а также последовательности символов, обрамляющие секции «CDATA». Часть документа, не принадлежащая разметке, составляет символьные данные документа.

Логическая структура XML

Все составляющие части документа обобщаются в пролог и корневой элемент. Корневой элемент — обязательная часть документа, составляющая всю его суть (пролог, вообще говоря, может отсутствовать). Может включать (а может не включать) вложенные в него элементы и символьные данные, а также комментарии. Вложенные в корневой элемент элементы, в свою очередь, могут включать вложенные в них элементы, символьные данные и комментарии, и так далее. Пролог может включать объявления, инструкции обработки, комментарии. Его следует начинать с объявления XML, хотя в определённой ситуации допускается отсутствие этого объявления.

Символы разметки XML

Разметка всегда начинается символом <и заканчивается символом >. Наряду с символами < и  >, специальную роль для разметки играет также &символ. Угловые скобки обозначают границы элементов, инструкций обработки и некоторых других последовательностей. Амперсанд позволяет выполнить замену текста при помощи сущностей.

Символ Замена
< &lt;
> &gt;
& &amp;

Для употребления апострофов и кавычек внутри значений атрибутов используются следующие сущности

Символ Замена
'' &apos;
" &quot;

Уроки по теме: