XML
XML (англ. eXtensible Markup Language) — расширяемый язык разметки.
XML разрабатывался как язык с простым формальным синтаксисом, удобный для создания и обработки документов программами. Также XML удобный для чтения и создания документов человеком. Этот язык разметки ориентирован на использование в Интернете. Язык называется расширяемым, поскольку он не фиксирует разметку, используемую в документах: разработчик волен создать разметку в соответствии с потребностями к конкретной области, будучи ограниченным лишь синтаксическими правилами языка. Сочетание простого формального синтаксиса, удобства для человека, расширяемости, а также базирование на кодировках Юникод для представления содержания документов привело к широкому использованию как собственно XML, так и множества производных специализированных языков на базе XML в. самых разнообразных программных средствах.
Физическая и логическая структуры документа XML
С физической точки зрения документ состоит из сущностей (англ. entities), из которых каждая может отсылать на другую сущность. Единственный корневой элемент — документная сущность. Содержание сущностей — символы.
С логической точки зрения документ состоит из комментариев, объявлений, элементов, ссылок на сущности и инструкций обработки. Всё это в документе структурируется разметкой.
Физическая структура XML
Сущность — мельчайшая часть в документе. Все сущности
Документ состоит из сущностей, содержание которых — символы. Все они разделены на два типа: символьных данных и разметки. К разметке принадлежат: теги, обозначающие границы элементов, объявления и инструкции обработки, включая их атрибуты, ссылки на сущности, комментарии, а также последовательности символов, обрамляющие секции «CDATA». Часть документа, не принадлежащая разметке, составляет символьные данные документа.
Логическая структура XML
Все составляющие части документа обобщаются в пролог и корневой элемент. Корневой элемент — обязательная часть документа, составляющая всю его суть (пролог, вообще говоря, может отсутствовать). Может включать (а может не включать) вложенные в него элементы и символьные данные, а также комментарии. Вложенные в корневой элемент элементы, в свою очередь, могут включать вложенные в них элементы, символьные данные и комментарии, и так далее. Пролог может включать объявления, инструкции обработки, комментарии. Его следует начинать с объявления XML, хотя в определённой ситуации допускается отсутствие этого объявления.
Символы разметки XML
Разметка всегда начинается символом <
и заканчивается символом >
. Наряду с символами <
и >
, специальную роль для разметки играет также &
символ. Угловые скобки обозначают границы элементов, инструкций обработки и некоторых других последовательностей. Амперсанд позволяет выполнить замену текста при помощи сущностей.
Символ | Замена |
---|---|
< | < |
> | > |
& | & |
Для употребления апострофов и кавычек внутри значений атрибутов используются следующие сущности
Символ | Замена |
---|---|
'' | ' |
" | " |