В стандарте sgml описывается. Языки разметки: SGML, HTML, XML

  • Дата: 19.03.2024

В 1986 году, задолго до того, как идея создания сети Веб была воплощена в жизнь, универсальный стандартизированный язык разметки SGML (Standardized Generalized Markup Language ) был утвержден в качестве международного стандарта (ISO 8879 ) определения языков разметки, хотя SGML существовал еще с конца шестидесятых. Он использовался для того, чтобы описывать языки разметки, предоставляя при этом автору возможность давать формальные определения каждому элементу и атрибуту языка .

Язык HTML первоначально был всего лишь одним из SGML -приложений. Он описывал правила, по которым должна быть подготовлена информация для World Wide Web . Таким образом, язык HTML - это набор предписаний SGML , сформулированных в виде определения типа документа (DTD ), объясняющих, что именно обозначают тэги и элементы. Схема DTD для языка HTML хранится в веб-браузере.

К недостаткам языка HTML можно отнести следующие:

  • HTML имеет фиксированный набор тэгов . Нельзя создавать свои тэги, понятные другим пользователям.
  • HTML - это исключительно технология представления данных . HTML не несет информации о значении содержания, заключенного в тэгах.
  • HTML - "плоский" язык . Значимость тэгов в нем не определена, поэтому с его помощью нельзя описать иерархию данных.
  • В качестве платформы для приложений используются браузеры . HTML не обладает достаточной мощью для создания веб-приложений на том уровне, к которому в настоящее время стремятся веб-разработчики. Например, на языке HTML невозможно разработать приложение для профессиональной обработки и поиска документов.
  • Большие объемы трафика сети . Существующие HTML -документы, используемые как приложения, перегружают Интернет большими объемами трафика в системах клиент-сервер. Примером может служить пересылка по сети большого по объему документа, в то время как необходима только небольшая часть этого документа.

Таким образом, с одной стороны, язык HTML является очень удобным средством разметки документов для использования в веб, а с другой - документ, размеченный в HTML , имеет мало информации о своем содержании. Если тот или иной документ несет достаточно полную информацию о своем содержании, появляется возможность сравнительно легко провести автоматическую обобщенную обработку и поиск в файле, хранящем документ. Язык SGML позволяет сохранять информацию о содержании документа, однако вследствие особой сложности он никогда не использовался так широко, как HTML .

Группа экспертов по языку SGML , возглавляемая Джоном Боузэком (Jon Bosak ) из компании Sun Microsystems , приступила к работе по созданию подмножества языка SGML , которое могло бы быть принято Web -сообществом. Решено было удалить многие несущественные возможности SGML . Перестроенный таким образом язык назвали XML . Упрощенный вариант оказался значительно более доступным, чем оригинал, его спецификации занимали всего 26 страниц по сравнению с более чем 500 страницами спецификаций SGML .

Рассмотрим более детально структуру и особенности этого языка.

XML ( eXtensible Markup Language ) - рекомендованный W3C язык разметки . XML - текстовый формат , предназначенный для хранения структурированных данных, для обмена информацией между программами, а также для создания на его основе специализированных языков разметки. XML является упрощённым подмножеством языка SGML .

Язык XML имеет следующие достоинства :

  • Это человеко-ориентированный формат документа, он понятен как человеку, так и компьютеру.
  • Поддерживает Юникод.
  • В формате XML могут быть описаны основные структуры данных - такие как записи, списки и деревья.
  • Это самодокументируемый формат, который описывает структуру и имена полей также как и значения полей.
  • Имеет строго определённый синтаксис и требования к анализу, что позволяет ему оставаться простым, эффективным и непротиворечивым.
  • Широко используется для хранения и обработки документов;
  • Это формат, основанный на международных стандартах;
  • Иерархическая структура XML подходит для описания практически любых типов документов;
  • Представляет собой простой текст, свободный от лицензирования и каких-либо ограничений;
  • Не зависит от платформы;
  • Является подмножеством SGML , для которого накоплен большой опыт работы и созданы специализированные приложения;

К известным недостаткам языка можно отнести следующие:

  • Синтаксис XML избыточен.
    • Размер XML документа существенно больше бинарного представления тех же данных (порядка 10 раз).
    • Размер XML документа существенно больше, чем документа в альтернативных текстовых форматах передачи данных (например JSON , YAML ) и особенно в форматах данных, оптимизированных для конкретного случая использования.
    • Избыточность XML может повлиять на эффективность приложения. Возрастает стоимость хранения, обработки и передачи данных.
    • Для большого количества задач не нужна вся мощь синтаксиса XML , и можно использовать значительно более простые и производительные решения.
  • Пространства имён XML сложно использовать и их сложно реализовывать в XML парсерах .
  • XML не содержит встроенной в язык поддержки типов данных. В нём нет понятий "целых чисел", "строк", "дат", "булевых значений" и т. д.
  • Иерархическая модель данных , предлагаемая XML , ограничена по сравнению с реляционной моделью и объектно-ориентированными графами.

Вообще говоря, XML можно рассматривать не только как новый язык разметки , но и как основу для целого семейства технологий:

Таблица 9.1. Структура семейства XML
XML Технические рекомендации об использовании XML
DTD Определение типа документа (схема)
XDR Формат XML Reduced (схема Microsoft )
XSD Определение схемы XML (схемы W3C )
Пространство имен Метод определения имен элементов и атрибутов
XPath Язык путей XML
XLink Язык ссылок XML
XPointer Язык указателей XML
DOM API для объектной модели документа
SAX Простой API для XML
XSL Расширяемый язык таблиц стилей
XSL -FO Объекты форматирования XSL
XSLT Язык преобразований XSL
XInclude Синтаксис XML Include

SGML (англ. Standard Generalized Markup Language - стандартный обобщённый язык разметки; произносится [эс-джи-эм-эл ]) - метаязык, на котором можно определять язык разметки для документов. SGML - наследник разработанного в 1969 году в IBM языка GML (Generalized Markup Language), который не стоит путать с Geography Markup Language, разрабатываемым Open GIS Consortium.

Изначально SGML был разработан для совместного использования машинно-читаемых документов в больших правительственных и аэрокосмических проектах. Он широко использовался в печатной и издательской сфере, но его сложность затруднила его широкое распространение для повседневного использования.

Основные части документа SGML:

1. SGML-декларация - определяет, какие символы и ограничители могут появляться в приложении;

2. Document Type Definition - определяет синтаксис конструкций разметки. DTD может включать дополнительные определения, такие, как символьные ссылки-мнемоники;

3. Спецификация семантики, относится к разметке - также даёт ограничения синтаксиса, которые не могут быть выражены внутри DTD;

4. Содержимое SGML-документа - по крайней мере, должен быть корневой элемент.

SGML предоставляет множество вариантов синтаксической разметки для использования различными приложениями. Изменяя SGML-декларацию, можно даже отказаться от использования угловых скобок, хотя этот синтаксис считается стандартным, так называемым concrete reference syntax .

SGML стандартизован ISO: «ISO 8879:1986 Information processing-Text and office systems-Standard Generalized Markup Language (SGML)»

HTML и XML произошли от SGML. HTML - это приложение SGML, а XML - это подмножество SGML, разработанное для упрощения процесса машинного разбора документа. Другими приложениями SGML являются SGML Docbook (документирование) и «Z Format» (типография и документирование).

XML (англ. eXtensible Markup Language - расширяемый язык разметки; произносится [икс-эм-э́ль ]) - рекомендованный Консорциумом Всемирной паутины язык разметки, фактически представляющий собой свод общих синтаксических правил. XML - текстовый формат, предназначенный для хранения структурированных данных (взамен существующих файлов баз данных), для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки (например, XHTML). XML является упрощённым подмножеством языка SGML.

Стандартом определены два уровня правильности документа XML:

· Правильно построенный (англ. well-formed ). Правильно построенный документ соответствует всем общим правилам синтаксиса XML, применимым к любому XML-документу. И если, например, начальный тег не имеет соответствующего ему конечного тега, то это неправильно построенный документ XML. Документ, который неправильно построен, не может считаться документом XML; XML-процессор (парсер) не должен обрабатывать его обычным образом и обязан классифицировать ситуацию как фатальная ошибка.

· Действительный (англ. valid ). Действительный документ дополнительно соответствует некоторым семантическим правилам. Это более строгая дополнительная проверка корректности документа на соответствие заранее определённым, но уже внешним правилам, в целях минимизации количества ошибок, например, структуры и состава данного, конкретного документа или семейства документов. Эти правила могут быть разработаны как самим пользователем, так и сторонними разработчиками, например, разработчиками словарей или стандартов обмена данными. Обычно такие правила хранятся в специальных файлах - схемах, где самым подробным образом описана структура документа, все допустимые названия элементов, атрибутов и многое другое. И если документ, например, содержит не определённое заранее в схемах название элемента, то XML-документ считается недействительным ; проверяющий XML-процессор (валидатор) при проверке на соответствие правилам и схемам обязан (по выбору пользователя) сообщить об ошибке.

Данные два понятия не имеют достаточно устоявшегося стандартизированного перевода на русский язык, особенно понятие valid , которое можно также перевести, как имеющий силу , правомерный , надёжный , годный , или даже проверенный на соответствие правилам, стандартам, законам . Некоторые программисты применяют в обиходе устоявшуюся кальку «Валидный ».

Технология XML. Предназначение, область применения.

XML - расширяемый язык разметки. Представляющий собой свод общих синтаксических правил. XML - текстовый формат, предназначенный для хранения структурированных данных, для обмена информацией между программами, а также для создания на его основе более специализированных языков разметки (например, XHTML, HTML). XML является упрощённым подмножеством языка SGML.

Целью создания XML было обеспечение совместимости при передаче структурированных данных между разными системами обработки информации, особенно при передаче таких данных через Интернет. Словари, основанные на XML (например, RDF, RSS, MathML, XHTML, SVG), сами по себе формально описаны, что позволяет программно изменять и проверять документы на основе этих словарей, не зная их семантики, то есть не зная смыслового значения элементов. Важной особенностью XML также является применение так называемых пространств имён.

XML - это иерархическая структура, предназначенная для хранения любых данных, визуально структура может быть представлена как дерево. Важнейшее обязательное синтаксическое требование является то, что документ имеет только один корневой элемент. Это означает, что текст должны быть расположены между единственным начальным корневым тегом и соответствующим ему конечным тегом.

Перечислим важнейшие задачи, решение которых обеспечивает платформа XML:

Создание Веб второго поколения;

Выполнение функций языка-посредника при обмене данными между программными системами, реализующими, возможно, различные технологии, и обеспечение тем самым их интероперабельности;

Интеграция неоднородных информационных ресурсов, различных технологий управления данными и приложений;

Создание новой ветви технологий баз данных, называемых XML-ориентированными базами данных;

Наряду с использованием технологий XML-ориентированных баз данных по их прямому назначению - для управления репозиториями XML-документов, можно ожидать, что они найдут применение и в решении проблемы "скрытого" Веб; благодаря единству модели данных XML-документов, представленных на Веб-сервере, и в доступной через него XML-ориентированной базе данных, появляется возможность "открыть" "скрытые" информационные ресурсы баз данных для механизмов таких Веб-серверов;

Обеспечение инструментария для новых сфер применения Веб, таких как электронный бизнес, электронные библиотеки, электронные издания и т.п.

Области применений стандартов платформы XML постоянно расширяются и охватывают ряд технологий и стандартов как горизонтальной, так и вертикальной сферы.

Технология Ajax.

AJAX (, от англ. Asynchronous Javascript and XML - «асинхронный JavaScript и XML») - подход к построению интерактивных пользовательских интерфейсов веб-приложений, заключающийся в «фоновом» обмене данными браузера с веб-сервером. В результате, при обновлении данных, веб-страница не перезагружается полностью, и веб-приложения становятся более быстрыми и удобными.

Технология

AJAX - не самостоятельная технология, а концепция использования нескольких смежных технологий. AJAX базируется на двух основных принципах:

Использование технологии динамического обращения к серверу «на лету», без перезагрузки всей страницы полностью, например:

С использованием XMLHttpRequest (основной объект);

Через динамическое создание дочерних фреймов;

Через динамическое создание тега .

Использование DHTML для динамического изменения содержания страницы;

В качестве формата передачи данных обычно используются JSON или XML.

Преимущества

-Экономия трафика

Использование AJAX позволяет значительно сократить трафик при работе с веб-приложением благодаря тому, что часто вместо загрузки всей страницы достаточно загрузить только изменившуюся часть, как правило, довольно небольшую.

-Уменьшение нагрузки на сервер

AJAX позволяет несколько снизить нагрузку на сервер. К примеру, на странице работы с почтой, когда вы отмечаете прочитанные письма, серверу достаточно внести изменения в базу данных и отправить клиентскому скрипту сообщение об успешном выполнении операции без необходимости повторно создавать страницу и передавать её клиенту.

-Ускорение реакции интерфейса

Поскольку нужно загрузить только изменившуюся часть, пользователь видит результат своих действий быстрее.

Недостатки

-Отсутствие интеграции со стандартными инструментами браузера

Динамически создаваемые страницы не регистрируются браузером в истории посещения страниц, поэтому не работает кнопка «Назад», предоставляющая пользователям возможность вернуться к просмотренным ранее страницам, но существуют скрипты, которые могут решить эту проблему.

Другой недостаток изменения содержимого страницы при постоянном URL заключается в невозможности сохранения закладки на желаемый материал. Частично решить эти проблемы можно с помощью динамического изменения идентификатора фрагмента (части URL после #), что позволяют многие браузеры.

-Динамически загружаемое содержимое недоступно поисковикам (если не проверять запрос, обычный он или XMLHttpRequest)

Поисковые машины не могут выполнять JavaScript, поэтому разработчики должны позаботиться об альтернативных способах доступа к содержимому сайта.

-Старые методы учёта статистики сайтов становятся неактуальными

-Усложнение проекта

Перераспределяется логика обработки данных - происходит выделение и частичный перенос на сторону клиента процессов первичного форматирования данных. Это усложняет контроль целостности форматов и типов. Конечный эффект технологии может быть нивелирован необоснованным ростом затрат на кодирование и управление проектом, а также риском снижения доступности сервиса для конечных пользователей.

-Требуется включенный JavaScript в браузере

SGML (англ. Standard Generalized Markup Language - стандартный обобщённый язык разметки; произносится [эс-джи-эм-эл]) - метаязык, на котором можно определять язык разметки для документов. SGML - наследник разработанного в 1969 году в IBM языка GML (Generalized Markup Language), который не стоит путать с Geography Markup Language, разрабатываемым Open GIS Consortium.

Изначально SGML был разработан для совместного использования машинно-читаемых документов в больших правительственных и аэрокосмических проектах. Он широко использовался в печатной и издательской сфере, но его сложность затруднила его широкое распространение для повседневного использования.

Основные части документа SGML:

SGML-декларация - определяет, какие символы и ограничители могут появляться в приложении;

Document Type Definition - определяет синтаксис конструкций разметки. DTD может включать дополнительные определения, такие, как символьные ссылки-мнемоники;

Спецификация семантики, относится к разметке - также даёт ограничения синтаксиса, которые не могут быть выражены внутри DTD;

Содержимое SGML-документа - по крайней мере, должен быть корневой элемент.

SGML предоставляет множество вариантов синтаксической разметки для использования различными приложениями. Изменяя SGML-декларацию, можно даже отказаться от использования угловых скобок, хотя этот синтаксис считается стандартным, так называемым concrete reference syntax.

Пример синтаксиса SGML:

typically something like this

SGML стандартизован ISO: «ISO 8879:1986 Information processing-Text and office systems-Standard Generalized Markup Language (SGML)»

HTML и XML произошли от SGML. HTML - это приложение SGML, а XML - это подмножество SGML, разработанное для упрощения процесса машинного разбора документа. Другими приложениями SGML являются SGML Docbook (документирование) и «Z Format» (типография и документирование).

XML - Extensible Markup Language, то есть Расширяемый Язык Разметки, возник в результате развития языка HTML (HyperText Markup Language, языка разметки гипертекста). Однако было бы грубой ошибкой воспринимать его лишь как некую усовершенствованную версию языка HTML. По сути, язык XML представляет собой новое поколение языков разметки. Здесь следует иметь в виду 3 момента, принципиально отличающих XML от HTML и его предшественников (GML - Generalized Markup Language, SGML - Standard General Markup Language):

XML, в отличие от HTML, НЕ ИМЕЕТ ПРЕДОПРЕДЕЛЕННЫХ ТЭГОВ - точнее, каждый разработчик может создавать СВОИ СОБСТВЕННЫЕ XML-тэги - столько, сколько нужно. Количество таких тэгов практически неограничено. Таким образом, XML является метаязыком, позволяющим создавать другие языки разметки, такие как, например, HTML.

По мере развития языка HTML количество тэгов быстро увеличивалось. В конце концов их число достигло "критического значения" - разработчикам web-документов стало трудно запоминать все новые и новые тэги, но еще в худшем положении оказались разработчики браузеров - им приходится создавать все новые версии браузеров, которые "понимали бы" новые тэги. Более "умные" браузеры становятся и большими по объему, предъявляют все возрастающие требования к компьютерам, на которых они используются. Дело усугубляется тем, что в последнее время все большую популярность приобретают карманные устройства (в частности, они все шире используются в электронной коммерции), с ограниченным объемом памяти и "слабенькими" экранами, а потому, браузеры, используемые на них, имеют лишь очень ограниченные возможности. Язык XML, не имеющий определенной заранее системы тэгов, позволяет решить эту проблему. "Платой" за универсальность является большая строгость оформления web-документов. Правила оформления XML-документов просты:

недопустимы незакрытые контейнеры тэгов (но можно объединять открывающий и закрывающий тэги в одном, например:
)

"вложенные" контейнеры не могут "перекрываться"

строчные и прописные буквы воспринимаются как разные символы

в качестве названий тэгов нельзя использовать ключевые слова

в названиях тэгов нельзя использовать пробелы, знаки пунктуации, круглые, квадратные и фигурные скобки

знак подчеркивания (_) и цифры могут встречаться в названиях тэгов, но цифра не может быть перым символом названия тэга

(При необходимости использовать несколько слов в качестве названия тэга их следует писать слитно, начиная каждое слово с большой буквы.)

Документы, отвечающие этим правилам, называются well-formed documents.

XML служит для ОПИСАНИЯ СТРУКТУРЫ ДАННЫХ, главным образом, ИЕРАРХИЧЕСКИХ СТРУКТУР.

Одной из основных тенденций развития web-технологий является РАЗДЕЛЕНИЕ ДАННЫХ, СТРУКТУРЫ ДОКУМЕНТА И ЕГО СТИЛЕВОГО ОФОРМЛЕНИЯ. Как известно, одним из способов обособления данных от структуры документа является динамическое связывание СУБД с web-документами через интерфейс ODBC (Open DataBase Connectivity). Обособление стилей достигается за счет использования каскадных таблиц стилей. XML позволяет описывать нереляционные базы данных. Поскольку тэги могут создаваться разработчиком, их названия обычно характеризуют смысл данных.

XML, как средство описания структуры данных, обеспечивает ОБМЕН ДАННЫМИ между различными приложениями, выступая, таким образом, в качестве своеобразного "клея".

Значение этой "связующей" функции XML трудно переоценить. Благодаря возможности обмена данными между различными приложениями web-технологии "выходят" на качественно новый уровень.

Hypertext Markup Language (HTML ) это простая система для создания гипертекстовых документов, которые переносимы с одной платформы на другую. В сущности, HTML документы это SGML документы с общей семантикой, которая подходит для представления информации в большом количестве приложений. HTML может использоваться для представления:

    Гипертекстовых новостей, почты, документации и гипермедиа

    Меню опций

    Результатов запросов к базам данных

    Простых документов с встроенными графическими образами

    А также, для гипертекстового просмотра существующих массивов информации

Проект World Wide Web (WWW) объединяет разбросанную по миру информацию. Для этого WWW использует Internet HyperText Transfer Protocol (HTTP) - Протокол Передачи Гипертекста, который позволяет ввести соглашения на способы представления данных при взаимодействии клиента и сервера.

Данные передаются в теле сообщения в соответствии с MIME стандартом. HTML это одно из представлений информации в WWW. Предполагается, что HTML соответствует одному из типов MIME, а именно text/html. Дополнительно, HTML это разработка, соответствующая Международному Стандарту ISO 8879 - Standard Generalized Markup Language (SGML), который является системой для определения структурированных типов документов.

HTML документ

HTML документ подобен текстовому файлу, за исключением того, что некоторые символы (строки) являются управляющими. Эти символы называются тэгами и определяют структуру документа.

HTML документы должны начинаться с тэга , стоящего в начале файла, и заканчиваться тэгом . Между этими тэгами HTML документ организован как ЗАГОЛОВОК (HEAD) и ТЕЛО (BODY) документа, подобно почтовому сообщению. Внутри HEAD части указывается ЗАГОЛОВОК (TITLE) и другая информация о документе в целом. Внутри BODY части с помощью HTML тэгов текст структурируется в параграфы, списки и пр. с возможностью выделения стилем отдельных слов и целых предложений и создания ссылок на части этого и внешние документы. Технически, открывающий и закрывающий тэги для HTML, HEAD и BODY элементов можно не использовать. Тем не менее, делать это не рекомендуется, так как HEAD/BODY структура позволяет приложениям определять особенности документов (например заголовок), не просматривая весь документ целиком.

Структура HTML элементов

В HTML документе тэги определяют начало и конец заголовков, параграфов, списков, подсветку символов и ссылки. Большинство HTML элементов в документе определены как открывающий тэг, который указывает имя элемента и атрибуты, затем указывается тело элемента, за которым следует закрывающий тэг. Символами-ограничителями для открывающего тэга являются ""; для закрывающего - "". Например:

Это Заголовок

Это параграф.

Некоторые элементы появляются только как открывающий тэг. Например, для создания линии- разделителя используется тэг
. Кроме того, закрывающие тэги для некоторых элементов (P, LI, DT, DD) могут быть опущены. Тело элемента это последовательность символов и вложенных элементов. Некоторые элементы, такие как элементы, определяющие ссылки, не могут быть вложенными друг в друга. При этом элементы, определяющие ссылки и выделения символов могут быть помещены внутрь других конструкций.

Отображение документа

Конкретный вид отображения документа может изменяться от клиента к клиенту. HTML тэги определяют только общий стиль отображения документа. Что означает, например, что HTML рассматривает заголовок первого уровня только как заголовок первого уровня, но не определяет, что заголовок первого уровня должен отображаться шрифтом Times размера 24 в центре верхней части страницы. Преимущество такого подхода заключается в том, что если пользователь решит изменить заголовок первого уровня на шрифт Helvetica размера 20 выравненный по левому краю, все, что ему надо сделать, это изменить определение заголовка первого уровня в его WWW просмоторщике. Таким образом, конкретное представление документа на экране монитора определяет пользователь конкретного клиента.

Основная сила HTML заключается в его способности связывать области текста (а также картинок) с другими документами. Просмотрщики выделяют эти области (обычно цветом и/или подчеркиванием)для того, чтобы указать, что это гипертекстовые ссылки. Anchor это часть текста, которая отмечает начало и/или конец гипертекстовой ссылки. Текст, находящийся между открывающим и закрывающим тэгом является стартовой точкой или местом назначения гипертекстовой ссылки. Атрибуты данного тэга следующие: HREF

Необязательный. Если присутствует атрибут HREF, Anchor это чувствительный текст: стартовая точка для ссылки. Если читатель выбирает этот текст, ему будет представлен другой документ, чей сетевой адрес был указан в значении атрибута HREF. Формат сетевого адреса аналогичен URL. Это позволяет структуре HREF="#identifier" ссылаться на другой anchor в текущем документе, или в удаленном документе при указании его адреса перед знаком "#".

Необязательный. Если присутствует, позволяет использовать anchor как место назначения ссылки. Значением атрибута является идентификатор anchor"а. В качестве значения идентификатора может быть использована обычная текстовая строка, за исключением того, что внутри одного документа все подобные идентификаторы должны быть уникальны.

Необязательные. Позволяют указывать взаимосвязи между документом из которого была сделана ссылка, и документом, на который была сделана ссылка.

Все атрибуты необязательны, за исключением того, что для того, чтобы тэг имел смысл, должен присутствовать либо атрибут HREF, либо атрибут NAME.

Примеры использования

...

Определяет место в документе, на которое будет сделана ссылка

...

...

Стандартом определены два уровня правильности документа XML:

  • Правильно построенный (Well-formed). Правильно построенный документ соответствует всем общим правилам синтаксиса XML, применимым к любому XML-документу. И если, например, начальный тег не имеет соответствующего ему конечного тега, то это неправильно построенный документ XML. Документ, который неправильно построен, не может считаться документом XML; XML-процессор (парсер) не должен обрабатывать его обычным образом и обязан классифицировать ситуацию как фатальная ошибка .
  • Действительный (Valid). Действительный документ дополнительно соответствует некоторым семантическим правилам. Это более строгая дополнительная проверка корректности документа на соответствие заранее определённым, но уже внешним правилам, в целях минимизации количества ошибок, например, структуры и состава данного, конкретного документа или семейства документов. Эти правила могут быть разработаны как самим пользователем, так и сторонними разработчиками, например, разработчиками словарей или стандартов обмена данными. Обычно такие правила хранятся в специальных файлах - схемах, где самым подробным образом описана структура документа, все допустимые названия элементов, атрибутов и многое другое. И если документ, например, содержит не определённое заранее в схемах название элемента, то XML-документ считается недействительным ; проверяющий XML-процессор (валидатор) при проверке на соответствие правилам и схемам обязан (по выбору пользователя) сообщить об ошибке.

Данные два понятия не имеют достаточно устоявшегося стандартизированного перевода на русский язык, особенно понятие valid , которое можно также перевести, как имеющий силу , правомерный , надёжный , годный , или даже проверенный на соответствие правилам, стандартам, законам . Некоторые программисты применяют в обиходе устоявшуюся кальку «Валидный ».

Синтаксис XML

В этом разделе рассматривается лишь правильное построение документов XML, то есть их синтаксис.

XML - это иерархическая структура, предназначенная для хранения любых данных, визуально структура может быть представлена как дерево . Важнейшее обязательное синтаксическое требование - то, что документ имеет только один корневой элемент (root element) (альтернативно называемый элементом документа ). Это означает, что текст или другие данные всего документа должны быть расположены между единственным начальным корневым тегом и соответствующим ему конечным тегом.

Следующий простейший пример - правильно построенный документ XML: Это книга: "Книжечка" Первая строка XML-документа называется объявлением XML (XML declaration) - это необязательная строка, указывающая версию стандарта XML (обычно это 1.0), также здесь может быть указана кодировка символов и внешние зависимости. Спецификация требует, чтобы процессоры XML обязательно поддерживали Юникод -кодировки UTF-8 и UTF-16 (UTF-32 не обязателен). Признаются допустимыми, поддерживаются и широко используются (но не обязательны) другие кодировки, основанные на стандарте ISO/IEC 8859 , также допустимы другие кодировки, например, русские Windows-1251 , KOI-8 .

Комментарий может быть размещен в любом месте дерева. XML комментарии размещаются внутри пары тегов . Два знака дефис (--) не могут быть применены ни в какой части внутри комментария.

Ниже приведён пример простого кулинарного рецепта, размеченного с помощью XML:

Простой хлеб Мука Дрожжи Тёплая вода Соль

Структура

Остальная часть этого XML-документа состоит из вложенных элементов , некоторые из которых имеют атрибуты и содержимое . Элемент обычно состоит из открывающего и закрывающего тегов, обрамляющих текст и другие элементы. Открывающий тег состоит из имени элемента в угловых скобках, например, « »; закрывающий тег состоит из того же имени в угловых скобках, но перед именем ещё добавляется косая черта, например, « ». Содержимым элемента (content) называется всё, что расположено между открывающим и закрывающим тегами, включая текст и другие (вложенные) элементы. Ниже приведён пример XML-элемента, который содержит открывающий тег, закрывающий тег и содержимое элемента:

Замесить ещё раз, положить на противень и поставить в духовку.

Мука

В приведённом примере у элемента « ingredient » есть два атрибута: « amount », имеющий значение «3», и « unit », имеющий значение «стакан». С точки зрения XML-разметки, приведённые атрибуты не несут никакого смысла, а являются просто набором символов.

Кроме текста, элемент может содержать другие элементы:

Смешать все ингредиенты и тщательно замесить. Закрыть тканью и оставить на один час в тёплом помещении. Замесить ещё раз, положить на противень и поставить в духовку.

В данном случае элемент « Instructions » содержит три элемента « step ». XML не допускает перекрывающихся элементов. Например, приведённый ниже фрагмент некорректен, так как элементы « em » и « strong » перекрываются.

Обычный акцентированный выделенный и акцентированный выделенный

Каждый XML-документ должен содержать в точности один корневой элемент (root element или document element ), таким образом, следующий фрагмент не может считаться корректным XML-документом.

Сущность №1 Сущность №2

Для обозначения элемента без содержания, называемого пустым элементом , необходимо применять особую форму записи, состоящую из одного тега, в котором после имени элемента ставится косая черта. Если в DTD элемент не объявлен пустым, но в документе он не имеет содержания, для него допускается применять такую форму записи. Например:

В XML определены два метода записи специальных символов: ссылка на сущность и ссылка по номеру символа. Сущностью (entity) в XML называются именованные данные, обычно текстовые, в частности, спецсимволы. Ссылка на сущность (entity references) указывается в том месте, где должна быть сущность и состоит из амперсанда (« & »), имени сущности и точки с запятой (« ; »). В XML есть несколько предопределённых сущностей, таких как « lt » (ссылаться на неё можно написав « < ») для левой угловой скобки и « amp » (ссылка - « & ») для амперсанда, возможно также определять собственные сущности. Помимо записи с помощью сущностей отдельных символов, их можно использовать для записи часто встречающихся текстовых блоков. Ниже приведён пример использования предопределённой сущности для избежания использования знака амперсанда в названии:

AT&T

Полный список предопределённых сущностей состоит из & («&»), < (« («>»), " («"»), и " («"») - последние две полезны для записи разделителей внутри значений атрибутов. Определить свои сущности можно в DTD -документе.

Иногда бывает необходимо определить неразрывный пробел, который очень часто используется в HTML и обозначается как в XML такой предопределённой сущности нет, его записывают, а использование вызывает ошибку. Отсутствие этой весьма распространённой сущности у множества программистов зачастую вызывает удивление и это создаёт некоторые трудности при миграции своих HTML-разработок в XML.

Ссылка по номеру символа (numeric character reference) выглядит как ссылка на сущность, но вместо имени сущности указывается символ # и число (в десятичной или шестнадцатеричной записи), являющееся номером символа в кодовой таблице Юникод . Это обычно символы, которые невозможно закодировать напрямую, например, буква арабского алфавита в ASCII -кодированном документе. Амперсанд может быть представлен следующим образом:

AT&T

Существует ещё множество правил, касающихся составления корректного XML-документа, но целью данного краткого обзора было лишь показать основы, необходимые для понимания структуры XML-документа.

История

Годом рождения XML можно считать 1996 год , в конце которого появился черновой вариант спецификации языка, или , когда эта спецификация была утверждена. А началось всё с появления в 1986 году языка SGML.

SGML (Standard Generalized Markup Language - стандартный обобщённый язык разметки) заявил о себе как гибкий, комплексный и всеохватывающий мета-язык для создания языков разметки. Несмотря на то, что понятие гипертекста появилось в 1965 году (а основопологающие принципы сформулированы в 1945 году ), SGML не имеет гипертекстовой модели. Создание SGML можно с уверенностью назвать попыткой объять необъятное, так как он объединяет в себе такие возможности, которые крайне редко используются все вместе. В этом и состоит его главный недостаток - сложность и, как следствие, дороговизна этого языка ограничивает его использование только крупными компаниями, которые могут позволить себе купить соответствующее программное обеспечение и нанять высокооплачиваемых специалистов. Кроме того, у небольших компаний редко возникают настолько сложные задачи, чтобы привлекать к их решению SGML.

Наиболее широко SGML применяется для создания других языков разметки, именно с его помощью был создан язык разметки гипертекстовых документов - HTML , спецификация которого была утверждена в 1992 году . Его появление было связано с необходимостью организации стремительно увеличивающегося массива документов в сети Интернет. Бурный рост количества подключений к Интернету и, соответственно, Web -серверов повлек за собой такую потребность в кодировке электронных документов, с которой не мог справиться SGML вследствие высокой трудности освоения. Появление HTML - очень простого языка разметки - быстро решило эту проблему: лёгкость в изучении и богатство средств оформления документов сделали его самым популярным языком для пользователей Интернет. Но, по мере роста количества и изменения качества документов в Сети, росли и предъявляемые к ним требования, и простота HTML превратилась в его главный недостаток. Ограниченность количества тегов и полное безразличие к структуре документа побудили разработчиков в лице консорциума W3C к созданию такого языка разметки, который был бы не столь сложен, как SGML, и не настолько примитивен, как HTML. В результате, сочетая в себе простоту HTML, логику разметки SGML и удовлетворяя требованиям Интернет, появился на свет язык XML.

Сильные и слабые стороны Достоинства Недостатки
  • Неоднозначность моделирования.
  • XML не содержит встроенной в язык поддержки типов данных . В нём нет строгой типизации, то есть понятий «целых чисел», «строк», «дат», «булевых значений» и т. д.
  • Иерархическая модель данных , предлагаемая XML, ограничена по сравнению с реляционной моделью и объектно-ориентированными графами и сетевой моделью данных.
Отображение XML во Всемирной паутине

Наиболее распространены три способа преобразования XML-документа в отображаемый пользователю вид:

  • Применение стилей CSS ;
  • Применение преобразования XSLT ;
  • Написание на каком-либо языке программирования обработчика XML-документа.
  • Без использования CSS или XSL XML-документ отображается как простой текст в большинстве Web-браузеров. Некоторые браузеры, такие как Internet Explorer , Mozilla и Mozilla Firefox отображают структуру документа в виде дерева, позволяя сворачивать и разворачивать узлы с помощью нажатий клавиши мыши.

    Применение стилей CSS

    Процесс аналогичен применению CSS к HTML документу для отображения.

    Для применения CSS при отображении в браузере, XML документ должен содержать специальную ссылку на таблицу стилей. Например:

    Это отличается от подхода HTML, где используется элемент .

    Применение преобразования XSLT

    XSL является технологией, описывающей как форматировать или преобразовывать данные XML-документа. Документ трансформируется в формат, подходящий для отображения в браузере. Браузер - это наиболее частое использование XSL, но не стоит забывать, что с помощью XSL можно трансформировать XML в любой формат, например

    вПТЙУ фПВПФТБУ

    SGML: У ЮЕН ЬФП ЕДСФ?

    уЕЗПДОС ЧУЕ ЮБЭЕ НПЦОП ЧУФТЕФЙФШ БВВТЕЧЙБФХТХ SGML. нОПЗЙЕ ЧЙДЩ ДПЛХНЕОФБГЙЙ РПУФБЧМСАФУС Ч ЖПТНБФЕ SGML. рПРХМСТОЩК СЪЩЛ ТБЪНЕФЛЙ Web-УФТБОЙГ HTML СЧМСЕФУС РТЙМПЦЕОЙЕН SGML. рПСЧМСЕФУС ЧУЕ ВПМШЫЕ РТЙЛМБДОЩИ РТПЗТБНН ДМС ТБВПФЩ У SGML: ТЕДБЛФПТЩ, УТЕДУФЧБ ЖПТНБФЙТПЧБОЙС, УЙУФЕНЩ ДПЛХНЕОФППВПТПФБ, ЙУРПМШЪХАЭЙЕ SGML Ч ЛБЮЕУФЧЕ ЖПТНБФБ ИТБОЕОЙС ДПЛХНЕОФПЧ... SGML-РТПДХЛФЩ ЧЩРХУЛБАФ Adobe, Corel, SoftQuad, Microsoft. ч SGML ЗПФПЧСФУС ЛОЙЗЙ ЙЪДБФЕМШУФЧБ O"Reilly, ФЕИОЙЮЕУЛБС ДПЛХНЕОФБГЙС IBM, Sun Й OSF. пУОПЧЩЧБЕФУС ОБ SGML ЙОЖПТНБГЙПООБС ФЕИОПМПЗЙС НОПЗЙИ ЧЕДХЭЙИ НБЫЙОПУФТПЙФЕМШОЩИ Й БЧЙБЛПУНЙЮЕУЛЙИ ЖЙТН ЧУЕЗП НЙТБ.

    рПСЧЙЧЫБСУС Ч ОБЮБМЕ ЧПУШНЙДЕУСФЩИ SGML-ФЕИОПМПЗЙС РЕТЕЦЙЧБЕФ УЕКЮБУ РЕТЙПД ТБУГЧЕФБ. юФП ЬФП ФБЛПЕ? юФП ПОБ ДБЕФ УЧПЙН РПМШЪПЧБФЕМСН? лБЛ У ОЕК ТБВПФБФШ? оБ ЬФЙ Й ДТХЗЙЕ ЧПРТПУЩ С РЩФБАУШ ПФЧЕФЙФШ ЬФПК УФБФШЕК.

    уПДЕТЦБОЙЕ



















    лБЛ С ОБВТЕМ ОБ SGML-ФЕИОПМПЗЙА

    чУЕ ОБЮБМПУШ У ЙОФТБОЕФБ. ьФП НПДОПЕ УМПЧП ПЪОБЮБМП ДМС НЕОС ОБ РТБЛФЙЛЕ ФП, ЮФП ДПЛХНЕОФЩ, ЛПФПТЩЕ С ТЕЗХМСТОП РЙУБМ РП ТПДХ УЧПЕК ДЕСФЕМШОПУФЙ, УФБМП НПЦОП Й ОХЦОП ДЕМБФШ ДПУФХРОЩНЙ "online". дП УЙИ РПТ С РТПУФП ОБВЙТБМ ДПЛХНЕОФЩ Ч T E X-e Й РЕЮБФБМ ЙИ ОБ ВХНБЗЕ. йДЕС ДХВМЙТПЧБФШ ЙИ Ч HTML ЧТХЮОХА ПФРБМБ УТБЪХ: ОЕНЕДМЕООП ЧПЪОЙЛМБ ВЩ РТПВМЕНБ УЙОИТПОЙЪБГЙЙ ВХНБЦОПК Й ЬМЕЛФТПООПК ЧЕТУЙК ПДОПЗП Й ФПЗП ЦЕ ДПЛХНЕОФБ.

    б ЧУЛПТЕ РПФТЕВПЧБМПУШ РЕТЙПДЙЮЕУЛБС РЕТЕДБЮБ ДПЛХНЕОФПЧ РПУФПТПООЙН МАДСН Ч ЬМЕЛФТПООПК ЖПТНЕ, ЮФП, РП УМПЦЙЧЫЕКУС Х ОБУ РТБЛФЙЛЕ, ПЪОБЮБЕФ -- Ч ЖПТНБФЕ Microsoft Word. тБВПФБФШ У MS Word Х НЕОС РП ТСДХ РТЙЮЙО ОЕ ВЩМП ОЙЛБЛПЗП ЦЕМБОЙС, Л ФПНХ ЦЕ ЬФП ФПМШЛП ХУХЗХВЙМП ВЩ РТПВМЕНХ УЙОИТПОЙЪБГЙЙ ЧЕТУЙК.

    ъОБЮЙФ, ОХЦОП ВЩМП РТЙДХНБФШ УРПУПВ БЧФПНБФЙЮЕУЛПЗП РТЕПВТБЪПЧБОЙС ОБВЙТБЕНЩИ ДПЛХНЕОФПЧ Ч ТБЪМЙЮОЩЕ ЖПТНБФЩ: T E X-a -- ДМС РЕЮБФЙ ОБ ВХНБЗЕ, HTML -- ДМС РПНЕЭЕОЙС ОБ WWW УЕТЧЕТ, Word -- ДМС ПВНЕОБ У ТБВПФБАЭЙНЙ Ч Windows. лТПНЕ ФПЗП, НОЕ ИПФЕМПУШ, ЮФПВЩ ФБЛПЕ УТЕДУФЧП ПФЧЕЮБМП ЕЭЕ ТСДХ ФТЕВПЧБОЙК:

    • ВЩФШ НПДХМШОЩН, ЮФПВЩ НПЦОП ВЩМП РТЙ ОЕПВИПДЙНПУФЙ МЕЗЛП ДПВБЧМСФШ ОПЧЩЕ ЧЩИПДОЩЕ ЖПТНБФЩ ЙМЙ ЙЪНЕОСФШ БМЗПТЙФНЩ РТЕПВТБЪПЧБОЙС Ч УХЭЕУФЧХАЭЙЕ;
    • ВЩФШ ПФЛТЩФЩН, ВЕУРМБФОЩН, ЛБЛ НПЦОП НЕОШЫЕ РТЙЧСЪБООЩН Л ЛПОЛТЕФОЩН РТПЗТБННБН;
    • ВЩФШ НПВЙМШОЩН: ТБВПФБФШ, ЛБЛ НЙОЙНХН, ОБ ТБЪОЩИ UNIX-РМБФЖПТНБИ;
    • ВЩФШ МЕЗЛП ТХУЙЖЙГЙТХЕНЩН.

    рЕТЧЩН, ЮФП РПРБМПУШ НОЕ РПД ТХЛХ РПУМЕ РПИПДБ ОБ Altavista , ПЛБЪБМУС РБЛЕФ РПД ОБЪЧБОЙЕН linuxdoc-sgml . пО ЛБЛ ТБЪ Й РТЕДОБЪОБЮБМУС ДМС ЗЕОЕТБГЙЙ HTML, T E X Й RTF ЙЪ ПДОПЗП ЧИПДОПЗП ЖБКМБ. ыЙТПЛП ЙУРПМШЪХЕНЩК Ч ТБНЛБИ Linux Documentation Project , ПО ЙУРПМШЪПЧБМ Ч ЛБЮЕУФЧЕ ЧИПДОПЗП ЖПТНБФБ ОЕЪОБЛПНЩК НОЕ ДП УЙИ РПТ СЪЩЛ SGML . чРТПЮЕН, ОЙЮЕЗП УМПЦОПЗП Ч ОЕН ОЕ ПЛБЪБМПУШ -- ПО ЧЕУШНБ ОБРПНЙОБМ ЪОБЛПНЩК НОЕ HTML Й ЧЩЗМСДЕМ ЧРПМОЕ РПОСФОП. чПФ, Л РТЙНЕТХ, ЛХУПЮЕЛ SGML-ДПЛХНЕОФБ:

    The Structure of a TEI Text

    All TEI-conformant texts contain a TEI header (marked up as a teiHeader element) and the transcription of the text proper (marked up as a text element).

    дМС ФПЗП, ЮФПВЩ ОБЮБФШ ОБ ЬФПН РЙУБФШ, РПФТЕВПЧБМПУШ ЧУЕЗП МЙЫШ ЪБРПНОЙФШ ОЕУЛПМШЛП ПУОПЧОЩИ ЬМЕНЕОФПЧ ТБЪНЕФЛЙ, ОБРТЙНЕТ, ЮФП

    ПЪОБЮБЕФ ОБЮБМП РБТБЗТБЖБ, -- ОБЮБМП РЕТЕЮЙУМЕОЙС Й Ф.Р.

    оБВТБООЩК Ч SGML ФЕЛУФ ДБМЕЕ ЪБРХУЛПН ПДОПЗП ЖЙМШФТБ РТЕПВТБЪХЕФУС Ч HTML, ДТХЗПЗП -- Ч T E X, ФТЕФШЕЗП -- Ч RTF, Й ФБЛ ДБМЕЕ.

    юФП ФБЛПЕ SGML Й ЮЕН ПО ИПТПЫ фЕТНЙОПМПЗЙС

    GML (Generalized Markup Language ) ТБЪТБВПФБО Ч ОЕДТБИ ЧЕЪДЕУХЭЕК ЛПТРПТБГЙЙ IBM. еЗП ОБУМЕДОЙЛ SGML (Standard Generalized Markup Language ) РТЙОСФ Ч 1986 ЗПДХ Ч ЛБЮЕУФЧЕ НЕЦДХОБТПДОПЗП УФБОДБТФБ ДМС ПРТЕДЕМЕОЙС ОЕЪБЧЙУЙНЩИ ПФ ХУФТПКУФЧ ЧЧПДБ/ЧЩЧПДБ, ОЕЪБЧЙУЙНЩИ ПФ ЧЩЮЙУМЙФЕМШОПК УТЕДЩ НЕФПДПЧ РТЕДУФБЧМЕОЙС ФЕЛУФПЧ Ч ЬМЕЛФТПООПК ЖПТНЕ. вПМЕЕ ФПЮОП, SGML -- ЬФП НЕФБСЪЩЛ , ФП ЕУФШ УТЕДУФЧП ЖПТНБМШОПЗП ПРЙУБОЙС СЪЩЛБ, Ч ДБООПН УМХЮБЕ, СЪЩЛБ ТБЪНЕФЛЙ .

    йУФПТЙЮЕУЛЙ УМПЧП ТБЪНЕФЛБ ЙУРПМШЪПЧБМПУШ ДМС ПРЙУБОЙК БООПФБГЙК ЙМЙ ДТХЗЙИ ПВПЪОБЮЕОЙК ЧОХФТЙ ФЕЛУФБ, РТЕДОБЪОБЮЕООЩИ ДМС ХЛБЪБОЙК УПУФБЧЙФЕМА ЙМЙ "ЧЕТУФБМШЭЙЛХ" ФПЗП, ЛБЛ ЙНЕООП ЛПОЛТЕФОПЕ НЕУФП ДПМЦОП ВЩФШ ОБРЕЮБФБОП ЙМЙ УЧЕТУФБОП. рТЙНЕТЩ ЧЛМАЮБАФ РПДЮЕТЛЙЧБОЙЕ ЧПМОЙУФПК ЮЕТФПК, ПВПЪОБЮБАЭЕЕ ЛХТУЙЧ, УРЕГЙБМШОЩЕ ЪОБЮЛЙ ДМС РТПРХУЛБ ЖТБЪ ЙМЙ ЙИ РЕЮБФЙ ЛПОЛТЕФОЩН ЫТЙЖФПН, Й ФБЛ ДБМЕЕ. лПЗДБ ЖПТНБФЙТПЧБОЙЕ Й РЕЮБФШ ФЕЛУФПЧ УФБМЙ БЧФПНБФЙЪЙТПЧБООЩНЙ, ЬФПФ ФЕТНЙО УФБМ ПИЧБФЩЧБФШ ЧУЕ ЧЙДЩ УРЕГЙБМШОЩИ ЛПДПЧ ТБЪНЕФЛЙ , ЧУФБЧМСЕНЩИ Ч ЬМЕЛФТПООЩЕ ФЕЛУФЩ ДМС ХРТБЧМЕОЙС ЖПТНБФЙТПЧБОЙЕН, РЕЮБФША ЙМЙ ДТХЗПК ПВТБВПФЛПК.

    пВПВЭБС, ТБЪНЕФЛХ, ЙМЙ ЛПДЙТПЧЛХ , ПРТЕДЕМСАФ ЛБЛ МАВПЕ УТЕДУФЧП УДЕМБФШ СЧОЩН ЙОФЕТРТЕФБГЙА ФЕЛУФБ. оБ ВБОБМШОПН ХТПЧОЕ ЧУЕ ОБРЕЮБФБООЩЕ ФЕЛУФЩ ЛПДЙТПЧБОЩ Ч ЬФПН УНЩУМЕ: ЪОБЛЙ РТЕРЙОБОЙС, ЙУРПМШЪПЧБОЙЕ ЪБЗМБЧОЩИ ВХЛЧ, ТБУРПМПЦЕОЙЕ ВХЛЧ РП УФТБОЙГЕ, ДБЦЕ ЙОФЕТЧБМЩ НЕЦДХ УМПЧБНЙ НПЦОП УЮЙФБФШ Ч ЛБЛПК-ФП УФЕРЕОЙ ТБЪНЕФЛПК, ЖХОЛГЙС ЛПФПТПК -- РПНПЮШ ЮЕМПЧЕЛХ, ЮЙФБАЭЕНХ ФЕЛУФ, ПРТЕДЕМЙФШ, ЗДЕ ЛПОЮБЕФУС ПДОП УМПЧП Й ОБЮЙОБЕФУС ДТХЗПЕ, ЙМЙ ЛБЛ ЙДЕОФЙЖЙГЙТПЧБФШ ПУПВЕООПУФЙ УФТХЛФХТЩ, ФБЛЙЕ ЛБЛ ЪБЗПМПЧЛЙ, ЙМЙ РТПУФЩЕ УЙОФБЛУЙЮЕУЛЙЕ ЕДЙОЙГБ ЧТПДЕ РПДЮЙОЕООЩИ РТЕДМПЦЕОЙК. лПДЙТПЧБОЙЕ ФЕЛУФБ ДМС ЛПНРШАФЕТОПК ПВТБВПФЛЙ, Ч РТЙОГЙРЕ, ЛБЛ ТБУЫЙЖТПЧЛБ НБОХУЛТЙРФБ У РЕТЗБНЕОФБ, -- РТПГЕУУ ДЕМБОЙС СЧОЩН ОЕСЧОПЗП ЙМЙ РПДТБЪХНЕЧБЕНПЗП, РТПГЕУУ ХЛБЪБОЙС РПМШЪПЧБФЕМА ФПЗП, ЛБЛ ДПМЦОП ЙОФЕТРТЕФЙТПЧБФШУС УПДЕТЦЙНПЕ ФЕЛУФБ.

    рПД СЪЩЛПН ТБЪНЕФЛЙ РПОЙНБАФ ОБВПТ УПЗМБЫЕОЙК П ТБЪНЕФЛЕ, РТЙНЕОСЕНЩИ ДМС ЛПДЙТПЧБОЙС ФЕЛУФПЧ. сЪЩЛ ТБЪНЕФЛЙ ДПМЦЕО УРЕГЙЖЙГЙТПЧБФШ, ЛБЛБС ТБЪНЕФЛБ ДПРХУФЙНБ, ЛБЛБС ТБЪНЕФЛБ ПВСЪБФЕМШОБ, ЛБЛ ПФМЙЮЙФШ ТБЪНЕФЛХ ПФ ФЕЛУФБ Й ЮФП ТБЪНЕФЛБ ЪОБЮЙФ. SGML РТЕДПУФБЧМСЕФ ТЕЫЕОЙС ДМС РЕТЧЩИ ФТЕИ ЪБДБЮ, ПФДЕМШОБС ДПЛХНЕОФБГЙС ПВЩЮОП ОЕПВИПДЙНБ ДМС РПУМЕДОЕК.

    пУПВЕООПУФЙ SGML

    фТЙ ИБТБЛФЕТЙУФЙЛЙ SGML ПФМЙЮБАФ ЕЗП ПФ РТПЮЙИ СЪЩЛПЧ ТБЪНЕФЛЙ.

    пРЙУБФЕМШОБС ТБЪНЕФЛБ

    уЙУФЕНБ У ПРЙУБФЕМШОПК ТБЪНЕФЛПК ЙУРПМШЪХЕФ ЛПДЩ ТБЪНЕФЛЙ, ЛПФПТЩЕ РТПУФП РТЕДПУФБЧМСАФ ОБЪЧБОЙС ДМС ЛБФЕЗПТЙЪБГЙЙ ЮБУФЕК ДПЛХНЕОФБ. лПДЩ ТБЪНЕФЛЙ, ФБЛЙЕ ЛБЛ ЙМЙ \end{list} , РТПУФП ЙДЕОФЙЖЙГЙТХАФ РПТГЙА ДПЛХНЕОФБ Й ХФЧЕТЦДБАФ, ЮФП "ПОБ СЧМСЕФУС РБТБЗТБЖПН", ЙМЙ ЮФП "ЬФП -- ЛПОЕГ РПУМЕДОЙН ОБЮБФПЗП УРЙУЛБ" Й Ф.Р. у ДТХЗПК УФПТПОЩ, УЙУФЕНБ У РТПГЕДХТОПК ТБЪНЕФЛПК ПРТЕДЕМСЕФ, ЛБЛБС ПВТБВПФЛБ ДПМЦОБ ЧЩРПМОСФШУС Ч ЛПОЛТЕФОПК ФПЮЛЕ ДПЛХНЕОФБ: "Ч ЬФПН НЕУФЕ ЧЩЪЧБФШ РТПГЕДХТХ PARA У РБТБНЕФТБНЙ 1, b Й x", ЙМЙ "РЕТЕДЧЙОХФШ МЕЧХА ЗТБОЙГХ ОБ 2НН МЕЧЕЕ, РТБЧХА ЗТБОЙГХ -- ОБ 2НН РТБЧЕЕ, РТПРХУФЙФШ ПДОХ УФТПЛХ Й ЧУФБФШ ОБ ОПЧХА МЕЧХА ЗТБОЙГХ" Й Ф.Р. ч SGML ЙОУФТХЛГЙЙ, ОЕПВИПДЙНЩЕ ДМС ПВТБВПФЛЙ ДПЛХНЕОФБ У ЛБЛПК-МЙВП ЛПОЛТЕФОПК ГЕМША (ОБРТЙНЕТ, ДМС ЖПТНБФЙТПЧБОЙС), ЮЕФЛП ПФДЕМСАФУС ПФ ПРЙУБФЕМШОПК ТБЪНЕФЛЙ, ЛПФПТБС ЧУФТЕЮБЕФУС ЧОХФТЙ ДПЛХНЕОФБ. пВЩЮОП ПОЙ УПВТБОЩ ЧОЕ ДПЛХНЕОФБ Ч ПФДЕМШОЩИ РТПГЕДХТБИ ЙМЙ РТПЗТБННБИ.

    у ПРЙУБФЕМШОПК, Б ОЕ РТПГЕДХТОПК, ТБЪНЕФЛПК ПДЙО Й ФПФ ЦЕ ДПЛХНЕОФ НПЦЕФ ВЩФШ ПВТБВПФБО ТБЪОППВТБЪОЩНЙ РТПЗТБННБНЙ, ЛБЦДБС ЙЪ ЛПФПТЩИ НПЦЕФ РТЙНЕОСФШ ТБЪМЙЮОЩЕ ЙОУФТХЛГЙЙ ПВТБВПФЛЙ Л ФЕН ЕЗП ЮБУФСН, ЛПФПТЩЕ ПОБ УЮЙФБЕФ ЧБЦОЩНЙ. оБРТЙНЕТ, РТПЗТБННБ БОБМЙЪБ УПДЕТЦЙНПЗП НПЦЕФ РПМОПУФША ЙЗОПТЙТПЧБФШ УОПУЛЙ, ФПЗДБ ЛБЛ РТПЗТБННБ ЖПТНБФЙТПЧБОЙС НПЦЕФ ЙЪЧМЕЛБФШ Й УПВЙТБФШ ЙИ ДМС РЕЮБФШ Ч ЛПОГЕ ЛБЦДПК ЮБУФЙ. тБЪМЙЮОЩЕ ЧЙДЩ ЙОУФТХЛГЙК ПВТБВПФЛЙ НПЗХФ БУУПГЙЙТПЧБФШУС У ПДОПК Й ФПК ЦЕ ЮБУФША ЖБКМБ. оБРТЙНЕТ, ПДОБ РТПЗТБННБ НПЦЕФ ЙЪЧМЕЛБФШ ЙЪ ДПЛХНЕОФБ ЖБНЙМЙЙ МАДЕК Й ЗЕПЗТБЖЙЮЕУЛЙЕ ОБЪЧБОЙС ДМС УПЪДБОЙС ЙОДЕЛУБ ЙМЙ ВБЪЩ ДБООЩИ, ФПЗДБ ЛБЛ ДТХЗБС, ПВТБВБФЩЧБАЭБС ФПФ ЦЕ УБНЩК ФЕЛУФ, НПЦЕФ РЕЮБФБФШ ЖБНЙМЙЙ Й ОБЪЧБОЙС ПФМЙЮБАЭЙНУС ЫТЙЖФПН.

    фЙРЩ ДПЛХНЕОФПЧ

    SGML ЧЧПДЙФ РПОСФЙЕ ФЙРБ ДПЛХНЕОФБ , Й, УППФЧЕФУФЧЕООП, ПРТЕДЕМЕОЙС ФЙРБ ДПЛХНЕОФБ (document type definition, DTD ). дПЛХНЕОФЩ УЮЙФБАФУС ФЙРЙЪЙТПЧБООЩНЙ, ФБЛ ЦЕ, ЛБЛ Й ДТХЗЙЕ ПВТБВБФЩЧБЕНЩЕ ЛПНРШАФЕТБНЙ ПВЯЕЛФЩ. фЙР ДПЛХНЕОФБ ЖПТНБМШОП ПРТЕДЕМСЕФУС ЕЗП УПУФБЧОЩНЙ ЮБУФСНЙ Й ЙИ УФТХЛФХТПК. пРТЕДЕМЕОЙЕ, ОБРТЙНЕТ, ПФЮЕФБ НПЦЕФ ВЩФШ ФБЛЙН, ЮФП ПО УПУФПЙФ ЙЪ ЪБЗПМПЧЛБ Й, ЧПЪНПЦОП, БЧФПТБ, ЪБ ЛПФПТЩНЙ УМЕДХЕФ БООПФБГЙС Й РПУМЕДПЧБФЕМШОПУФШ ПДОПЗП ЙМЙ ВПМЕЕ БВЪБГЕЧ. мАВПК ДПЛХНЕОФ Ч ПФУХФУФЧЙЕ ЪБЗПМПЧЛБ, Ч УППФЧЕФУФЧЙЙ У ЬФЙН ЖПТНБМШОЩН ПРТЕДЕМЕОЙЕН, ОЕ ВХДЕФ ЖПТНБМШОП СЧМСФШУС ПФЮЕФПН, ФБЛ ЦЕ ЛБЛ ОЕ ВХДЕФ ЙН СЧМСФШУС Й РПУМЕДПЧБФЕМШОПУФШ БВЪБГЕЧ, ЪБ ЛПФПТПК УМЕДХЕФ БООПФБГЙС, ОЕЧЪЙТБС ОБ ФП, ОБУЛПМШЛП РПИПЦ ОБ ПФЮЕФ ФБЛПК ДПЛХНЕОФ У ФПЮЛЙ ЪТЕОЙС ЮЙФБФЕМС-ЮЕМПЧЕЛБ.

    рПУЛПМШЛХ ДПЛХНЕОФЩ ПФОПУСФУС Л ЙЪЧЕУФОЩН ФЙРБН, НПЦОП ЙУРПМШЪПЧБФШ УРЕГЙБМШОХА РТПЗТБННХ, ОБЪЩЧБЕНХА БОБМЙЪБФПТПН (parser ), ДМС ФПЗП, ЮФПВЩ ПВТБВПФБФШ ДПЛХНЕОФ, ХФЧЕТЦДБАЭЙК, ЮФП ПО ПФОПУЙФУС Л ЛПОЛТЕФОПНХ ФЙРХ, Й РТПЧЕТЙФШ, ДЕКУФЧЙФЕМШОП МЙ ЧУЕ ЬМЕНЕОФЩ, ФТЕВХЕНЩЕ ДМС ДБООПЗП ФЙРБ ДПЛХНЕОФПЧ, РТЙУХФУФЧХАФ Й ОБИПДСФУС Ч РТБЧЙМШОПК РПУМЕДПЧБФЕМШОПУФЙ. юФП ЕЭЕ ВПМЕЕ ЧБЦОП, ТБЪОЩЕ ДПЛХНЕОФЩ ПДОПЗП ФЙРБ НПЗХФ ПВТБВБФЩЧБФШУС ХОЙЖЙГЙТПЧБООЩН ПВТБЪПН. нПЦОП РЙУБФШ ВПМЕЕ ЙОФЕММЕЛФХБМШОЩЕ РТПЗТБННЩ, ЙУРПМШЪХАЭЙЕ ЪОБОЙС, ЪБЛМАЮЕООЩЕ Ч ЙОЖПТНБГЙПООПК УФТХЛФХТЕ ДПЛХНЕОФБ.

    оЕЪБЧЙУЙНПУФШ ДБООЩИ

    пУОПЧОБС ГЕМШ РТПЕЛФЙТПЧБОЙС SGML ВЩМБ Ч УПЪДБОЙЙ ЗБТБОФЙК ФПЗП, ЮФП ДПЛХНЕОФ, ЪБЛПДЙТПЧБООЩК УПЗМБУОП ЕЗП РПМПЦЕОЙСН, ВХДЕФ РЕТЕОПУЙНЩН У ПДОПК БРРБТБФОПК Й РТПЗТБННОПК УТЕДЩ Ч ДТХЗХА ВЕЪ РПФЕТЙ ЙОЖПТНБГЙЙ. дЧБ ЕЗП УЧПКУФЧБ, ПРЙУБООЩИ ЧЩЫЕ, ПФЧЕЮБАФ ЬФПНХ ФТЕВПЧБОЙА ОБ БВУФТБЛФОПН ХТПЧОЕ; ФТЕФШЕ УЧПКУФЧП -- ОБ ХТПЧОЕ УФТПЮЕЛ ВБКФПЧ (УЙНЧПМПЧ), ЛПФПТЩЕ УПУФБЧМСАФ ДПЛХНЕОФ. SGML РТЕДПУФБЧМСЕФ ПВПВЭЕООЩК НЕИБОЙЪН УФТПЛПЧПК РПДУФБОПЧЛЙ , ФП ЕУФШ, РТПУФПК НБЫЙООП-ОЕЪБЧЙУЙНЩК УРПУПВ ХЛБЪБОЙС, ЮФП ЛПОЛТЕФОБС УФТПЛБ УЙНЧПМПЧ Ч ДПЛХНЕОФЕ Ч НПНЕОФ ПВТБВПФЛЙ ДПЛХНЕОФБ ДПМЦОБ ЪБНЕОСФШУС ОБ ОЕЛПФПТХА ДТХЗХА УФТПЛХ. пДОП ПЮЕЧЙДОПЕ РТЙНЕОЕОЙЕ ЬФПНХ НЕИБОЙЪНХ -- ПВЕУРЕЮЕОЙЕ ЕДЙОПК ФЕТНЙОПМПЗЙЙ; ДТХЗПЕ, Й ВПМЕЕ ЪОБЮЙФЕМШОПЕ, -- РТПФЙЧПДЕКУФЧЙЕ ЙЪЧЕУФОПК ОЕУРПУПВОПУФЙ ТБЪОЩИ ЛПНРШАФЕТОЩИ УЙУФЕН РПОЙНБФШ ОБВПТЩ УЙНЧПМПЧ ДТХЗ ДТХЗБ, ОБРТЙНЕТ, ПДОПК УЙУФЕНЕ РТЕДУФБЧМСФШ ЧУЕ ЗТБЖЙЮЕУЛЙЕ УЙНЧПМЩ, ОЕПВИПДЙНЩЕ РТЙМПЦЕОЙА, РХФЕН ПРЙУБФЕМШОПЗП ПФПВТБЦЕОЙС ОЕРЕТЕДБЧБЕНЩИ УЙНЧПМПЧ. уФТПЛЙ, ПРТЕДЕМСЕНЩЕ ЬФЙН НЕИБОЙЪНПН, ОБЪЩЧБАФУС УХЭОПУФСНЙ (entities).

    п РТЕЙНХЭЕУФЧБИ

    юФП ДБЕФ ЙУРПМШЪПЧБОЙЕ SGML Ч ТЕБМШОПК ЦЙЪОЙ? нОЕ ПОП УТБЪХ ДБМП ЧПЪНПЦОПУФШ РТПЙЪЧПДЙФШ ДПЛХНЕОФЩ Ч МАВПН ФТЕВХЕНПН ЧЙДЕ. хДПВОП ПЛБЪБМПУШ Й ОБРЙУБОЙЕ "ЧПТДПЧЩИ" ВХНБЦЕЛ Ч РТЙЧЩЮОПК УТЕДЕ XEmacs ВЕЪ ЙУРПМШЪПЧБОЙС Windows. чУЕ ЙУРПМШЪПЧБООЩЕ РТПЗТБННЩ -- ВЕУРМБФОЩ Й ТБУРТПУФТБОСАФУС Ч ЙУИПДОЩИ ФЕЛУФБИ, ЮФП РПЪЧПМЙМП ХУФБОПЧЙФШ ЙИ ОБ ЧУЕИ ЙУРПМШЪХЕНЩИ НОПК УЙУФЕНБИ. рТЙЮЕН ПЛБЪБМПУШ, ЮФП ОБЮБФШ ТБВПФБФШ У SGML ЧПЧУЕ ОЕ УМПЦОП, ЛБЦДЩК, ЛФП ИПФШ ТБЪ ТЕДБЛФЙТПЧБМ WWW УФТБОЙЮЛХ, ОЕ ЙУРХЗБЕФУС ЧЙДБ ЛПОУФТХЛГЙК SGML.

    рПФПН ХЦЕ, РП НЕТЕ РПУФЕРЕООПЗП ЙЪХЮЕОЙС SGML, С ПУПЪОБМ, ЮФП ЬФБ ФЕИОЙЛБ ДБЕФ ЗТПНБДОПЕ ЛПМЙЮЕУФЧП ЧПЪНПЦОПУФЕК РП УТБЧОЕОЙА У ФЙРЙЮОПК "ОБУФПМШОПК ФЙРПЗТБЖЙЕК":

    рТПДХЛФЙЧОПУФШ юЕФЛП ТБЪДЕМЕООЩЕ РТПГЕУУЩ ЧЧПДБ ЙОЖПТНБГЙЙ Й ЕЕ ЖПТНБФЙТПЧБОЙС РПЪЧПМСАФ БЧФПТХ УПУТЕДПФПЮЙФШУС ОБ ЙЪМПЦЕОЙЙ НЩУМЕК, ОЕ ПФЧМЕЛБСУШ ОБ ДЧЙЗБОЙЕ ФЕЛУФБ РП ЬЛТБОХ Й РПДВПТ УФЙМЕК.

    еДЙОБС УФЙМЙУФЙЛБ мЕЗЛП ЧЩДЕТЦЙЧБФШ ТБЪМЙЮОЩЕ ДПЛХНЕОФЩ Ч ЕДЙОПН УФЙМЕ, ЙУРПМШЪХС ЕДЙОХА ФЕТНЙОПМПЗЙА. еУМЙ УФЙМШ ЙМЙ ФЕТНЙОЩ ОХЦОП ЙЪНЕОЙФШ, ЬФП ДЕМБЕФУС ТБЪПН ЧП ЧУЕИ ДПЛХНЕОФБИ, ОЕ ФТПЗБС ЙИ УПДЕТЦЙНПЕ.

    рПЧФПТОПЕ ЙУРПМШЪПЧБОЙЕ ьФПФ ФЕТНЙО, ИПТПЫП ЪОБЛПНЩК РТПЗТБННЙУФБН, ПЪОБЮБЕФ ОБМЙЮЙЕ ЧПЪНПЦОПУФЙ ЙУРПМШЪПЧБФШ ДЕФБМЙ УФБТЩИ РТПЕЛФПЧ Ч ОПЧЩИ, У НЙОЙНБМШОЩНЙ ЙЪНЕОЕОЙСНЙ. юБУФШ ДПЛХНЕОФБ, ПЖПТНМЕООБС Ч ЧЙДЕ SGML-ЬМЕНЕОФБ, НПЦЕФ РЕТЕОПУЙФШУС Ч ДТХЗЙЕ ДПЛХНЕОФЩ, МЕЗЛП РПЧФПТСФШУС Ч ТБЪОЩИ НЕУФБИ ФЕЛУФБ.

    дПМЗПЧЕЮОПУФШ ЙОЖПТНБГЙЙ йЪ-ЪБ ФПЗП, ЮФП SGML -- РТПУФПК Й УФБОДБТФОЩК ЖПТНБФ ИТБОЕОЙС ДБООЩИ, ПФУХФУФЧХЕФ ОЕПВИПДЙНПУФШ РЕТЕЖПТНБФЙТПЧБФШ ЙИ ЧЧЙДХ ХУФБТЕЧБОЙС БРРБТБФОПК ЙМЙ РТПЗТБННОПК РМБФЖПТНЩ. йОЖПТНБГЙС РТПУФП ДПУФХРОБ ОБЧУЕЗДБ. пОБ ОЕУЕФ У УПВПК ЧУЕ ОЕПВИПДЙНПЕ ДМС УПЪДБОЙС ДПЛХНЕОФБ.

    мХЮЫЕЕ ХРТБЧМЕОЙЕ ДБООЩНЙ у SGML НПЦОП ПРТЕДЕМСФШ ЙОЖПТНБГЙПООЩЕ ЬМЕНЕОФЩ Й НБОЙРХМСГЙЙ У ОЙНЙ У РТПЙЪЧПМШОПК УФЕРЕОША ДЕФБМШОПУФЙ. тБЪНЕЮЕООЩЕ ЬМЕНЕОФЩ НПЗХФ ЙНЕФШ БФТЙВХФЩ, ПРТЕДЕМСАЭЙЕ ИБТБЛФЕТЙУФЙЛЙ Й УЧПКУФЧБ ЬМЕНЕОФПЧ. ьФБ ЙОЖПТНБГЙС ОЕ РТЕДОБЪОБЮЕОБ ДМС РЕЮБФЙ, ОП НПЦЕФ РПНПЮШ Ч ХРТБЧМЕОЙЙ ЬМЕНЕОФБНЙ ДБООЩИ. оБРТЙНЕТ, БФТЙВХФ ID (ЙДЕОФЙЖЙЛБФПТ) НПЦЕФ ХОЙЛБМШОЩН ПВТБЪПН ЙДЕОФЙЖЙГЙТПЧБФШ ПДЙО БВЪБГ, ЙМЙ ГЕМЩК ТБЪДЕМ, РТЙНЕЮБОЙЕ, ЙММАУФТБГЙА, ЪБДБОЙЕ, -- МАВПК ЬМЕНЕОФ, ЛБЛ Ч ЬФПН РТЙНЕТЕ:

    йОЖПТНБГЙС
    фБЛ ЛБЛ ЙДЕОФЙЖЙЛБФПТЩ СЧМСАФУС НБЫЙООП-ЮЙФБЕНЩНЙ, ПОЙ НПЗХФ УЧСЪЩЧБФШ НЕЦДХ УПВПК ЙОЖПТНБГЙА Й ЙУРПМШЪПЧБФШУС ДМС ТБЪОППВТБЪОПЗП ХРТБЧМЕОЙС ЕК. оБРТЙНЕТ:
    • лПОФТПМЙТПЧБФШ ВЕЪПРБУОПУФШ ДПУФХРБ Л ЙОЖПТНБГЙЙ, РПЪЧПМСС ФПМШЛП ПРТЕДЕМЕООЩН МАДСН РТПУНБФТЙЧБФШ ЙМЙ ЙЪНЕОСФШ ЕЕ.
    • бЧФПНБФЙЪЙТПЧБФШ РЕТЕНЕЭЕОЙЕ ЙОЖПТНБГЙЙ -- ОБРТЙНЕТ, ПВОПЧМЕОЙЕ ДБООЩИ Ч ПДОПН НЕУФЕ НПЦЕФ ЙОЙГЙЙТПЧБФШ ПВОПЧМЕОЙЕ ФПК ЦЕ ЙОЖПТНБГЙЙ Ч ДТХЗЙИ РТЙМПЦЕОЙСИ.

    тБЪДЕМСЕНПУФШ чПЪНПЦОПУФШ ТБВПФЩ УП УФТХЛФХТЙТПЧБООЩНЙ ЛПНРПОЕОФБНЙ ДПЛХНЕОФБ РПЪЧПМСЕФ УФТПЙФШ ГЕМЩК ДПЛХНЕОФ ЙЪ УПУФБЧОЩИ ЮБУФЕК, ТБЪВТПУБООЩИ РП ПТЗБОЙЪБГЙЙ. ьФП РПЪЧПМСЕФ РПМШЪПЧБФЕМСН ДЕМЙФШУС ЙОЖПТНБГЙЕК ВЕЪ ЕЕ ДХВМЙТПЧБОЙС.

    нПВЙМШОПУФШ ч ЙОЖПТНБГЙПООЩИ УЕФСИ, ПВЯЕДЙОСАЭЙИ ТБЪОППВТБЪОЩЕ ЛПНРШАФЕТЩ, ПРЕТБГЙПООЩЕ УЙУФЕНЩ Й РТЙМПЦЕОЙС, НПВЙМШОПУФШ УФБОПЧЙФУС ЛМАЮПН ЛП ЧУЕПВЭЕК ДПУФХРОПУФЙ ЙОЖПТНБГЙЙ. рПУЛПМШЛХ SGML ОЕ ЪБЧЙУЙФ ПФ БРРБТБФХТЩ Й РТЙМПЦЕОЙК, НПЦОП МЕЗЛП ПВНЕОЙЧБФШУС ДПЛХНЕОФБНЙ НЕЦДХ ТБЪМЙЮОЩНЙ УЙУФЕНБНЙ.

    зЙВЛПУФШ Ч РТЙМПЦЕОЙЙ SGML РПЪЧПМСЕФ ЙУРПМШЪПЧБФШ ЙОЖПТНБГЙА ДБМЕЛП ЪБ ТБНЛБНЙ "ОБУФПМШОПК ФЙРПЗТБЖЙЙ". оБРТЙНЕТ:

    • УФТБОЙГЩ WWW;
    • ЙОЖПТНБГЙПООЩЕ ВБЪЩ ДБООЩИ;
    • ДЙБЗОПУФЙЮЕУЛЙЕ / ЬЛУРЕТФОЩЕ УЙУФЕНЩ;
    • ЬМЕЛФТПООБС РПЮФБ;
    • ЗЙРЕТФЕЛУФПЧБС ДПЛХНЕОФБГЙС;
    • РХВМЙЛБГЙЙ ОБ CD-ROM;
    • ЙОФЕТБЛФЙЧОЩЕ ЬМЕЛФТПООЩЕ НБОХБМЩ.
    рПЮЕНХ SGML?

    рПЮЕНХ ОЕ Word? рПФПНХ, ЮФП ЬФП ЪБЛТЩФЩК ЖПТНБФ. рПФПНХ, ЮФП ЬФП ЖПТНБФ ПДОПЗП РТЙМПЦЕОЙС. рПФПНХ, ЮФП ЬФПЗП РТЙМПЦЕОЙС ОЕФ РПД АОЙЛУБНЙ, У ЛПФПТЩНЙ С ТБВПФБА. рПФПНХ, ЮФП ЬФП ОЕ ФЕЛУФПЧЩК ЖПТНБФ. рПФПНХ, ЮФП ОЕФ УТЕДУФЧ БЧФПНБФЙЮЕУЛПК ЗЕОЕТБГЙЙ ФБЛЙИ ДПЛХНЕОФПЧ. рПФПНХ, ЮФП ОЕФ ФПМЛПЧЩИ УТЕДУФЧ ХРТБЧМЕОЙС ЧЕТУЙСНЙ Й ЛПММЕЛФЙЧОПК ТБВПФЩ. рПФПНХ, ЮФП ЬФП ЖПТНБФ ТБЪНЕФЛЙ РЕЮБФЙ, Б ОЕ УНЩУМПЧПК УФТХЛФХТЩ, Й ОЕФ ЧПЪНПЦОПУФЙ ЙИ УППФОПУЙФШ. рПФПНХ, ЮФП РТЙ ЬЛУРПТФЕ РПМХЮБЕФУС УПЧЕТЫЕООП ОЕХДПЧМЕФЧПТЙФЕМШОЩК HTML. рПФПНХ, ЮФП ЛБЮЕУФЧП ЧЕТУФЛЙ Й РЕЮБФЙ ОЙЦЕ УТЕДОЕЗП.

    рПЮЕНХ ОЕ T E X? рПФПНХ, ЮФП ЬФП УМЙЫЛПН ОЙЪЛПХТПЧОЕЧЩК СЪЩЛ. еЗП ОЕ ДБЫШ Ч ТХЛЙ ОБЮЙОБАЭЕНХ. рПФПНХ, ЮФП ЬФП ЖПТНБФ ТБЪНЕФЛЙ РЕЮБФЙ, Б ОЕ УНЩУМПЧПК УФТХЛФХТЩ . рПФПНХ, ЮФП НБМП T E X-ПТЙЕОФЙТПЧБООЩИ ТЕДБЛФПТПЧ. рПФПНХ, ЮФП ОЕФ ХДПЧМЕФЧПТЙФЕМШОЩИ УТЕДУФЧ ЬЛУРПТФБ Ч Word.

    рПЮЕНХ ОЕ HTML? рПФПНХ, ЮФП УБНП РПОСФЙЕ HTML УЙМШОП ТБЪНЩФП ЗПОЛПК WWW ЪБ ЛПННЕТГЙЕК Й ЧПКОПК РТПЙЪЧПДЙФЕМЕК ВТБХЪЕТПЧ ДТХЗ У ДТХЗПН. рПФПНХ, ЮФП HTML УФТБДБЕФ ЧУЕ ФЕН ЦЕ ОЕДПУФБФЛПН: ПТЙЕОФЙТПЧБО ОБ РТЕДУФБЧМЕОЙЕ, Б ОЕ ОБ УФТХЛФХТХ. рПФПНХ, ЮФП ПО ПЮЕОШ ВЕДЕО ЧЩТБЪЙФЕМШОЩНЙ УТЕДУФЧБНЙ, Й ПФУХФУФЧХАФ ЧПЪНПЦОПУФЙ ЕЗП ТБУЫЙТЕОЙС. рПФПНХ, ЮФП ОЕ ТЕЫЕОБ РТПВМЕНБ ЛПТТЕЛФОПК ТХУЙЖЙЛБГЙЙ. рПФПНХ, ЮФП ОЕФ ХДПЧМЕФЧПТЙФЕМШОЩИ УТЕДУФЧ ЬЛУРПТФБ Ч Word.

    SGML РТПФЙЧ WYSIWYG

    дМС ФЕИ, ЛФП РТЙЧЩЛ РПМШЪПЧБФШУС ФПМШЛП "word processor"-БНЙ, ОБРТЙНЕТ, MS Word ЙМЙ WordPerfect, НПЦЕФ ВЩФШ ЙОФЕТЕУОП УПРПУФБЧМЕОЙЕ ЙИ У SGML ЙОУФТХНЕОФБНЙ. ьФЙ ДЧЕ ЗТХРРЩ РТПЗТБННОЩИ УТЕДУФЧ, ОЕУНПФТС ОБ УИПЦЕУФШ ТЕЫБЕНЩИ ЪБДБЮ -- РТПЙЪЧПДУФЧП ДПЛХНЕОФПЧ -- ЧЕУШНБ ДТХЗ ПФ ДТХЗБ ПФМЙЮБАФУС РП БТИЙФЕЛФХТЕ Й ЖХОЛГЙСН.

    Word processor -- ЬФП ЙОФЕММЕЛФХБМШОБС РЙЫХЭБС НБЫЙОЛБ. пО ПТЙЕОФЙТПЧБО ОБ ТБВПФХ У ЧЙЪХБМШОЩН РТЕДУФБЧМЕОЙЕН ФЕЛУФБ, ИБТБЛФЕТЙЪХАЭЕЗПУС ОБВПТПН УФЙМЕК: УФЙМЕК УЙНЧПМПЧ (ЫТЙЖФ, ЛЕЗМШ, ОБЮЕТФБОЙЕ), БВЪБГЕЧ (ЛТБУОБС УФТПЛБ, ЧЩТБЧОЙЧБОЙЕ, РПМПЦЕОЙЕ РП ЫЙТЙОЕ УФТБОЙГЩ), УФТБОЙГ (ЛПМПОФЙФХМЩ, УОПУЛЙ), ТБЪДЕМПЧ Й ДПЛХНЕОФПЧ (ЖПТНБФ ВХНБЗЙ, ПЗМБЧМЕОЙЕ), Й РТПЮЙИ. Word processor ОЕ ТБВПФБЕФ У ЧОХФТЕООЕК УФТХЛФХТПК ДПЛХНЕОФБ.

    SGML ТЕДБЛФПТ, ОБРТПФЙЧ, ПТЙЕОФЙТПЧБО ОБ ТБВПФХ У УПДЕТЦЙНЩН ДПЛХНЕОФБ. дМС SGML ТЕДБЛФПТБ, ОБРТЙНЕТ, ТБЪДЕМ -- ЬФП ЬМЕНЕОФ, Ч ЛПФПТЩК НПЗХФ ЧЛМАЮБФШУС РПДТБЪДЕМЩ, Б ОЕ РТПНЕЦХФПЛ ПФ ПДОПЗП БВЪБГБ, ОБВТБООПЗП УФЙМЕН "ъБЗПМПЧПЛ" ДП ДТХЗПЗП, ЛБЛ ДМС word processor-a.

    ьФП РПЪЧПМСЕФ БЧФПТХ УПУТЕДПФПЮЙФШУС ОБ УПДЕТЦБОЙЙ ФЕЛУФБ, Б ОЕ ЧПЪЙФШУС У ЕЗП ЖПТНБФЙТПЧБОЙЕН Й ЧЩВПТПН УФЙМЕК. чЙЪХБМШОБС УФЙМЙУФЙЛБ ДПЛХНЕОФБ ПРТЕДЕМСЕФУС РТЙ ЕЗП ЬЛУРПТФЕ Ч ЧЩИПДОЩЕ ЖПТНБФЩ, Б ОЕ РТЙ ОБВПТЕ ФЕЛУФБ.

    п РТПЗТБННОПН ПВЕУРЕЮЕОЙЙ

    юФПВЩ ОБЮБФШ ТБВПФБФШ У ДПЛХНЕОФБНЙ Ч SGML РПМШЪПЧБФЕМА ОХЦОЩ ДЧБ ПУОПЧОЩИ УТЕДУФЧБ: ТЕДБЛФПТ Й УТЕДУФЧБ ЬЛУРПТФБ (ЖПТНБФЙТПЧБОЙС).

    SGML-ТЕДБЛФПТ

    SGML-ТЕДБЛФПТ ПФМЙЮБЕФУС ЛБЛ ПФ РТЙЧЩЮОЩИ ФЕЛУФПЧЩИ ТЕДБЛФПТПЧ, ФБЛ Й ПФ "word processor"-ПЧ. пФ РЕТЧЩИ -- ОБМЙЮЙЕН РПДДЕТЦЛЙ УФТХЛФХТЙТПЧБООЩИ ДПЛХНЕОФПЧ, ПФ ЧФПТЩИ -- ПФУХФУФЧЙЕН РПДДЕТЦЛЙ ЧЙЪХБМШОПЗП ЖПТНБФЙТПЧБОЙС. тЕДБЛФПТ ТБЪВЙТБЕФ DTD ТЕДБЛФЙТХЕНПЗП ДПЛХНЕОФБ Й "ЧЕДЕФ" РПМШЪПЧБФЕМС Ч УППФЧЕФУФЧЙЙ У ОЙН. оБРТЙНЕТ, ЕУМЙ DTD РТЕДХУНБФТЙЧБЕФ ЬМЕНЕОФ , Ч ЛПФПТПН НПЗХФ ЧУФТЕЮБФШУС ФПМШЛП ЬМЕНЕОФЩ ЙМЙ , ФП РПМШЪПЧБФЕМА, ТЕДБЛФЙТХАЭЕНХ ЬМЕНЕОФ , ВХДЕФ РТЕДМПЦЕОП ЧУФБЧЙФШ ПДЙО ЙЪ ЬФЙИ ДЧХИ ТБЪТЕЫЕООЩИ ЬМЕНЕОФПЧ. SGML-ТЕДБЛФПТ ФБЛЦЕ ПВЩЮОП УПДЕТЦЙФ УТЕДУФЧБ ОБЧЙЗБГЙЙ РП ЙЕТБТИЙЙ ДПЛХНЕОФ.

    йЪ ЮЙУМБ РПРХМСТОЩИ SGML-ТЕДБЛФПТПЧ НПЦОП ОБЪЧБФШ ArborText ADEPT*Editor , SoftQuad Author/Editor , psgml , Adobe FrameMaker+SGML , Corel WordPerfect , Й НОПЦЕУФЧП ДТХЗЙИ.

    уТЕДУФЧБ ЖПТНБФЙТПЧБОЙС

    уХЭЕУФЧХЕФ НОПЦЕУФЧП УТЕДУФЧ ТБВПФЩ У SGML ФЕЛУФБНЙ. вóМШЫХА ЙИ ЮБУФШ УПУФБЧМСАФ УТЕДУФЧБ ЖПТНБФЙТПЧБОЙС -- ЬЛУРПТФБ SGML Ч ДТХЗЙЕ ЖПТНБФЩ ДМС РЕЮБФЙ, РТПУНПФТБ Й Ф.Р. чЩИПДОЩЕ ЖПТНБФЩ НПЗХФ ВЩФШ МАВЩНЙ, ЪБЧЙУС МЙЫШ ПФ ДПУФХРОПЗП РТПЗТБННОПЗП ПВЕУРЕЮЕОЙС Й ОХЦД РПМШЪПЧБФЕМС. оБРТЙНЕТ, С ЙУРПМШЪХА ЛПОЧЕТФЕТЩ Ч HTML, RTF Й L A T E X.