ГОСТ Р 52292-2004 Информационная технология. Электронный обмен информацией стр. 8

В цифровой среде информация представляется в виде битовой строки - набора нулей и единиц. Понимание этой информации (ее интерпретация) относится к сфере деятельности человека. В самой цифровой (и электронной) среде "понимание" информации отсутствует. В этой среде могут быть заданы (человеком) только формальные правила обработки данных.
Иначе данные можно определить как реализацию ЭлД в цифровой среде. Данные состоят из упорядоченной последовательности блоков - элементов. Для каждого элемента должен быть задан его тип, позволяющий интерпретировать (понимать) данные. Тип элемента данных не является свойством данных, а предписывается человеком в стандартах, спецификациях и других технических документах. Один и тот же элемент данных может интерпретироваться различными способами, т.е. ему может быть предписано несколько разных типов. Например, последовательность из 16 бит может быть интерпретирована как двоичное, восьмиричное, десятичное, шестнадцатиричное число, код символа (буквы) или машинной команды. Каждой из этих интерпретаций соответствует свой способ воспроизведения данных, свой набор допустимых операций и значений. Тип данных может использоваться для определения аппаратного, программного обеспечения или другого оборудования, необходимого для воспроизведения или работы с этими данными.
Часть интерпретации данных, представляемая в виде формальных правил, может быть введена в компьютер, а также представлена в виде формализованного алгоритма. Это не означает, что компьютер будет "понимать" информацию. Он будет лишь выполнять заданные команды.
Примечание - Правила обработки данных (алгоритм) сами являются информацией, которая в цифровой среде может быть представлена только в виде данных.
Воспроизведение данных в виде битовой строки неудобно для восприятия человеком. Поэтому обычно данные воспроизводятся в другом, удобном для восприятия, виде. Этот вид определяется типом данных, который предписан для конкретного элемента данных: буква, число, текст, изображение, аудиозапись и т.д.
Примечание - Воспроизведение является одним из методов интерпретации данных. Обычно эта часть интерпретации передается компьютеру.
Пример - Может быть задано, что некоторый элемент данных (в форме нулей и единиц) должен интерпретироваться как дата. Интерпретация этого элемента данных компьютером может означать, что в компьютер введена программа, обеспечивающая такое преобразование данных, что они могут быть выведены на экран в виде, понятном человеку. Иначе, в компьютер может быть введена программа, которая проверяет значение элемента данных и при определенных условиях (равенство заданному значению или превышение заданного значения) передает управление другой программе.
Тип составного элемента данных является упорядоченной последовательностью типов его подэлементов.
Текст является привычным для человека представлением информации в аналоговой среде. Интерпретация этого представления основывается на знаниях читателя: чтобы прочитать текст, нужно, как минимум, знать язык, на котором он написан. Для понимания текста нужно иметь знания в той предметной области, к которой он относится.
Текст в привычном для человека понимании мало пригоден для автоматизированной обработки компьютерными программами. Для того чтобы компьютерная программа могла интерпретировать и соответствующим образом обрабатывать текст, он должен содержать специальные, невидимые человеку при "обычном" воспроизведении, знаки, которые называются разметкой (термин 6.4.6).
Типы данных, определенные в различных стандартах (цифра, буква, знак, число, изображение, аудиоданные, видеоданные, аудиовизуальные данные), являются предписанием для интерпретации одного и того же базового представления данных в цифровой среде - битовой строки. Формат данных конкретизирует метод интерпретации битовой строки, задавая такие детали, как размеры отдельных полей, способы визуализации (в общем случае - воспроизведения) данных и т.п.
Б.7 Подраздел 6.2
Определение атрибута объекта электронной или цифровой среды должно, как правило, содержать имя атрибута, его формат (или, как минимум, тип).
Сервисные атрибуты не обязательно являются элементами данных ЭлД. Например, атрибуты "имя файла", "дата создания файла", "размер файла" и т.п., характеризующие конкретную реализацию ЭлД, не обязательно должны присутствовать в данных документа.
Различие между справочными и сервисными атрибутами имеет принципиальный характер: справочные атрибуты описывают документ как объект социальной среды, сервисные - реализацию документа как материального предмета или процесса в конкретной среде существования. Например, атрибут "дата создания документа" относится к документу, характеризует момент появления документа независимо от формы, в которой документ был первоначально создан и существует в текущий момент, и должен пониматься в таком смысле, независимо от технической реализации. С другой стороны, атрибут "имя файла" носит чисто технический характер, его интерпретация зависит от реализации (например, в разных операционных системах "имя файла" может по-разному обрабатываться) и поэтому является сервисным атрибутом. Как следствие "имя файла", как и любой другой сервисный атрибут, не может быть реквизитом документа, а "дата создания документа" - может.
Примечание - В практике использования распределенных информационных сетей (Интернет) различие между сервисными и справочными атрибутами соответствует различию между URL и URI, интерпретация первого из которых зависит от технической реализации, а второй описывает документ независимо от текущей технической реализации.
Б.8 Подраздел 6.3
Устанавливаемые в формате ограничения типа данных могут относиться к любой составляющей определения этого типа: к диапазону допустимых значений данных, к допустимым способам воспроизведения, к допустимым операциям, к интерпретации значений. Например, если тип данных целое число, то формат может ограничить допустимый диапазон значениями от 0 до 23 включительно. Возможные способы воспроизведения значений могут быть ограничены двузначными цифрами без знака с наличием или отсутствием незначащего нуля для чисел меньше 10. Допустимые операции над такими числами могут быть ограничены арифметическими действиями по модулю 24. Тогда эти данные (целое число) можно интерпретировать как количество целых часов, прошедших с начала суток.
Примечание - Так как допустимый формат данных определяется их типом, то на практике при автоматизированной обработке данных часто решается обратная задача: по формату данных определяется их тип и выбирается устройство и способ воспроизведения данных.
Так как тип составного элемента данных является упорядоченной последовательностью типов его подэлементов (Б.9), то формат составного элемента данных является упорядоченной последовательностью форматов его подэлементов. Таким образом, форма определяет последовательную организацию данных в терминах их компонентов.
Б.9 Подраздел 6.4
В соответствии с моделью ВОС (см. Б.3 и ГОСТ Р ИСО/МЭК 7498-1) специфика прикладных данных (их семантика) связана только с верхними уровнями модели (прикладным уровнем и уровнем представления); с уровня представления нижележащему (сеансовому) уровню весь объект уровня представления передается как единое целое (атрибут "значение данных уровня представления" - ЗДП). Следовательно, вся специфика ЭлД находится на уровне представления (и выше), а ниже он обрабатывается "на общих основаниях" - как и любой другой поток данных согласно правилам электронной среды - и, соответственно, имеет унифицированные на этом уровне атрибуты, интерпретация которых не зависит от передаваемых данных.
Таким образом, ниже уровня представления реализации ЭлД выглядят как и реализации любых других объектов: данные плюс сервисные атрибуты этого уровня.
На уровне представления реализация ЭлД выглядит как набор атрибутов: содержимое плюс сервисные атрибуты уровня представления. Само содержимое является элементом данных (уровня представления) и ничем не отличается от других атрибутов, т.е. содержимое является атрибутом ЭлД уровня представления.
Следовательно, формат ЭлД следует определять только на уровне представления - форматы реализаций нижележащих уровней получаются из формата реализации ЭлД на уровне представления на основе формальных преобразований.
Формат ЭлД (следовательно, форматы и последовательность его атрибутов) определяется его типом и не зависит от его содержания.
Б.10 Подраздел 7.1
Активизированный электронный документ является динамическим процессом последовательных преобразований некоторого множества сигналов.