Для тех, кто не в курсе,
Moving Picture
Experts Group (MPEG) — это рабочая группа, которая совместно с
Международной организацией по стандартизации
(International Standards Organization, ISO/IEC)
трудится над стандартами кодирования цифрового аудио и видео.
Она занимается созданием и внедрением
нескольких аудио- и видеостандартов, включая алгоритмы компрессии, схемы
обработки данных и инструментальные платформы.
Больше всего эту группу знают, наверное, как
разработчика схемы компрессии MPEG-1 Audio Layer 3 (MP3), но она создала и
ряд других технологических стандартов, которыми мы, сами того не подозревая,
ежедневно пользуемся, когда смотрим телевизор и работаем с компьютером.
MPEG движется поэтапно и к настоящему моменту
выпустила стандарт хранения и воспроизведения видео и аудио MPEG-1; стандарт
цифрового телевидения MPEG-2 и стандарт мультимедиа-приложений
MPEG-4.
В стадии разработки находится стандарт
представления контента MPEG-7, включающий в себя «интерфейс описания
мультимедийного контента».
Стандарт
MPEG-4
Работа над
стандартом MPEG-4 «Кодирование
аудиовизуальных объектов» началась в 1993 году, а первый набор стандартов (версия
1) был утвержден в октябре 1998 года. Значительное расширение этого
стандарта (версия 2) было утверждено в 1999 году. В том же году
MPEG-4 получил официальный статус стандарта
ISO/IEC, несмотря на продолжающуюся разработку расширений по определенным
разделам.
Целью
MPEG-4 было создание стандарта кодирования
на основе объектов, который обеспечил бы авторов, сервис-провайдеров и
конечных пользователей гибкими средствами работы с мультимедийным контентом.
Кроме натурального аудио- и видеоконтента (аудио- и видеозаписей), стандарт
MPEG-4 работает с синтезированными (сгенерированными
на компьютере) аудио- и видеообъектами.
MPEG-4 обеспечивает необходимые средства
для описания взаимного расположения таких объектов в пространстве и времени
с целью их интерактивной доставки. Кроме того, при разработке стандарта
MPEG-4 решались проблемы обеспечения
воспроизведения таких объектов в различных условиях. Был разработан формат,
допускающий «универсальный доступ» к мультимедийной информации с учетом
возможных ограничений полосы пропускания, возникающих в сетях при самых
разных условиях.
Стандарт
MPEG-4 подразделяется на три главных
раздела: видео, аудио и системы. Первоначально стандарт предназначался для
решения нескольких задач, возникших в связи с быстрым развитием
интерактивных технологий: универсальный доступ и распространение в
ненадежной среде; широкие интерактивные функциональные возможности;
кодирование натуральных и синтезированных данных; эффективная компрессия и
др.
Системный раздел стандарта выполняет роль
клея, на котором держится композиция
MPEG-4; в него входят инструкции по
воспроизведению интерактивного контента и взаимному размещению объектов. Это
существенное развитие стандарта
MPEG-4 по сравнению с предыдущими
стандартами MPEG, представлявшими собой относительно линейные технологии, не
решавшие проблем интерактивности, характерных для CD-ROM, DVD-ROM, интернета
и т.п.
Видеофункции
MPEG-4
В основу видеофункций стандарта
MPEG-4 была положена технология
Apple Quicktime; эти функции обслуживают широкий набор форматов и
значений скорости передачи данных. Они охватывают методы прогрессивного и
чересстрочного сканирования, произвольные значения пространственного
разрешения в диапазоне от 8*8 до 2048*2048 и скорости передачи данных в
диапазоне от 5 Кбит/с до 10 Мбит/с.
В
MPEG-4 усовершенствована и компрессия,
качество и эффективность которой повышены при всех поддерживаемых значениях
скорости передачи данных.
В принципе,
MPEG-4 осуществляет компрессию обычных и
видеоизображений теми же методами, что и MPEG-1/2. Эти методы заключаются в
том, что сначала осуществляется прогнозирование движения для следующего
видеокадра, а затем выполняется кодирование текстуры.
При реализации традиционных методов
кодирования в
MPEG-4 поддерживается гораздо более широкий
диапазон значений частоты кадров, а дальнейшие разработки направлены на
полную замену методов, устанавливаемых стандартом MPEG-2.
Кроме традиционного кодирования, основанного
на прямоугольных кадрах,
MPEG-4 обеспечивает возможность
индивидуально кодировать специфические медиаэлементы в рамках сюжета. Так
как разные объекты, используемые в сюжете, могут иметь разную природу (текстурный
фон, персонажи переднего плана), независимые инструменты компрессии,
используемые для разных типов контента, позволяют добиться более высокой ее
эффективности.
Индивидуальные объекты
Основная задача
MPEG-4 — не компрессия прямоугольных
видеокадров, как у предыдущих стандартов MPEG. В отличие от линейных
механизмов кодирования кадров MPEG-1 и MPEG-2, стандарт
MPEG-4 использует принцип кодирования
индивидуальных объектов произвольной формы.
Кодирование формы, или альфа-канала, означает,
что произвольная форма в сцене
MPEG-4 может отслеживаться посредством
двоичной альфа-карты, определяющей принадлежность данного пиксела к объекту.
Это особенно полезно для разработчиков интерактивного контента по нескольким
причинам.
Во-первых, видеоинформация
необязательно должна быть оформлена в виде прямоугольных кадров.
Во-вторых, применяя раздел
MPEG-4 Systems, индивидуально
закодированные видеоформы можно интегрировать с другими объектами, такими
как 2D-, 3D- или естественный видеофон, образуя сцены.
Наконец, особый интерес для
разработчиков интерактивного контента представляет возможность использования
отдельных объектов в качестве элементов интерактивного действия. Примерами
могут служить простые взаимосвязи в рамках сюжета или смоделированные
персонажи, реагирующие на действия пользователя.
Результатом такой объектной ориентации стала
возможность интеграции естественных и синтетических видеоисточников.
Стандарт
MPEG-4 содержит средства интеграции для
кодирования растровых видеоизображений и средства создания и интеграции
синтезированных 2D- и 3D-элементов, включая геометрические формы и объекты,
текст и синтезированную графику. Стандартизованные в
MPEG-4 параметры физиономической анимации
позволяют маркировать и анимировать синтезированные персонажи.
Интерактивность — главное
преимущество, которого добивались разработчики
MPEG-4
Интерактивное взаимодействие медиаобъектов в
видеопотоке подчиняется параметрам, устанавливаемым автором сюжета. Диапазон
интерактивных возможностей в сюжете
MPEG-4 охватывает такие действия, как
навигация, зависящая от точки зрения (с соответствующим изменением аудио- и
видеопотоков); движение объектов в пределах сюжета; выбор национального
языка и т.п.
Версия ZDNET на русском языке
издается по лицензии CNET Networks, Inc., San Francisco, CA, USA.
Статьи в "ZDNET Россия", источниками которых служат публикации американской
редакции ZDNET, а также GameSpot и CNET, являются предметом авторского права
CNET Networks, Inc. или ее партнеров.
Copyright ® 2001, 2002 CNET Networks, Inc. и Algorithm Online. Все права
защищены.
ZDNET, GameSpot и CNET - торговые марки CNET Networks, Inc
www.pseudology.org |