litceyvib.ru 1
Лекция. Представление видео и звука в компьютере


1. Представление звука в ЭВМ

Звук – это механические колебания среды: воздуха, воды и т.д, воспринимаемые слуховым аппаратом человека. То, что мы слышим – это результат обработки колебательных движений барабанной перепонки уха, представленный в виде сигналов нервной системы. Вне среды переноса звуковых волн звук не существует. Однако звуковые колебания можно перевести на другой носитель: изменить представление информации, не теряя ее фактически. Обычно звуковые колебания переносят на сигналы радиоволн.

З
вуковую информацию можно также представить в математической форме, в виде периодических функций времени. Это представление обычно записывают в виде формулы


Здесь A(t) – амплитуда звукового сигнала, а t – время.

Все слышимые звуки являются результатом воздействия звуковых волн. На магнитной ленте, виниловой пластинке звук сохраняется в виде непрерывного электрического сигнала, определяющего изменение звуковых волн. Звук, создаваемый электрическими волнами, называют аналоговым.

Звук может храниться на цифровых носителях, т.е. быть представленным в виде набора цифр. Любая цифровая техника или программа работают со звуком, представленным в цифровом виде. Таким образом, для переноса звука на цифровой носитель, необходимо осуществить его аналогово-цифровое преобразование. Такое преобразование состоит из трех этапов:

дискретизация – представление непрерывного сигнала в виде последовательного набора отдельных амплитуд;

квантование – разделение каждой амплитуды на заданное число уровней;

кодирование – запись данных позиции и уровня амплитуды в цифровом виде.

На практике преобразования звуковой информации из непрерывной формы в дискретную выполняются электронными устройствами, называемыми аналого-цифровыми преобразователями (АЦП) и цифро-аналоговыми преобразователями (ЦАП). Современные звуковые карты могут обеспечить кодирование 65536 различных уровней сигнала или состояний. Для определения количества бит, необходимых для кодирования, решим показательное уравнение: 65536 = 2I, т.к. 65536 = 216, то I = 16 бит.


Таким образом, современные звуковые карты обеспечивают 16-битное кодирование звука. При каждой выборке значению амплитуды звукового сигнала присваивается 16-битный код.

Количество выборок в секунду может быть в диапазоне от 8000 до 48000, т.е. частота дискретизации аналогового звукового сигнала может принимать значения от 8 до 48 Кгц. При частоте 8 Кгц качество дискретизированного звукового сигнала соответствует качеству радиотрансляции, а при частоте
48 Кгц – качеству звучания аудио-CD. Следует также учитывать, что возможны как моно-, так и стерео-режимы.

Можно оценить информационный объем моно-аудио-файла длительностью звучания 1 секунду при среднем качестве звука (16 бит,
24 Кгц). Для этого количество бит на одну выборку необходимо умножить на количество выборок в 1 секунду:

16 бит * 24000 = 384000 бит = 48000 байт  47 Кбайт.

Устройства для работы со звуком

Звуковая карта явилась одним из наиболее поздних усовершенствований персонального компьютера. Она подключается к одному из слотов материнской платы в виде дочерней карты и выполняет вычислительные операции, связанные с обработкой звука, речи, музыки. Звук воспроизводится через внешние звуковые колонки, подключаемые к выходу звуковой карты. Специальный разъем позволяет отправить звуковой сигнал на внешний усилитель. Имеется также разъем для подключения микрофона, что позволяет записывать речь или музыку и сохранять их на жестком диске для последующей обработки и использования.

Основным параметром звуковой карты является разрядность, определяющая количество битов, используемых при преобразовании сигналов из аналоговой в цифровую форму и наоборот. Чем выше разрядность, тем меньше погрешность, связанная с оцифровкой, тем выше качество звучания. Минимальным требованием сегодняшнего дня являются 16 разрядов, а наибольшее распространение имеют 32-разрядные и 64-разрядные устройства.



Форматы звуковых файлов.


Звук в компьютере хранится в файлах, имеющих различные способы пред­ставления информации. Перечислим основные форматы хранения звуко­вой информации.

WAVE (*.wav) – наиболее широко распространенный звуковой формат. Используется операционной системой Windows для хранения звуковых файлов. В его основе лежит формат RIFF (Resource Interchange File Format), позволяющий сохранять данные в структурированном виде.

Стандарт MPEG-1 представляет собой, целый комплект аудио и видео стандартов. Согласно стандартам ISO ( International Standards Organization), аудио часть MPEG-1 включает в себя три алгоритма различных уровней сложности: Layer 1 (уровень 1), Layer 2 (уровень 2) и Layer 3 (уровень 3). Общая структура процесса кодирования одинакова для всех уровней MPEG-1 . Вместе с тем, несмотря на схожесть уровней в общем подходе к кодированию, уровни различаются по целевому использованию и задействованным в кодировании внутренним механизмам. Для каждого уровня определен свой формат записи выходного потока данных и, соответственно, свой алгоритм декодирования.

MPEG Layer 3 (*.мр3) - формат звуковых файлов с потерями качества, разработанный для сохранения звуков, от­личных от человеческой речи. Используется для оцифровки музыкальных записей.

Windows Media Audio (*.wma) - формат звуковых файлов, предложенный фирмой Мiсrosоft. Кодек Windows Media Audio 8 обеспечивает качество, аналогичное mрЗ, при размерах файлов втрое меньших.

MIDI (*.mid) - цифровой интерфейс музыкальных инструментов (Musical Instгument Digital Interface). MIDI определяет обмен данными между музыкальными и звуковыми синтезаторами разных производителей. Интерфейс MIDI представляет собой протокол передачи музыкальных нот и мелодий. Но данные MIDI не являются цифровым звуком: это сокращенная форма записи музыки в числовой форме.

Программное обеспечение для редактирования звука.


Наиболее известными в настоящее время являются следующие программы для обработки звука: Sound Forge, GoldWave, Adobe Audition и др.


Основные операции со звуком.


  1. Запись.

  2. Добавление/удаление звуковой дорожки.

  3. Изменение размера звуковой дорожки.

  4. Разбиение звуковой дорожки на фрагменты.

  5. Редактирование звуковой кривой.

  6. Изменение громкости звучания.



2. Представление видео в ЭВМ


Ви́део (от лат. video — смотрю, вижу) — под этим термином понимают широкий спектр технологий записи, обработки, передачи, хранения и воспроизведения визуального и аудиовизуального материала на мониторах. Когда в быту говорят «видео» — то обычно имеют в виду видеоматериал, телесигнал или кинофильм, записанный на физическом носителе (видеокассете, видеодиске и т. п.).

Количество (частота) кадров в секунду — это число неподвижных изображений, сменяющих друг друга при показе 1 секунды видеоматериала и создающих эффект движения объектов на экране. Чем больше частота кадров в секунду, тем более плавным и естественным будет казаться движение. Минимальный показатель, при котором движение будет восприниматься однородным — примерно 10 кадров в секунду (это значение индивидуально для каждого человека). В традиционном плёночном кинематографе используется частота 24 кадра в секунду. Системы телевидения PAL и SÉCAM используют 25 кадров в секунду (англ. 25 fps или 25 Герц), а система NTSC использует 29,97 кадров в секунду. Компьютерные оцифрованные видеоматериалы хорошего качества, как правило, используют частоту 30 кадров в секунду.


Оборудование для обработки видео на компьютере.

Для записи видеоинформации необходимо:

  • специальная плата или устройство для оцифровки видеоизображения;

  • видеомагнитофон или видеокамера;
  • программное обеспечение для записи и редактирования цифрового видео.


  • звуковая карта (если плата видеозахвата не поддерживает возможности захвата звука).

Видеокарта (видеоадаптер). Совместно с монитором видеокарта образует видеоподсистему персонального компьютера. Физически видеоадаптер выполнен в виде отдельной дочерней платы, которая вставляется в один из слотов материнской платы и называется видеокартой. Видеоадаптер взял на себя функции видеоконтроллера, видеопроцессора и видеопамяти.

За время существования персональных компьютеров сменилось несколько стандартов видеоадаптеров: MDA (монохромный); CGA (4 цвета); EGA (16 цветов); VGA (256 цветов). В настоящее время применяются видеоадаптеры SVGA, обеспечивающие по выбору воспроизведение до 16,7 миллионов цветов с возможностью произвольного выбора разрешения экрана из стандартного ряда значений.

Плата оцифровки видео

Можно воспользоваться простейшей аналоговой картой видеозахвата или ТV-тюнером. При этом существуют следующие особенности такой платы. Она должна:

  • показывать и захватывать аналоговое видео со скоростью потока данных, ограничиваемым только устройством записи;

  • захватывать видео с произвольными размерами кадра, в частности, с разрешением 352×288 (необходимое для стандарта МРЕG-1);

  • захватывать видео как через композитный вход, так и через S- Video.



Основные форматы видео файлов

Audio Video Interleaved (*.AVI) - формат, разработанный Мiсrоsоft для записи и воспроизведения видео в операционной системе Windows. При записи в этом формате используются несколько различных алгоритмов сжатия (компрессии) видеоизображения. Среди них Cinepak, Indeo video, Motion-JPEG (M-JPEG) и др. Но только M-JPEG был признан среди них как международный стандарт для сжатия видео. Первоначально для захвата и воспроизведения видео использовались возможности про­граммного комплекта Video fоr Windows, разработанного Microsoft. Ком­пания Мicrоsоft разработала два формата, призванных заменить формат АVI: Advanced Streaming Format (*. ASF) и Advanced Authoring Format (*. AAF).


Windows Media Video (*.WМV) - новый формат видео от Microsoft, который приходит на смену формату АVI. В его основе Wiцdоws Video Codec, разработанный на базе стандарта MPEG-4.

Quick Time Моvе (*.MOV) - наиболее распространенный формат для записи и воспроизведения видео, разработанный фирмой Аррlе для ком­пьютеров Macintosh в рамках технологии Quick Time. Включает поддерж­ку не только видео, но и звука, текста, потоков MPEG, расширенного набора команд MIDI, векторной графики, панорам и объектов (QT) и трехмерных моделей. Поддерживает несколько различных форматов сжатия видео, в том числе MPEG, а также свой собственный метод компрессии.

MPEG (*.MPG, *.MPEG) - формат для записи и воспроизведения видео, разработанный группой экспертов по движущимся изображениям (MPEG). Имеет собственный алгоритм компрессии. В настоящее время активно используются для записи цифрового видео. Наиболее широкое распро­странение нашли два формата: MPEG-I и MPEG-2. Они различаются по объему и качеству получаемой видеоинформации и признаны междуна­родными стандартами для сжатия видео. В настоящее время наряду с MPEG-l и MPEG-2 используется новый формат MPEG-4. Он позволяет сжать ин­формацию с большим коэффициентом сжатия.

Digital Video (*.DV) - формат, разработанный для цифровых видеокамер и видеомагнитофонов. Кодер-декодер (кодек) определен ведущими миро­выми производителями электроники, чтобы его могли поддерживать производители в своих платах с интерфейсом FireWare и комплексных решениях для редактирования цифрового видео. Формат не является компактным, поэтому необходимо его преобразование в MPEG.


Кодеки для видеоинформации

Кодек является сокращением от слов компрессор и декомпрессор, это любая технология для сжатия и обратного восстановления данных. Кодеки могут быть реализованы на уровне программного обеспечения, аппаратной части или в их комбинации. Кодеки используются для того, чтобы сделать большие видео файлы намного меньше, делая их пригодными для распространения по сети, локальной или всемирной, или любого другого метода передачи файлов.


Часть кодеков пользователь получает при установке операционной системы Windows. Это те кодеки, которые используются в файлах формата АVI. Если требуется пользоваться для записи форматом QuickТimе, то нужно установить его поддержку.

Cinepak - cоздавался фирмой SuperMac для компьютеров с процессорами Motorola 68030 и Inte1386 и с односкоростными дисководами CD-ROM. Файлы АVI, в которых использован этот кодек, могут быть переведены в формат QuickТimе и, наоборот, без переупаковки.

Sorenson Video - использует усовершенствованные алгоритмы векторного квантования и компенсации движения и адаптивное управление потоком. Оптимизирован для работы со скоростями от 2 до 100 Кбайт/с. Качество изображения значительно превышает Cinepak даже при меньших размерах файла. Сжатие очень медленное. Включен в стандартную поставку QuickТimе.

Indeo Video Interactive (IVI) - видеокодек для форматов АVI и МОV требует компьютеры класса Реntium. Кодек основан на wаvеlеt - компрессии.

MPEG - кодек, который, является официальным стандартом для сжатия и видеоинформации. В нем применяется дискретное коси­нусное преобразование (DCT, или ДКП) с межкадровым предсказанием. Существует несколько версий этого стандарта (MPEG-l, MPEG-2; MPEG-4).

MPEG-4 задает правила организации объектно-ориентированной среды. Он имеет дело не просто с потоками и массивами медиаданных, а с медиа объектами, например, аудио, видео, аудио/видео, графическими (плоскими и трехмерными), текстовыми. При этом MPEG-4 обеспечивает наилучшую эффективность сжатия. Используется алгоритм "сжатия повышенной эффективности" (АСЕ - Advanced Coding Efficiency). Можно обрабатывать звуковые сигналы в диапазоне от 2 до 24 Кбит/с, а видеосигнал - от 5 до 10 Мбит/с. Благодаря такой масштабируемости, аудио и видеоданные можно адаптировать к реальному применению. Этим обусловлен более универсальный характер MPEG-4 по сравнению с MPEG-2. Наиболее интересны практические достижения в создании видеокодеков, построенных на основе стандарта MPEG-4. Среди них - Windows Media Codec и DivX.



Программы для видеомонтажа

Чтобы превратить оцифро­ванную информацию в готовый продукт, ее необходимо обработать: размес­тить монтажные эпизоды, задать эффекты и переходы между ними, добавить титры и пояснительные тексты, отредактировать звуковое сопровождение, наконец, смонтировать готовый фильм. Для этого можно использовать следующие программы: Windows Movie Maker, Pinnacle Studio, VideoStudio, Video Wave, Media Studio Pro, Adobe Premiere, Speed Razor Pro, Adobe After Effects, Cannopus Edius и др.


Основные операции с видео файлами


  1. Импорт

  2. Добавление/удаление кадров

  3. Изменение размера кадра

  4. Разбиение кадра на фрагменты

  5. Добавление эффектов и переходов

  6. Тоновая коррекция кадров

  7. Добавление интерактивных элементов управления

  8. Добавление текста (титры, бегущая строка, текст на кадре и т.д.)