Содержание
СОДЕРЖАНИЕ
КНИГА 2, ГЛАВЫ 10–16
ГЛАВА 10.
ОСНОВНЫЕ МЕТОДЫ КОДИРОВАНИЯ
РЕЧЕВОЙ И ЗВУКОВОЙ ИНФОРМАЦИИ .........671
10.1.
Основные характеристики и цифровое
представление звуковой информации ......... 672
10.1.1.
Статистика мгновенных значений и уровней
звуковых сигналов ....... 673
10.1.2.
Спектральные характеристики звуковых сигналов .......... 677
10.1.3.
Огибающая и мгновенная частота звуковых сигналов ............. 681
10.1.4.
Пространственное восприятие звуковых сигналов .......... 683
10.1.5.
Основные принципы цифровых преобразований
звуковых сигналов ....... 685
10.1.6.
Аналого-цифровое и цифроаналоговое преобразование
звуковых сигналов ....... 689
- Импульсно-кодовая модуляция (ИКМ) .............689
- Дифференциальная импульсно-кодовая модуляция (ДИКМ) .......689
- Сигма-дельта-модуляция (СДМ) ........691
10.1.7.
Принципы кодирования речевой и звуковой информации......... 692
- Принципы кодирования речевой информации .........692
- Принципы кодирования звуковой информации .......696
- Психоакустическая модель 1 .......697
- Психоакустическая модель 2 .......701
- Психоакустическая модель 3 .......704
10.1.8.
Предыскажения звуковых сигналов при цифровом
кодировании ........ 708
10.2.
Основные стандарты кодирования речевой
информации ........ 709
10.2.1.
G711 – стандарт кодирования речи с применением ИКМ ......... 710
10.2.2.
G.722 – стандарт кодирования речи со спектром до 7 кГц
в цифровой поток 64 кбит/с ......... 710
10.2.3.
G.723.1 – стандарт речевого кодека для мультимедиа
с двумя скоростями потока 5,3 и 6,3 кбит/сек ............ 711
10.2.4.
G.726 – стандарт речевого кодека 40, 32, 24, 16 кбит/с
с адаптивной дифференциальной импульсно-кодовой
модуляцией .......... 717
10.2.5.
G.727 – стандарт речевого кодека с алгоритмом вложенной
адаптивной дифференциальной импульсно-кодовой
модуляции (АДИКМ) при 5, 4, 3 и 2 бит на отсчет .......... 718
10.6.
G.728 - речевой кодек в выходным потоком
16
кбит/с и малой задержкой........ 720
10.2.7.
G.729 – стандарт речевого кодека на 8 кбит/с
с применением сопряженного линейного предсказания
с алгебраическим кодом возбуждения ......... 722
10.2.8.
GSM – стандарт речевого кодека для систем сотовой связи ....... 726
10.2.9.
GIPS iLBC – стандарт кодека, предназначенного
для передачи речи по IP-сетям ............. 731
10.2.10.
Speex – свободный кодек, предназначенный для передачи
речи по IP-сетям ......... 735
10.3.
Стандарты кодирования звуковой информации ........ 737
10.3.1.
MPEG-1/Audio – стандарт кодирования аудиоинформации
для цифровых систем с потоком до 1,5 Мбит/с .......... 739
10.3.2.
MPEG-1 / Layer 1 – профессиональная система кодирования
аудиоинформации с высоким качеством ............ 740
10.3.3.
MPEG-1 / Layer 2 – система кодирования аудиоинформации
для высококачественного телерадиовещания ............. 744
10.3.4.
MPEG-1 / Layer 3 – система кодирования аудиоинформации
для интернет-вещания ............ 745
10.3.5.
MPEG-2/Audio – стандарт кодирования аудиоинформации
для многоканального стереофонического вещания ......... 751
10.3.6.
MPEG-2/AAC – стандарт усовершенствованного аудиокодера
(Advanced Audio Coding) ......... 753
10.3.7.
MPEG-4/Audio – стандарт аудиокодера для мультимедийных
приложений ......... 755
10.3.8.
DOLBY AC3 – стандарт аудиокодера для телевидения
высокой четкости и других применений ............. 757
10.3.9.
Совершенствование форматов сжатия звука на основе
стандарта AAC ......... 761
- Общие алгоритмы кодека AAC ............763
- Метод спектрального дублирования или отражения .......766
- Параметрическое стереокодирование ........770
- Конфигурации режимов работы кодеков AAC и HE-AAC ..........771
10.4.
Методы оценки качества кодирования звуковой информации....... 772
10.4.1.
Персептивная оценка качества звука PEAQ ....... 773
- Психоакустическая модель FFT based ........776
- Моделирование наружного среднего уха ............776
- Модель внутреннего ушного шума .........778
- Одновременное маскирование ............779
- Неодновременное маскирование вперед ............780
10.4.2.
Психоакустическая модель Filter Bank based ....... 780
- Банк фильтров ........781
- Моделирование наружного среднего уха ............783
- Одновременное маскирование ............783
- Обратное маскирование .........784
- Модель внутреннего ушного шума .........785
- Неодновременное маскирование вперед ............785
10.4.3.
Предварительная обработка энергий возбуждения .......... 785
- Адаптация уровней .........787
- Спектральная адаптация ........788
- Выделение модуляции ...........789
- Выделение уровня громкости ..............789
- Выделение энергии искажения ...........791
10.4.4.
Вычисление параметров MOV ............. 791
- Различие модуляции ..............792
- Оконное среднее различий в мерах модуляции во временных
огибающих исходного и тестируемого сигнала
(базовая версия, модель FFT) ..............792
- Линейное среднее различий в мерах модуляции
(базовая версия, модель FFT) ..............792
- Другой вариант различия в мерах модуляции
(базовая версия, модель FFT) ..............792
- Взвешенное квадратическое усреднение по времени различий
в мерах модуляции (продвинутая версия, модель Filter Bank) ........793
10.4.5.
Громкость искажений ............. 793
- Взвешенное квадратичное усреднение искажений громкости
шума (базовая версия, модель FFT) ........794
- Взвешенная сумма среднеквадратических значений громкостей
шума искажений и частотных компонент
(продвинутая версия, модель Filter Bank) ...........795
- Громкость компонентов, потерянных при спектральной
адаптации энергий возбуждения исходного и тестируемого
сигналов (продвинутая версия, модель Filter Bank) .........795
10.4.6.
Ширина полосы .............. 796
- Средняя ширина полосы исходного сигнала
(базовая версия, модель FFT) ..............797
- Средняя ширина полосы тестируемого сигнала
(базовая версия, модель FFT) ..............797
10.4.7.
Шум/маска .......... 797
- Суммарное отношение шум/маска (базовая версия, модель FFT) .........798
- Суммарное отношение шум/маска в частотной области
(продвинутая версия, модель FFT) .........798
- Относительные искажения кадров (базовая версия, модель FFT) .........798
10.4.8.
Вероятность обнаружения ........ 799
- Мера вероятности обнаружения отличий между исходным и
тестируемым сигналами (базовая версия, модель FFT) ..........800
- Характеристика искажения кадров
(базовая версия, модель FFT) ..............800
10.4.9.
Структура ошибочных гармоник ......... 801
- Структура ошибочных гармоник
(базовая и продвинутая версии, модель FFT) ............801
10.5.
Когнитивная модель ....... 802
10.5.1.
Веса нейронной сети в базовой версии PEAQ ............ 804
10.6.
Проблемы совершенствования систем оценки
качества кодеров звука ............ 804
10.6.1.
Совершенствование психоакустической модели........ 804
10.6.2.
Когнитивная модель ....... 806
10.6.3.
Мультиканальные метрики .......... 807
10.7.
Многоканальные звуковые технологии
в вещательных приложениях ....... 809
ГЛАВА 11
ЦИФРОВЫЕ ИНТЕРФЕЙСЫ И МУЛЬТИПЛЕКСИРОВАНИЕ
ЦИФРОВЫХ ПОТОКОВ В ВИДЕОИНФОРМАЦИОННЫХ
СИСТЕМАХ .........815
11.1.
Синхронный параллельный интерфейс SPI ....... 816
11.1.1.
Параллельный интерфейс при цифровом преобразовании
компонентного сигнала .......... 818
11.1.2.
Параллельный интерфейс при цифровом преобразовании
композитного сигнала ............ 819
11.2.
Цифровой последовательный интерфейс SDI ............ 822
11.2.1.
Синхронный последовательный интерфейс ....... 825
11.2.2.
Асинхронный последовательный интерфейс ............. 827
11.3.
Высокоскоростной цифровой последовательный
интерфейс IEEE-1394 ............. 833
11.4.
Основные виды искажений цифровых сигналов. Джиттер ......... 837
11.5.
Методы анализа и измерения джиттера .............. 841
11.5.1.
Глазковая диаграмма ....... 841
11.5.2.
U-образная кривая и ее экстраполяция .............. 844
11.5.3.
Гистограммы распределения набора значений параметров
глазковой диаграммы .............. 846
11.5.4.
Измерение частотных характеристик джиттера .......... 848
11.5.5.
Контур вероятности распределения BER ............ 849
11.6.
Мультиплексирование цифровых потоков
в видеоинформационных системах ........ 851
11.6.1.
Транспортный поток (TS, TP, MPEG-TS или M2TS) ....... 851
11.6.2.
Программный поток MPEG-2 ............. 866
11.6.3.
Обобщенный инкапсулированный поток (GSE) ....... 870
11.6.4.
Обобщенный непрерывный поток (GСS) ........... 873
11.6.5.
Обобщенный поток пакетов фиксированной длины (GFPS) ......... 875
ГЛАВА 12
ОСНОВНЫЕ МЕТОДЫ И СИСТЕМЫ КАНАЛЬНОГО
КОДИРОВАНИЯ И МОДУЛЯЦИИ ЦИФРОВОЙ ИНФОРМАЦИИ .............876
12.1.
Помехоустойчивое канальное кодирование
системах передачи цифровой информации ........ 878
12.1.1.
Принципы кодирования источника сообщений ........ 878
12.1.2.
Теоретические предпосылки помехоустойчивого кодирования .............. 879
- Теорема Шеннона для канала связи без помех ...........879
- Теорема Шеннона для канала связи с помехами ........881