Видеонаблюдение долгое время относилось к звуку как к странному бонусу. Камера должна видеть, диск должен писать, а если где то ещё и слышно, то это уже роскошь. Звук включали по остаточному принципу, микрофоны ставили «чтобы было», а настройки аудио открывали примерно никогда. Но в какой то момент оказалось, что видео без нормального звука это половина картины. Детекторы плача, крика, выстрела, речи, конфликтов и даже простого присутствия человека внезапно стали зависеть не от мегапикселей, а от качества аудио. И тут инженеры с удивлением обнаружили вкладку Audio в настройках камеры и осознали, что выбор кодека это не формальность, а архитектурное решение.
Список аудиокодеков, встречающихся в настройках IP-камер
PCM (LPCM)
Несжатый цифровой звук. Максимально честный и тяжёлый.
Лицензия: отсутствует, это не кодек, а формат представления данных.
На практике: высокое качество, огромный поток, слабая совместимость с регистраторами и облаками.
G.711 (A-law / μ-law)
Классический телефонный кодек, 8 кГц.
Лицензия: свободен, патенты давно истекли.
На практике: минимальное качество, но почти стопроцентная поддержка.
G.726
ADPCM, более экономичный родственник G.711.
Лицензия: патенты истекли, свободное использование.
На практике: чуть лучше G.711, но всё ещё «телефон».
G.722
Широкополосная речь, 16 кГц.
Лицензия: свободен.
На практике: хороший звук для речи, но не везде стабильно поддерживается.
G.722.1
Расширенная версия G.722 с лучшим сжатием.
Лицензия: патенты были, сейчас в основном истекли.
На практике: звучит хорошо, но часто вызывает проблемы совместимости.
AAC (AAC-LC, HE-AAC, AAC+)
Современный универсальный аудиокодек.
Лицензия: патентованный, лицензируется через Via Licensing.
На практике: лицензия уже включена в камерах, лучший баланс качества и стабильности.
MPEG-1/2 Layer II (MP2)
Старый MPEG-аудиокодек.
Лицензия: патенты истекли.
На практике: надёжный, но морально устаревший, встречается в корпоративном оборудовании.
Opus
Современный кодек для речи и стриминга.
Лицензия: полностью свободный, IETF.
На практике: технически отличный, но редко поддерживается камерами и NVR.
Speex
Речевой кодек предыдущего поколения.
Лицензия: свободный.
На практике: устарел, иногда встречается в старых или нишевых прошивках.
AMR / AMR-WB
Мобильные речевые кодеки.
Лицензия: патентованные.
На практике: редко используются, поддержка ограничена.
ADPCM (разные варианты)
Простое дифференциальное сжатие.
Лицензия: зависит от реализации, чаще всего свободно.
На практике: экзотика, встречается в старых моделях.
Иллюзия идеального качества и суровая реальность PCM
PCM выглядит красиво. Несжатый звук, никакой потери данных, чистая цифра без компромиссов. В теории это идеал. На практике PCM в IP камере ведёт себя как спортивный автомобиль в пробке. Поток огромный, сеть начинает задыхаться, архив раздувается, а половина регистраторов и облаков делают вид, что такого формата они вообще не знают. PCM хорошо живёт в закрытых системах, в лабораториях и в случаях, когда разработчик контролирует всю цепочку от камеры до плеера. В реальных системах видеонаблюдения он часто превращается в источник странных проблем. Звук есть, но не воспроизводится. Или воспроизводится только локально. Или пропадает при удалённом доступе. PCM не плохой, он просто слишком честный для индустрии, построенной на компромиссах.
Телефонное прошлое, которое всё ещё с нами
G.711 и его родственники это классика. 8 кГц, узкая полоса, звук как из старого телефона. Зато работает почти везде. Эти кодеки пережили смену эпох, брендов и интерфейсов, потому что они просты и предсказуемы. G.726 пытается быть немного лучше, экономит битрейт и слегка улучшает восприятие, но чуда не происходит. Это выбор тех, кому нужен звук «чтобы был». Разборчиво, стабильно, без сюрпризов. Для охраны, простых событий и базового контроля этого хватает. Для аналитики, ASR и нормального архива это уже нижняя граница приемлемого.
Широкополосная речь и вечная лотерея совместимости
Когда камера предлагает G.722 или G.722.1, появляется надежда. Частота выше, речь живее, детали слышны лучше. Иногда это действительно работает отлично. Иногда нет. Всё зависит от конкретной реализации в камере, от прошивки и от того, понимает ли этот кодек регистратор или VMS. В одной системе G.722 звучит приятно и стабильно, в другой даёт странные артефакты или проблемы при воспроизведении. Это не вина стандарта. Это следствие того, что звук в видеонаблюдении десятилетиями был второстепенным и реализовывался по остаточному принципу. Хорошая идея, но без гарантий.
AAC как редкий случай здравого смысла
AAC это тот редкий момент, когда всё сошлось. Качество, битрейт, стабильность и совместимость. Он создавался для музыки и видео, но неожиданно идеально вписался в видеонаблюдение. При разумных настройках AAC даёт чистый, понятный звук, хорошо переживает шумы и не разваливает архив. Да, он патентованный, но для пользователя это давно не проблема. Лицензии включены, поддержка широкая, плееры довольны. Если не хочется экспериментировать и ловить странные баги, AAC это самый безопасный и рациональный выбор на сегодня.
Кодеки будущего, которые пока живут на периферии
Opus выглядит как кодек мечты. Свободный, современный, отлично работающий с речью. В мире VoIP он давно стал нормой. В мире IP камер он пока гость. Поддержка редкая, совместимость нестабильная, регистраторы часто его просто игнорируют. Speex уже морально устарел, но иногда всё ещё встречается. AMR и AMR-WB пришли из мобильного мира и так там и остались. Эти кодеки интересны, но сегодня они скорее эксперимент, чем рабочий инструмент для массовых систем видеонаблюдения.
Короткий вывод без иллюзий
В IP камерах можно встретить PCM, G.711 A-law и μ-law, G.726, G.722, G.722.1, AAC в разных вариантах, MPEG-2 Layer II, Speex, Opus, реже AMR и различные ADPCM. Это не стройная эволюция, а музей индустрии, где рядом живут технологии из разных десятилетий. И если отбросить романтику и маркетинг, вывод получается простой. Для нормального звука, адекватного архива, удалённого доступа и работы аналитики лучше всего выбирать AAC с частотой 16 или 32 кГц. Он не самый модный и не самый идеологически чистый, но он стабильно работает. А в видеонаблюдении это качество ценится выше всех остальных.