Meta? спроектировала аудиокодек EnCodec на ИИ — стискивает в 10 раз мощнее, чем MP3 при том же качестве
Организация Meta? продемонстрировала свежий голосовой плеер EnCodec, который применяет способы автомобильного учебы для увеличения стадии сжатия без утраты качества — в итоге он способен стискивать аудио в 10 раз мощнее, чем MP3 при том же качестве. Про это рассказывает издание Ars Technica.
Плеер EnCodec может использоваться как для потоковой передачи звука в режиме настоящего времени, к примеру, при телефонных звонках в участках неустойчивой связи, так и при кодировке для следующего сбережения в документах.
Создатели рассказали, что система сжатия EnCodec состоит из трёх элементов. Вначале кодировщик конвертирует несжатые данные в особый формат с не менее невысоким битрейтом. После этого приобретенный формат сдавливается до нужного объема, а сохраняется значительная информация, которая будет применена для восстановления отправного знака. В итоге дешифратор в режиме настоящего времени конвертирует стиснутые данные назад в голосовые волны при помощи нейронной сети.
В компании выделяют, что нейросеть правильно стискивает звук и разница между звуков до и после сжатия не будет оцениваться нашим слухом. Нейросети для сжатия звука применяются достаточно давно, но Meta? первой использовала технологию к стереозвуку при 48 кГц.
Система EnCodec как и прежде располагается в стадии подготовки и испытания. Создатели не рассказывают о сроках её внедрения в собственные сервисы и помощи иными фирмами.