Вы можете объединить видео и аудио из двух форматов в один файл при помощи -f <video-format>+<audio-format> (требуется установленная ffmpeg или avconv). Например, -f bestvideo+bestaudio позволит загрузить лучшее видео одного формата и лучшее аудио другого формата, собрав их воедино с помощью ffmpeg/avconv.
Начиная с конца апреля 2015 года и версии 2015.04.26 youtube-dl использует по умолчанию формат -f bestvideo+bestaudio/best. При установленных ffmpeg или avconv будут загружаться отдельно bestvideo и bestaudio с последующим мультиплексированием их в единый файл для получения лучшего доступного качества. В противном случае произойдёт обращение к формату best, приводящему к загрузке наилучшего по качеству единого файла. Режим best необходим также для видео с YouTube, не поддерживающих разделение потока на аудио и видео. Если вы хотите скачать только некоторые комбинации форматов (например, если вы не заинтересованы в получении видео с разрешением свыше 1080p), вы можете добавить bestvideo[height<=?1080]+bestaudio/best в файл конфигурации. Обратите внимание, что в случае получения программой выходного потока stdout (с вероятной передачей в медиа-проигрыватель), т.е. с явным указанием шаблона вывода через -o-, youtube-dl по-прежнему будет использовать формат -f best для того, чтобы сразу начать доставку контента в плеер без ожидания загрузки и мультиплексирования bestvideo и bestaudio.
Если вы хотите оставить прежнее поведение в выборе формата (до youtube-dl 2015.04.26), т.е. скачивать наилучший по качеству объединённый медиаконтент, то должны сделать выбор с явным указанием формата -f best. При желании вы можете добавить его в файл конфигурации, дабы не вводить его каждый раз при вызове youtube-dl. |