Вернёмся к функции Лагранжа и параметру лямда, задающегося пользователем.

Как было сказано ранее, для того чтобы найти вектор перемещения, нужно искать похожий блок в некоторой малой области по некоторой метрике, в нашем случае это среднеквадратичное отклонение по пикселям блока, т.е корень из суммы 64 значений, корень не извлекается в целях эффективности. Используемая область — 32x32 пикселя, если искать похожий блок в каждой точке, это займёт слишком много времени, поэтому было предложено использовать один из 3х алгоритмов (рис 1,2,3, 31x31 пиксель – рассказать, не забыть про второй шаг поиска, 4/8 пикселей). Учитывая особенности временной корреляции и предсказание движения, область, близкую к точке старта, стоит рассматривать более тщательно. Более отдалённые области не нуждаются в столь тщательном рассмотрении, однако, если выяснится, что наиболее похожий блок находится в наиболее “разреженной” области, то необходимо проверить и соседние точки.

7.

Далее, были проведены ещё две полезных модификации:

 

§  Реализована глобальная компенсация движения

§  Улучшен поиск предсказаний на 3м слое 3-х слойной схемы.

 

Идея глобальной компенсации движения состоит в том чтобы определить “движение камеры”, если таковое присутствует. При перемещений сюжета (особенно быстром) может получиться так что поиск перемещённых блоков будет работать не совсем эффективно, т.к блоки перемещаются на слишком большое расстояние. Если найти вектор перемещение камеры, то можно прибавить его к Vpredи искать начиная с этой позиции. В данной работе был реализован следующий алгоритм поиска глобальной компенсации: выбирается 1/16 часть всех блоков кадра так как показано на рисунке 1. Затем производится их медианная фильтрация и результирующий вектор считается за вектор движения камеры, далее он используется в 1м слое трёхслойной схемы для поиска блоков. На последующих слоях он не учитывается, т.к они зависят от 1го слоя, а там он уже учтён.

 

Также на 3м слое 4-х точечный поиск блока был заменён на 6-ти точечный, что позволило более точно предсказывать область поиска (показать на рисунок, объяснить)

8.

Вернёмся к функции Лагранжа и параметру лямда, задающегося пользователем. Оказывается, при (любых!) фиксированных битовых затратах параметр лямда является почти константой и нет необходимости в его задании пользователем. В работе были проведены эксперименты, некоторые результаты представлены на рисунках, из которых видно, что при лямда = 50-200 (исключение составляет tennisна 0.15bpp) качество сжатия

Ссылка на основную публикацию
Adblock detector