Существующие алгоритмы поиска и классификации изображений чаще
всего основываются на именах файлов, папок и других специфических атрибутах, таких как размер снимка или дата изготовления. Этот подход срабатывает в том случае, если название файла в точности описывает содержимое снимка, но он совершенно бесполезен при использовании абстрактных имен, понятных только авторам
фото. Неудивительно, что ведущие производители поисковых систем крайне заинтересованы в разработке новых методик, позволяющих автоматически
интерпретировать содержимое статичных снимков и видеороликов. Возможно, в
основу будущих решений ляжет технология, разработанная испанскими учеными из University
of Granada и способная обнаруживать присутствие на снимке людей или
специфических объектов.
По словам исследователей, самой сложной задачей для них
стала разработка методик, позволяющих компьютеру с высокой точностью идентифицировать людей на фото. Известно, что на большинстве снимков персонажи запечатлены не полностью, чаще всего в кадре оказывается лишь верхняя половина тела. Поэтому членам исследовательской группы пришлось разработать механизм, способный восстанавливать картинку по небольшому фрагменту.
Согласно результатам проведенных испытаний, продукт неплохо
справляется с поставленной задачей. Впрочем, обнаружение людей на снимках и кадрах видеосъемки - далеко не единственная и не самая полезная способность новой системы. Технология Pose Search также позволяет с легкостью идентифицировать позу человека и предусматривает возможность классификации персонажей по типам активности.
После обнаружения в кадре человеческого тела (а точнее его
верхней части) система ограничивает область поиска и переходит ко второму,
более сложному этапу обработки снимка, а именно к построению двухмерного
изображения человеческой фигуры. Pose Search распознает шесть ключевых элементов тела: голову, торс, плечи и предплечья правой и левой рук и определяет их специфическое расположение, ориентацию в пространстве. Последним шагом является поиск соответствия схематичному изображению в обширной базе данных. Благодаря этой инновационной методике система может использоваться для автоматической классификации видеороликов, в которых люди запечатлены в различных позах.
Работа над проектом продолжается несколько лет. Руководители
рабочей группы Мануэль Хесус Марин Хименес (Manuel Jesús Marín
Jiménez) из University of Córdoba и профессор Николас Перес де ла
Бланка Капилла (Nicolás Pérez de la Blanca Capilla) из University of Granada уже выступали с докладами на международных
конференциях, включая International Conference in Pattern Recognition (2006 год)
и Computer Vision and Pattern Recognition (2008 и 2009 годы).
По материалам сайта Gizmag.
|