Виртуальный компьютерный музей Кафедра "Вычислительной техники" МЭИ (ТУ) Виртуальная школа компьютерных технологий |
К.т.н. с.н.с. Акcенов
О.Ю.
В настоящее время наблюдается растущий интерес к системам машинного зрения. Это в значительной мере объясняется тем, что прогресс цифровой техники привел к доступности систем машинного зрения, способных решать актуальные задачи, возникающие в промышленности, в транспорте, в области безопасности и в других приложениях. Тем не менее, судя по печати, спрос на такие системы сегодня не удовлетворяется. В значительной мере это объясняется существенной ресурсоемкостью подобных систем, приводящей к тому, что использование распространенных аппаратных средств, таких, как РС, зачастую не позволяет обеспечить требуемые потребительские свойства, например, в части точности работы, габаритов и мобильности аппаратуры. Однако создание специализированных аппаратных средств – дело достаточно трудоемкое и дорогостоящее.
Ниже рассматривается один из возможных подходов к созданию систем машинного зрения. Этот подход отработан в НТЦ «Модуль» (www.module.ru). В значительной мере он определен направлениями деятельности НТЦ «Модуль» к которым относятся:
· проектирование интегральных схем, таких как процессор Л1879ВМ1 (NM6403) для цифровой обработки сигналов, СБИС 1879BM3 для аналоговой и цифровой обработки сигналов;
· разработка и изготовление аппаратуры, в том числе встраиваемых и бортовых вычислителей, модулей обработки сигналов, в том числе и многопроцессорных, некоторые из которых представлены на рисунке;
· создание программного обеспечения, обеспечивающего функционирование разрабатываемой аппаратуры и решение конкретных прикладных задач.
Следует отметить, что задача обеспечить эффективную работу с изображениями ставилась (и была решена) еще при разработке упомянутого процессора. Таким образом, наличие высокопроизводительных вычислительных средств, создаваемых с учетом потребностей конкретных прикладных задач позволило достичь определенных успехов в такой ресурсоемкой области цифровой обработки сигналов, как машинное зрение. В том числе, в создании систем, работающих с изображениями естественных сцен в реальном масштабе времени. Последнее подразумевает, что обработка изображений проводится с темпом их поступления, например, от телевизионной камеры. Именно об этой разновидности систем машинного зрения и пойдет речь в дальнейшем.
Задача обработки изображения, как правило, сводится к обнаружению объектов на изображении, а зачастую и к распознаванию их класса. Можно предложить следующую классификацию таких систем (в порядке возрастания сложности):
· неподвижная камера, подвижный объект;
· подвижная камера, подвижный объект;
· неподвижная камера, неподвижный объект;
· подвижная камера, неподвижный объект.
В двух первых случаях обнаружение возможно по факту движения. В двух последних случаях – в зависимости от конкретной постановки (в порядке возрастания сложности):
· по отличию объекта от фона по яркости;
· на базе исследования текстуры;
· на основании анализа формы объекта.
Для систем, работающем в видимом диапазоне спектра, наиболее перспективным, очевидно, является использование анализа формы объекта.
Работа с изображениями естественных сцен сопряжена с необходимостью преодоления ряда трудностей, к числу которых принадлежат, в частности:
· сложный характер изображения, получаемого в естественных условиях;
· неопределенность условий наблюдения, в том числе масштаба, ракурса;
· низкое качество исходных изображений, например, по пространственному разрешению, контрастности.
Решение указанных проблем должно базироваться на знаниях конкретной предметной области, учитывающих специфику получения изображений и использования их результатов. Не меньшую роль имеет эффективность аппаратно-программной реализации обработки изображений. Практика показала, что получение положительных результатов в реализации систем машинного зрения связано с:
· использованием адаптации и обучения для обеспечения работы в меняющихся и трудно формализуемых условиях соответственно, а также при низком качестве исходных изображений;
· выбором схемы обработки информации, обеспечивающей последовательное снижение размерности информации, и, в конечном итоге, переход от изображения к его инвариантному (условиям наблюдения) описанию, как средство преодоления ограничений, связанных с реализацией систем реального времени на относительно небольших аппаратных средствах;
· применением специально разработанного парка универсальных аппаратных средств, позволяющих собрать вычислительную систему, в том числе и многопроцессорную, из готовых компонентов для реализации сжатых сроков отработки и создания систем машинного зрения;
· использование параллельных вычислений, в том числе, деления разрядной сетки процессора Л1879ВМ1 (NM6403) для получения эффективной аппаратной реализации;
· накоплением и использованием программных реализаций, обеспечивающих эффективное решение наиболее трудоемких этапов обработки изображений.
Полностью статья будет опубликована в ближайшем номере журнала PC\WEEK\RE