Как определить положение автомобиля внутри изображения?

Возможно ли проанализировать изображение и определить положение автомобиля внутри него? Если да, то как вы подходите к этой проблеме?

Я работаю с относительно небольшим набором данных (50-100), и большинство изображений будут похожи на следующие примеры: введите описание изображения здесьвведите описание изображения здесьвведите описание изображения здесь

Меня больше всего интересуют только обнаружение вертикальных координат, а не фактическая форма автомобиля. Например, это область, которую я хочу выделить в качестве моего окончательного вывода: введите описание изображения здесь

Вы можете попробовать OpenCV, у которого есть API обнаружения объектов. Но вам нужно «обучить» его … предоставив ему большой набор изображений, содержащих «автомобили».

Посмотрите на вторую ссылку выше, и она показывает пример обнаружения и создания ограничивающей рамки вокруг объекта … вы можете использовать это как основу для того, что вы хотите сделать.

Различные документы:

Различные базы данных изображений:

1) У вашего первого и второго изображений есть две машины.

2) Если у вас есть только 50-100 изображений, я могу почти гарантировать, что их классификация вручную будет быстрее, чем писать или адаптировать алгоритм для распознавания автомобилей и доставки координат.

3) Если вы решили сделать это с помощью компьютерного зрения, я бы рекомендовал OpenCV. Учебник здесь: http://docs.opencv.org/doc/tutorials/tutorials.html

Вы можете использовать детектор openCV latentSVM для обнаружения автомобиля и построения вокруг него ограничивающего прямоугольника:

http://docs.opencv.org/modules/objdetect/doc/latent_svm.html

Не нужно обучать новую модель, используя HaarCascade, поскольку уже есть обученная модель для автомобилей:

https://github.com/Itseez/opencv_extra/tree/master/testdata/cv/latentsvmdetector/models_VOC2007

Это контролируемая проблема машинного обучения . Вам нужно будет использовать API, в котором есть алгоритмы обучения, предлагаемые или предлагаемые некоторыми исследованиями и написанием. Python довольно хорош для машинного обучения (это то, что я использую лично) и имеет некоторые полезные инструменты, такие как scikit: http://scikit-learn.org/stable/

Я бы предложил вам изучить классификаторы HAAR. Поскольку вы упомянули, что у вас есть набор из 50-100 изображений, вы можете использовать это, чтобы создать учебный набор данных для классификатора и использовать его для классификации ваших изображений.

Вы также можете изучить алгоритмы SURF и SIFT для указанной проблемы.