Распознавание логотипа на изображениях [закрыто]



кто-нибудь знает о недавних научных работах, которые были сделаны по распознаванию логотипов в изображениях?
Пожалуйста, ответьте, только если вы знакомы с этой конкретной темой (я могу искать Google для "распознавания логотипа" сам, Спасибо большое).
Любой, кто хорошо разбирается в компьютерном зрении и проделал работу по распознаванию объектов, также может прокомментировать.



обновление:
Пожалуйста, обратитесь к алгоритмическим аспектам (какой подход вы считаете подходящим, документы в поле, должно ли оно работать (и было протестировано) для реальных данных, соображений эффективности), а не технических сторон (используемый язык программирования или был ли он с OpenCV...)
Работа над индексированием изображений и извлечением изображений на основе контента также может помочь.

831   4  

4 ответов:

вы можете попробовать использовать локальные функции, такие как SIFT здесь: http://en.wikipedia.org/wiki/Scale-invariant_feature_transform

Он должен работать, потому что форма логотипа обычно постоянна, поэтому извлеченные функции должны хорошо совпадать.

рабочий процесс будет выглядеть так:

  1. обнаружение углов (например, Harris corner detector) - для логотипа Nike это два острых конца.

  2. вычислить дескрипторы (например, SIFT-128D целочисленный вектор)

  3. на этапе обучения запомните их; на этапе сопоставления найдите ближайших соседей для каждой функции в базе данных, полученной во время обучения. Наконец, у вас есть набор спичек (некоторые из них, вероятно, ошибочны).

  4. сеять неправильные матчи с помощью RANSAC. Таким образом, вы получите матрицу, которая описывает преобразование из идеального изображения логотипа в тот, где вы найдете логотип. В зависимости от настроек, вы можете разрешить различные виды преобразования (просто перевод; перевод и вращение; аффинное преобразование).

силински из Есть главы (4.1) на местные особенности. http://research.microsoft.com/en-us/um/people/szeliski/Book/

П. С.

  1. Я предположил, что вы хотите найти логотипы на фотографиях, например, найти все рекламные щиты Pepsi, чтобы они могли быть искажены. Если вам нужно найти логотип телеканала на экране (чтобы он не вращался и масштабируется), вы могли бы сделать это проще (сопоставление шаблонов или что-то еще).

  2. обычное просеивание не учитывает информацию о цвете. Поскольку логотипы обычно имеют постоянные цвета (хотя точный цвет зависит от молнии и камеры), вы можете каким-то образом рассмотреть информацию о цвете.

мы работали над обнаружением/распознаванием логотипа в реальных изображениях. Мы также создали набор данных FlickrLogos-32 и сделал его общедоступным, включая данные, наземную правду и сценарии оценки.

в нашей работе мы рассматривали распознавание логотипов как задачу поиска, чтобы упростить распознавание нескольких классов и позволить таким системам легко масштабироваться до многих (например, тысяч) классов логотипов.

недавно мы разработали метод связывания под названием Bundle мин-хеширование это агрегирует пространственные конфигурации нескольких локальных объектов в очень отличительные наборы объектов. Представление пакета можно использовать как для извлечения, так и для распознавания. См. следующие примеры тепловых карт для обнаружения логотипов:

enter image description hereenter image description here

вы найдете более подробную информацию о внутренних операциях, потенциальных приложениях подхода, экспериментах по его выполнению и, конечно же, много ссылок на соответствующие работы в статьях [1][2].

работал на этом: соответствие торговой марки и получение в спорте видео базы данных получить PDF документа: http://scholar.google.it/scholar?cluster=9926471658203167449&hl=en&as_sdt=2000

мы использовали SIFT в качестве дескрипторов товарных знаков и изображений, а также нормализованное пороговое соответствие для вычисления расстояния между моделями и изображениями. В нашей последней работе мы смогли значительно сократить вычисления с использованием метамоделей, созданных для оценки релевантности точек отсева которые присутствуют в разных версиях одного и того же товарного знака.

Я бы сказал, что в целом работа с видео сложнее, чем работа с фотографиями из-за очень плохого визуального качества используемых в настоящее время телевизионных стандартов.

Марко

Я работал над проектом, где мы должны были сделать что-то очень похожее. Сначала я попытался использовать методы обучения Haar с помощью этого программного обеспечения

OpenCV

Это сработало, но не было оптимальным решением для наших нужд. Наши исходные изображения (где мы искали логотип) были фиксированного размера и содержали только логотип. Из-за этого мы смогли использовать cvMatchShapes с известным хорошим совпадением и сравнить возвращенное значение, чтобы считать хорошее совпадение.

Comments

    Ничего не найдено.