Иван Бегтин

Проверенный чёрт

Previous Entry Share Next Entry
iMARS и распознавание образов
ivbeg

Я ранее в двух постах писал про IBMовскую экспериментальную разработку MARVEL

К сожалению, его, как и многие другие исследовательские проекты IBM трудно отслеживать через RSS, поэтому периодически проверяю их вручную. Каково же было моё удивление когда я обнаружил что следы MARVEL на сайте IBM исчезли. Ссылка на проект благополучно возвращает 404 ошибку. В конце концов после детальных поисков обнаружилось что он не стал сверхсекретным и его не прикрыли, а всего лишь переименовали в iMARS - IBM Multimedia Analysis and Retrieval System.

Как бы то ни было сегодня натравил iMars на коллекцию фотографий и обнаружил сразу несколько изменений. Первое - повысилось качество распознавания. Если ранее на моей выборке было до 20% ошибок, то теперь только каждая 20 фотография классифицировалась неправильно.

Второе -   видно что активно идёт работа над новыми шаблонами распознавания. Повились шаблоны студий и толп.

Чем мне лично именно этот проект интересен так это что учитывая рост процессорных мощностей и качества распознавания изображений он вполне сможет заменить назначение тэгов через фолксономию. Сколько я ни смотрел аналогичного рода ПО нигде нет, только статьи и исследования. Очень интересно во что это выльется в итоге.

Кросспост из Иван Бегтин. Комментарии можно оставлять здесь или здесь.


  • 1
кстати, а где то на IBM было распознование голоса
можно сейчас имея mp3 перевести его в текст? хотя бы примерно?

Действительно был у них проект ViaVoice правда на самом сайте IBM о нём информации немного, как я понимаю они дали права на его разрешение Wizzard которые предоставляют продукты по распознаванию.
Был у них проект MASTOR для автоматического перевода с языка на язык.

Насколько я знаю до сих проблема точного распознавания голоса не решена. Тут неважно mp3 или другой формат, если качество позволяет преобразовать в wav, проблема в том большинство движков распознавания требуют предварительного обучения на голос. Собственно IBM MASTOR один из немногих продуктов который работает без обучения, но информации о нём очень немного, и языки он поддерживает только китайский и арабский.

(Deleted comment)
  • 1
?

Log in

No account? Create an account