Американские программисты работают над оригинальным алгоритмом, способным узнавать изображения. Любопытно, что тренируются авторы программы, как в известном фильме "на кошках". Они создали машину, которая допускает животное с прогулки в дом лишь тогда, когда кошка не несёт в зубах полудохлую мышь или птичку.
Компания Quantum Picture полагает, что любое изображение можно описать, как собрание конечного числа особенностей. Речь не идёт о простом описании пикселей.
Если тот же самый объект сфотографирован с различным разрешением или различной ориентацией, освещением и так далее, мы получаем два совершенно разных описания, которые бессмысленно сравнивать пиксель за пикселем.
Человек же сразу видит, что на снимках один и тот же предмет, поскольку наш мозг делает "запись" изображения не как множества пикселей, но как дискретного набора особенностей кончик носа, развилка в кроне дерева, конец палки и тому подобное.
Можно ли определить, имеют два изображения то же самое содержание или нет, не описывая их как наборы особенностей? Да. Значительное число таких алгоритмов было разработано, главным образом, на основе так называемых нейронных сетей.
| ||
Это очень трудоёмкая задача, и не зря пока в Сети можно искать картинки лишь по подписям к ним. А ведь поиск в Интернете нужных людей, животных или вещей именно по их изображениям занимает компанию Quantum Picture в первую очередь.
Основатель фирмы и автор программы Борис Цикановский (Boris Tsikanovsky), чей дом расположен близ Сиэтла, развивает свой подход к этой проблеме.
Его компьютер пока не может отличать людей по лицам, но уже занимается допуском в загородный дом кошек Бориса, которые имеют обыкновение притаскивать полудохлых птичек или мышей и играть потом с ними по всему особняку, что, понятно, не нравится хозяину.
Профиль кошки с добычей и без, как его видит компьютер (фото с сайта quantumpicture.com). |
В его основе маленькая кошачья дверка, замок которой управляется компьютером. Прежде, чем попасть в дом, кошка должна пройти через крохотный отсек, оснащённый лампой с большим плафоном, дающим рассеянный свет, зеркалом и цифровой камерой Kodak DVC323, фиксирующей профиль кошки в тот момент, когда центр изображения оказывается затенённым.
| ||
Камера передаёт снимок в компьютер посредством порта USB. У компьютера есть примерно секунда на принятие решения до того момента, как кошка уткнётся мордочкой в запертую дверцу, пытаясь попасть в дом.
Главный элемент, который оценивает программа подбородок кошки. Если он видится как плавная закруглённая кривая кошка бежит без добычи, и дверь отпирается. Если во рту кошки что-то есть дверь остаётся закрытой.
Flo Control работает на обычном ПК (фото с сайта quantumpicture.com). |
Компьютер записывает в память все значимые события: уход и приход каждой из кошек, их попытки проникнуть в дом с добычей, а также желания непрошенных гостей попасть внутрь, например скунсов или птиц. Программа отличает их от кошек по профилю.
Недавняя модернизация софта добавила машине возможность генерировать WAP-страницы и теперь как сами разработчики, так и все желающие, могут посмотреть записи программы-сторожа по сотовому телефону с WAP-браузером. Программа показывает последнее событие, а их обычно бывает по 10-15 в день.
Разумеется, есть вариант страницы и для обычной сети.
| ||
Числа на самих картинках отражают некий критерий совпадения изображения со стандартным образом каждой кошки. Если "число подобия" меньше 40 кошка (или иной зверь) не допускается в дом. Весь диапазон оценки от 0 до 80.
Как пишет сам автор программы, если бы нам пришлось иметь дело со всем туловищем кошки задача усложнилась бы неимоверно, ведь тень от пластичного животного будет невероятно разнообразной.
Но поскольку череп жёсткий, профиль головы кошки оказывается почти неизменным. Лишь добыча во рту вносит разнообразие в его линии. Это позволяет машине узнавать кошку практически безошибочно.
Любопытно, что некоторые из алгоритмов, отработанные на кошачьем стороже, нашли применение в программе создания трёхмерных изображений, именуемой GroBoto, рассчитанной правда только на "Макинтоши".
Изображение, созданное при помощи GroBoto программы, придуманной, в том числе, благодаря непоседливым кошкам Цикановского (фото с сайта groboto.com). |
Она уже продаётся через Сеть. А, тем временем, автор идеи продолжает совершенствовать систему распознавания образов. Но Фло, Белка и Алексия, конечно, не подозревают, какое полезное дело они "затеяли", донимая своего хозяина охотничьими трофеями.
Статья получена: Membrana.ru