Computer vision: как его применять и в чем сложность для разработчиков и заказчиков

Ольга Лисина

11 февраля на вебинаре в рамках проекта AI Heroes основатель Eora Рома Доронин и руководитель направления computer vision Влад Виноградов рассказали о своей платформе VisionHub — маркетплейсе моделей компьютерного зрения, а также о том, где и как можно применять эту технологию.

Computer vision: как его применять и в чем сложность для разработчиков и заказчиков

Павел Доронин

Компьютерное зрение — это направление в ИИ, которое применимо в огромном числе сфер: от медицины до безопасности. Алгоритмы компьютерного зрения работают по аналогии с человеческими глазами. 

Основные направления компьютерного зрения:

    детекция,

    распознавание объектов,

    трекинг объектов,

    задачи из области обработки и восстановления изображений.

Проблемы в сфере искусственного интеллекта

Проблем в сфере ИИ множество. Именно этим объясняется такое малое количество реальных кейсов. Сложности проявляются на этапах:

    сбора данных,

    обработки данных,

    расчета стоимости решения,

    обслуживания,

    дообучения моделей,

    извлечения метрик точности работы, так как метрики не только меняются от камеры к камере, но и деградируют со временем. 

Применение компьютерного зрения в повседневной жизни

Компьютерное зрение применяется в разных сферах.

Пример 1. Медицина

Система, помогающая врачам детектировать опухоли на снимках. Как результат, быстрая и точная работа врачей при первичной проверке.

Пример 2. Магазины одежды

Искусственный интеллект в роли модельера. Анализ примеров одежды и генерация собственных вариантов.

Пример 3. Коммунальные службы 

Камеры и микрофоны на фонарях анализируют текущую ситуацию. Как результат, детекция драк, выстрелов, звуков битого стекла.

Пример 4. Телевидение

Разделение видео телепередач на блоки и генерация названия блока. Определение «перебивок» между блоками на видео- и аудиоряде, генерация названия на основе текста.

Пример 5. Химия

Распознавание нарисованной молекулы и перевод в формулу. Распознавание атомов и связей, составление молекул в цифровом формате.

Пример 6. Банки

Чат-бот с возможностью верификации пользователя по лицу. Благодаря этому функционалу он отвечает на вопросы пользователей и дает возможность производить оплату.

Все эти модели уже работают и представлены на платформе VisionHub.

Трудности, с которыми сталкиваются разработчики и заказчики

Перед заказчиками стоит задача правильной формулировки запроса, отбора разработчиков и интеграторов для внедрения систем computer vision. Разработчикам сложно объединить несколько моделей на одном видеопотоке.

Например, есть видеопоток с камеры. Изначально необходимо реализовать модель распознавания лиц. Далее — подключить модель распознавания касок. Далее — добавить модель распознавания падений, модель детекции пожара и любые другие. Необходимо прописывать логику моделей непосредственно под каждую камеру.

Для нового скачка в области computer vision необходима демократизация AI, то есть упрощение внедрения и кратное снижение стоимости таких решений, что позволит им выйти на новую экономическую эффективность.

Решения

На рынке существуют отлаженные модели в руках у команд разработчиков и компаний. Также есть решение в виде платформы Eora VisionHub — это маркетплейс готовых моделей машинного обучения. Его задача — объединить разработчиков, интеграторов и заказчиков для простого внедрения систем computer vision.

Особенность платформы заключается в возможности объединения нескольких моделей на одном видеопотоке. Логику моделей можно прописать под каждую камеру за пару кликов.

Как получить максимум от computer vision

    Убедитесь, что вы готовы к внедрению ИИ.

    Поймите, в какой области вашего бизнеса ИИ будет наиболее полезен.

    Посчитайте, в каком случае ИИ оправдает затраты.

    Найдите команду компетентных разработчиков или воспользуйтесь готовым решением.

    И шагайте навстречу новым интеграциям!

Фото на обложке: Shutterstock / Lidiia

Источник: rb.ru

Добавить комментарий