Small Object Detection model

Оптимизированная модель распознавания классов объектов.

Лицензия

Other

Возможности

Сервис позволяет распознавать объекты на изображениях.

Подходит для быстрого тестирования гипотез, запуска на небольших конфигурациях инфраструктуры и для задач с не высокими требованиями к качеству предикта.

Так же существует модель с полным функционалом распознавания объектов (ссылка на большую модель в платформе).

Мини-версия модели и модель с расширенными возможностями могут быть полезны для сортировки изображений в фотобанках, классификации типов документов, решения задач поиска объектов определенного класса на изображениях большого разрешения с множеством деталей (например, фаеры на трибунах стадионов).

Пайплайн модели:

Единая нейронная сеть применяется к полному изображению. Сеть делит изображение на области и предсказывает ограничительные рамки и вероятности для каждой области. Ограничивающие рамки взвешиваются по прогнозируемым вероятностям.

Преимущества

Работает быстро и точно. На карте, измеренной при .5 IOU, YOLOv3 находится на одном уровне с фокусной потерей, но примерно в 4 раза быстрее.

Сценарии использования

Детектирование объектов в реальном времени

Все веса модели доступны для скачивания, поэтому она может быть дообучена под специфические задачи. Такие как:

медицинская диагностика по рентгеновским снимкам, гистологическим срезам и т.д.; распознавание утечек на изображениях аэрофотосъемки;
визуальный контроль исправности деталей, качества производственного сырья и др.

Инструкции по использованию

Чтобы деплой был постоянно включен и ожидал запросов без задержки на инициализацию установить 1-1 pod. Если деплой больше не нужен, установить 0-1 pod, чтобы деплой перешел в режим ожидания и деньги не списывались.
Чтобы создать деплой модели, необходимо указать следующий базовый образ: https://cr.msk.sbercloud.ru/aicloud-base-images/horovod-cuda10.0-tf1.15.0-pt1.3.0:0.0.28
Изображение необходимо сконвертировать в BASE64 и отправить запрос.

Конвертер: https://codebeautify.org/image-to-base64-converter

Пример функции для конвертирования:

def open_images_base64(img_strs):
  return np.array(Image.open(BytesIO(base64.b64decode(img_strs))).convert("RGB"))[:,:,::-1]

def create_image(img):
  buffered = BytesIO()
  img.save(buffered, format="JPEG")
  img_str = base64.b64encode(buffered.getvalue()).decode("latin1")
  return img_str

Для каждого изображения, которое необходимо распознать требуется отдельный запрос

Обучающие примеры

Запрос

{ "instances":[ { "image": "your base64 string" } ] }

Пример ответа

строка base64

Полезные сcылки

GitHub - https://github.com/quanhua92/darknet

Дисклеймер

Начиная использовать контент, пользователь принимает условия Пользовательского соглашения и Лицензии контента. Ответственность за выбор и способы использования контента AI Marketplace (DataHub/AI Services) лежит на пользователе. В случае возникновения сомнений в соответствии описания контента с его фактическим содержимым и свойствами, Пользователь может обратиться в окно технической поддержки, размещенное на Платформе в модуле «Сообщить о проблеме».

Исчерпывающая информация по лицензии данного контента находится в разделе Лицензионное соглашение ниже.

Лицензионное соглашение

Лицензия на контент

Обратная связь

Круглосуточная поддержка по телефону 8 800 444-24-99, почте support@cloud.ru и в Telegram