Фрод (мошенничество) в цифровом мерчендайзинге. Цифровое противодействие. Часть 1.

Случаи мошенничества (фрода, fraud – англ. “обман”, “фальсификация”) в мерчендайзинге часты и увы, неизбежны. Полевой персонал – вероятно, в силу специфики труда без надзора руководства – изобретателен на различные уловки, чтобы работать меньше, а зарабатывать больше. Поэтому для компаний, имеющих в штате мерчендайзеров, всегда актуален вопрос аудита и проверок деятельности сотрудников.

В этой статье мы расскажем о видах фрода в мерчендайзинге и о нашем опыте технологического преодоления ловушек нерадивых сотрудников. В первой и второй, практических, частях более подробно остановимся на том, как мы умеем работать с некоторыми типами мошенничества.

И в третьей части, теоретической, для полноты картины расскажем о других популярных способах обмана со стороны полевого персонала.

Цель мошенничества

Основная цель фрода – искусственное повышение производительности. Поскольку полевые специалисты, занятые съемкой витрин и составлением отчетов, зачастую имеют сдельную оплату труда, то манипулирование фотографиями позволяет создать видимость бОльшего количества посещенных точек продаж и отснятых витрин – и, соответственно, получить бОльшее вознаграждение.

Другой случай, когда гонорар специалиста зависит не от количества сделанных фотографий, а от качества работы, то есть достигнутых KPI. В этом случае чем более качественные с точки зрения выкладки фотографии он предоставит заказчику, тем больше баллов и, как следствие, большее вознаграждение он получит.

В этой статье мы расскажем, как ShelfMatch работает с фальшивыми снимками, а именно:

1) Определяет и ищет дубликаты фотографий

2) Различает и отбраковывает из всего потока фотографии плохого качества

3) Умеет определять фотографии, сделанные с экрана / полиграфического носителя

1) Детектирование дубликатов фотографий

Дублирование фотографий – наиболее распространенный тип мошенничества. Мерчендайзер загружает в систему одну и ту же фотографию с промежутком несколько дней или недель. Фотография эта может быть реальным снимком из торговой точки, а может быть и скачанной из специальной подборки: у мерчендайзеров существуют группы и чаты по обмену качественными фотографиями полок, в которых собрана большая база изображений. Смысл такой уловки – не нанести визит в магазин, но отправить супервайзеру старое неактуальное фото полок с товарами, как если бы сотрудник посетил торговую точку.

Как мы работаем с таким фродом:

С одной стороны, поиск дубликатов изображений – это достаточно известная, понятная и решённая задача для машинного обучения. Сервис обработки фото создаёт цифровой отпечаток (digital fingerprint) фотографии, записывает его в базу, создаёт такой виртуальный отпечаток для всех входящих изображений и сравнивает каждый новый фингерпринт с предыдущими, находя, тем самым, повторяющиеся изображения.

С другой стороны, в нашем контексте эта задача не так однозначна, как может показаться на первый взгляд. Существует несколько сложностей, которые затрудняют работу.

Во-первых, что считать дубликатом? Казалось бы, ответ прост: точно такое же изображение витрины. Но при таком понимании дубликата систему будет достаточно легко обмануть. Например, можно немного обрезать исходное изображение, даже частично пожертвовать какими-то SKU на фото, и тогда, с точки зрения машинного зрения, абсолютным дубликатом оно уже не будет – хотя будет дубликатом, с точки зрения информационного наполнения. И это первая сложность, которую приходится учитывать при построении системы по поиску дубликатов изображений.

Во-вторых, за какой период осуществлять поиск по базе предыдущих визитов? Эта сложность лежит в плоскости серверных мощностей. Одно дело, когда у нас есть некая база изображений фиксированного размера. А другое дело, когда эта база ежедневно прирастает на несколько десятков тысяч картинок и больше. В итоге, нужно решать вопрос с физическим местом для хранения отпечатков и скоростью сравнения каждого отпечатка со всей базой. Можно периодически очищать базу от старых записей, но рано или поздно мерчендайзеры получат шанс повторять предыдущие изображения.

Несмотря на эти нюансы, сервис ShelfMatch позволяет защитить вас от настырных и очевидных попыток подлога фото.

2) Детектирование фотографий плохого качества

Нередки случаи, когда сотрудники загружают в систему фотографии плохого качества, по которым невозможно провести качественный аудит. Это могут быть засвеченные, смазанные, нечеткие фотографии, снимки, сделанные под случайным углом, фотографии, на которых не виден весь стеллаж, и прочие негодные файлы. Причина, по которой сотрудники делают такие фото, — это заданный объём данных. Проще сделать и отправить супервайзеру много некачественных фото, чем стараться делать качественные, добротные снимки. И, конечно, играет роль человеческий фактор: все могут ошибаться и нечаянно сделать плохую фотографию.

Как мы работаем с таким фродом:

В сервисе ShelfMatch за оценку качества фотографий визита отвечает специализированный отдельный модуль. Обработка фотографии происходит в 2 этапа:

1 – предобработка (до распознавания SKU) и

2 – постобработка (уже после распознавания SKU и ценников на фотографии).

1) Предобработка

В части предобработки входящее изображение полки пропускается через несколько нейронных сетей, которые оценивают следующие параметры:

–  Ракурс съёмки. В частности, нейронная сеть ищет угол наклона полок стеллажей на фотографии. Это довольно важный параметр, поскольку от угла съёмки зависит качество распознавания SKU. Чем более фронтально сделана фотография, тем точнее будут результаты распознавания. Подробнее о качестве фото см. соответствующий раздел FAQ.

Наличие товаров на фото. Ещё одна нейронная сеть определяет, содержит ли фото изображение товаров или имеет иное содержание. Под “иным” может быть масса вариантов: на практике мы встречаем фотографии из машины, фото входной группы торговой точки, фото пола/потолка магазина, отправленные по ошибке, и тому подобные нерелевантные изображения.

–  Качество фото, в целом. Отдельная нейронная сеть определяет в связке параметры (“степень четкости изображения” + “засвеченность”) и выдаёт совокупное значение: перед нами изображение плохого или хорошего качества.

Фото с экрана или реальная фотография. Об этом варианте фрода мы подробнее поговорим ниже в п.3.

Результаты предобработки позволяют нам не брать дальше в распознавание откровенно плохие фотографии, а мерчендайзер, в свою очередь, может получить быстрый запрос на новое, качественное фото (если работа происходит в онлайн-режиме).

2) Постобработка

Часто бывает так, что плохим является не всё фото целиком, а какая-то его часть. Такие случаи сервис ShelfMatch умеет оценивать постобработкой.

В процессе постобработки происходит оценка качества не всей фотографии, а отдельно каждого маленького кусочка изображения, содержащего SKU или ценник.

В процессе постобработки можно:

– отслеживать, кто из мерчендайзеров делает идеальные или близкие к идеальным фото, а кто не очень старается

– получать дополнительную метку о точности/сомнительности результатов распознавания SKU и/или ценника в данном конкретном месте изображения.

Так или иначе, в сфере автоматического распознавания товаров идёт постоянная борьба за точность распознавания, ведь от этого напрямую зависит качество отчётов, которые получает клиент. Но часто точность распознавания страдает по не зависящим от нейронных сетей причинам: на фото закрался большой блик, или рука дрогнула при фотографировании, и смазалась часть изображения и т.п. В таких случаях оценка качества фото, в целом, ничего не даст. А вот постобработка и оценка уже отдельных областей покажет, что результаты по такой фотографии не очень точны и нужно их хотя бы частично опустить. Таким образом, у нас есть ещё один инструмент по выявлению некачественных фотографий, позволяющий повысить точность аналитики, которую получает конечный клиент.

Продолжение следует.

Мы помогаем ритейлерам бороться с мошенничеством полевых специалистов, используя технологии компьютерного зрения. Если у вас есть подобные задачи, напишите нам. Мы поможем вам найти подходящее решение.