2. Все эти данные поступают в
RVM — "блок оптимизации дохода" (
revenue manager).
Важная задача RVM — обеспечивать
баланс между эксплуатацией и исследованием цены (Exploration–Exploitation Dilemma). Суть:
— Если тестировать слишком много разных цен, то слишком часто будет использоваться неоптимальная цена, и на выходе будет проигрыш вместо выигрыша.
— Если не исследовать цены, в итоге может быть выбрана совершенно не оптимальная цена, так как оптимальную цену просто не успели протестировать. Потери в виде упущенной прибыли могут оказаться еще выше.
— Поэтому в ценовой оптимизации очень важен баланс исследования и эксплуатации.
Внутри RVM работает
алгоритм, который
выбирает один из двух алгоритмов оптимизации цены для конкретного товара. Для этого анализируется статистика частоты покупок:
✓ Epsilon-greedy. Алгоритм оптимизации для товаров с малым объемом накопленной статистики (с большой вероятностью, редко покупаемых); например, для товаров, которые до оптимизации покупали 2-3 раза за квартал. Исследование цены редко покупаемых товаров может занять годы, поэтому рациональнее сразу выбрать наилучшую из имеющихся цену без поиска более оптимальной цены. Данный алгоритм не задействует "устаревание" данных (уменьшение веса данных по мере увеличения давности их сбора).
✓ Thompson sampling, о котором подробно рассказано
выше. Основной алгоритм системы, в котором сбалансировано исследование и эксплуатация цены (это доказывалось в ряде научных публикаций).
При вычислении оптимальной цены
учитываются роли SKU в корзине (драйверы трафика, драйверы корзины, заменители, дополнители и так далее), и как каждый конкретный
товар влияет на продажи других товаров.
В частности, это помогает
избежать каннибализации в категориях.
3. Далее RVM выбирает цену, при которой на текущий момент достигается максимум нашего целевого показателя (выручки, валовой прибыли или продаж в штуках) — с учетом взаимного влияния товаров. Эта
оптимальная цена передается на выход.