Поиск гипотез роста через мини-кластеры: Путь самурая


ТЕХНОЛОГИИ КЛИЕНТСКОЙ АНАЛИТИКИ
Валерий Дедюхин
Аналитик данных
07.07.23
"Аналитика сама по себе не зарабатывает деньги" – такой тезис приходится слышать довольно часто со стороны менеджмента компании.И действительно, инсайты и корреляции нельзя так просто снять с банковской карточки. Однако, внедряя тот или иной аналитический продукт в процесс принятия решений, важно заранее понимать, какую пользу он принесет. В экономике знаний критически важно уметь конвертировать информацию в рост KPI.

Любой аналитический продукт – это, прежде всего, инструмент: он должен быть создан для какой-то цели, и с самого начала все должны понимать, как им пользоваться.

В этой статье расскажем, как используем мини-кластеризации для извлечения полезного знания, а также при чем тут самураи.
Содержание
Определим истоки мини-кластерного подхода
Как их использовать
Техническая реализация
Примеры из практики
ChatGPT
Истоки подхода к анализу
Мини-кластеризации – это подход, который идейно находится на стыке RFM и Lifestyle сегментаций на всей доступной витрине признаков и позволяет охарактеризовать каждого клиента в разных аспектах его потребительского поведения.

В отличие от классического RFM, который сосредоточен на верхнеуровневых транзакционных данных, мини-кластеры могут учесть гораздо больше информации:
В отличие от Lifestyle сегментаций, мини-кластеры имеют фиксированную размерность по признакам (так и появилась приставка "мини"). Вместо одной большой кластеризации по всем признакам сразу мы проводим ряд параллельных "мини-кластеризаций", собирая признаки в пары.

Зачастую один признак характеризует клиента в том или ином аспекте, а другой – указывает на достоверность характеристики. Например, в мини-кластеризации по отношению к скидкам первый и основной признак – это доля скидки в общей сумме покупок клиента. Вторым признаком мы вводим суммарное количество заказов: так мы можем оценить, насколько мы доверяем значению основного признака (если заказов пока мало, то степень достоверности низкая).
В результате, каждый клиент характеризуется с разных сторон: каждая мини-кластеризация отвечает за отдельный аспект, разбивая клиентов на группы по значению 2х признаков. Такие сегменты очень просто интерпретировать и комбинировать между собой.

Например, мы можем собрать комбинированный сегмент на пересечениях разных мини-кластеризаций:

- предпочтение товарной категории: кроссовки для бега, степень склонности 75%

- предпочтение ценовой категории: medium (средние цены)

- отношение к скидкам: устойчиво индифферентное

- не покупают сопутствующие товары

Более подробное описание можно найти в предыдущем материале цикла.
Процесс сборки
Прежде чем перейти к примерам, добавим еще немного концепта.

Все сегментации мы можем условно разделить на 2 типа: ЦЕЛЕВЫЕ и ОПИСАТЕЛЬНЫЕ
В целевых сегментациях мы делим клиентов с позиции целей маркетинга: увеличение ценности клиента, предотвращение оттока, развитие ширины потребительской корзины, повышение лояльности и др. В итоге, каждый сегмент отражает рейтинг клиента в том или ином аспекте. Например, ценность клиента можно охарактеризовать через общую сумму его трат (фактический LTV) и lifetime – период жизни. Целевые сегментации позволяют выстроить путь, по которому мы хотели бы провести клиента, чтобы повысить его ценность.

Описательные сегментации помогают нам лучше понимать потребности клиентов и формировать для них лучшее предложение. Это могут быть сегментации по отношению к скидкам, по приоритетным ценовым / товарным категориям, по склонности покупать много, по стремлению покупать новые коллекции / сопутствующие товары и др.
Самое очевидное применение мини кластеризаций – это, безусловно, персонализация предложения через описательные сегменты. Мы можем использовать известные предпочтения клиентов, повышая OR и CR в адресных коммуникациях. Также мы можем уточнять дизайн общих промо-компаний, основываясь на дополнительной информации о ядре ЦА.

Зачастую такой подход сводится к поиску "идеального" сегмента для уже поставленной задачи: стимулировать продажи конкретной товарной категории, привлечь внимание к новому товару или избавиться от старого. Для этого достаточно использовать описательные сегментации. Например, если бизнесу нужно продвигать новую коллекцию одежды, то нам нужно найти людей, которые покупают часто, без скидок и в целом склонны покупать в периоды запуска коллекций. При этом мы можем диверсифицировать предложение по стилю / категории товаров, исходя из предпочтений клиента.

Но часто бывает так, что сама постановка цели становится задачей анализа. В этом случае нам могут помочь целевые сегментации. В ходе анализа целевых сегментаций аналитик может выбрать конкретный фокус для маркетинга. Например, это может быть сокращение оттока – фокусным сегментом в этом случае станут клиенты, ушедшие в отток или близкие к этому. Возможны и другие цели: повышение среднего чека, увеличение ширины корзины, снижение доли охотников за скидками, etc. Так мы отвечаем на вопрос "Кому?" - кому мы хотим сформировать предложение.

Еще одно применение целевых сегментаций – это контроль ключевых KPI сегмента.

Воздействуя на конкретный срез аудитории, важно помнить об основной цели – мы всегда стремимся к развитию ценности клиента. В своей практике мы в обязательном порядке вводим кластеризацию по ценности. Состав признаков для такой кластеризации может быть разным, но чаще всего мы используем lifetime и LTV (фактический или прогнозный).

Анализ распределения аудитории по сегментам в целевых сегментациях позволяет сформировать клиентский путь и определить ключевые факторы, которые способствуют росту ценности сегмента.
Техническая реализация
Пара слов об инфраструктуре. Для комфортной работы нужно выбрать такую среду, которая была бы доступна для широкого круга пользователей. Наиболее простой и быстрый способ, который мы использовали в своей практике – это связка Google Big Query и Google Sheets. Формируем витрину данных в Big Query, где для каждого клиента отображаем его кластер в каждой мини-кластеризации, а также считаем ряд важных для нас метрик (AOV, ITT, Recency, Lifetime и др.). В такую таблицу можно добавлять сколько угодно характеристик клиента, в зависимости от текущих нужд анализа.

Далее мы просто подключаем готовую витрину к Google Sheets и работаем с данными через функционал сводных таблиц.
Самое время поговорить о самураях
Основа мировоззрения японского самурая эпохи Сэнгоку – это концепция моментальности и присутствия. Самураи осознавали, что цель может быть недостижимой или подвержена изменениям, в то время как путь – это непрерывный процесс, который есть всегда. Поэтому самураи сосредотачивались на совершенствовании своего пути. Такой фокус позволял им быть гибкими и адаптивными в сражениях и в жизни.

Применительно к работе аналитика, "Путь самурая" – это естественный ответ на окружение с высоким уровнем неопределенности. Когда неизвестно, что конкретно искать, нужно просто идти вперед, управляя одним моментом.
Рассмотрим на примере из реальной практики step-by-step.
Процесс поиска гипотез: (1) Отправная точка
Предположим, мы решили сформировать идею для продвижения детской коллекции одежды. Начнем с простого вопроса: кто покупает детские товары? Судя по данным, структура базы по предпочтениям в половозрастных категориях выглядит следующим образом (выбраны только сегменты, связанные с детским ассортиментом):
  • Д – клиенты, которые предпочитают покупать только детские товары (клиенты с детьми, пол неизвестен);
  • ЖД – предпочитают покупать женские и детские товары (женщины с детьми);
  • МД – предпочитают покупать мужские и детские товары (мужчины с детьми);
  • МЖД – предпочитают покупать товары всех половозрастных групп (семьи).
Таким образом, подавляющая доля покупателей детских товаров – это сегмент ЖД – женщины с детьми. Интересно. Но попробуем пойти дальше.
(2) Что еще мы о них знаем?
Нужно охарактеризовать сегмент в разных аспектах. Полезная информация о клиентах обычно лежит на пересечении нескольких описательных сегментов. Поэтому попробуем раскрыть выбранный сегмент через другие описательные сегментации. Посмотрим, например, как эти люди относятся к скидкам.

Для этого возьмем сегмент из предыдущего шага и оценим его структуру в другой сегментации – по отношению к скидкам.

Так, видим, что самая большая группа – это женщины с детьми, индифферентные к скидкам (хотя в целом по компании покупателей-мужчин оказалось в два раза больше, чем женщин). При этом именно среди женщин доля индифферентных выше, чем в других группах.

Таким образом, сегмент индифферентных женщин – самый крупный в категории детских товаров. Это значит, что помимо скидок в продвижении нам следует уделять соразмерное внимание немонетарным стимулам, а ориентироваться следует в основном на женскую аудиторию.

Что еще мы знаем об этих людях? Возьмем полученный сегмент (Indifferent, indiff_robust) + (Д, ЖД) и раскроем его в других аспектах. Например, с позиции предпочитаемых ценовых категорий:
Итак, в основном это low и medium сегменты, причем довольно устойчивые в своих предпочтениях. Это также можно иметь в виду при планировании маркетинговой кампании. Итоговый сегмент: (Indifferent, indiff_robust) + (Д, ЖД) + (medium, low)

Можно проделать несколько таких итераций, попутно уточняя сегмент (если нужно).
(3) Определить цели коммуникации и рычаги влияния
В качестве цели мы можем рассматривать приращение сегментов в целевых сегментациях. При этом не обязательно концентрироваться на конкретном сегменте.

Возьмем сегментацию по финансовому результату. Клиенты в ней распределены в зависимости от их lifetime и LTV. Чем больше оба показателя, тем «выше» и «ценнее» сегмент. Наша задача – провести клиента по этому пути вверх.

Сделать это мы можем через средний чек, частоту покупок, реактивацию и т.д. Это и будут наши рычаги влияния.
(4) Раскрыть описательный сегмент в аспекте целевого сегмента
Чтобы понять, как именно запустить переток в более высокие сегменты, нужно понять, чем отличаются между собой соседние ступени. Так мы поймем, на каком факторе лучше сфокусироваться.
* ITT (inter-transaction time) – среднее расстояние между заказами в сегменте

Так, мы видим, что econom может перейти в econom_up, если увеличится его средний чек. Далее, если с тем же средним чеком и частотой покупок клиент останется с нами на 1,5 года, то он переместится в premium. А если его частота покупок и средний чек вырастут за это время, то он может попасть даже в VIP.

Сегменты econom_old, middle_old для нас нежелательны, потому что их определяет в основном lifetime. Время жизни таких клиентов такое же, как у premium и vip, но финансовый результат намного ниже. Нужно стремиться к тому, чтобы таких клиентов было меньше: гораздо предпочтительнее было бы видеть их в числе premium или vip сегментов. Для этого нужно работать со средним чеком и частотой покупок.

Итак, теперь мы понимаем, на какие показатели воздействовать.
(5) Собрать весь контект
Итак, имеем следующие вводные для поиска оптимальной коммуникации.

● Товарная категория: детские товары
● ЦА: женщины
● Стимулы: немонетарные
● Цели и метрики (по убыванию приоритета): средний чек, реактивация, частота покупок
(6) Подключим маркетингового аналитика + ChatGPT
В 2022 году привычный мир маркетинга встряхнуло. И маркетинговая аналитика не стоит в стороне. Развитие нейросетей происходит настолько стремительно, что опции НЕ использовать их уже попросту нет.

С подготовленным контекстом для поиска гипотез значительно проще сфокусировать внимание на конкретных идеях. Для их перебора можно устроить мозговой штрум с командой или начать с ChatGPT.

На пример выше может подойти такая затравка:

"Думай как CRM маркетолог. Твоя товарная категория - детские товары. Целевая аудитория - женщины. Предложи 10 идей для немонетарных стимулов и промо. Цели коммуникации - рост среднего чека, реактивация клиентов, рост числа покупок."

Из 10 предложений 2-3 обязательно будут достойны внимания. И по ним уже прорабатывайте конкретные АБ тесты.
И внимательный читатель заметил, что мини-кластеры имеют один весомый недостаток перед классическим подходом к полной ML кластеризации. Группируя признаки попарно, мы создаем довольно много сегментов, а это значит, что у нас появляется дополнительная ручная работа по поиску однородных скоплений на пересечении разных мини-сегментов.

И здесь ChatGPT тоже пригодится. В 2023 появился плагин Chat With Your Data, который позволяет провести работу по поиску заметных отклонений по всем вариантам пересечений практически автономно.

Подробнее о работе с ChatGPT в контексте анализа клиентской базы мы расскажем в следующих материалах цикла.
Приходите с интересными задачами.
Error get alias