Комплексный аналитический проект основанный на eCommerce данных за 2 месяца включающий 100 млн. юзеров. В рамках проекта была создана локальная аналитическая система DWH + BI и проведен A/B тест для тестирования продуктовой гипотезы.
В тесте приняло участие 1.88M уникальных пользователей.
| Метрика | Группа A (Control) | Группа B (Test) | Uplift | Стат. значимость (p-value) |
|---|---|---|---|---|
| Conversion Rate (CR) | 5.39% | 7.87% | +20.41% | < 0.05 (Z-test) |
Продуктовый вывод: Внедрение кнопки статистически значимый прирост конверсии. Анализ в разрезе брендов показал, что эффект стабилен на топ-10 брендов (Apple, Samsung, Xiaomi и т.п). Рекомендация: раскатить фичу на 100% пользователей.
- ETL-процесс: Сырые логи обрабатываются чанками с помощью pandas, очищаются от пустых значений и приводятся типы.
- Сплитование: Пользователи разделены на группы А и B (50/50).
- Хранилище: Обработанные датафреймы загружаются в колоночную СУБД ClickHouse.
- Визуализация: ClickHouse подключен к Apache Superset, где написаны SQL-запросы для создания витрин и дашбордов.


