СРАВНИТЕЛЬНЫЙ АНАЛИЗ АРХИТЕКТУРЫ ХРАНЕНИЯ АНАЛИТИЧЕСКИХ ДАННЫХ ДЛЯ СЕРВИСА АНАЛИТИКИ

СРАВНИТЕЛЬНЫЙ АНАЛИЗ АРХИТЕКТУРЫ ХРАНЕНИЯ АНАЛИТИЧЕСКИХ ДАННЫХ ДЛЯ СЕРВИСА АНАЛИТИКИ
Авторы: Серпинский Р. Э., Буракова М. С., Аскеров С. Т.
Аннотация:

В данной работе проводится экспериментальное исследование архитектур хранения аналитических данных для сервиса аналитики Wildberries на базе ClickHouse. Рассматриваются четыре подхода к организации данных: Wide-table, Star schema, Normalized schema и модель Raw-Clean-Mart с заранее подготовленными аналитическими витринами. Цель исследования заключается в оценке влияния структуры хранения на скорость загрузки, объём занимаемого дискового пространства, время выполнения аналитических запросов и масштабируемость при росте объёма данных. Экспериментальная часть выполнена на синтетически масштабированных Wildberries- подобных данных объёмом до 500 МБ.

Ключевые слова: Wildberries, ClickHouse, аналитическое хранилище, архитектура данных, wide table, star schema, normalized schema, Raw-Clean-Mart, витрины данных, OLAP, масштабируемость, производительность запросов.
Страницы в выпуске: 239-243

Журнал "Оригинальные исследования (ОРИС)" (включен в РИНЦ) ведет прием статей в ближайший номер до 30 апреля 2026 г.