Article title:
СРАВНИТЕЛЬНЫЙ АНАЛИЗ АРХИТЕКТУРЫ ХРАНЕНИЯ АНАЛИТИЧЕСКИХ ДАННЫХ ДЛЯ СЕРВИСА АНАЛИТИКИ
Authors:
Серпинский Р. Э., Буракова М. С., Аскеров С. Т.
Keywords: Wildberries, ClickHouse, аналитическое хранилище, архитектура данных, wide table, star schema, normalized schema, Raw-Clean-Mart, витрины данных, OLAP, масштабируемость, производительность запросов.
Pages: 239-243
Abstract: В данной работе проводится экспериментальное исследование архитектур хранения
аналитических данных для сервиса аналитики Wildberries на базе ClickHouse.
Рассматриваются четыре подхода к организации данных: Wide-table, Star schema,
Normalized schema и модель Raw-Clean-Mart с заранее подготовленными аналитическими
витринами. Цель исследования заключается в оценке влияния структуры хранения на
скорость загрузки, объём занимаемого дискового пространства, время выполнения
аналитических запросов и масштабируемость при росте объёма данных.
Экспериментальная часть выполнена на синтетически масштабированных Wildberries-
подобных данных объёмом до 500 МБ.
Full text is not available
Download full text