СРАВНИТЕЛЬНЫЙ АНАЛИЗ OLAP-СИСТЕМ ХРАНЕНИЯ ДАННЫХ ДЛЯ АНАЛИТИЧЕСКОГО СЕРВИСА

СРАВНИТЕЛЬНЫЙ АНАЛИЗ OLAP-СИСТЕМ ХРАНЕНИЯ ДАННЫХ ДЛЯ АНАЛИТИЧЕСКОГО СЕРВИСА
Авторы: Аскеров С. T., Кондратьева С. Д., Романовский И. О.
Аннотация:

В данной работе проводится экспериментальное сравнение двух OLAP-систем хранения данных для аналитического сервиса Wildberries: DuckDB и ClickHouse Server. Исследование направлено на оценку скорости загрузки данных, эффективности хранения и времени выполнения типовых аналитических SQL-запросов на наборах данных объёмом 100, 250 и 500 МБ. В эксперименте DuckDB рассматривается как embedded OLAP-база данных, работающая внутри процесса приложения, а ClickHouse — как отдельная серверная аналитическая СУБД. Полученные результаты показывают, что DuckDB быстрее выполняет одиночные локальные запросы, однако ClickHouse остаётся более обоснованным выбором для production-сервиса, где важны многопользовательская работа, разделение backend и хранилища, мониторинг, управление ресурсами и дальнейшее масштабирование.

Ключевые слова: Wildberries, OLAP, DuckDB, ClickHouse, аналитическое хранилище, marketplace analytics, MergeTree, embedded analytics, серверная аналитика, производительность запросов, масштабируемость.
Страницы в выпуске: 170-174

Журнал "Оригинальные исследования (ОРИС)" (включен в РИНЦ) ведет прием статей в ближайший номер до 30 апреля 2026 г.