Перейти к основному содержимому
Перейти к основному содержимому

TPC-DS (2012)

Аналогично Star Schema Benchmark (SSB), TPC-DS основан на TPC-H, но выбрал противоположный путь, т.е. увеличил количество соединений, необходимых для хранения данных в сложной схеме снежинки (24 вместо 8 таблиц). Распределение данных искажено (например, нормальное и распределение Пуассона). Включает 99 отчетных и произвольных запросов с случайными подстановками.

Ссылки

Сначала проверьте репозиторий TPC-DS и скомпилируйте генератор данных:

Затем сгенерируйте данные. Параметр -scale определяет масштабный коэффициент.

Затем сгенерируйте запросы (используйте тот же масштабный коэффициент):

Теперь создайте таблицы в ClickHouse. Вы можете использовать либо оригинальные определения таблиц в tools/tpcds.sql, либо "настроенные" определения таблиц с правильно определенными первичными индексами и типами столбцов LowCardinality, где это имеет смысл.

Данные можно импортировать следующим образом:

Затем выполните сгенерированные запросы.

осторожно

TPC-DS активно использует коррелированные подзапросы, которые на момент написания (сентябрь 2024 года) не поддерживаются ClickHouse (issue #6697). В результате многие из приведенных выше запросов для бенчмарка завершатся ошибками.