TPC-DS (2012)
Аналогично Star Schema Benchmark (SSB), TPC-DS основан на TPC-H, но выбрал противоположный путь, т.е. увеличил количество соединений, необходимых для хранения данных в сложной схеме снежинки (24 вместо 8 таблиц). Распределение данных искажено (например, нормальное и распределение Пуассона). Включает 99 отчетных и произвольных запросов с случайными подстановками.
Ссылки
- Создание TPC-DS (Nambiar), 2006
Сначала проверьте репозиторий TPC-DS и скомпилируйте генератор данных:
Затем сгенерируйте данные. Параметр -scale
определяет масштабный коэффициент.
Затем сгенерируйте запросы (используйте тот же масштабный коэффициент):
Теперь создайте таблицы в ClickHouse. Вы можете использовать либо оригинальные определения таблиц в tools/tpcds.sql, либо "настроенные" определения таблиц с правильно определенными первичными индексами и типами столбцов LowCardinality, где это имеет смысл.
Данные можно импортировать следующим образом:
Затем выполните сгенерированные запросы.
TPC-DS активно использует коррелированные подзапросы, которые на момент написания (сентябрь 2024 года) не поддерживаются ClickHouse (issue #6697). В результате многие из приведенных выше запросов для бенчмарка завершатся ошибками.