Анонимные данные веб-аналитики
Этот набор данных состоит из двух таблиц с анонимными данными веб-аналитики с хитами (hits_v1
) и визитами (visits_v1
).
Таблицы можно загрузить в виде сжатых файлов tsv.xz
. В дополнение к образцу, рассмотренному в этом документе, доступна расширенная (7.5 ГБ) версия таблицы hits
, которая содержит 100 миллионов строк, в формате TSV по ссылке.
Загрузка и прием данных
Загрузка сжатого TSV файла хитовой таблицы:
Создание базы данных и таблицы
Для hits_v1
Или для hits_100m_obfuscated
Импорт данных с хитами:
Проверьте количество строк
Загрузка сжатого TSV файла визитов:
Создание таблицы визитов
Импорт данных визитов
Проверьте количество
Пример JOIN
Набор данных хит и визиты используется в тестовых процедурах ClickHouse, это один из запросов из тестового набора. Остальные тесты упоминаются в разделе Следующие шаги в конце этой страницы.
Следующие шаги
Практическое введение в разреженные первичные индексы в ClickHouse использует набор данных хитов, чтобы обсудить различия в индексации ClickHouse по сравнению с традиционными реляционными базами данных, как ClickHouse строит и использует разреженный первичный индекс, и лучшие практики индексации.
Дополнительные примеры запросов к этим таблицам можно найти среди состояний тестов.
Тестовый набор использует имя базы данных test
, и таблицы называются hits
и visits
. Вы можете переименовать вашу базу данных и таблицы или отредактировать SQL из тестового файла.