Перейти к основному содержимому
Перейти к основному содержимому

Учебники и Примеры Наборов Данных

У нас есть много ресурсов, которые помогут вам начать работу и узнать, как работает ClickHouse:

  • Если вам нужно установить ClickHouse и запустить его, ознакомьтесь с нашим Быстрым Началом
  • Учебник ClickHouse анализирует набор данных поездок такси в Нью-Йорке

Кроме того, примеры наборов данных предоставляют отличные возможности для работы с ClickHouse, изучения важных техник и приемов, а также демонстрации того, как воспользоваться множеством мощных функций ClickHouse. Примеры наборов данных включают:

СтраницаОписание
Данные Такси Нью-ЙоркаДанные о миллиардах поездок такси и служебных автомобилей (Uber, Lyft и др.) с 2009 года, начинающихся в Нью-Йорке
Логи Клика от CriteoТерабайт логов кликов от Criteo
WikiStatИсследуйте набор данных WikiStat, содержащий 0.5 триллиона записей.
TPC-DS (2012)Набор данных и запросы для тестирования TPC-DS.
Набор данных рецептовНабор данных RecipeNLG, содержащий 2.2 миллиона рецептов
Открытые данные COVID-19Открытые данные COVID-19 — это большая база данных открытых источников эпидемиологических данных COVID-19 и связанных факторов, таких как демография, экономика и меры правительства
Глобальная историческая климатологическая сеть NOAA2.5 миллиарда строк климатических данных за последние 120 лет
Набор данных событий GitHubНабор данных, содержащий все события на GitHub с 2011 года по 6 декабря 2020 года, размером 3.1 миллиарда записей.
Отзывы клиентов AmazonБолее 150 миллионов отзывов клиентов о продуктах Amazon
Бенчмарк Брауновского университетаНовый аналитический бенчмарк для журналов, создаваемых машинами
Написание запросов в ClickHouse с использованием данных GitHubНабор данных, содержащий все коммиты и изменения репозитория ClickHouse
Анализ данных Stack Overflow с помощью ClickHouseАнализ данных Stack Overflow с помощью ClickHouse
Бенчмарк Больших Данных AMPLabНабор данных бенчмарка, используемый для сравнения производительности решений для хранения данных.
Набор данных Библиотеки Нью-Йорка "Что в меню?"Набор данных, содержащий 1.3 миллиона записей исторических данных о меню отелей, ресторанов и кафе с блюдами и их ценами.
Набор данных Laion-400MНабор данных, содержащий 400 миллионов изображений с английскими подписями к изображениям
Бенчмарк звездной схемы (SSB, 2009)Набор данных и запросы для бенчмарка звездной схемы (SSB)
Набор данных цен на жилье в ВеликобританииУзнайте, как использовать проекции для улучшения производительности часто выполняемых запросов, используя набор данных о недвижимости в Великобритании, который содержит данные о ценах, уплаченных за недвижимость в Англии и Уэльсе
Набор данных комментариев RedditНабор данных, содержащий общедоступные комментарии на Reddit с декабря 2005 года по март 2023 года с более чем 14 миллиардами строк данных в формате JSON
OnTimeНабор данных, содержащий показатели своевременности авиарейсов
Исторические метеоданные Тайваня131 миллион строк данных наблюдений за погодой за последние 128 лет
Данные о воздушном движении, собранные OpenSky Network 2020Данные в этом наборе получены и очищены из полного набора данных OpenSky для иллюстрации развития воздушного движения во время пандемии COVID-19.
Данные о жалобах NYPDПрием и запрос данных Tab Separated Value в 5 этапов
TPC-H (1999)Набор данных и запросы для тестирования TPC-H.
Набор данных YouTube о дизлайкахКоллекция дизлайков видеороликов YouTube.
Геоданные с использованием набора данных вышек сотовой связиУзнайте, как загрузить данные OpenCelliD в ClickHouse, подключить Apache Superset к ClickHouse и создать панель управления на основе данных
Данные об экологических сенсорахБолее 20 миллиардов записей данных от Sensor.Community, глобальной сети датчиков, работающей на основе вкладов, которая создает Открытые Экологические Данные.
Анонимизированная веб-аналитикаНабор данных, состоящий из двух таблиц, содержащих анонимизированные данные веб-аналитики с попаданиями и визитами