Учебники и Примеры Наборов Данных
У нас есть много ресурсов, которые помогут вам начать работу и узнать, как работает ClickHouse:
- Если вам нужно установить ClickHouse и запустить его, ознакомьтесь с нашим Быстрым Началом
- Учебник ClickHouse анализирует набор данных поездок такси в Нью-Йорке
Кроме того, примеры наборов данных предоставляют отличные возможности для работы с ClickHouse, изучения важных техник и приемов, а также демонстрации того, как воспользоваться множеством мощных функций ClickHouse. Примеры наборов данных включают:
Страница | Описание |
---|---|
Данные Такси Нью-Йорка | Данные о миллиардах поездок такси и служебных автомобилей (Uber, Lyft и др.) с 2009 года, начинающихся в Нью-Йорке |
Логи Клика от Criteo | Терабайт логов кликов от Criteo |
WikiStat | Исследуйте набор данных WikiStat, содержащий 0.5 триллиона записей. |
TPC-DS (2012) | Набор данных и запросы для тестирования TPC-DS. |
Набор данных рецептов | Набор данных RecipeNLG, содержащий 2.2 миллиона рецептов |
Открытые данные COVID-19 | Открытые данные COVID-19 — это большая база данных открытых источников эпидемиологических данных COVID-19 и связанных факторов, таких как демография, экономика и меры правительства |
Глобальная историческая климатологическая сеть NOAA | 2.5 миллиарда строк климатических данных за последние 120 лет |
Набор данных событий GitHub | Набор данных, содержащий все события на GitHub с 2011 года по 6 декабря 2020 года, размером 3.1 миллиарда записей. |
Отзывы клиентов Amazon | Более 150 миллионов отзывов клиентов о продуктах Amazon |
Бенчмарк Брауновского университета | Новый аналитический бенчмарк для журналов, создаваемых машинами |
Написание запросов в ClickHouse с использованием данных GitHub | Набор данных, содержащий все коммиты и изменения репозитория ClickHouse |
Анализ данных Stack Overflow с помощью ClickHouse | Анализ данных Stack Overflow с помощью ClickHouse |
Бенчмарк Больших Данных AMPLab | Набор данных бенчмарка, используемый для сравнения производительности решений для хранения данных. |
Набор данных Библиотеки Нью-Йорка "Что в меню?" | Набор данных, содержащий 1.3 миллиона записей исторических данных о меню отелей, ресторанов и кафе с блюдами и их ценами. |
Набор данных Laion-400M | Набор данных, содержащий 400 миллионов изображений с английскими подписями к изображениям |
Бенчмарк звездной схемы (SSB, 2009) | Набор данных и запросы для бенчмарка звездной схемы (SSB) |
Набор данных цен на жилье в Великобритании | Узнайте, как использовать проекции для улучшения производительности часто выполняемых запросов, используя набор данных о недвижимости в Великобритании, который содержит данные о ценах, уплаченных за недвижимость в Англии и Уэльсе |
Набор данных комментариев Reddit | Набор данных, содержащий общедоступные комментарии на Reddit с декабря 2005 года по март 2023 года с более чем 14 миллиардами строк данных в формате JSON |
OnTime | Набор данных, содержащий показатели своевременности авиарейсов |
Исторические метеоданные Тайваня | 131 миллион строк данных наблюдений за погодой за последние 128 лет |
Данные о воздушном движении, собранные OpenSky Network 2020 | Данные в этом наборе получены и очищены из полного набора данных OpenSky для иллюстрации развития воздушного движения во время пандемии COVID-19. |
Данные о жалобах NYPD | Прием и запрос данных Tab Separated Value в 5 этапов |
TPC-H (1999) | Набор данных и запросы для тестирования TPC-H. |
Набор данных YouTube о дизлайках | Коллекция дизлайков видеороликов YouTube. |
Геоданные с использованием набора данных вышек сотовой связи | Узнайте, как загрузить данные OpenCelliD в ClickHouse, подключить Apache Superset к ClickHouse и создать панель управления на основе данных |
Данные об экологических сенсорах | Более 20 миллиардов записей данных от Sensor.Community, глобальной сети датчиков, работающей на основе вкладов, которая создает Открытые Экологические Данные. |
Анонимизированная веб-аналитика | Набор данных, состоящий из двух таблиц, содержащих анонимизированные данные веб-аналитики с попаданиями и визитами |