Быстрый старт
Обзор
Настройте ClickHouse быстро. Скачайте подходящий бинарный файл для вашей ОС, узнайте, как запустить сервер ClickHouse, создать таблицу, вставить данные в неё и запросить вашу таблицу с помощью клиента ClickHouse.
Предварительные требования
Вам понадобится curl или другой клиент HTTP командной строки для получения бинарного файла ClickHouse.
Скачайте бинарный файл
ClickHouse работает на Linux, FreeBSD и macOS, а также запускается на Windows через
WSL. Самый простой способ скачать ClickHouse локально - это выполнить
следующую команду curl
. Она определяет, поддерживается ли ваша операционная система,
а затем скачивает подходящий бинарный файл ClickHouse.
Мы рекомендуем выполнять команду ниже из новой и пустой подкаталога, так как некоторые файлы конфигурации будут созданы в директории, где находится бинарный файл, когда сервер ClickHouse запустится в первый раз.
Вы должны увидеть:
На этом этапе вы можете проигнорировать предложенный запрос выполнить команду install
.
Для пользователей Mac: Если вы получаете ошибки о том, что разработчик бинарного файла не может быть проверен, пожалуйста, посмотрите "Исправление ошибки проверки разработчика в MacOS".
Запустите сервер
Выполните следующую команду, чтобы запустить сервер ClickHouse:
Вы должны увидеть, как терминал заполняется логами. Это ожидаемо. В ClickHouse
уровень логирования по умолчанию
установлен на trace
, а не warning
.
Запустите клиент
Используйте clickhouse-client
, чтобы подключиться к вашему сервису ClickHouse. Откройте новое
окно терминала, перейдите в каталог, где сохранен ваш бинарный файл clickhouse
, и
выполните следующую команду:
Вы должны увидеть улыбающееся лицо, когда он подключается к вашему сервису, запущенному на localhost:
Создайте таблицу
Используйте CREATE TABLE
, чтобы определить новую таблицу. Типичные команды SQL DDL работают в
ClickHouse с одним добавлением - таблицы в ClickHouse требуют
клаузы ENGINE
. Используйте MergeTree
,
чтобы воспользоваться преимуществами производительности ClickHouse:
Вставьте данные
Вы можете использовать знакомую команду INSERT INTO TABLE
с ClickHouse, но важно понимать,
что каждое вставление в таблицу MergeTree
приводит к созданию того, что мы
называем частью в ClickHouse. Эти части затем объединяются ClickHouse в фоновом режиме.
В ClickHouse мы стараемся вставлять много строк за раз (десятки тысяч или даже миллионы за раз), чтобы минимизировать количество частей, которые должны быть объединены в фоновом процессе.
В этом руководстве мы пока не будем об этом беспокоиться. Выполните следующую команду чтобы вставить несколько строк данных в вашу таблицу:
Запросите вашу новую таблицу
Вы можете написать запрос SELECT
, как и с любой SQL базой данных:
Обратите внимание, что ответ возвращается в аккуратном табличном формате:
Вставьте свои данные
Следующий шаг - добавить ваши собственные данные в ClickHouse. У нас много табличных функций и интеграций для приема данных. У нас есть несколько примеров в вкладках ниже, или вы можете ознакомиться с нашей страницей Интеграций для длинного списка технологий, которые интегрируются с ClickHouse.
- S3
- GCS
- Веб
- Локальный
- PostgreSQL
- MySQL
- ODBC/JDBC
- Очереди сообщений
- Озера данных
- Прочее
Используйте s3
таблицу функцию для
чтения файлов из S3. Это табличная функция - значит, что результат - это таблица
которая может быть:
- использована как источник для запроса
SELECT
(что позволяет выполнять запросы по мере необходимости и оставлять ваши данные в S3), или... - вставить получившуюся таблицу в таблицу
MergeTree
(когда вы будете готовы перенести ваши данные в ClickHouse)
Запрос по мере необходимости выглядит следующим образом:
Перенос данных в таблицу ClickHouse выглядит следующим образом, где
nyc_taxi
- это таблица MergeTree
:
Посмотрите на нашу коллекцию страниц документации AWS S3 для получения более подробной информации и примеров использования S3 с ClickHouse.
Используемая s3
таблица функция для
чтения данных в AWS S3 также работает с файлами в Google Cloud Storage.
Например:
Найдите больше деталей на странице s3
таблица функции.
Функция url
таблицы читает
файлы, доступные в интернете:
Найдите больше деталей на странице url
таблица функции.
Используйте file
табличный движок, чтобы
считать локальный файл. Для удобства скопируйте файл в директорию user_files
,
которая находится в каталоге, где вы скачали бинарный файл ClickHouse.
Обратите внимание, что ClickHouse выводит имена и типы данных ваших столбцов, анализируя большую партию строк. Если ClickHouse не может определить тип хранения из имени файла, вы можете указать его как второй аргумент:
Смотрите страницу документации по file
таблице функции
для получения более подробной информации.
Используйте postgresql
таблицу функцию,
чтобы читать данные из таблицы в PostgreSQL:
Смотрите страницу документации по postgresql
таблице функции
для получения более подробной информации.
Используйте mysql
таблицу функцию,
чтобы читать данные из таблицы в MySQL:
Смотрите страницу документации по mysql
таблице функции
для получения более подробной информации.
ClickHouse может читать данные из любого источника данных ODBC или JDBC:
Смотрите страницы документации по odbc
таблице функции
и jdbc
таблице функции
для получения более подробной информации.
Очереди сообщений могут стримить данные в ClickHouse с помощью соответствующего табличного движка, включая:
- Kafka: интеграция с Kafka с использованием
Kafka
табличного движка - Amazon MSK: интеграция с Amazon Managed Streaming for Apache Kafka (MSK)
- RabbitMQ: интеграция с RabbitMQ с использованием
RabbitMQ
табличного движка
ClickHouse имеет табличные функции для чтения данных из следующих источников:
- Hadoop: интеграция с Apache Hadoop с использованием
hdfs
табличной функции - Hudi: чтение из существующих таблиц Apache Hudi в S3 с использованием
hudi
табличной функции - Iceberg: чтение из существующих таблиц Apache Iceberg в S3 с использованием
iceberg
табличной функции - DeltaLake: чтение из существующих таблиц Delta Lake в S3 с использованием
deltaLake
табличной функции
Проверьте наш длинный список интеграций ClickHouse, чтобы узнать, как подключить ваши существующие фреймворки и источники данных к ClickHouse.
Следующие шаги
- Ознакомьтесь с разделом Основные концепции, чтобы узнать некоторые основы работы ClickHouse.
- Ознакомьтесь с Расширенным учебником, который углубляется в ключевые концепции и возможности ClickHouse.
- Продолжайте обучение, проходя наши бесплатные курсы по запросу в ClickHouse Academy.
- У нас есть список примеров наборов данных с инструкциями по их вставке.
- Если ваши данные поступают из внешнего источника, ознакомьтесь с нашей коллекцией руководств по интеграции для подключения к очередям сообщений, базам данных, конвейерам и другим.
- Если вы используете инструмент UI/BI визуализации, посмотрите пользовательские руководства по подключению UI к ClickHouse.
- Пользовательское руководство по первичным ключам содержит всю необходимую информацию о первичных ключах и их определении.