system.asynchronous_metrics
Данные в этой системной таблице хранятся локально на каждом узле в ClickHouse Cloud. Для получения полного представления о всех данных необходимо использовать функцию clusterAllReplicas
. Подробности см. здесь.
Содержит метрики, которые периодически рассчитываются в фоновом режиме. Например, объем используемой оперативной памяти.
Столбцы:
metric
(String) — Название метрики.value
(Float64) — Значение метрики.description
(String) — Описание метрики.
Пример
Описания метрик
AsynchronousHeavyMetricsCalculationTimeSpent
Время в секундах, затраченное на расчет асинхронных тяжелых (связанных с таблицами) метрик (это накладные расходы асинхронных метрик).
AsynchronousHeavyMetricsUpdateInterval
Интервал обновления тяжелых (связанных с таблицами) метрик.
AsynchronousMetricsCalculationTimeSpent
Время в секундах, затраченное на расчет асинхронных метрик (это накладные расходы асинхронных метрик).
AsynchronousMetricsUpdateInterval
Интервал обновления метрик.
BlockActiveTime_name
Время в секундах, в течение которого блок-устройство имело очередь запросов IO. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardBytes_name
КоличествоDiscarded bytes на блок-устройстве. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardMerges_name
Количество операций удаления, запрашиваемых с блока и объединяемых ОС-IO планировщиком. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardOps_name
Количество операций удаления, запрашиваемых на блок-устройстве. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockDiscardTime_name
Время в секундах, проведенное на операциях удаления, запрашиваемых с блока, суммированное по всем операциям. Эти операции актуальны для SSD. Операции удаления не используются ClickHouse, но могут использоваться другими процессами в системе. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockInFlightOps_name
Это значение учитывает число запросов I/O, которые были выданы драйверу устройства, но еще не завершены. Это не включает запросы IO, которые находятся в очереди, но еще не были выданы драйверу устройства. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockQueueTime_name
Это значение учитывает количество миллисекунд, которые запросы IO ожидали на этом блок-устройстве. Если несколько запросов IO ждут, это значение увеличится как произведение числа миллисекунд на количество ожидающих запросов. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadBytes_name
Количество байт, прочитанных с блока-устройства. Это может быть меньше, чем количество байт, прочитанных из файловой системы из-за использования кэша страниц ОС, который экономит IO. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadMerges_name
Количество операций чтения, запрашиваемых с блока-устройства и объединяемых ОС-IO планировщиком. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadOps_name
Количество операций чтения, запрашиваемых с блока-устройства. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockReadTime_name
Время в секундах, проведенное на операциях чтения, запрашиваемых с блока-устройства, суммированное по всем операциям. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteBytes_name
Количество байт, записанных на блок-устройство. Это может быть меньше, чем количество байт, записанных в файловую систему из-за использования кэша страниц ОС, который экономит IO. Запись на блок-устройство может произойти позже, чем соответствующая запись в файловую систему из-за кэширования записи. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteMerges_name
Количество операций записи, запрашиваемых с блок-устройства и объединяемых ОС-IO планировщиком. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteOps_name
Количество операций записи, запрашиваемых с блок-устройства. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
BlockWriteTime_name
Время в секундах, проведенное на операциях записи, запрашиваемых с блок-устройства, суммированное по всем операциям. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Источник: /sys/block
. См. https://www.kernel.org/doc/Documentation/block/stat.txt
CPUFrequencyMHz_name
Текущая частота CPU, в МГц. Большинство современных CPU динамически регулируют частоту для экономии энергии и Turbo Boost.
CompiledExpressionCacheBytes
Общее количество байт, используемых для кэша JIT-скомпилированного кода.
CompiledExpressionCacheCount
Общее количество записей в кэше JIT-скомпилированного кода.
DiskAvailable_name
Доступные байты на диске (виртуальная файловая система). Удаленные файловые системы могут показывать большие значения, такие как 16 EiB.
DiskTotal_name
Общий размер в байтах диска (виртуальная файловая система). Удаленные файловые системы могут показывать большие значения, такие как 16 EiB.
DiskUnreserved_name
Доступные байты на диске (виртуальная файловая система) без резервирования для слияний, извлечений и перемещений. Удаленные файловые системы могут показывать большие значения, такие как 16 EiB.
DiskUsed_name
Используемые байты на диске (виртуальная файловая система). Удаленные файловые системы не всегда предоставляют эту информацию.
FilesystemCacheBytes
Общее количество байт в виртуальной файловой системе cache
. Этот кэш хранится на диске.
FilesystemCacheFiles
Общее количество сегментов файлов в кэше виртуальной файловой системы cache
. Этот кэш хранится на диске.
FilesystemLogsPathAvailableBytes
Доступные байты на разделе, где смонтирован путь журнала ClickHouse. Если это значение приближается к нулю, вам следует настроить ротацию журналов в файле конфигурации.
FilesystemLogsPathAvailableINodes
Количество доступных инодов на разделе, где смонтирован путь журнала ClickHouse.
FilesystemLogsPathTotalBytes
Размер раздела, на котором смонтирован путь журнала ClickHouse, в байтах. Рекомендуется иметь не менее 10 ГБ для журналов.
FilesystemLogsPathTotalINodes
Общее количество инодов на разделе, где смонтирован путь журнала ClickHouse.
FilesystemLogsPathUsedBytes
Используемые байты на разделе, где смонтирован путь журнала ClickHouse.
FilesystemLogsPathUsedINodes
Количество использованных инодов на разделе, где смонтирован путь журнала ClickHouse.
FilesystemMainPathAvailableBytes
Доступные байты на разделе, где смонтирован основной путь ClickHouse.
FilesystemMainPathAvailableINodes
Количество доступных инодов на разделе, где смонтирован основной путь ClickHouse. Если оно близко к нулю, это указывает на неправильную конфигурацию, и вы получите сообщение 'недостаточно места на устройстве', даже когда диск не заполнен.
FilesystemMainPathTotalBytes
Размер раздела, где смонтирован основной путь ClickHouse, в байтах.
FilesystemMainPathTotalINodes
Общее количество инодов на разделе, где смонтирован основной путь ClickHouse. Если оно меньше 25 миллионов, это указывает на неправильную конфигурацию.
FilesystemMainPathUsedBytes
Используемые байты на разделе, где смонтирован основной путь ClickHouse.
FilesystemMainPathUsedINodes
Количество использованных инодов на разделе, где смонтирован основной путь ClickHouse. Это значение в основном соответствует количеству файлов.
HTTPThreads
Количество потоков в сервере HTTP-интерфейса (без TLS).
InterserverThreads
Количество потоков в сервере протокола коммуникации реплик (без TLS).
Jitter
Разница во времени, когда поток для расчета асинхронных метрик был запланирован для пробуждения и времени, когда он фактически проснулся. Прокси-показатель общей задержки и отклика системы.
LoadAverageN
Общая нагрузка системы, усредненная с экспоненциальным сглаживанием за 1 минуту. Нагрузка представляет количество потоков среди всех процессов (сущностей планирования ядра ОС), которые в данный момент выполняются процессором или ожидают IO, или готовы к выполнению, но в данный момент не планируются. Это число включает все процессы, а не только clickhouse-server. Число может превышать количество ядер CPU, если система перегружена, и многие процессы готовы к выполнению, но ожидают CPU или IO.
MMapCacheCells
Количество файлов, открытых с помощью mmap
(отображенных в памяти). Это используется для запросов с установленной конфигурацией local_filesystem_read_method
, установленной на mmap
. Файлы, открытые с помощью mmap
, хранятся в кэше, чтобы избежать затратных сбросов TLB.
MarkCacheBytes
Общий размер кэша меток в байтах.
MarkCacheFiles
Общее количество файлов меток в кэше меток.
MaxPartCountForPartition
Максимальное количество частей на раздел для всех разделов всех таблиц семейства MergeTree. Значения больше 300 указывают на неправильную конфигурацию, перегрузку или массовую загрузку данных.
MemoryCode
Общее количество виртуальной памяти, распределенной для страниц машинного кода процесса сервера, в байтах.
MemoryDataAndStack
Количество виртуальной памяти, распределенной для использования стека и для выделенной памяти, в байтах. Не указано, включает ли это стеки на потоках и большую часть выделенной памяти, которая выделяется с помощью системного вызова 'mmap'. Эта метрика существует только по причине полноты. Я рекомендую использовать метрику MemoryResident
для мониторинга.
MemoryResidentMax
Максимальное количество физической памяти, используемой процессом сервера, в байтах.
MemoryResident
Количество физической памяти, используемой процессом сервера, в байтах.
MemoryShared
Количество памяти, используемой процессом сервера, которая также используется другими процессами, в байтах. ClickHouse не использует совместно используемую память, но некоторая память может быть обозначена ОС как совместно используемая по своим причинам. Эта метрика не имеет большого смысла для наблюдения и существует только для полноты.
MemoryVirtual
Размер виртуального адресного пространства, выделенного процессом сервера, в байтах. Размер виртуального адресного пространства обычно намного больше, чем потребление физической памяти, и не должен использоваться в качестве оценки потребления памяти. Большие значения этой метрики полностью нормальны и имеют только технический смысл.
MySQLThreads
Количество потоков в сервере протокола совместимости MySQL.
NetworkReceiveBytes_name
Количество байт, полученных через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkReceiveDrop_name
Количество байт, потерянных пакетом при получении через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkReceiveErrors_name
Количество раз, когда произошла ошибка во время получения через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkReceivePackets_name
Количество сетевых пакетов, полученных через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendBytes_name
Количество байт, отправленных через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendDrop_name
Количество раз, когда пакет был потерян при отправке через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendErrors_name
Количество раз, когда произошла ошибка (например, повторная передача TCP) во время отправки через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.
NetworkSendPackets_name
Количество сетевых пакетов, отправленных через сетевой интерфейс. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.
NumberOfDatabases
Общее количество баз данных на сервере.
NumberOfDetachedByUserParts
Общее количество частей, открепленных от таблиц MergeTree пользователями с помощью запроса ALTER TABLE DETACH
(в отличие от неожиданных, поврежденных или игнорируемых частей). Сервер не заботится об открепленных частях, и они могут быть удалены.
NumberOfDetachedParts
Общее количество частей, открепленных от таблиц MergeTree. Часть может быть откреплена пользователем с помощью запроса ALTER TABLE DETACH
или самим сервером в случае, если часть повреждена, неожиданна или не нужна. Сервер не заботится об открепленных частях, и они могут быть удалены.
NumberOfTables
Общее количество таблиц, суммируемое по базам данных на сервере, исключая базы данных, которые не могут содержать таблицы MergeTree. Исключенные движки баз данных — это те, которые создают набор таблиц на лету, такие как Lazy
, MySQL
, PostgreSQL
, SQlite
.
OSContextSwitches
Количество переключений контекста, произошедших в системе на хост-машине. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.
OSGuestNiceTime
Соотношение времени, затраченного на выполнение виртуального CPU для гостевых операционных систем под контролем ядра Linux, когда гость был установлен на более высокий приоритет (см. man procfs
). Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все же существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].
OSGuestNiceTimeCPU_N
Соотношение времени, затраченного на выполнение виртуального CPU для гостевых операционных систем под контролем ядра Linux, когда гость был установлен на более высокий приоритет (см. man procfs
). Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все же существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].
OSGuestNiceTimeNormalized
Значение аналогично OSGuestNiceTime
, но делится на количество ядер CPU, чтобы быть измеряемым в интервале [0..1], независимо от количества ядер. Это позволяет усреднить значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и все еще получить усредненный показатель использования ресурсов.
OSGuestTime
Соотношение времени, затраченного на выполнение виртуального CPU для гостевых операционных систем под контролем ядра Linux (см. man procfs
). Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все же существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].
OSGuestTimeCPU_N
Соотношение времени, затраченного на выполнение виртуального CPU для гостевых операционных систем под контролем ядра Linux (см. man procfs
). Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Эта метрика не имеет значения для ClickHouse, но все же существует для полноты. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].
OSGuestTimeNormalized
Значение аналогично OSGuestTime
, но делится на количество ядер CPU, чтобы быть измеряемым в интервале [0..1], независимо от количества ядер. Это позволяет усреднить значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и все еще получить усредненный показатель использования ресурсов.
OSIOWaitTime
Соотношение времени, в течение которого ядро CPU не выполняло код, но когда ядро ОС не запускало другие процессы на этом CPU, так как процессы ожидали IO. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].
OSIOWaitTimeCPU_N
Соотношение времени, в течение которого ядро CPU не выполняло код, но когда ядро ОС не запускало другие процессы на этом CPU, так как процессы ожидали IO. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].
OSIOWaitTimeNormalized
Значение аналогично OSIOWaitTime
, но делится на количество ядер CPU, чтобы быть измеряемым в интервале [0..1], независимо от количества ядер. Это позволяет усреднить значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и все еще получить усредненный показатель использования ресурсов.
OSIdleTime
Соотношение времени, в течение которого ядро CPU было бездействующим (даже не готовым к запуску процесса, ожидающего IO) с точки зрения ядра ОС. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Это не включает время, когда CPU использовался недостаточно из-за причин, внутренних для CPU (загрузки памяти, зависания конвейера, ошибочные прогнозы ветвлений, работа другого SMT-ядра). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].
OSIdleTimeCPU_N
Соотношение времени, в течение которого ядро CPU было бездействующим (даже не готовым к запуску процесса, ожидающего IO) с точки зрения ядра ОС. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Это не включает время, когда CPU использовался недостаточно из-за причин, внутренних для CPU (загрузки памяти, зависания конвейера, ошибочные прогнозы ветвлений, работа другого SMT-ядра). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].
OSIdleTimeNormalized
Значение аналогично OSIdleTime
, но делится на количество ядер CPU, чтобы быть измеряемым в интервале [0..1], независимо от количества ядер. Это позволяет усреднить значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и все еще получить усредненный показатель использования ресурсов.
OSInterrupts
Количество прерываний на хост-машине. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.
OSIrqTime
Соотношение времени, затраченного на выполнение аппаратных запросов прерываний на CPU. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неправильную конфигурацию оборудования или очень высокую нагрузку сети. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].
OSIrqTimeCPU_N
Соотношение времени, затраченного на выполнение аппаратных запросов прерываний на CPU. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неправильную конфигурацию оборудования или очень высокую нагрузку сети. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU рассчитывается как сумма по всем ядрам [0..num cores].
OSIrqTimeNormalized
Значение аналогично OSIrqTime
, но делится на количество ядер CPU, чтобы быть измеряемым в интервале [0..1], независимо от количества ядер. Это позволяет усреднить значения этой метрики по нескольким серверам в кластере, даже если количество ядер неоднородно, и все еще получить усредненный показатель использования ресурсов.
OSMemoryAvailable
Количество памяти, доступной для использования программами, в байтах. Это очень похоже на метрику OSMemoryFreePlusCached
. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.
OSMemoryBuffers
Количество памяти, используемой буферами ядра ОС, в байтах. Обычно это должно быть небольшим, и большие значения могут указывать на неправильную конфигурацию ОС. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.
OSMemoryCached
Количество памяти, используемой кэшем страниц ОС, в байтах. Обычно почти вся доступная память используется кэшем страниц ОС — высокие значения этой метрики нормальны и ожидаемы. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.
OSMemoryFreePlusCached
Количество свободной памяти плюс память кэша страниц ОС на хост-системе, в байтах. Эта память доступна для использования программами. Значение должно быть очень похоже на OSMemoryAvailable
. Это метрика по всей системе, она включает все процессы на хост-машине, а не только clickhouse-server.
OSMemoryFreeWithoutCached
Объем свободной памяти на хост-системе в байтах. Это значение не включает память, используемую кешем страниц ОС, в байтах. Память кеша страниц также доступна для использования программами, поэтому значение этой метрики может быть несколько запутанным. Вместо этого смотрите метрику OSMemoryAvailable
. Для удобства мы также предоставляем метрику OSMemoryFreePlusCached
, которая должна быть похожа на OSMemoryAvailable. Смотрите также https://www.linuxatemyram.com/. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSMemoryTotal
Общее количество памяти на хост-системе в байтах.
OSNiceTime
Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства с более высоким приоритетом. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].
OSNiceTimeCPU_N
Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства с более высоким приоритетом. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].
OSNiceTimeNormalized
Значение похоже на OSNiceTime
, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное, и по-прежнему получать среднюю метрику использования ресурсов.
OSOpenFiles
Общее количество открытых файлов на хост-машине. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSProcessesBlocked
Количество потоков, ожидающих завершения ввода-вывода (man procfs
). Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSProcessesCreated
Количество созданных процессов. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSProcessesRunning
Количество потоков, готовых к выполнению (выполняющихся или ожидающих выполнения), по версии операционной системы. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server.
OSSoftIrqTime
Соотношение времени, затраченного на выполнение программных прерываний на CPU. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективное программное обеспечение, работащее на системе. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].
OSSoftIrqTimeCPU_N
Соотношение времени, затраченного на выполнение программных прерываний на CPU. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Высокое значение этой метрики может указывать на неэффективное программное обеспечение, работающее на системе. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].
OSSoftIrqTimeNormalized
Значение похоже на OSSoftIrqTime
, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное, и по-прежнему получать среднюю метрику использования ресурсов.
OSStealTime
Соотношение времени, затраченного CPU на работу в других операционных системах при работе в виртуализированной среде. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Не каждая виртуализированная среда предоставляет эту метрику, и большинство из них этого не делает. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].
OSStealTimeCPU_N
Соотношение времени, затраченного CPU на работу в других операционных системах при работе в виртуализированной среде. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Не каждая виртуализированная среда предоставляет эту метрику, и большинство из них этого не делает. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].
OSStealTimeNormalized
Значение похоже на OSStealTime
, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное, и по-прежнему получать среднюю метрику использования ресурсов.
OSSystemTime
Соотношение времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].
OSSystemTimeCPU_N
Соотношение времени, в течение которого ядро CPU выполняло код ядра ОС (системный код). Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].
OSSystemTimeNormalized
Значение похоже на OSSystemTime
, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное, и по-прежнему получать среднюю метрику использования ресурсов.
OSThreadsRunnable
Общее количество "выполнимых" потоков, по версии планировщика ядра ОС.
OSThreadsTotal
Общее количество потоков, по версии планировщика ядра ОС.
OSUptime
Время работы хост-сервера (машина, на которой запущен ClickHouse) в секундах.
OSUserTime
Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Это также включает время, когда CPU был частично недозагружен по причинам, внутренним для CPU (загрузки памяти, зависания в конвейере, неверные предсказания ветвлений, работа другого ядра SMT). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].
OSUserTimeCPU_N
Соотношение времени, в течение которого ядро CPU выполняло код пользовательского пространства. Это метрика на уровне системы, она включает все процессы на хост-машине, а не только clickhouse-server. Это также включает время, когда CPU был частично недозагружен по причинам, внутренним для CPU (загрузки памяти, зависания в конвейере, неверные предсказания ветвлений, работа другого ядра SMT). Значение для одного ядра CPU будет в интервале [0..1]. Значение для всех ядер CPU вычисляется как сумма этих значений [0..число ядер].
OSUserTimeNormalized
Значение похоже на OSUserTime
, но делится на количество ядер CPU, чтобы измеряться в интервале [0..1], независимо от количества ядер. Это позволяет усреднять значения этой метрики по нескольким серверам в кластере, даже если количество ядер неравномерное, и по-прежнему получать среднюю метрику использования ресурсов.
PostgreSQLThreads
Количество потоков на сервере протокола совместимости PostgreSQL.
QueryCacheBytes
Общий размер кэша запросов в байтах.
QueryCacheEntries
Общее количество записей в кэше запросов.
ReplicasMaxAbsoluteDelay
Максимальная разница в секундах между самой свежей реплицированной частью и самой свежей частью данных, которая еще не была реплицирована, по всем реплицированным таблицам. Очень высокое значение указывает на реплику без данных.
ReplicasMaxInsertsInQueue
Максимальное количество операций INSERT в очереди (еще не реплицированных) по всем реплицированным таблицам.
ReplicasMaxMergesInQueue
Максимальное количество операций слияния в очереди (еще не примененных) по всем реплицированным таблицам.
ReplicasMaxQueueSize
Максимальный размер очереди (в количестве операций, таких как get, merge) по всем реплицированным таблицам.
ReplicasMaxRelativeDelay
Максимальная разница между задержкой реплики и задержкой самой актуальной реплики той же таблицы, по всем реплицированным таблицам.
ReplicasSumInsertsInQueue
Сумма операций INSERT в очереди (еще не реплицированных) по всем реплицированным таблицам.
ReplicasSumMergesInQueue
Сумма операций слияния в очереди (еще не примененных) по всем реплицированным таблицам.
ReplicasSumQueueSize
Сумма размера очереди (в количестве операций, таких как get, merge) по всем реплицированным таблицам.
TCPThreads
Количество потоков в сервере протокола TCP (без TLS).
Temperature_N
Температура соответствующего устройства в ℃. Датчик может возвращать нереалистичное значение. Источник: /sys/class/thermal
Temperature_name
Температура, сообщаемая соответствующим аппаратным монитором и соответствующим датчиком в ℃. Датчик может возвращать нереалистичное значение. Источник: /sys/class/hwmon
TotalBytesOfMergeTreeTables
Общее количество байт (сжатых, включая данные и индексы), хранящихся во всех таблицах семейства MergeTree.
TotalPartsOfMergeTreeTables
Общее количество частей данных во всех таблицах семейства MergeTree. Числа больше 10 000 негативно влияют на время запуска сервера и могут указывать на неразумный выбор ключа раздела.
TotalPrimaryKeyBytesInMemory
Общее количество памяти (в байтах), используемой значениями первичного ключа (учитываются только активные части).
TotalPrimaryKeyBytesInMemoryAllocated
Общее количество памяти (в байтах), зарезервированной для значений первичного ключа (учитываются только активные части).
TotalRowsOfMergeTreeTables
Общее количество строк (записей), хранящихся во всех таблицах семейства MergeTree.
UncompressedCacheBytes
Общий размер несжатого кэша в байтах. Несжато кэш обычно не увеличивает производительность и его стоит избегать.
UncompressedCacheCells
Общее количество записей в несжатом кэше. Каждая запись представляет собой распакованный блок данных. Несжатый кэш обычно не увеличивает производительность и его стоит избегать.
Uptime
Время работы сервера в секундах. Включает время, затраченное на инициализацию сервера перед принятием соединений.
jemalloc.active
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.allocated
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.dirty_purged
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.muzzy_purged
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pactive
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pdirty
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.arenas.all.pmuzzy
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.num_runs
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.num_threads
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.background_thread.run_intervals
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.epoch
Внутренний номер инкрементного обновления статистики jemalloc (аллокатора памяти Джейсона Эванса), используемый во всех других метриках jemalloc
.
jemalloc.mapped
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.metadata
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.metadata_thp
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.resident
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.retained
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
jemalloc.prof.active
Внутренняя метрика низкоуровневого аллокатора памяти (jemalloc). См. https://jemalloc.net/jemalloc.3.html
Смотрите также
- Monitoring — Основные концепции мониторинга ClickHouse.
- system.metrics — Содержит моментально вычисляемые метрики.
- system.events — Содержит ряд произошедших событий.
- system.metric_log — Содержит историю значений метрик из таблиц
system.metrics
иsystem.events
.