Кассандра: как получить общий размер таблицы / подсчет строк оценки

интро

Я пытаюсь собрать некоторую статистику из кластера Cassandra 1.2.6 для реализации веб-службы для предоставления этой статистики веб-приложению. Я получаю доступ к кластеру из Python с помощью библиотеки cql, но я также могу ssh или pssh к узлам.

проблема

моя проблема заключается в том, как получить общий размер таблицы (т. е. фактическое использование диска каждой таблицы) во всем кластере и, если возможно, общее количество строк каждая таблица (это может быть оценка).

вопрос

пока единственный вариант, который я нашел, похоже, работает nodetool cfstats на каждом узле и анализирует ответ, есть ли лучший способ сделать это?

спасибо заранее!

1 ответов


Я думаю, что лучший способ сделать это-получить доступ к статистике непосредственно через JMX (именно так работает nodetool.) Каждый узел provdies широкий спектр показателей, но то, что вам было бы интересно.

org.apache.cassandra.metrics
  ColumnFamily
    cf_name
       TotalDiskSpaceUsed
       MemtableDataSize