Неверный запрос: индексированные столбцы, присутствующие в предложении by-columns, с помощью оператора Equal: ошибка CQL?

Я вставил пару записей в приведенную выше таблицу, как это, что я буду вставлять в наш фактический сценарий использования -

Теперь я делал запрос select - дайте мне все employee_id для employee_name e27.

Есть ли что-то неправильное, что я здесь делаю?

Ответы

Ответ 1

Общее правило прост: "вы можете запрашивать только столбцы, которые являются частью ключа". В качестве объяснения для всех других запросов потребуется полное сканирование таблиц, что может означать много просеивания данных.

Есть вещи, которые могут изменить это правило:

используйте вторичные индексы для столбцов с низкой мощностью (подробнее здесь)
определить многоколоночные ключи (например, PRIMARY KEY (col1, col2), что позволит запрашивать такие запросы, как col1 = value1 и col1 = value1 and col2 COND)
используйте ALLOW FILTERING в запросах. Это приведет к предупреждению о том, что Cassandra придется просеять много данных и не будет никаких гарантий производительности. Для получения дополнительной информации см. детали ALLOW FILTERING в CQL и этот поток SO

Ответ 2

Кассандра немного привыкает:) Некоторые из нас были избалованы некоторыми дополнительными вещами, которые RDBMS делает для вас, что вы не получаете бесплатно от noSql.

Если вы вернетесь к обычной таблице РСУБД, если вы ВЫБЕРИТЕ в столбце, который не имеет индекса, БД должна выполнить полноэкранное сканирование, чтобы найти все совпадения, которые вы ищете. Это не-нет в Кассандре, и он будет жаловаться, если вы попытаетесь это сделать. Представьте, если вы нашли 10 ^ 32 совпадений с этим запросом? Это не разумный вопрос.

В вашей таблице вы кодировали * PRIMARY KEY (employee_id); * это первичный и уникальный идентификационный ключ строки. Теперь вы можете выбрать SELECT * из TEST, где employee_id = '123'; это вполне разумно, и Cassandra с радостью вернет результат.

Однако ваш SELECT from TEST WHERE employee_name = 'e27'; сообщает Cassandra, что он должен идти и читать КАЖДУЮ запись, пока не найдет совпадение на 'e27'. Без индекса, на который можно положиться, он вежливо просит вас "забыть".

Если вы хотите отфильтровать столбец, убедитесь, что у вас есть индекс в этом столбце, чтобы Cassandra могла выполнить необходимую фильтрацию.