Обеспечение взаимной уникальности в нескольких столбцах

Я пытаюсь найти интуитивный способ обеспечения взаимной уникальности между двумя столбцами в таблице. Я не ищу сложную уникальность, где дублирующиеся комбинации ключей запрещены; скорее, я хочу правило, когда любой из ключей не может появляться снова в любом столбце. Возьмем следующий пример:

Человек может выбрать любую комнату, как свою гостиную, и любую другую комнату в качестве столовой. Когда комната была выделена жильцу, она не может быть выделена другому человеку (будь то в гостиной или в столовой).

Я знаю, что эта проблема может быть решена с помощью нормализации данных; однако я не могу ~~изменить схему~~ внести изменения в схему.

Обновление. В ответ на предлагаемые ответы:

Два уникальных ограничения (или два уникальных индекса) не будут препятствовать дублированию в двух столбцах. Точно так же простое ограничение проверки LivingRoomId != DiningRoomId не будет препятствовать дублированию строк. Например, я хочу, чтобы следующие данные были запрещены:

Комната 2 занята одновременно Алексом (как гостиная) и Линкольном (как столовая); это не должно быть разрешено.

Обновление ₂. Я провел несколько тестов по трем основным предлагаемым решениям, указав, сколько времени потребуется, чтобы вставить 500 000 строк в таблицу Occupants причем каждая строка имеет пару случайных уникальных идентификаторов номеров.

Расширение таблицы Occupants с уникальными индексами и контрольное ограничение (которое вызывает скалярную функцию) приводит к тому, что вставка занимает примерно в три раза больше. Реализация скалярной функции является неполной, и только проверка того, что гостиная нового жителя не противоречит существующей столовой обитателей. Я не смог получить вставку в разумные сроки, если была выполнена обратная проверка.

Добавление триггера, который вставляет каждую комнату для пассажиров в новую строку в другую таблицу, снижает производительность на 48%. Точно так же индексированное представление увеличивается на 43%. На мой взгляд, использование индексированного представления является более чистым, поскольку оно позволяет избежать необходимости создания другой таблицы, а также позволяет SQL Server автоматически обрабатывать обновления и удалять также.

Полные сценарии и результаты тестов приведены ниже:

Ответы

Ответ 1

Вы можете создать "внешнее" ограничение в виде индексированного представления:

CREATE VIEW dbo.OccupiedRooms
WITH SCHEMABINDING
AS
SELECT r.Id
FROM   dbo.Occupants AS o
INNER JOIN dbo.Rooms AS r ON r.Id IN (o.LivingRoomId, o.DiningRoomId)
;
GO

CREATE UNIQUE CLUSTERED INDEX UQ_1 ON dbo.OccupiedRooms (Id);

Вид по существу не содержит идентификаторов занятых комнат, помещая их в одну колонку. Уникальный индекс в этом столбце гарантирует, что он не имеет дубликатов.

Вот демонстрации того, как работает этот метод:

UPDATE

Как hvd правильно заметил, вышеупомянутое решение не пытается попытаться вставить идентичные LivingRoomId и DiningRoomId, когда они помещаются в одну строку. Это связано с тем, что таблица dbo.Rooms сопоставляется только один раз в этом случае и, следовательно, объединение создает только одну строку для пары ссылок.

Один из способов исправления, предложенный в том же комментарии: дополнительно к индексированному представлению используйте ограничение CHECK в таблице dbo.OccupiedRooms, чтобы запретить строки с идентичными идентификаторами комнат. Однако предлагаемое условие LivingRoomId <> DiningRoomId не будет работать для случаев, когда оба столбца имеют значение NULL. Для учета этого случая условие можно было бы расширить до этого:

LivingRoomId <> DinindRoomId AND (LivingRoomId IS NOT NULL OR DinindRoomId IS NOT NULL)

В качестве альтернативы вы можете изменить оператор SELECT представления, чтобы поймать все ситуации. Если LivingRoomId и DinindRoomId были столбцами NOT NULL, вы могли бы избежать присоединения к dbo.Rooms и отключить столбцы, используя перекрестное соединение с виртуальной таблицей из двух строк:

SELECT  Id = CASE x.r WHEN 1 THEN o.LivingRoomId ELSE o.DiningRoomId END
FROM    dbo.Occupants AS o
CROSS
JOIN    (SELECT 1 UNION ALL SELECT 2) AS x (r)

Однако, поскольку эти столбцы допускают NULL, этот метод не позволит вам вставлять несколько строк с одной ссылкой. Чтобы он работал в вашем случае, вам нужно отфильтровать записи NULL, но только если они поступают из строк, где другая ссылка не является NULL. Я считаю, что добавление следующего предложения WHERE к вышеуказанному запросу будет достаточным:

WHERE o.LivingRoomId IS NULL AND o.DinindRoomId IS NULL
   OR x.r = 1 AND o.LivingRoomId IS NOT NULL
   OR x.r = 2 AND o.DinindRoomId IS NOT NULL

Ответ 2

Я думаю, что единственный способ сделать это - использовать ограничение и функцию.

Псевдокод (не делал это в течение длительного времени):

CREATE FUNCTION CheckExlusiveRoom
RETURNS bit
declare @retval bit
set @retval = 0
    select retval = 1 
      from Occupants as Primary
      join Occupants as Secondary
        on Primary.LivingRoomId = Secondary.DiningRoomId
     where Primary.ID <> Secondary.ID
        or (   Primary.DiningRoomId= Secondary.DiningRoomId
            or Primary.LivingRoomId = Secondary.LivingRoomID)
return @retval
GO

Затем используйте эту функцию в контрольном ограничении....

Альтернативой будет использование промежуточной таблицы OccupiedRoom, где вы всегда будете вставлять в нее комнаты, которые используются (например, триггером?) и FK, вместо таблицы Room

Реакция на комментарий:

Нужно ли принудительно применять его непосредственно в таблице или это нарушение ограничений происходит в ответ на вставку/обновление? Потому что тогда я так думаю:

создать простую таблицу:

create table RoomTaken (RoomID int primary key references Room (Id) )

создать триггер для вставки/обновления/удаления, который гарантирует, что любая Комната, используемая в Жильцах, также хранится в RoomID.
Если вы попытаетесь дублировать использование комнаты, таблица RoomTaken вызовет нарушение PK

Не уверен, что этого достаточно и/или как он будет сравнивать скорость с UDF (я предполагаю, что это будет лучше).

И да, я вижу проблему, что RoomTaken не будет использовать FK для использования в оккупантах, но... действительно, вы работаете под некоторыми ограничениями, и нет идеального решения - это скорость (UDF) и 100% принудительное исполнение по-моему.

Ответ 3

Вы добавили контрольное ограничение в таблицу Occupants:

CHECK (LivingRoomId <> DiningRoomId)

Если вы также хотите обрабатывать NULL:

CHECK ((LivingRoomId <> DiningRoomId) or LivingRoomId is NULL or DiningRoomId is NULL)

Ответ 4

Вы можете выполнить это с помощью двух уникальных ограничений. Если вы хотите разрешить более одного NULL, используйте отфильтрованные индексы, каждый с WHERE... NOT NULL.