Как выбрать самые новые четыре позиции для каждой категории?
У меня есть база данных элементов. Каждый элемент классифицируется с идентификатором категории из таблицы категорий. Я пытаюсь создать страницу, в которой перечислены все категории, и под каждой категорией я хочу показать 4 новых элемента в этой категории.
Пример:
Принадлежности для домашних животных
img1
img2
img3
img4
Корм для домашних животных
img1
img2
img3
img4
Я знаю, что я мог бы легко решить эту проблему, запросив базу данных для каждой категории следующим образом:
SELECT id FROM category
Затем повторить эти данные и запросить базу данных для каждой категории, чтобы захватить новейшие элементы:
SELECT image FROM item where category_id = :category_id
ORDER BY date_listed DESC LIMIT 4
Я пытаюсь выяснить, могу ли я просто использовать 1 запрос и захватить все эти данные. У меня 33 категории, поэтому я подумал, что это может помочь уменьшить количество вызовов в базе данных.
Кто-нибудь знает, возможно ли это? Или, если 33 звонка не так важны, и я должен просто сделать это легко.
Ответы
Ответ 1
Это самая большая проблема с n-группой, и это очень распространенный вопрос SQL.
Вот как я решаю его с помощью внешних соединений:
SELECT i1.*
FROM item i1
LEFT OUTER JOIN item i2
ON (i1.category_id = i2.category_id AND i1.item_id < i2.item_id)
GROUP BY i1.item_id
HAVING COUNT(*) < 4
ORDER BY category_id, date_listed;
Я предполагаю, что основным ключом таблицы item
является item_id
, и что это монотонно возрастающее псевдокод. То есть большее значение в item_id
соответствует более новой строке в item
.
Здесь, как это работает: для каждого элемента есть несколько других элементов, которые новее. Например, есть три элемента новее, чем четвертый новый элемент. Есть ноль, новее, чем самый новый элемент. Поэтому мы хотим сравнить каждый элемент (i1
) с набором элементов (i2
), которые новее и имеют ту же категорию, что и i1
. Если число этих новых элементов меньше четырех, i1
является одним из тех, которые мы включаем. В противном случае не включайте его.
Красота этого решения заключается в том, что он работает независимо от того, сколько у вас категорий, и продолжает работать, если вы меняете категории. Он также работает, даже если количество элементов в некоторых категориях меньше четырех.
Другое решение, которое работает, но использует функцию пользовательских переменных MySQL:
SELECT *
FROM (
SELECT i.*, @r := IF(@g = category_id, @r+1, 1) AS rownum, @g := category_id
FROM (@g:=null, @r:=0) AS _init
CROSS JOIN item i
ORDER BY i.category_id, i.date_listed
) AS t
WHERE t.rownum <= 3;
В MySQL 8.0.3 появилась поддержка стандартных оконных функций SQL. Теперь мы можем решить такую проблему, как это делают другие РСУБД:
WITH numbered_item AS (
SELECT *, ROW_NUMBER() OVER (PARTITION BY category_id ORDER BY item_id) AS rownum
FROM item
)
SELECT * FROM numbered_item WHERE rownum <= 4;
Ответ 2
Это решение является адаптацией из другого SO-решения, спасибо RageZ за поиск этого связанного/подобного вопроса.
Примечание
Это решение кажется удовлетворительным для случая использования Джастина. В зависимости от вашего варианта использования вы можете проверить решения Bill Karwin или David Andres в этой публикации. Решение Билла имеет мой голос! Посмотрите, почему, поскольку я поставил оба вопроса рядом друг с другом, -)
Преимущество моего решения состоит в том, что он возвращает одну запись для категории_ид (информация из таблицы элементов "свернута" ). Основным недостатком моего решения является отсутствие читаемости и растущая сложность, так как количество желаемых строк растет (скажем, 6 строк для каждой категории, а не 6). Кроме того, это может быть немного медленнее по мере роста количества строк в таблице элементов. (Независимо от того, что все решения будут лучше работать с меньшим количеством допустимых строк в таблице элементов, и поэтому рекомендуется либо периодически удалять, либо перемещать старые элементы и/или вводить флаг, чтобы помочь SQL отфильтровать строки раньше)
Первая попытка (не работает!!!)...
Проблема с этим подходом заключалась в том, что подзапрос [по праву, но плохой для нас] производит очень много строк, основанных на декартовых произведениях, определенных самим собой.
SELECT id, CategoryName(?), tblFourImages.*
FROM category
JOIN (
SELECT i1.category_id, i1.image as Image1, i2.image AS Image2, i3.image AS Image3, i4.image AS Image4
FROM item AS i1
LEFT JOIN item AS i2 ON i1.category_id = i2.category_id AND i1.date_listed > i2.date_listed
LEFT JOIN item AS i3 ON i2.category_id = i3.category_id AND i2.date_listed > i3.date_listed
LEFT JOIN item AS i4 ON i3.category_id = i4.category_id AND i3.date_listed > i4.date_listed
) AS tblFourImages ON tblFourImages.category_id = category.id
--WHERE here_some_addtional l criteria if needed
ORDER BY id ASC;
Вторая попытка. (работает нормально!)
Предложение WHERE в добавлении для подзапроса, заставляющее указанную дату быть последней, второй, последней и т.д. для i1, i2, i3 и т.д., соответственно (а также допускать нулевые случаи, когда их меньше 4 элемента для идентификатора определенной категории). Кроме того, были добавлены несвязанные предложения фильтра, чтобы запретить показ записей, которые "проданы" или записи, которые не имеют изображения (добавленные требования)
Эта логика делает предположение о том, что не существует повторяющихся значений, указанных в дате (для данной категории_id). В противном случае такие случаи создавали бы повторяющиеся строки. Эффективно это использование указанной даты - это монотонно увеличенный первичный ключ, как определено/требуется в решении Билла.
SELECT id, CategoryName, tblFourImages.*
FROM category
JOIN (
SELECT i1.category_id, i1.image as Image1, i2.image AS Image2, i3.image AS Image3, i4.image AS Image4, i4.date_listed
FROM item AS i1
LEFT JOIN item AS i2 ON i1.category_id = i2.category_id AND i1.date_listed > i2.date_listed AND i2.sold = FALSE AND i2.image IS NOT NULL
AND i1.sold = FALSE AND i1.image IS NOT NULL
LEFT JOIN item AS i3 ON i2.category_id = i3.category_id AND i2.date_listed > i3.date_listed AND i3.sold = FALSE AND i3.image IS NOT NULL
LEFT JOIN item AS i4 ON i3.category_id = i4.category_id AND i3.date_listed > i4.date_listed AND i4.sold = FALSE AND i4.image IS NOT NULL
WHERE NOT EXISTS (SELECT * FROM item WHERE category_id = i1.category_id AND date_listed > i1.date_listed)
AND (i2.image IS NULL OR (NOT EXISTS (SELECT * FROM item WHERE category_id = i1.category_id AND date_listed > i2.date_listed AND date_listed <> i1.date_listed)))
AND (i3.image IS NULL OR (NOT EXISTS (SELECT * FROM item WHERE category_id = i1.category_id AND date_listed > i3.date_listed AND date_listed <> i1.date_listed AND date_listed <> i2.date_listed)))
AND (i4.image IS NULL OR (NOT EXISTS (SELECT * FROM item WHERE category_id = i1.category_id AND date_listed > i4.date_listed AND date_listed <> i1.date_listed AND date_listed <> i2.date_listed AND date_listed <> i3.date_listed)))
) AS tblFourImages ON tblFourImages.category_id = category.id
--WHERE --
ORDER BY id ASC;
Теперь... сравните следующее, когда я представляю ключ item_id и использую решение Билла, чтобы предоставить их список "внешнему" запросу. Вы можете понять, почему подход Билла лучше...
SELECT id, CategoryName, image, date_listed, item_id
FROM item I
LEFT OUTER JOIN category C ON C.id = I.category_id
WHERE I.item_id IN
(
SELECT i1.item_id
FROM item i1
LEFT OUTER JOIN item i2
ON (i1.category_id = i2.category_id AND i1.item_id < i2.item_id
AND i1.sold = 'N' AND i2.sold = 'N'
AND i1.image <> '' AND i2.image <> ''
)
GROUP BY i1.item_id
HAVING COUNT(*) < 4
)
ORDER BY category_id, item_id DESC
Ответ 3
В других базах данных вы можете сделать это с помощью функции ROW_NUMBER
.
SELECT
category_id, image, date_listed
FROM
(
SELECT
category_id, image, date_listed,
ROW_NUMBER() OVER (PARTITION BY category_id
ORDER BY date_listed DESC) AS rn
FROM item
) AS T1
WHERE rn <= 4
К сожалению, MySQL не поддерживает функцию ROW_NUMBER
, но вы можете эмулировать ее с помощью переменных:
SELECT
category_id, image, date_listed
FROM
(
SELECT
category_id, image, date_listed,
@rn := IF(@prev = category_id, @rn + 1, 1) AS rn,
@prev := category_id
FROM item
JOIN (SELECT @prev := NULL, @rn = 0) AS vars
ORDER BY category_id, date_listed DESC
) AS T1
WHERE rn <= 4
Посмотрите, как он работает в Интернете: sqlfiddle
Он работает следующим образом:
- Внутри @prev установлено значение NULL, а @rn - 0.
- Для каждой строки, которую мы видим, проверьте, совпадает ли category_id с предыдущей строкой.
- Если да, увеличьте номер строки.
- В противном случае запустите новую категорию и reset номер строки, чтобы вернуться к 1.
- Когда подзапрос завершается, последним шагом является фильтрация, так что сохраняются только строки с номером строки, меньшим или равным 4.
Ответ 4
не очень красиво, но:
SELECT image
FROM item
WHERE date_listed IN (SELECT date_listed
FROM item
ORDER BY date_listed DESC LIMIT 4)
Ответ 5
В зависимости от того, насколько постоянны ваши категории, следующий простейший маршрут
SELECT C.CategoryName, R.Image, R.date_listed
FROM
(
SELECT CategoryId, Image, date_listed
FROM
(
SELECT CategoryId, Image, date_listed
FROM item
WHERE Category = 'Pet Supplies'
ORDER BY date_listed DESC LIMIT 4
) T
UNION ALL
SELECT CategoryId, Image, date_listed
FROM
(
SELECT CategoryId, Image, date_listed
FROM item
WHERE Category = 'Pet Food'
ORDER BY date_listed DESC LIMIT 4
) T
) RecentItemImages R
INNER JOIN Categories C ON C.CategoryId = R.CategoryId
ORDER BY C.CategoryName, R.Image, R.date_listed
Ответ 6
приведенный ниже код показывает способ сделать это в цикле
он определенно нуждается в большом редактировании, но я надеюсь, что это поможет.
declare @RowId int
declare @CategoryId int
declare @CategoryName varchar(MAX)
create table PART (RowId int, CategoryId int, CategoryName varchar)
create table NEWESTFOUR(RowId int, CategoryId int, CategoryName varchar, Image image)
select RowId = ROW_NUMBER(),CategoryId,CategoryName into PART from [Category Table]
set @PartId = 0
set @CategoryId = 0
while @Part_Id <= --count
begin
set @PartId = @PartId + 1
SELECT @CategoryId = category_id, @CategoryName = category_name from PART where PartId = @Part_Id
SELECT RowId = @PartId, image,CategoryId = @category_id, CategoryName = @category_name FROM item into NEWESTFOUR where category_id = :category_id
ORDER BY date_listed DESC LIMIT 4
end
select * from NEWESTFOUR
drop table NEWESTFOUR
drop table PART
Ответ 7
ok после того, как поисковый запрос быстрого ответа невозможен, по крайней мере, на mysql
этот поток для справки
возможно, вам следует кэшировать результат этого запроса, если вы боитесь свалить сервер и хотите, чтобы код работал более хорошо.