Вычисление процентов с запросом GROUP BY
У меня есть таблица с тремя столбцами, которая выглядит так:
File User Rating (1-5)
------------------------------
00001 1 3
00002 1 4
00003 2 2
00004 3 5
00005 4 3
00005 3 2
00006 2 3
Etc.
Я хочу сгенерировать запрос, который выводит следующее (для каждого пользователя и рейтинг, отображение количества файлов, а также процентных файлов):
User Rating Count Percentage
-----------------------------------
1 1 3 .18
1 2 6 .35
1 3 8 .47
2 5 12 .75
2 3 4 .25
С Postgresql я знаю, как создать запрос, который включает первые 3 столбца, используя следующий запрос, но я не могу понять, как вычислить процент в GROUP BY:
SELECT
User,
Rating,
Count(*)
FROM
Results
GROUP BY
User, Rating
ORDER BY
User, Rating
Здесь я хочу, чтобы процентный расчет применялся к каждой группе пользователей/групп.
Ответы
Ответ 1
WITH t1 AS
(SELECT User, Rating, Count(*) AS n
FROM your_table
GROUP BY User, Rating)
SELECT User, Rating, n,
(0.0+n)/(COUNT(*) OVER (PARTITION BY User)) -- no integer divide!
FROM t1;
или
SELECT User, Rating, Count(*) OVER w_user_rating AS n,
(0.0+Count(*) OVER w_user_rating)/(Count(*) OVER (PARTITION BY User)) AS pct
FROM your_table
WINDOW w_user_rating AS (PARTITION BY User, Rating);
Я бы увидел, если один из этих или других вариантов даст лучший план запроса с соответствующим инструментом для вашей РСУБД.
Ответ 2
В качестве альтернативы, вы можете поступить по-старому - возможно, проще уловить:
select usr.User as User ,
usr.Rating as Rating ,
usr.N as N ,
(100.0 * item.N) / total.N as Pct
from ( select User, Rating , count(*) as N
from Results
group by User , Rating
) usr
join ( select User , count(*) as N
from Results
group by User
) total on total.User = usr.User
order by usr.User, usr.Rating
Ура!
Ответ 3
Лучший способ сделать это - использовать оконные функции.
Ответ 4
WITH data AS
(SELECT User, Rating, Count(*) AS Count
FROM Results
GROUP BY User, Rating)
SELECT User, Rating, Count,
(0.0+n)/(SUM(Count) OVER (PARTITION BY User))
FROM data;