Как найти самые большие объекты в базе данных SQL Server?
Как мне найти наиболее крупные объекты в базе данных SQL Server? Во-первых, определяя, какие таблицы (и связанные индексы) являются наибольшими, а затем определяют, какие строки в конкретной таблице являются самыми большими (мы храним двоичные данные в BLOB)?
Существуют ли какие-либо инструменты для помощи в таком анализе базы данных? Или есть некоторые простые запросы, которые я мог бы выполнить против системных таблиц?
Ответы
Ответ 1
Я использовал этот сценарий SQL (который я получил от кого-то, где-то - не могу восстановить, от кого он появился) целую вечность, и он помог мне немного понять и определить размер индексов и таблиц:
SELECT
t.name AS TableName,
i.name as indexName,
sum(p.rows) as RowCounts,
sum(a.total_pages) as TotalPages,
sum(a.used_pages) as UsedPages,
sum(a.data_pages) as DataPages,
(sum(a.total_pages) * 8) / 1024 as TotalSpaceMB,
(sum(a.used_pages) * 8) / 1024 as UsedSpaceMB,
(sum(a.data_pages) * 8) / 1024 as DataSpaceMB
FROM
sys.tables t
INNER JOIN
sys.indexes i ON t.object_id = i.object_id
INNER JOIN
sys.partitions p ON i.object_id = p.object_id AND i.index_id = p.index_id
INNER JOIN
sys.allocation_units a ON p.partition_id = a.container_id
WHERE
t.name NOT LIKE 'dt%' AND
i.object_id > 255 AND
i.index_id <= 1
GROUP BY
t.name, i.object_id, i.index_id, i.name
ORDER BY
object_name(i.object_id)
Конечно, вы можете использовать другие критерии заказа, например
ORDER BY SUM(p.rows) DESC
чтобы получить таблицы с наибольшим количеством строк, или
ORDER BY SUM(a.total_pages) DESC
чтобы получить таблицы с наибольшим количеством используемых страниц (8K блоков).
Ответ 2
В SQL Server 2008 вы также можете просто запустить стандартное использование диска "Использование диска по верхним таблицам". Это можно найти с помощью щелчка правой кнопкой мыши БД, выбора отчетов- > стандартных отчетов и выбора требуемого отчета.
Ответ 3
Вы также можете использовать следующий код:
USE AdventureWork
GO
CREATE TABLE #GetLargest
(
table_name sysname ,
row_count INT,
reserved_size VARCHAR(50),
data_size VARCHAR(50),
index_size VARCHAR(50),
unused_size VARCHAR(50)
)
SET NOCOUNT ON
INSERT #GetLargest
EXEC sp_msforeachtable 'sp_spaceused ''?'''
SELECT
a.table_name,
a.row_count,
COUNT(*) AS col_count,
a.data_size
FROM #GetLargest a
INNER JOIN information_schema.columns b
ON a.table_name collate database_default
= b.table_name collate database_default
GROUP BY a.table_name, a.row_count, a.data_size
ORDER BY CAST(REPLACE(a.data_size, ' KB', '') AS integer) DESC
DROP TABLE #GetLargest
Ответ 4
Этот запрос поможет найти самую большую таблицу в вас - это соединение.
SELECT TOP 1 OBJECT_NAME(OBJECT_ID) TableName, st.row_count
FROM sys.dm_db_partition_stats st
WHERE index_id < 2
ORDER BY st.row_count DESC
Ответ 5
Если вы используете Sql Server Management Studio 2008, есть определенные поля данных, которые вы можете просмотреть в окне сведений о проводнике объекта. Просто просмотрите и выберите папку с таблицами. В представлении деталей вы можете щелкнуть правой кнопкой мыши заголовки столбцов и добавить поля в "отчет". Ваш пробег может отличаться, если вы используете экспресс-службу SSMS 2008.
Ответ 6
Я нашел этот запрос очень полезным в SqlServerCentral, вот ссылка на оригинальное сообщение
Максимальные таблицы серверов Sql
select name=object_schema_name(object_id) + '.' + object_name(object_id)
, rows=sum(case when index_id < 2 then row_count else 0 end)
, reserved_kb=8*sum(reserved_page_count)
, data_kb=8*sum( case
when index_id<2 then in_row_data_page_count + lob_used_page_count + row_overflow_used_page_count
else lob_used_page_count + row_overflow_used_page_count
end )
, index_kb=8*(sum(used_page_count)
- sum( case
when index_id<2 then in_row_data_page_count + lob_used_page_count + row_overflow_used_page_count
else lob_used_page_count + row_overflow_used_page_count
end )
)
, unused_kb=8*sum(reserved_page_count-used_page_count)
from sys.dm_db_partition_stats
where object_id > 1024
group by object_id
order by
rows desc
В моей базе данных они дали разные результаты между этим запросом и первым ответом.
Надеюсь, что кто-нибудь найдет полезный
Ответ 7
Ответ @marc_s очень хорош, и я использую его уже несколько лет. Однако я заметил, что скрипт пропускает данные в некоторых индексах columnstore и не показывает полную картину. Например, когда вы выполняете SUM(TotalSpace)
для сценария и сравниваете его со свойством базы данных общего пространства в Management Studio, в моем случае числа не совпадают (Management Studio показывает большие числа). Я изменил скрипт, чтобы преодолеть эту проблему и немного расширил его:
select
tables.[name] as table_name,
schemas.[name] as schema_name,
isnull(db_name(dm_db_index_usage_stats.database_id), 'Unknown') as database_name,
sum(allocation_units.total_pages) * 8 as total_space_kb,
cast(round(((sum(allocation_units.total_pages) * 8) / 1024.00), 2) as numeric(36, 2)) as total_space_mb,
sum(allocation_units.used_pages) * 8 as used_space_kb,
cast(round(((sum(allocation_units.used_pages) * 8) / 1024.00), 2) as numeric(36, 2)) as used_space_mb,
(sum(allocation_units.total_pages) - sum(allocation_units.used_pages)) * 8 as unused_space_kb,
cast(round(((sum(allocation_units.total_pages) - sum(allocation_units.used_pages)) * 8) / 1024.00, 2) as numeric(36, 2)) as unused_space_mb,
count(distinct indexes.index_id) as indexes_count,
max(dm_db_partition_stats.row_count) as row_count,
iif(max(isnull(user_seeks, 0)) = 0 and max(isnull(user_scans, 0)) = 0 and max(isnull(user_lookups, 0)) = 0, 1, 0) as no_reads,
iif(max(isnull(user_updates, 0)) = 0, 1, 0) as no_writes,
max(isnull(user_seeks, 0)) as user_seeks,
max(isnull(user_scans, 0)) as user_scans,
max(isnull(user_lookups, 0)) as user_lookups,
max(isnull(user_updates, 0)) as user_updates,
max(last_user_seek) as last_user_seek,
max(last_user_scan) as last_user_scan,
max(last_user_lookup) as last_user_lookup,
max(last_user_update) as last_user_update,
max(tables.create_date) as create_date,
max(tables.modify_date) as modify_date
from
sys.tables
left join sys.schemas on schemas.schema_id = tables.schema_id
left join sys.indexes on tables.object_id = indexes.object_id
left join sys.partitions on indexes.object_id = partitions.object_id and indexes.index_id = partitions.index_id
left join sys.allocation_units on partitions.partition_id = allocation_units.container_id
left join sys.dm_db_index_usage_stats on tables.object_id = dm_db_index_usage_stats.object_id and indexes.index_id = dm_db_index_usage_stats.index_id
left join sys.dm_db_partition_stats on tables.object_id = dm_db_partition_stats.object_id and indexes.index_id = dm_db_partition_stats.index_id
group by schemas.[name], tables.[name], isnull(db_name(dm_db_index_usage_stats.database_id), 'Unknown')
order by 5 desc
Надеюсь, это будет полезно для кого-то. Этот скрипт был протестирован с большими базами данных по всему ТБ с сотнями различных таблиц, индексов и схем.