Выполнить регулярное выражение (заменить) в SQL-запросе

Каков наилучший способ заменить все "& lt" на < в данном столбце базы данных? В основном выполните s/&lt[^;]/</gi

Примечания:

  • должен работать в MS SQL Server 2000
  • Должен быть повторяемым (и не заканчиваться <;;;;;;;;;)

Ответы

Ответ 1

Требуется некоторая хакерская атака, но мы можем сделать это с помощью LIKE, PATINDEX, LEFT И ВПРАВО и доброй старой конкатенация строк.

create table test
(
    id int identity(1, 1) not null,
    val varchar(25) not null
)

insert into test values ('&lt; <- ok, &lt <- nok')

while 1 = 1
begin
    update test
        set val = left(val, patindex('%&lt[^;]%', val) - 1) +
                      '&lt;' +
                      right(val, len(val) - patindex('%&lt[^;]%', val) - 2)
    from test
    where val like '%&lt[^;]%'

    IF @@ROWCOUNT = 0 BREAK
end

select * from test

Лучше то, что это версия агрегирования SQL Server и должна работать нормально.

Ответ 2

Я думаю, что это можно сделать намного чище, если вы используете разные STUFF:)

create table test
(
    id int identity(1, 1) not null,
    val varchar(25) not null
)

insert into test values ('&lt; <- ok, &lt <- nok')

WHILE 1 = 1
BEGIN
    UPDATE test SET
        val = STUFF( val , PATINDEX('%&lt[^;]%', val) + 3 , 0 , ';' )
    FROM test
    WHERE val LIKE '%&lt[^;]%'

    IF @@ROWCOUNT = 0 BREAK
END

select * from test

Ответ 3

Как насчет:

    UPDATE tableName
    SET columName = REPLACE(columName , '&lt', '&lt;')
    WHERE columnName LIKE '%lt%'
    AND columnName NOT LIKE '%lt;%'

Edit:

Я только понял, что это будет игнорировать столбцы с частично правильными строками &lt;.

В этом случае вы можете игнорировать вторую часть предложения where и вызывать это позже:

    UPDATE tableName
    SET columName = REPLACE(columName , '&lt;;', '&lt;')

Ответ 4

В этой статье описывается, как создать простую функцию Regex Replace, которую вы можете использовать в SQL 2000 (и 2005 с простой настройкой), которая может помогите вам.

Ответ 5

Если рецепт регулярного выражения MSSQL поддерживает отрицательный результат, это будет Правильный способ приблизиться к этому.

s/&lt(?!;)/&lt;/gi

поймает все экземпляры & lt, за которыми не следует ; (даже если за ними ничего не будет, что [^;] пропустит) и не отображает следующий символ не ; как часть совпадения, устраняя проблему, упомянутую в комментариях по исходному вопросу о том, что этот символ теряется при замене.

К сожалению, я не использую MSSQL, поэтому я понятия не имею, поддерживает ли он негативный просмотр или нет...

Ответ 6

Очень специфичен для этого шаблона, но я уже делал это в прошлом:

REPLACE(REPLACE(columName, '&lt;', '&lt'), '&lt', '&lt;')

более широкий пример (кодировать символы, которые могут быть неуместными в атрибуте TITLE)

REPLACE(REPLACE(REPLACE(REPLACE(
REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(REPLACE(
    columName
    -- Remove existing encoding:
    , '&amp;', '&')
    , '&#34;', '"')
    , '&#39;', '''')
    -- Reinstate/Encode:
    , '&', '&amp;')
    -- Encode:
    , '"', '&#34;')
    , '''', '&#39;')
    , ' ', '%20')
    , '<', '%3C')
    , '>', '%3E')
    , '/', '%2F')
    , '\', '%5C')