Регулярное выражение IPv6 (RegEx) не работает в PL/SQL
Я не могу понять, почему это регулярное выражение не работает в PL/SQL
.
if ( REGEXP_LIKE(v,'/^(?>(?>([a-f0-9]{1,4})(?>:(?1)){7}|(?!(?:.*[a-f0-9](?>:|$)){8,})((?1)(?>:(?1)){0,6})?::(?2)?)|(?>(?>(?1)(?>:(?1)){5}:|(?!(?:.*[a-f0-9]:){6,})(?3)?::(?>((?1)(?>:(?1)){0,4}):)?)?(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(?>\.(?4)){3}))$/iD') ) then
Для проверки IPv4 и IPv6 он пришел сюда: qaru.site/info/19824/...
Не уверен, что это имеет к этому какое-то отношение, но я также задал этот вопрос о знаке D
в конце: Что такое регулярное выражение (RegEx) Ид
По какой-то причине это регулярное выражение работает для большинства моих тестов на этом сайте: http://regex101.com/, но в PL/SQL
все недействительно.
Что я имею в виду под most, так это то, что есть некоторые случаи, когда я нахожу, что он терпит неудачу, но я искал дни, и это лучший из них, который я могу найти под 512 символами ( 512 является предел при использовании REGEXP_LIKE
в PL/SQL
)
Буду признателен за любую помощь. Спасибо!
Это те тесты, которые я использую...
{1: Initial address, regex should say valid/match}
select isValid('2001:0db8:0000:0000:0000:ff00:0042:8329','ipv6') from dual;
{2: After removing all leading zeroes, regex should say valid/match}
select isValid('2001:db8:0:0:0:ff00:42:8329','ipv6') from dual;
{3: After omitting consecutive sections of zeroes, regex should say valid/match}
select isValid('2001:db8::ff00:42:8329','ipv6') from dual;
{4: The loopback address, regex should say valid/match}
select isValid('0000:0000:0000:0000:0000:0000:0000:0001','ipv6') from dual;
{5: The loopback address be abbreviated to ::1 by using both rules, regex should say valid/match}
select isValid('::1','ipv6') from dual;
{6: This should be valid/match}
select isValid('ABCD:ABCD:ABCD:ABCD:ABCD:ABCD:192.168.158.190','ipv6') from dual;
{7: This should be valid/match}
select isValid('::','ipv6') from dual;
{8: IPv6 applications to communicate directly with IPv4 applications, regex should say valid/match}
select isValid('0:0:0:0:0:ffff:192.1.56.10','ipv6') from dual;
{9: should NOT be valid/match}
select isValid('::ffff:192.1.56.10/96','ipv6') from dual;
{old formats used for tunneling, these should NOT be valid/matches}
{10}
select isValid('0:0:0:0:0:0:192.1.56.10','ipv6') from dual;
{11}
select isValid('::192.1.56.10/96','ipv6') from dual;
{These 4 should be valid/match}
{12}
select isValid('::FFFF:129.144.52.38','ipv6') from dual;
{13}
select isValid('::129.144.52.38','ipv6') from dual;
{14}
select isValid('::FFFF:d','ipv6') from dual;
{15}
select isValid('1080:0:0:0:8:800:200C:417A','ipv6') from dual;
{These 4 should NOT be valid/match}
{16}
select isValid('::FFFF:d.d.d','ipv6') from dual;
{17}
select isValid('::FFFF:d.d','ipv6') from dual;
{18}
select isValid('::d.d.d','ipv6') from dual;
{19}
select isValid('::d.d','ipv6') from dual;
Мне сказали, что тест №6 был неправильным, ABCD:ABCD:ABCD:ABCD:ABCD:ABCD:192.168.158.190
не является допустимым адресом IPv6, это правильно?
Тестовые примеры 8-11 пришли отсюда: http://publib.boulder.ibm.com/infocenter/iseries/v5r3/index.jsp?topic=%2Frzai2%2Frzai2ipv6addrformat.htm, но мне сказали, что 10 и 11 больше не используются.
Ответы
Ответ 1
Вместо того, чтобы делать все в одном регулярном выражении, лучше разбить регулярное выражение на более мелкие и проверить их:
if (
/* IPv6 expanded */
REGEX_LIKE(v, '\A[a-f0-9]{1,4}(:[a-f0-9]{1,4}){7}\z', 'i')
/* IPv6 shorthand */
OR (NOT REGEX_LIKE(v, '\A(.*?[a-f0-9](:|\z)){8}', 'i')
AND REGEX_LIKE(v, '\A([a-f0-9]{1,4}(:[a-f0-9]{1,4}){0,6})?::([a-f0-9]{1,4}(:[a-f0-9]{1,4}){0,6})?\z', 'i'))
/* IPv6 dotted-quad notation, expanded */
OR REGEX_LIKE(v, '\A[a-f0-9]{1,4}(:[a-f0-9]{1,4}){5}:(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}\z', 'i')
/* IPv6 dotted-quad notation, shorthand */
OR (NOT REGEX_LIKE(v, '\A(.*?[a-f0-9]:){6}', 'i')
AND REGEX_LIKE(v, '\A([a-f0-9]{1,4}(:[a-f0-9]{1,4}){0,4})?::([a-f0-9]{1,4}:){0,5}(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(\.(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])){3}\z', 'i'))
) then
Это только тесты для IPv6. IPv4 не разрешен.
Так как аромат PL/SQL не имеет вызовов подпрограмм (?n)
, выбора нет, кроме как развернуть все. И отсутствие негативного внешнего вида (?!pattern)
заставляет нас имитировать его с помощью двух операций тестирования регулярных выражений.
\A
и \z
используются для сопоставления начала и конца строки, поскольку на обоих из них не влияют флаги, а поведение \z
такое же, как $
в режиме D
в PCRE.
Ответ 2
Вам нужно избавиться от/в начале и /iD с конца, это часть синтаксиса perl, указывающая, что это регулярное выражение.
ключ я в конце означает игнорировать регистр и может быть задан как дополнительный аргумент вашего regexp_like, поэтому:
if ( REGEXP_LIKE(v,'^(?>(?>([a-f0-9]{1,4})(?>:(?1)){7}|(?!(?:.*[a-f0-9](?>:|$)){8,})((?1)(?>:(?1)){0,6})?::(?2)?)|(?>(?>(?1)(?>:(?1)){5}:|(?!(?:.*[a-f0-9]:){6,})(?3)?::(?>((?1)(?>:(?1)){0,4}):)?)?(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])(?>\.(?4)){3}))$','i') ) the
Есть больше проблем, так как регулярные выражения perl не эквивалентны 100% эквивалентным регулярным выражениям oracle, и я вижу, что используемые здесь тестеры недоступны как? > Возможно, вы можете разделить регулярное выражение между ipv4 и ipv6, чтобы избежать попадания в оракул. И просто сделайте REGEXP_LIKE (ip, 'ipv4pattern') или REGEXP_LIKE (ip, 'ipv6pattern')
Настройка части ipv4 вышеуказанного регулярного выражения на то, что работает в oracle, дает мне:
REGEXP_LIKE(ip,'^((25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])\.){3}(25[0-5]|2[0-4][0-9]|1[0-9]{2}|[1-9]?[0-9])$','i')
Ответ 3
REGEXP_LIKE(ip,'^(([\dA-F]{1,4}:([\dA-F]{1,4}:([\dA-F]{1,4}:([\dA-F]{1,4}:([\dA-F]{1,4}:[\dA-F]{0,4}|:[\dA-F]{1,4})?|(:[\dA-F]{1,4}){0,2})|(:[\dA-F]{1,4}){0,3})|(:[\dA-F]{1,4}){0,4})|:(:[\dA-F]{1,4}){0,5})((:[\dA-F]{1,4}){2}|:(25[0-5]|(2[0-4]|1\d|[1-9])?\d)(\.(25[0-5]|(2[0-4]|1\d|[1-9])?\d)){3})|(([\dA-F]{1,4}:){1,6}|:):[\dA-F]{0,4}|([\dA-F]{1,4}:){7}:)\z', 'i')
Изменено из регулярного выражения XML в http://home.deds.nl/~aeron/regex/