Ответ 1
Наткнулся на это:
validates_format_of :domain_name, :with => /^(http|https):\/\/[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.[a-z]{2,5}(:[0-9]{1,5})?(\/.*)?$/ix
FYI: Rubular - фантастический ресурс для тестирования ваших регулярных выражений Ruby
Я пытаюсь создать проверку, которая проверяет, действительно ли домен/URL-адрес действителен, например, "test.com"
def valid_domain_name?
domain_name = domain.split(".")
name = /(?:[A-Z0-9\-])+/.match(domain_name[0]).nil?
tld = /(?:[A-Z]{2}|aero|ag|asia|at|be|biz|ca|cc|cn|com|de|edu|eu|fm|gov|gs|jobs|jp|in|info|me|mil|mobi|museum|ms|name|net|nu|nz|org|tc|tw|tv|uk|us|vg|ws)/.match(domain_name[1]).nil?
if name == false or tld == false
errors.add(:domain_name, 'Invalid domain name. Please only use names with letters (A-Z) and numbers (0-9).')
end
end
Это то, что у меня есть, но это не работает. Это позволяет без проблем работать с плохими URL-адресами.
Я не знаю regex очень хорошо.
Наткнулся на это:
validates_format_of :domain_name, :with => /^(http|https):\/\/[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.[a-z]{2,5}(:[0-9]{1,5})?(\/.*)?$/ix
FYI: Rubular - фантастический ресурс для тестирования ваших регулярных выражений Ruby
@Tate хорош для полного URL-адреса, но если вы хотите проверить столбец domain
, вы не хотите разрешать дополнительные биты URL, которые разрешает его регулярное выражение (например, вы определенно не хотите разрешать URL с указанием пути к файлу).
Итак, я удалил протокол, порт, путь к файлу и строки запроса в регулярном выражении, в результате получилось следующее:
^[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.[a-z]{2,5}$
Проверьте те же тестовые примеры для обеих версий.
^(http|https):\/\/|[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.[a-z]{2,6}(:[0-9]{1,5})?(\/.*)?$/ix
http://rubular.com/r/cdkLxAkTbk
Добавлен необязательный http:// или https://
Самый длинный TLD .museum
, который имеет 6 символов...
Еще один способ проверки URL-адресов в Rails -
validates :web_address, :format => { :with => URI::regexp(%w(http https)), :message => "Valid URL required"}
require 'uri'
def valid_url?(url)
url.slice(URI::regexp(%w(http https))) == url
end
Я взял то, что у вас было, и изменил его, чтобы я мог сделать http://
или https://
необязательным:
/^((http|https):\/\/)?[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.[a-z]{2,5}(:[0-9]{1,5})?(\/.*)?$/ix
Что для меня работает
def validate_url(text)
uri = URI.parse(text)
raise URI::InvalidURIError unless uri.kind_of?(URI::HTTP) || uri.kind_of?(URI::HTTPS)
rescue URI::InvalidURIError
errors.add(:url, 'is invalid')
end
end
В соответствии с Google, это хорошо работает:
/^([a-z0-9]([-a-z0-9]*[a-z0-9])?\\.)+((a[cdefgilmnoqrstuwxz]|aero|arpa)|(b[abdefghijmnorstvwyz]|biz)|(c[acdfghiklmnorsuvxyz]|cat|com|coop)|d[ejkmoz]|(e[ceghrstu]|edu)|f[ijkmor]|(g[abdefghilmnpqrstuwy]|gov)|h[kmnrtu]|(i[delmnoqrst]|info|int)|(j[emop]|jobs)|k[eghimnprwyz]|l[abcikrstuvy]|(m[acdghklmnopqrstuvwxyz]|mil|mobi|museum)|(n[acefgilopruz]|name|net)|(om|org)|(p[aefghklmnrstwy]|pro)|qa|r[eouw]|s[abcdeghijklmnortvyz]|(t[cdfghjklmnoprtvwz]|travel)|u[agkmsyz]|v[aceginu]|w[fs]|y[etu]|z[amw])$/i
Немного длинный...
Он нечувствителен к регистру... он не похож на ваши регулярные выражения, но я не знаю Ruby. Или, возможно, вы загладили их раньше.
Вот регулярное выражение, используемое henrik validates_url_format_of Rails validator:
REGEXP = %r{
\A
https?:// # http:// or https://
([^\s:@]+:[^\s:@]*@)? # optional username:[email protected]
( ((#{ALNUM}+\.)*xn---*)?#{ALNUM}+([-.]#{ALNUM}+)*\.[a-z]{2,6}\.? | # domain (including Punycode/IDN)...
#{IPv4_PART}(\.#{IPv4_PART}){3} ) # or IPv4
(:\d{1,5})? # optional port
([/?]\S*)? # optional /whatever or ?whatever
\Z
}iux
Используя ответ Брайана Рэй, который, на мой взгляд, отвечает на вопрос (домен не URL-адрес) и обновляет его для Rails 4.
/\A[a-z0-9]+([\-\.]{1}[a-z0-9]+)*\.[a-z]{2,5}\z/ix
Попробуйте настроить шаблон так, чтобы они начинались с ^ (символ "начинается с" ) и заканчивается символом $( "заканчивается на" ), так что весь шаблон читает "строку, которая начинается с этого, а затем заканчивается", в противном случае совпадение имени, скажем, будет положительным, если шаблон найден вообще (т.е. имеет один единственный правильный символ.)
^(([a-zA-Z]{1})|([a-zA-Z]{1}[a-zA-Z]{1})|([a-zA-Z]{1}[0-9]{1})|([0-9]{1}[a-zA-Z]{1})|([a-zA-Z0-9][a-zA-Z0-9-_]{1,61}[a-zA-Z0-9]))\.([a-zA-Z]{2,6}|[a-zA-Z0-9-]{2,30}\.[a-zA-Z]{2,3})$
Это мой валидатор URL, используя встроенный парсер Ruby
class UrlValidator < ActiveModel::EachValidator
def validate_each(record, attribute, value)
p = URI::Parser.new
valid = begin
p.parse(value)
true
rescue
false
end
unless valid
record.errors[attribute] << (options[:message] || "is an invalid URL")
end
end
end