Ответ 1
Вам не нужны регулярные выражения. Python имеет встроенный строковый метод, который делает то, что вам нужно:
mystring.replace(" ", "_")
Я хочу заменить пробел символом подчеркивания в строке, чтобы создать хорошие URL-адреса. Так что, например:
"This should be connected" becomes "This_should_be_connected"
Я использую Python с Django. Можно ли это решить с помощью регулярных выражений?
Вам не нужны регулярные выражения. Python имеет встроенный строковый метод, который делает то, что вам нужно:
mystring.replace(" ", "_")
Замена пространств в порядке, но я мог бы предложить немного поработать с другими URL-враждебными символами, такими как вопросительные знаки, апострофы, восклицательные знаки и т.д.
Также обратите внимание, что общее мнение экспертов SEO заключается в том, что тире предпочтительнее подчеркивать в URL-адресах.
def urlify(s):
# Remove all non-word characters (everything except numbers and letters)
s = re.sub(r"[^\w\s]", '', s)
# Replace all runs of whitespace with a single dash
s = re.sub(r"\s+", '-', s)
return s
# Prints: I-cant-get-no-satisfaction"
print urlify("I can't get no satisfaction!")
Django имеет функцию "slugify", которая делает это, а также другие оптимизирующие URL-адреса оптимизацию. Он скрыт в модуле defaultfilters.
>>> from django.template.defaultfilters import slugify
>>> slugify("This should be connected")
this-should-be-connected
Это не совсем тот результат, который вы просили, но IMO лучше использовать в URL-адресах.
Это учитывает пробельные символы, отличные от пробела, и я думаю, что это быстрее, чем с помощью модуля re
:
url = "_".join( title.split() )
Используя модуль re
:
import re
re.sub('\s+', '_', "This should be connected") # This_should_be_connected
re.sub('\s+', '_', 'And so\tshould this') # And_so_should_this
Если у вас есть несколько пробелов или другие пробелы, как указано выше, вы можете просто использовать string.replace
, как предложили другие.
использовать метод замены строки:
"this should be connected".replace(" ", "_")
"this_should_be_disconnected".replace("_", " ")
Я использую следующий фрагмент кода для моих дружественных URL-адресов:
from unicodedata import normalize
from re import sub
def slugify(title):
name = normalize('NFKD', title).encode('ascii', 'ignore').replace(' ', '-').lower()
#remove `other` characters
name = sub('[^a-zA-Z0-9_-]', '', name)
#nomalize dashes
name = sub('-+', '-', name)
return name
Он отлично работает с символами юникода.
Python имеет встроенный метод для строк, называемых replace, который используется как таковой:
string.replace(old, new)
Итак, вы должны использовать:
string.replace(" ", "_")
У меня была эта проблема некоторое время назад, и я написал код для замены символов в строке. Я должен начать вспоминать, чтобы проверить документацию на python, потому что у них есть встроенные функции для всего.
OP использует python, но в javascript (нужно быть осторожным, поскольку синтаксисы похожи.
// only replaces the first instance of ' ' with '_'
"one two three".replace(' ', '_');
=> "one_two three"
// replaces all instances of ' ' with '_'
"one two three".replace(/\s/g, '_');
=> "one_two_three"
Удивительно, что эта библиотека еще не упоминалась
пакет python с именем python-slugify, который выполняет довольно хорошую работу:
pip install python-slugify
Работает следующим образом:
from slugify import slugify
txt = "This is a test ---"
r = slugify(txt)
self.assertEquals(r, "this-is-a-test")
txt = "This -- is a ## test ---"
r = slugify(txt)
self.assertEquals(r, "this-is-a-test")
txt = 'C\'est déjà l\'été.'
r = slugify(txt)
self.assertEquals(r, "cest-deja-lete")
txt = 'Nín hǎo. Wǒ shì zhōng guó rén'
r = slugify(txt)
self.assertEquals(r, "nin-hao-wo-shi-zhong-guo-ren")
txt = 'Компьютер'
r = slugify(txt)
self.assertEquals(r, "kompiuter")
txt = 'jaja---lol-méméméoo--a'
r = slugify(txt)
self.assertEquals(r, "jaja-lol-mememeoo-a")
mystring.replace (" ", "_")
если вы присвоите это значение любой переменной, оно будет работать
s = mystring.replace (" ", "_")
по умолчанию у mystring не будет этого
perl -e 'map { $on=$_; s/ /_/; rename($on, $_) or warn $!; } <*>;'
Match et replace space > подчеркивание всех файлов в текущем каталоге