Ответ 1
address = "123 north anywhere street"
for word, initial in {"NORTH":"N", "SOUTH":"S" }.items():
address = address.replace(word.lower(), initial)
print address
приятный и лаконичный и читаемый.
Мне нужно заменить север, юг и т.д. N S в полях адреса.
Если у меня
list = {'NORTH':'N','SOUTH':'S','EAST':'E','WEST':'W'}
address = "123 north anywhere street"
Могу ли я перебирать значения словаря для замены моего поля адреса?
for dir in list[]:
address.upper().replace(key,value)
Я знаю, что я даже не закрыл! Но любой вход был бы оценен, если вы можете использовать значения словаря, подобные этому.
address = "123 north anywhere street"
for word, initial in {"NORTH":"N", "SOUTH":"S" }.items():
address = address.replace(word.lower(), initial)
print address
приятный и лаконичный и читаемый.
вы близки, на самом деле
dictionary = {"NORTH":"N", "SOUTH":"S" }
for key in dictionary.iterkeys():
address.upper().replace(key, dictionary[key])
Примечание: для пользователей Python 3 вы должны использовать .keys()
вместо .iterkeys()
:
dictionary = {"NORTH":"N", "SOUTH":"S" }
for key in dictionary.keys():
address.upper().replace(key, dictionary[key])
Один из вариантов, о которых я пока не думаю, заключается в том, чтобы создать регулярное выражение, содержащее все ключи, а затем просто выполнить замену в строке:
>>> import re
>>> l = {'NORTH':'N','SOUTH':'S','EAST':'E','WEST':'W'}
>>> pattern = '|'.join(sorted(re.escape(k) for k in l))
>>> address = "123 north anywhere street"
>>> re.sub(pattern, lambda m: l.get(m.group(0).upper()), address, flags=re.IGNORECASE)
'123 N anywhere street'
>>>
Это имеет то преимущество, что регулярное выражение может игнорировать случай входной строки без ее модификации.
Если вы хотите работать только с полными словами, вы можете сделать это тоже с простой модификацией шаблона:
>>> pattern = r'\b({})\b'.format('|'.join(sorted(re.escape(k) for k in l)))
>>> address2 = "123 north anywhere southstreet"
>>> re.sub(pattern, lambda m: l.get(m.group(0).upper()), address2, flags=re.IGNORECASE)
'123 N anywhere southstreet'
Возможно, вы ищете iteritems()
:
d = {'NORTH':'N','SOUTH':'S','EAST':'E','WEST':'W'}
address = "123 north anywhere street"
for k,v in d.iteritems():
address = address.upper().replace(k, v)
теперь находится '123 N ANYWHERE STREET'
Ну, если вы хотите сохранить регистр, пробелы и вложенные слова (например, Southstreet
не должны преобразовываться в Sstreet
), рассмотрите возможность использования этого простого списка:
import re
l = {'NORTH':'N','SOUTH':'S','EAST':'E','WEST':'W'}
address = "North 123 East Anywhere Southstreet West"
new_address = ''.join(l[p.upper()] if p.upper() in l else p for p in re.split(r'(\W+)', address))
new_address теперь
N 123 E Anywhere Southstreet W
"Перевод" строки со словарем является очень распространенным требованием. Я предлагаю функцию, которую вы можете захотеть сохранить в своем наборе инструментов:
def translate(text, conversion_dict, before=None):
"""
Translate words from a text using a conversion dictionary
Arguments:
text: the text to be translated
conversion_dict: the conversion dictionary
before: a function to transform the input
(by default it will to a lowercase)
"""
# if empty:
if not text: return text
# preliminary transformation:
before = before or str.lower
t = before(text)
for key, value in conversion_dict.items():
t = t.replace(key, value)
return t
Затем вы можете написать:
>>> a = {'hello':'bonjour', 'world':'tout-le-monde'}
>>> translate('hello world', a)
'bonjour tout-le-monde'
Все эти ответы хороши, но вам не нужна подстановка строки python - она простая и быстрая, но требует правильной отформатации строки.
address = "123 %(direction)s anywhere street"
print(address % {"direction": "N"})
def replace_values_in_string(text, args_dict):
for key in args_dict.keys():
text = text.replace(key, str(args_dict[key]))
return text
Попробуйте,
import re
l = {'NORTH':'N','SOUTH':'S','EAST':'E','WEST':'W'}
address = "123 north anywhere street"
for k, v in l.iteritems():
t = re.compile(re.escape(k), re.IGNORECASE)
address = t.sub(v, address)
print(address)
Оба с использованием replace()
и format()
не так точны:
data = '{content} {address}'
for k,v in {"{content}":"some {address}", "{address}":"New York" }.items():
data = data.replace(k,v)
# results: some New York New York
'{ {content} {address}'.format(**{'content':'str1', 'address':'str2'})
# results: ValueError: unexpected '{' in field name
Лучше перевести с помощью re.sub()
если вам нужно точное место:
import re
def translate(text, kw, ignore_case=False):
search_keys = map(lambda x:re.escape(x), kw.keys())
if ignore_case:
kw = {k.lower():kw[k] for k in kw}
regex = re.compile('|'.join(search_keys), re.IGNORECASE)
res = regex.sub( lambda m:kw[m.group().lower()], text)
else:
regex = re.compile('|'.join(search_keys))
res = regex.sub( lambda m:kw[m.group()], text)
return res
#'score: 99.5% name:%(name)s' %{'name':'foo'}
res = translate( 'score: 99.5% name:{name}', {'{name}':'foo'})
print(res)
res = translate( 'score: 99.5% name:{NAME}', {'{name}':'foo'}, ignore_case=True)
print(res)
Я бы предложил использовать регулярное выражение вместо простой замены. При замене вы рискуете заменить части слов, что, возможно, не то, что вы хотите.
import json
import re
with open('filePath.txt') as f:
data = f.read()
with open('filePath.json') as f:
glossar = json.load(f)
for word, initial in glossar.items():
data = re.sub(r'\b' + word + r'\b', initial, data)
print(data)