Регулярное выражение для изменения в случае предложения

Я использую Notepad ++ для замены текста в файле языка 5453 строки. Формат строк файла:

variable.name = Variable Value Over Here, that' for sure, Really

Двойной апостроф преднамерен.

Мне нужно преобразовать значение в случай предложения, за исключением слов "Здесь" и "Действительно", которые являются правильными и должны оставаться капитализированными. Как вы можете видеть, случай внутри значения обычно смешивается для начала.

Я немного поработал над этим. Все, что у меня есть до сих пор:

 (. )([A-Z])(.+)

который, по-видимому, по крайней мере выбирает правильные строки. Запасная часть - это то место, где я боюсь.

Ответы

Ответ 1

Замена регенератора не может выполнять функции (например, капитализацию) по совпадениям. Вы должны были бы script, например, в PHP или JavaScript.

Обновление: См. ответ Джонаса.

Я создал веб-страницу под названием Текстовые утилиты, чтобы сделать такие вещи:

вставьте текст
зайдите в "Найти, повторно и заменить" (или нажмите Ctrl + Shift + F)
введите ваше регулярное выражение (мой будет ^(.*?\=\s*\w)(.*)$)
установите флажок "Ограничения линии ссылок"
выберите "Применить JS-функцию к совпадениям"
добавить аргументы (сначала это совпадение, затем суб-шаблоны), здесь s, start, rest
измените оператор return на return start + rest.toLowerCase();

Последняя функция в текстовой области выглядит следующим образом:

return function (s, start, rest) {
     return start + rest.toLowerCase();
};

Возможно, добавьте некоторый код, чтобы использовать некоторые слова типа "Действительно" и "Здесь".

Ответ 2

Find:    (. )([A-Z])(.+)
Replace: \1\U\2\L\3

В Notepad ++ 6.0 или выше (который поставляется со встроенной поддержкой

Ответ 3

В Notepad ++ вы можете использовать плагин под названием PythonScript для выполнения задания. Если вы устанавливаете плагин, создайте новый script так:

Затем вы можете использовать следующий script, заменяя регулярные выражения и функциональные переменные, как вам удобно:

import re

#change these
regex = r"[a-z]+sym"
function = str.upper

def perLine(line, num, total):
for match in re.finditer(regex, line):
    if match:
        s, e = match.start(), match.end()
        line = line[:s] + function(line[s:e]) + line[e:]
        editor.replaceWholeLine(num, line)

editor.forEachLine(perLine)

Этот конкретный пример работает, находя все совпадения в определенной строке, а затем применяя каждую функцию каждый. Если вам нужна многострочная поддержка, Python script "Conext-Help" объясняет все предлагаемые функции, включая функции pymlsearch/pymlreplace, определенные под объектом "editor".

Когда вы будете готовы запустить script, перейдите в файл, который вы хотите запустить сначала, затем перейдите в "Скрипты > " в меню Python script и запустите свой.

Примечание:, в то время как вы, вероятно, сможете использовать функцию notepad ++ undo, если вы испортите, возможно, было бы неплохо сначала поместить текст в другой файл, чтобы убедиться, что он работает.

P.S. Вы можете "найти" и "пометить" каждое появление регулярного выражения, используя встроенный диалог поиска notepad ++, и если бы вы могли выбрать их все, то вы могли бы использовать функциональные возможности TextFX "Characteracters- > UPPER CASE" для этой конкретной проблемы, m не уверен, как перейти от отмеченного или найденного текста к выбранному тексту. Но, я думал, что опубликую это на случай, если кто-нибудь...

Изменить: В Notepad ++ 6.0 или более поздней версии вы можете использовать "PCRE (Perl Compatible Regular Expression) Search/Replace" (источник: http://sourceforge.net/apps/mediawiki/notepad-plus/?title=Regular_Expressions). Это можно было бы решить с помощью регулярного выражения типа (. )([A-z])(.+) с аргументом замены, например \1\U\2\3.

Ответ 4

У вопросника был очень конкретный случай. Как общее "изменение в случае предложения" в блокноте ++ первое предложение регулярного выражения не работало правильно для меня. в то время как это не идеально, вот уточненная версия, которая было большим улучшением оригинала для моих целей:

find:    ([\.\r\n][ ]*)([A-Za-z\r])([^\.^\r^\n]+) 
replace: \1\U\2\L\3

У вас все еще есть проблема с именами нижних регистров, именами, датами, странами и т.д., но хороший справитель может помочь с этим.