Ответ 1
Помните, что \W
оставляет символ подчеркивания. Коротким эквивалентом для [^a-zA-Z0-9]
будет [\W_]
text.replace(/[\W_]+/g," ");
\W
является отрицанием shorthand \W
для [A-Za-z0-9_]
символов слова (включая подчеркивание)
Я ищу аккуратное решение RegEx для замены
С одним пробелом
Для тех, кто играет дома (работает следующее)
text.replace(/[^a-z0-9]/gmi, " ").replace(/\s+/g, " ");
Я думаю, что RegEx, вероятно, достаточно мощный, чтобы достичь этого в одном утверждении. Компоненты, которые я считаю нужными
[^a-z0-9]
- Удалить не [^a-z0-9]
-цифровые символы\s+
- сопоставить любые коллекции пробелов\r?\n|\r
- сопоставить всю новую строку/gmi
- глобальный, многострочный, без /gmi
регистраТем не менее, я не могу оформить регулярное выражение в правильном направлении (следующее не работает)
text.replace(/[^a-z0-9]|\s+|\r?\n|\r/gmi, " ");
вход
234&^%,Me,2 2013 1080p x264 5 1 BluRay
S01(*&asd 05
S1E5
1x05
1x5
Желаемый вывод
234 Me 2 2013 1080p x264 5 1 BluRay S01 asd 05 S1E5 1x05 1x5
Помните, что \W
оставляет символ подчеркивания. Коротким эквивалентом для [^a-zA-Z0-9]
будет [\W_]
text.replace(/[\W_]+/g," ");
\W
является отрицанием shorthand \W
для [A-Za-z0-9_]
символов слова (включая подчеркивание)
Джонни 5 победил меня. Я собирался предложить использовать \W+
без \s
, как в text.replace(/\W+/g, " ")
. Это также покрывает пробел.
Поскольку [^a-z0-9]
класс символов содержит все, что не является alnum, оно также содержит белые символы!
text.replace(/[^a-z0-9]+/gi, " ");
Ну, я думаю, вам просто нужно добавить квантификатор к каждому шаблону. Кроме того, возвращение каретки немного забавно:
text.replace(/[^a-z0-9]+|\s+/gmi, " ");
edit Объект \s
совпадает с \r
и \n
.
A видел другой пост, который также имел диакритические знаки, и это здорово
s.replace(/[^a-zA-Z0-9À-ž\s]/g, "")
Это мой старый пост, принятые ответы по большей части хороши. Однако я решил сравнить каждое решение и другое очевидное (просто для удовольствия). Мне было интересно, есть ли разница между шаблонами регулярных выражений в разных браузерах с разным размером строк.
Так что в основном я использовал JSPerf на
Шаблоны регулярных выражений, которые я тестировал, были
/[\W_]+/g
/[^a-z0-9]+/gi
/[^a-zA-Z0-9]+/g
Я загрузил их с длиной строки случайных символов
Пример javascript, который я использовал, var newstr = str.replace(/[\W_]+/g," ");
Каждый прогон состоял из 50 или более выборок в каждом регулярном выражении, и я запускал их 5 раз в каждом браузере.
Давайте гонять наших лошадей!
Результаты
Chrome Edge
Chars Pattern Ops/Sec Deviation Op/Sec Deviation
------------------------------------------------------------------------
5,000 /[\W_]+/g 19,977.80 1.09 10,820.40 1.32
5,000 /[^a-z0-9]+/gi 19,901.60 1.49 10,902.00 1.20
5,000 /[^a-zA-Z0-9]+/g 19,559.40 1.96 10,916.80 1.13
------------------------------------------------------------------------
1,000 /[\W_]+/g 96,239.00 1.65 52,358.80 1.41
1,000 /[^a-z0-9]+/gi 97,584.40 1.18 52,105.00 1.60
1,000 /[^a-zA-Z0-9]+/g 96,965.80 1.10 51,864.60 1.76
------------------------------------------------------------------------
200 /[\W_]+/g 480,318.60 1.70 261,030.40 1.80
200 /[^a-z0-9]+/gi 476,177.80 2.01 261,751.60 1.96
200 /[^a-zA-Z0-9]+/g 486,423.00 0.80 258,774.20 2.15
По правде говоря, Regex в обоих браузерах (с учетом отклонения) были почти неразличимы, однако я думаю, что если запустить его еще раз, результаты станут немного более четкими (но не намного).
Теоретическое масштабирование для 1 символа
Chrome Edge
Chars Pattern Ops/Sec Scaled Op/Sec Scaled
------------------------------------------------------------------------
5,000 /[\W_]+/g 19,977.80 99,889,000 10,820.40 54,102,000
5,000 /[^a-z0-9]+/gi 19,901.60 99,508,000 10,902.00 54,510,000
5,000 /[^a-zA-Z0-9]+/g 19,559.40 97,797,000 10,916.80 54,584,000
------------------------------------------------------------------------
1,000 /[\W_]+/g 96,239.00 96,239,000 52,358.80 52,358,800
1,000 /[^a-z0-9]+/gi 97,584.40 97,584,400 52,105.00 52,105,000
1,000 /[^a-zA-Z0-9]+/g 96,965.80 96,965,800 51,864.60 51,864,600
------------------------------------------------------------------------
200 /[\W_]+/g 480,318.60 96,063,720 261,030.40 52,206,080
200 /[^a-z0-9]+/gi 476,177.80 95,235,560 261,751.60 52,350,320
200 /[^a-zA-Z0-9]+/g 486,423.00 97,284,600 258,774.20 51,754,840
Я бы не стал вдаваться в подробности этих результатов, так как в действительности это не является существенным отличием, все, что мы действительно можем сказать, это то, что край медленнее: Кроме того, мне было очень скучно.
В любом случае вы можете запустить тест для себя.
Я не понимаю, в чем проблема с этой ошибкой. пожалуйста, помогите мне
SQL71508 :: Модель уже имеет элемент с таким же именем dbo.Table. SQL71508 :: Модель уже имеет элемент с таким же именем dbo.Table.Id. SQL71501 :: Первичный ключ: безымянное ограничение для [dbo]. [Table] имеет неразрешенную ссылку на объект [dbo]. [Table]. SQL71501 :: SqlIndexedColumnSpecification: содержит неразрешенную ссылку на столбец [dbo]. [Table]. [Id]. SQL71508 :: Модель уже имеет элемент с таким же именем dbo.Table. SQL71508 :: Модель уже имеет элемент с таким же именем dbo.Table.Id. SQL71501 :: Первичный ключ: безымянное ограничение для [dbo]. [Table] имеет неразрешенную ссылку на объект [dbo]. [Table].