Ответ 1
ДЛЯ НЕИСПРАВНОСТЕЙ
,(?![^\(]*\))
ДЛЯ НЕСТИРОВАННЫХ (скобки внутри скобок)
(?<!\([^\)]*),(?![^\(]*\))
У меня есть строка, которую нужно разбить на основе появления "," (запятая), но нужно игнорировать любое ее появление, которое входит в пару круглых скобок.
Например, B2B,(A2C,AMM),(BNC,1NF),(106,A01),AAA,AX3
Должен быть разделен на
B2B,
(A2C,AMM),
(BNC,1NF),
(106,A01),
AAA,
AX3
ДЛЯ НЕИСПРАВНОСТЕЙ
,(?![^\(]*\))
ДЛЯ НЕСТИРОВАННЫХ (скобки внутри скобок)
(?<!\([^\)]*),(?![^\(]*\))
Попробуйте следующее:
var str = 'B2B,(A2C,AMM),(BNC,1NF),(106,A01),AAA,AX3';
console.log(str.match(/\([^)]*\)|[A-Z\d]+/g));
// gives you ["B2B", "(A2C,AMM)", "(BNC,1NF)", "(106,A01)", "AAA", "AX3"]
Версия для Java:
String str = "B2B,(A2C,AMM),(BNC,1NF),(106,A01),AAA,AX3";
Pattern p = Pattern.compile("\\([^)]*\\)|[A-Z\\d]+");
Matcher m = p.matcher(str);
List<String> matches = new ArrayList<String>();
while(m.find()){
matches.add(m.group());
}
for (String val : matches) {
System.out.println(val);
}
Одна простая итерация будет, вероятно, лучшим вариантом, чем любое регулярное выражение, особенно если ваши данные могут иметь круглые скобки в круглых скобках. Например:
String data="Some,(data,(that),needs),to (be, splited) by, comma";
StringBuilder buffer=new StringBuilder();
int parenthesesCounter=0;
for (char c:data.toCharArray()){
if (c=='(') parenthesesCounter++;
if (c==')') parenthesesCounter--;
if (c==',' && parenthesesCounter==0){
//lets do something with this token inside buffer
System.out.println(buffer);
//now we need to clear buffer
buffer.delete(0, buffer.length());
}
else
buffer.append(c);
}
//lets not forget about part after last comma
System.out.println(buffer);
Выход
Some
(data,(that),needs)
to (be, splited) by
comma
Попробуйте это
\w{3}(?=,)|(?<=,)\(\w{3},\w{3}\)(?=,)|(?<=,)\w{3}
Объяснение: Существуют три части, разделенные OR (|)
\w{3}(?=,)
- соответствует 3 буквенно-цифровым символам (включая подчеркивание) и делает положительный взгляд вперед для запятой
(?<=,)\(\w{3},\w{3}\)(?=,)
- соответствует этому шаблону (ABC,E4R)
, а также выполняет позитивный просмотр и ищет запятую
(?<=,)\w{3}
- соответствует 3 буквенно-цифровым символам (включая символ подчеркивания) и делает положительный внешний вид запятой