Регулярное выражение для захвата всех вариаций тона кожи эмозинга
Я пытаюсь использовать регулярное выражение для захвата твитов, содержащих подстроку 👏
, по крайней мере, дважды, поэтому я использую неискушенный ^.+ 👏 .+ 👏 .+$
. Однако это не соответствует строкам, которые вместо этого содержат, например, 👏🏼
.
Есть ли у меня разумный способ захватить эможи с любым изменением оттенка тона или без него, просто не помещая каждый из них в строку (например, [👏👏🏻👏🏼👏🏽👏🏾👏🏿]
)?
Ответы
Ответ 1
Благодаря вышеприведенным комментариям, я обнаружил, что emojis, с которым я столкнулся в twitter, является unicode, а вариации тона кожи объединяют символы в диапазоне 1f3fb
- 1f3ff
.
http://unicode.org/reports/tr51/#Emoji_Modifiers_Table
Итак, для меня то, что я хотел, было 👏[\x{1f3fb}-\x{1f3ff}]?
, а [\x{1f3fb}-\x{1f3ff}]?
было чем-то, что я мог бы затем добавить рядом с любым немодифицированным emoji, чтобы включить изменения тона кожи.