Какое подмножество символов Юникода следует использовать для обозначения специальных подстрок в тексте?

Наше приложение отправляет strings, которое затем должно быть локализовано на client side. Иногда это whole strings, иногда только substring, поэтому мы должны их отмечать. Было бы лучше, если бы он использовал только Unicode, так как он не требовал каких-либо изменений в протоколе.

Пример:

"Length: (mark)10(mark)"

где 10 - длина в см, но она должна быть преобразована так, чтобы она отображалась как дюймы или мм.
Являются ли специальные символы Unicode (0xFFF0-0xFFFF) правильным выбором для маркировки таких специальных подстрок в тексте?

Ответы

Ответ 1

Нет, точки кода в Специальном блоке имеют свои собственные применения. Использование их для других целей может привести к неожиданным последствиям. Даже если вы сами кодируете всю обработку, входящие данные могут содержать эти кодовые точки. Конечно, их можно обнаружить и отфильтровать, но лучше использовать кодовые точки, которые не могут столкнуться с любыми назначенными кодовыми точками.

Используйте кодовые точки в диапазоне U + FDD0..U + FDEF. Они обозначаются как "нехарактеры" и предназначены для использования внутри приложения. См. Раздел часто задаваемых вопросов Unicode Частые символы персонажа, нехарактеры и часто задаваемые вопросы.