HTTP: Являются ли имена наборов символов чувствительными к регистру?
Это продолжение Являются ли HTTP-заголовки чувствительными к регистру?.
В заголовке HTTP Content-Type
я видел имена наборов символов, выраженные как в форме верхнего и нижнего регистра. Например, для набора символов UTF-8
:
Content-Type: text/html; charset=UTF-8
Content-Type: text/html; charset=utf-8
Вот несколько вариантов смешанного варианта (последние два, конечно, не могут быть реальными):
Content-Type: text/html; charset=Utf-8
Content-Type: text/html; charset=UtF-8
Content-Type: text/html; charset=uTf-8
Являются ли все формы одинаково действительными? Или клиентские и серверные приложения игнорируют случай, когда имя набора символов просто гибко? Альтернативно, это те приложения, которые распознают только одно несоответствующее представление?
Ответы
Ответ 1
[Вот результат моих исследований.]
RFC 2616 в разделе 3.4 говорится следующее:
Наборы символов HTTP идентифицируются маркерами без учета регистра. полный набор токенов определяется реестром набора символов IANA [19].
charset = token
Теперь реестр IANA Character Set поддерживается здесь. В самом верху этого документа в разделе Примечание, второй абзац гласит:
Имена наборов символов могут содержать до 40 символов, взятых из печатные символы US-ASCII. Однако никакого различия не делается между использованием букв верхнего и нижнего регистра.
Заключение:. Эти две ссылки показывают, что при использовании имени не имеет значения.