Общая начальная последовательность и выравнивание

Придумав встречный пример для этого вопроса, я придумал:

struct A
{
    alignas(2) char byte;
};

Но если этот законный и стандартный макет, совместим ли он с этим struct B?

struct B
{
    char byte;
};

Кроме того, если мы имеем

struct A
{
    alignas(2) char x;
    alignas(4) char y;
};
// possible alignment, - is padding
// 00 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15
//  x  -  -  -  y  -  -  -  x  -  -  -  y  -  -  -

struct B
{
    char x;
    char y;
}; // no padding required

union U
{
    A a;
    B b;
} u;

Существует ли общая начальная последовательность для A и B? Если да, включает ли он A::y и B::y? I.e., мы можем написать следующее w/o, вызывающее UB?

u.a.y = 42;
std::cout << u.b.y;

(ответы для С++ 1y/ "fixed С++ 11" также приветствуются)

См. [basic.align] для выравнивания и [dcl.align] для спецификатора выравнивания.
[basic.types]/11 говорит для фундаментальных типов "Если два типа T1 и T2 являются одним и тем же типом, то T1 и T2 являются совместимыми с макетами типами." (основной вопрос заключается в том, имеют ли A::byte и B::byte типы совместимости с макетами)
[class.mem]/16 "Два типа структуры стандартного макета совместимы с макетами, если они имеют одинаковое количество нестатических элементов данных и соответствующих нестатических членов данных (в порядке объявления) имеют макет -собираемые типы."
[class.mem]/18 "Две структуры стандартного компоновки имеют общую начальную последовательность, если соответствующие члены имеют совместимые с макетами типы, и ни один из них не является битовым полем или оба являются битовыми полями с одинаковой шириной для последовательности одного или нескольких начальных элементов. "
[class.mem]/18 "Если объединение стандартного макета содержит две или более структуры стандартного макета, которые имеют общую начальную последовательность, и если объект объединения стандартного макета в настоящее время содержит одну из этих структур стандартной компоновки, это разрешено для проверки общей исходной части любого из них ".

Конечно, на уровне юрисконсульта другой вопрос заключается в том, что это означает, что проверка общей исходной последовательности "разрешена". Я предполагаю, что какой-то другой абзац мог бы сделать описанное выше поведение u.b.x undefined (чтение из неинициализированного объекта).

Ответы

Ответ 1

Я не могу говорить о стандарте С++ 11, но я программист микропрограммного обеспечения/микрочипа и должен использовать такие функции, которые существуют в течение длительного времени (прагма-пакет, атрибуты выравнивания).

Использование alignas не может считаться "стандартным макетом", поэтому все последствия бесполезны. Стандартная компоновка означает одно фиксированное распределение выравнивания (для каждой архитектуры - обычно все align(min(sizeof,4)) или некоторые могут быть align(8)). Стандарт, вероятно, хочет сказать, что очевидно: без использования специальных функций (align, pack) структуры совместимы с одинаковой архитектурой, если они apepar одинаковы (одни и те же типы в одном порядке). В противном случае они могут и не могут быть совместимы - в зависимости от архитектуры (могут быть совместимы по одной архитектуре, но по другому).

Рассмотрим эту структуру:

struct foo{ char b; short h; double d; int i; };

В одной архитектуре (например, x86 32bit) это похоже на то, что кажется, но на Itanium или ARM это выглядит примерно так:

struct foo{char b, **_hidden_b**; short h; **int _maybe_hidden_h**; double d; int i;}

Примечание _maybe_hidden_h - его можно опустить в более раннем AEABI (выровнять до максимального 4) или там для выравнивания 64 бит /8B.

x86 Стандартный макет (пакет (1)):

alignas(1) char b; alignas(1) short h; alignas(1) double d; alignas(1) int i;

32-битная стандартная компоновка выравнивания (пакет (4) - архитектура ARM, более ранняя версия - EABI)

alignas(1) char b; alignas(2) short h; **alignas(4) double d**; alignas(4) int i;

64-битная стандартная компоновка выравнивания (пакет (8) - Itanium и более новый ARM/AEABI)

alignas(1) char b; alignas(2) short h; **alignas(8) double d**; alignas(4) int i;

К вашему примеру:
offsetof(A,y) = 4 в то время как offsetof(B,y) = 2 и объединение не меняет этого (таким образом, &u.a.y != u.b.y)

Ответ 2

Похоже на отверстие в стандарте. Ответственная вещь заключалась бы в записи отчета .

Несколько вещей:

Ваш первый пример на самом деле не демонстрирует проблемы. Добавление short после char также привело бы к выравниванию char к 2-байтовой границе без изменения общей подпоследовательности.
alignas не только С++; он был добавлен одновременно C11. Поскольку свойство стандартного макета является средством совместимости между языками, вероятно, предпочтительнее требовать соответствия соответствующих спецификаторов выравнивания, чем дисквалификация класса с нестатистическим спецификатором выравнивания участника.
Не было бы проблем, если бы спецификаторы выравнивания элементов соответствовали типам членов. Другие проблемы могут возникнуть из-за отсутствия корректировки типов, например, может потребоваться изменить параметр функции ret fn( alignas(4) char ) для того, чтобы ABI обработал его правильно, но язык может не обеспечить такую настройку.

Ответ 3

(основной вопрос заключается в том, имеют ли байты A:: байта и B::) совместимые типы)

Да. Это неотъемлемая часть. Атрибут alignas относится к объявлению , объявленному, а не типу. Может быть легко протестирован с помощью std::is_same и decltype.

I.e., мы можем написать следующее w/o, вызывающее UB?

Таким образом, это не UB, соответствующие параграфы были указаны вами.

EDIT: Простите меня, это, конечно, может привести к UB, потому что отступы между членами не определены (или реализованы) (§9.2/13)! Я случайно неправильно читаю пример, потому что я думал, что он обратился к x вместо y, потому что с x он всегда работает всегда, тогда как с y теоретически он не должен (хотя он практически всегда будет).