Странное поведение при попытке скомпилировать источник с tcc против gcc файла .o

Я пытаюсь скомпилировать источник с tcc (ver 0.9.26) с gcc -генерированным файлом .o, но он имеет странное поведение. Gcc (ver 5.3.0) - бит MinGW 64.

В частности, у меня есть следующие два файла (te1.c te2.c). Я сделал следующие команды в окне windows7

Обратите внимание, что он отключил 4 байта от строки 1234567in dummy!!!\n. Интересно, что могло пойти не так.

Увидели разницу в сборке между te1.o(te1.c, скомпилированным tcc) и te1_gcc.o(te1.c скомпилировано gcc). В сборке tcc я увидел lea -0x4(%rip),%rcx, на скомпилированном gcc я увидел lea 0x0(%rip),%rcx. Не знаю, почему.

Используя двоичный редактор, я изменил машинный код в te1.o(созданный gcc) и изменил lea 0(%rip),%rcx на lea -0x4(%rip),%rcx и используя tcc для его соединения, полученный exe работает отлично. Точнее, я сделал

В соответствии с запросом, вот вывод objdump -r te1.o

Ответы

Ответ 1

Не имеет никакого отношения к tcc или вызовам конвенций. Он имеет отношение к различным соглашениям компоновщика для форматов elf64-x86-64 and pe-x86-64.

С PE, компоновщик будет вычитать 4 неявно для вычисления окончательного смещения.

С ELF это не делает. Из-за этого 0 - это правильное начальное значение для PE, а -4 - для ELF.

К сожалению, objcopy не преобразует эту ошибку → в objcopy.

Ответ 2

добавить

extern void printf1(char *p);

в файл te1.c

Или: компилятор будет считать аргумент 32-битным целым числом, поскольку нет прототипа, а указатели - 64-разрядные.

Изменить: это все еще не работает. Я узнал, что функция никогда не возвращается (поскольку вызов printf1 второй раз ничего не делает!). Кажется, что 4 первых байта потребляются как обратный адрес или что-то в этом роде. В gcc 32-битном режиме он работает нормально. Звучит как проблема вызова вызова для меня, но все еще не может понять это. Другой ключ: вызов printf from te1.c side (gcc, с использованием привязок tcc stdlib) сбой с segv.

Я разобрал исполняемый файл. Первая часть - это повторный вызов со стороны tcc

  40104f:       48 8d 05 b3 0f 00 00    lea    0xfb3(%rip),%rax        # 0x402009
  401056:       48 89 45 f8             mov    %rax,-0x8(%rbp)
  40105a:       48 8b 4d f8             mov    -0x8(%rbp),%rcx
  40105e:       e8 9d ff ff ff          callq  0x401000
  401063:       48 8b 4d f8             mov    -0x8(%rbp),%rcx
  401067:       e8 94 ff ff ff          callq  0x401000
  40106c:       48 8b 4d f8             mov    -0x8(%rbp),%rcx
  401070:       e8 8b ff ff ff          callq  0x401000
  401075:       48 8b 4d f8             mov    -0x8(%rbp),%rcx
  401079:       e8 82 ff ff ff          callq  0x401000
  40107e:       e8 0d 00 00 00          callq  0x401090
  401083:       b8 00 00 00 00          mov    $0x0,%eax
  401088:       e9 00 00 00 00          jmpq   0x40108d
  40108d:       c9                      leaveq
  40108e:       c3                      retq

Вторая часть повторяется (6 раз) вызывает ту же функцию. Как вы можете видеть, адрес отличается (сдвиг на 4 байта, как и ваши данные)!!! Это работает как раз один раз, потому что 4 первые инструкции следующие:

 401000:       55                      push   %rbp
 401001:       48 89 e5                mov    %rsp,%rbp

так что стек уничтожается, если те пропускаются!!

  40109f:       48 89 45 f8             mov    %rax,-0x8(%rbp)
  4010a3:       48 8b 45 f8             mov    -0x8(%rbp),%rax
  4010a7:       48 89 c1                mov    %rax,%rcx
  4010aa:       e8 55 ff ff ff          callq  0x401004
  4010af:       48 8b 45 f8             mov    -0x8(%rbp),%rax
  4010b3:       48 89 c1                mov    %rax,%rcx
  4010b6:       e8 49 ff ff ff          callq  0x401004
  4010bb:       48 8b 45 f8             mov    -0x8(%rbp),%rax
  4010bf:       48 89 c1                mov    %rax,%rcx
  4010c2:       e8 3d ff ff ff          callq  0x401004
  4010c7:       48 8b 45 f8             mov    -0x8(%rbp),%rax
  4010cb:       48 89 c1                mov    %rax,%rcx
  4010ce:       e8 31 ff ff ff          callq  0x401004
  4010d3:       48 8b 45 f8             mov    -0x8(%rbp),%rax
  4010d7:       48 89 c1                mov    %rax,%rcx
  4010da:       e8 25 ff ff ff          callq  0x401004
  4010df:       48 8b 45 f8             mov    -0x8(%rbp),%rax
  4010e3:       48 89 c1                mov    %rax,%rcx
  4010e6:       e8 19 ff ff ff          callq  0x401004
  4010eb:       90                      nop