Ответ 1
Эти символы определены в компоновщик script.
Это код из справочной страницы Linux:
#include <stdio.h>
#include <stdlib.h>
extern char etext, edata, end;
int main() {
printf("First address past:\n");
printf(" program text (etext) %10p\n", &etext);
printf(" initialized data (edata) %10p\n", &edata);
printf(" uninitialized data (end) %10p\n", &end);
exit(EXIT_SUCCESS);
}
при запуске программа ниже производит выходные данные, такие как:
$ ./a.out
First address past:
program text (etext) 0x8048568
initialized data (edata) 0x804a01c
uninitialized data (end) 0x804a024
Где etext
, edata
end
определено? Как эти символы присваиваются значениям? Это линкер или что-то еще?
Эти символы определены в компоновщик script.
Обратите внимание, что в Mac OS X приведенный выше код может не работать! Вместо этого вы можете:
#include <stdio.h>
#include <stdlib.h>
#include <mach-o/getsect.h>
int main(int argc, char *argv[])
{
printf(" program text (etext) %10p\n", (void*)get_etext());
printf(" initialized data (edata) %10p\n", (void*)get_edata());
printf(" uninitialized data (end) %10p\n", (void*)get_end());
exit(EXIT_SUCCESS);
}
Эти символы соответствуют началу различных программных сегментов. Они устанавливаются компоновщиком.
Что GCC делает
Расширение kgiannakakis немного больше.
Эти символы определяются ключевым словом PROVIDE
компоновщика script, задокументированным на https://sourceware.org/binutils/docs-2.25/ld/PROVIDE.html#PROVIDE
Сценарии по умолчанию генерируются при создании Binutils и встроены в исполняемый файл ld
: внешние файлы, которые могут быть установлены в вашем дистрибутиве, например, в /usr/lib/ldscripts
, по умолчанию не используются.
Эхо компоновщик script, который будет использоваться:
ld -verbose | less
В binutils 2.24 он содержит:
.text :
{
*(.text.unlikely .text.*_unlikely .text.unlikely.*)
*(.text.exit .text.exit.*)
*(.text.startup .text.startup.*)
*(.text.hot .text.hot.*)
*(.text .stub .text.* .gnu.linkonce.t.*)
/* .gnu.warning sections are handled specially by elf32.em. */
*(.gnu.warning)
}
.fini :
{
KEEP (*(SORT_NONE(.fini)))
}
PROVIDE (__etext = .);
PROVIDE (_etext = .);
PROVIDE (etext = .);
.rodata : { *(.rodata .rodata.* .gnu.linkonce.r.*) }
.rodata1 : { *(.rodata1) }
Итак, мы также обнаруживаем, что:
__etext
и _etext
также будут работатьetext
не является концом раздела .text
, а скорее .fini
, который также содержит кодetext
не находится в конце сегмента, после него .rodata
, так как Binutils выгружает все разделы readonly в один и тот же сегмент PROVIDE
генерирует слабые символы: если вы также определяете эти символы в своем коде на C, ваше определение победит и скроет это.
Минимальный 32-разрядный пример Linux
Чтобы действительно понять, как все работает, мне нравится создавать минимальные примеры!
main.S
:
.section .text
/* Exit system call. */
mov $1, %eax
/* Exit status. */
mov sdata, %ebx
int $0x80
.section .data
.byte 2
link.ld
:
SECTIONS
{
. = 0x400000;
.text :
{
*(.text)
sdata = .;
*(.data)
}
}
Скомпилировать и запустить:
gas --32 -o main.o main.S
ld -m elf_i386 -o main -T link.ld main.o
./main
echo $?
Вывод:
2
Объяснение: sdata
указывает на первый байт начала следующего раздела .data
.
Итак, управляя первым байтом этого раздела, мы контролируем статус выхода!