Syscall/sysenter на LLVM

Как написать код LLVM, необходимый для выдачи инструкции по системному вызову, специфичной для архитектуры?

Более конкретно, clang поддерживает встроенную сборку и явно поддерживает испускание системных вызовов (иначе libc и vdso не удалось скомпилировать). Как работает перевод для этого, и как я могу пощекотать его, чтобы воспроизвести это поведение?

Я понимаю, что сам LLVM может не понимать интерфейс вызова и расписание регистрации, используемые различными архитектурами, достаточно высокоуровневым образом, чтобы быть выраженным в байт-коде LLVM (например, который может быть заполнен в другом месте). Тем не менее, очевидно, что эта страница может быть добавлена.

Как мне это сделать, начиная с любой стадии после "источника C с встроенной сборкой"?

Удовлетворительный ответ будет включать пример вызова системного вызова с пятью аргументами int 0x80. Я выбираю пять, так как это требует пролития стека, и я выбираю int 0x80, так как он легко понимается и на самой распространенной платформе.

Ответы

Ответ 1

Проводя ответ здесь, поскольку exa выставил награду.

Я понял, что это был несколько глупый вопрос, который нужно задать после комментариев Росс Ридж, а некоторые играют с clang.

Предположим, что у нас есть следующая программа, которая использует встроенную сборку для прямого вызова write().

#include <stdio.h>
int main(void)
{
    char *buf = "test\n";
    ssize_t n;
    asm volatile (
        "movl $0x00000002, %%edi\n"  /* first argument == stderr */
        "movl $0x00000006, %%edx\n"  /* third argument == number of bytes */
        "movl $1, %%eax\n"  /* syscall number == write on amd64 linux */
        "syscall\n"
        : "=A"(n)         /* %rax: return value */
        : "S"(buf));      /* %rsi: second argument == address of data to write */
    return n;
}

Мы можем скомпилировать это с помощью gcc или clang и получить примерно тот же результат.

$ gcc -o syscall.gcc syscall.c
$ clang -o syscall.clang syscall.c
$ ./syscall.gcc
test
$ ./syscall.clang
test

Если мы хотим видеть точные инструкции LLVM, которые будут использоваться для испускания этого кода, мы можем просто использовать флаг -emit-llvm. Как вы можете видеть, существует строка call i64 asm sideeffect, которая имеет полную встроенную строку сборки.

$ clang -S -emit-llvm syscall.c
$ cat syscall.ll
; ModuleID = 'syscall.c'
target datalayout = "e-m:e-i64:64-f80:128-n8:16:32:64-S128"
target triple = "x86_64-pc-linux-gnu"

@.str = private unnamed_addr constant [6 x i8] c"test\0A\00", align 1

; Function Attrs: nounwind uwtable
define i32 @main() #0 {
  %1 = alloca i32, align 4
  %buf = alloca i8*, align 8
  %n = alloca i64, align 8
  store i32 0, i32* %1
  store i8* getelementptr inbounds ([6 x i8]* @.str, i32 0, i32 0), i8** %buf, align 8
  %2 = load i8** %buf, align 8
  %3 = call i64 asm sideeffect "movl $$0x00000002, %edi\0Amovl $$0x00000006, %edx\0Amovl $$1, %eax\0Asyscall\0A", "=A,{si},~{dirflag},~{fpsr},~{flags}"(i8* %2) #1, !srcloc !1
  store i64 %3, i64* %n, align 8
  %4 = load i64* %n, align 8
  %5 = trunc i64 %4 to i32
  ret i32 %5
}

attributes #0 = { nounwind uwtable "less-precise-fpmad"="false" "no-frame-pointer-elim"="true" "no-frame-pointer-elim-non-leaf" "no-infs-fp-math"="false" "no-nans-fp-math"="false" "stack-protector-buffer-size"="8" "unsafe-fp-math"="false" "use-soft-float"="false" }
attributes #1 = { nounwind }

!llvm.ident = !{!0}

!0 = metadata !{metadata !"Ubuntu clang version 3.5-1ubuntu1 (trunk) (based on LLVM 3.5)"}
!1 = metadata !{i32 134, i32 197, i32 259, i32 312}