① 如何将这段汇编语言转换成C语言
如何将这段汇编语言转换成C语言?题目分别提供了同一C语言代码的32位和64位汇编版本:很容易可以得出其源C语言代码:
int f(int** p){
return (**p=**p+4,*(int*)**p);
}
则函数体的返回值类型是int,参数p的类型是int**,其唯一的语句是return (**p=**p+4,*(int*)**p);
先把结论放在这,节约不想思考的同学的时间,不同编译器可能会有所不同,lea 0x4(%eax),%ecx指令可能会被编译器拆开成两段:mov (%eax),%ecx 和add 0x4,%ecx(对于64位,则是编译器把lea lea 0x4(%rax),%rcx,拆开成mov (%rax),%rcx 和add 0x4,%rcx,但是效果是一样的。
根据题目中函数体只有1句代码的信息,我们至少确定了这个代码是一个return语句,如此短小的函数当然只需要用到段内跳转和段内指针,不需要段地址信息,所以指针大小(64位的RIP和32位的EIP)只是偏移量大小,分别为64位(8字节)和32位(4字节)。
题目的设问有相当好的引导性,对比查看左边和右边的倒数第3个指令,我们可以看出:函数的返回值都是放在eax变量之中,说明返回值的类型大小是4个字节。而同时,我们知道在C语言中,64位和32位环境下,int类型的大小都是4个字节,所以第1空的答案不能是只有1字节的char类型,也不能是在32位环境下大小为4字节而在64位环境下大小为8字节的指针类型如char*、int*。综上,第1空的答案:函数f的返回值类型只能是int。
第2空则是考查C语言函数的参数传递,栈式参数传递,在call函数f把ip压入(分别为64位的RIP和32位的EIP)之前,先压入的是函数的实际参数,其类型暂时不知道,那就得从汇编指令中找出这个信息点:
C语言函数体标志就是:push %ebp→mov %esp,%ebp→函数体内部→pop %ebp→ret(对64位则是:push %rbp→mov %rsp,%rbp→函数体内部→pop %rbp→retq)
两边都是同一个简单的c语句得到的汇编语句(64位和32位),左边64位的第2、3、4行对应于右边的第2、3行(64位多用了一个rdi寄存器传递参数,可能是编译器选项不同的缘故,又因为main函数中调用函数f的指令没有给出,且不一定相同,故不影响判断)。
两边剩下的几行代码(左边2、3、4、5、6、7、8行,右边2、3、4、5、6、7行)的工作大同小异,从数据流上看(函数体内,对于32位0x8(%ebp)是第一个也是唯一一个参数,对于64位-0x8(%rbp)才是):
*p→eax,*eax→eax,eax+4→ecx(①),*p→edx,ecx→*edx,*eax→eax
可以简化为:
**p→eax,eax+4→ecx,ecx→**p,***p→eax
再简化为
**p+4→**p,***p→eax
注:(①)lea 0x4(%eax), %ecx 意思是取有效地址Load Effect Address,相比于mov 0x4(%eax), %ecx使用地址所指向的值*(eax+4)→ecx,lea指令只使用地址的值eax+4→ecx,少做一步。64位也是如此a。
(对于64位则是:
*p→rax,*rax→rax,rax+4→rcx,*p→rdx,rcx→*rdx,*rax→eax
可以简化为:
**p→rax,rax+4→rcx,rcx→**p,***p→eax
再简化为
**p+4→**p,***p→eax
)
看到数据流了,C语言语句自然也就呼之欲出了,即return (**p=**p+4,*(int*)**p)。(逗号,运算符的意思是从左到右计算式子,然后返回最后一个)
注意这里的+4指的是4个字节,而在64位32位中都一样,于是初步断定**p是固定大小类型变量,同时返回值是int类型的,故认为它(**p)是int,所以参数p的类型就是int**。
② 寄存器 rdi与edi什么关系
DI、EDI、RDI都是抄目的变址寄存袭器,DI用于16位汇编、EDI用于32位汇编、RDI用于64位汇编中,并且RDI向前兼容EDI、DI,EDI向前兼容DI。与之对应的还有SI、ESI、RDI都是源变址寄存器,区别与DI、EDI、RDI类似。
③ arm汇编movb $0, (%rax,%rdi)是给谁赋值
你这个语法属于AT&T汇编,
movb $0,(%rax,%rdi)意思是将一个字节的0存入rax+rdi得出的结果对应的地址位置
x86汇编的写法为movb [rax,rdi], #0
④ 谁帮我把下面每一行的汇编语言解释翻译一下,谢谢啦~
我们的事情了我再来吧来吧,这个是谁啊你哟,这个是谁啊,的
⑤ 这段gcc内联汇编代码为什么没有写输出约束
根据您提供的代码,这是一个包含汇编指令的C程序。其中的汇编指令是使用GCC内联汇编语法嵌入到C代码中的。
您所说的“输出约束”通常是指将汇编指令执行结果写入C程序中的变量中。在这个例子中,确实没有在汇编代码中使用输出约束。
这是因为这段汇编代码并没有产生任何输出,它只是简单地将数组a中的每个元素乘以2,并将结果存储在数组b中。因此,在这种情况下,没有必要使用输出约束。