| shuai 的个人资料娱乐精神照片日志 | 帮助 |
|
2007/12/14 强暴.Net程序集 之十二 (反汇编之IL指令集)警告:本系列文章为本人原创,只作技术研究之用,您可以引用链接传播,禁止其它的转载方式,禁止用于商业或非法目的, 对于造成的一切后果本人概不负责
在方法头之后就是一字节形式存储的IL指令, 详细的IL取值请见: Partition III CIL, 比如有:
Opcode Instruction 0x00 nop 0x01 break 0x02 ldarg.0 .... 0x26 pop 0x27 jmp 0x28 call 0x29 calli 0x2A ret 0x2B br.s ... 0xFE 0x00 arglist 0xFE 0x01 ceq 0xFE 0x02 cgt 0xFE 0x03 cgt.un 0xFE 0x04 clt 如果按操作码的大小分类, 指令可以分为两组, 一组的操作码只占一个字节, 一组占两个字节, 并高位字节为0xFE
如果按是否含有操作数(参数), 可以分为无操作数, 和有操作数, 有操作数又可以细分为: 1) 操作数是一个Token, 比如 callvirt 指令 2) 操作数是一个跳转的目标Label, 比如br指令 3) 操作数是一个具体的值, 比如ldc.i4指令 4) 操作数是一个方法形参的索引指, 比如ldarg.s指令 5) 操作数是switch指令 按操作数占用大小又分为:
1) 1个字节, 比如br.s指令 ldc.i4.s指令 2) 2个字节, 比如ldarg指令 3) 4个字节, 比如br指令 ldc.i4指令 4) 8个字节, 比如ldc.i8指令, 程序需要针对不同的操作数类型, 以及大小进行不同的反汇编处理
因为操作数类型, 以及大小是可以确定的, 所以程序中我用一个结构类型保存这些确定的值(先下面的OperandType枚举, 和opcode结构)
然后以指令的字节形式为key保存在Map中 操作码为一个字节的Map m[0x00] = opcode(L"nop"); m[0x01] = opcode(L"break"); m[0x02] = opcode(L"ldarg.0"); .... m[0x26] = opcode(L"pop"); m[0x27] = opcode(L"jmp", 4, Token); m[0x28] = opcode(L"call", 4, Token); m[0x29] = opcode(L"calli", 4, Token); m[0x2a] = opcode(L"ret"); m[0x2b] = opcode(L"br.s", 1, Branch); 操作码为两个字节的Map
n[0x00] = opcode(L"arglist"); n[0x01] = opcode(L"ceq"); n[0x02] = opcode(L"cgt"); n[0x03] = opcode(L"cgt.un"); n[0x04] = opcode(L"clt"); typedef enum
{ Branch = 0, Token, Index, Value, Switch, None } OperandType; struct opcode
{ public: opcode() { operandSize = 0; } opcode(const std::wstring& instr) : instruction(instr), operandSize(0), operandType(None) { } opcode(const std::wstring& instr, int os, OperandType t) : instruction(instr), operandSize(os), operandType(t) { } private: std::wstring instruction; int operandSize; OperandType operandType; }; 评论 (3)
引用通告此日志的引用通告 URL 是: http://iauhsgnay.spaces.live.com/blog/cns!C7C5DB6D46321CDD!451.trak 引用此项的网络日志
|
|
|