关于float向u8,s8这种类型转换,比较内藏玄机,还是小心为妙,这种级别的优化做了不如不做。
直接float向char类型的做法是用__ftol2_sse命令完成,具体怎么做的就不跟了,想跟也能跟,结果放在al里面,然后move byte到结果。
这里是如果是范围相当,float是char能表示的数结果是正确的,如果是更大的,就是从4个byte中截取一个byte,不会有自动的clamp到边界-128这种。
到了针对unsigned char的表示可以看出使用频繁的loat,store完成的,本身就很慢,尽管c++代码很简洁,但是出来的汇编并不好,结果是截取类的,也是不会clamp。
float a = -10.0f;
004132FE fld dword ptr [__real@c1200000 (415850h)]
00413304 fstp dword ptr [a]
char b = static_cast
00413307 fld dword ptr [a]
0041330A call @ILT+220(__ftol2_sse) (4110E1h)
0041330F mov byte ptr [b],al
unsigned char c = (unsigned char)a;
00413312 fld dword ptr [a]
00413315 fnstcw word ptr [ebp-0E6h]
0041331B movzx eax,word ptr [ebp-0E6h]
00413322 or eax,0C00h
00413327 mov dword ptr [ebp-0ECh],eax
0041332D fldcw word ptr [ebp-0ECh]
00413333 fistp dword ptr [ebp-0F0h]
00413339 fldcw word ptr [ebp-0E6h]
0041333F mov al,byte ptr [ebp-0F0h]
00413345 mov byte ptr [c],al
parallel studio自带intel 的指令集的文档,很不错