虚函数效率低的原因 心已赠人 2022-04-11 13:41 176阅读 0赞 设想一下,如果说不是虚函数,那么在编译时期,其相对地址是确定的,编译器可以直接生成jmp/invoke指令; 如果是虚函数,多出来的一次查找vtable所带来的开销,倒是次要的,关键在于,这个函数地址是动态的,譬如 取到的地址在eax里,则在call eax之后的 那些已经被预取进入流水线的所有指令都将失效。流水线越长,一次分支预测失败的代价也就越大。 pf->test(); 011E146D mov eax,dword ptr \[pf\] 011E1470 mov edx,dword ptr \[eax\] 011E1472 mov esi,esp 011E1474 mov ecx,dword ptr \[pf\] 011E1477 mov eax,dword ptr \[edx\] 011E1479 call eax <------------------------- 分支预测失效 011E147B cmp esi,esp 011E147D call @ILT+355(\_\_RTC\_CheckEsp) (11E1168h) 此兄接着回答道“说到流水线,penalty基本上都是因为气泡(也就是分支指令造成预取失效),知道这个以后碰到了就不会再卡壳了。虽然引入流水线(流水线其实是 RISC最初使用的),极大提高了效率,流水线不是越长越好。像P4,几十级流水线,频率虽高,但是性能不好,很大原因就是因为流水线实在臭长。有兴趣可 以去看看CPU怎么做分支预测,乱序执行的。”
还没有评论,来说两句吧...