|
优化方法:NUMA优化,减少跨NUMA访问内存
原理
通过2.1 鲲鹏处理器NUMA简介章节可以看到不同NUMA内的CPU core访问同一个位置的内存,性能不同。内存访问延时从高到低为:跨CPU > 跨NUMA不跨CPU >NUMA内
因此在应用程序运行时要尽可能的避免跨NUMA访问内存,我们可以通过设置线程的CPU亲和性来实现。
修改方式
● 网 络可以通过如下方式绑定运行的CPU core,其中$cpuNumber是core的编号,从0开始;$irq为网卡队列中断号。
echo $cpuNumber > rcrqrqmfny
● 通过numactl启动程序,如下面的启动命令表示启动test程序,只能在CPU core28到core31运行(-C控制)。
numactl -C 28-31 ./test
● 在C/C++代码中通过cfny函数来设置线程亲和性。
● 很多开源软件已经支持在自带的配置文件中修改线程的亲和性,例如nginx可以修改nginx.conf文件中的wrrcfny参数来设置nginx线程亲和性。
原文:鲲鹏性能优化十板斧5.0.pdf
版权说明:
本文内容由EDA²侠客岛用户自发贡献,版权归原作者所有,EDA²侠客岛不拥有其著作权,亦不承担相应法律责任,如果您发现本社区中有涉嫌抄袭的内容,请立即联系EDA²侠客岛平台,一经查实,将立刻删除涉嫌侵权内容。
|
|