提示
暂不支持移动端,请在PC端查看

首页 难题挑战 演武堂 炼金阁 模板管理 运营中心 光明顶 关于我们
搜索

【鲲鹏】CPU 与内存子系统性能调优之调优简介

楼主
仗剑天涯

76

主题

14

回帖

372

积分

发布时间:2024-1-16 16:50:53 | 显示全部楼层
调优思路

    性能优化的思路如下:
        ● 如果CPU的利用率不高,说明资源没有充分利用,可以通过工具(如strace)查看应用程序阻塞在哪里,一般为磁盘,网 络或应用程序自己的业务逻辑有休眠或信号等待,这些优化措施在其它章节描述。
        ● 如果CPU利用率高,可以选择更好的硬件,优化硬件的配置参数来适配业务场景,或者通过优化软件来降低CPU占用率。

    根据CPU的能力配置合适的内存条,建议内存满通道配置,发挥内存最大带宽:一颗鲲鹏920处理器的内存通道数为8,两颗鲲鹏920处理器的内存通道数为16;建议选择高频率的内存条,提升内存带宽:鲲鹏920在1DPC配置时,支持的内存最高频率为 2933MHz。

主要优化参数

优化项优化项简介默认值生效范围鲲鹏916鲲鹏920
优化应用程序的NUMA 配置在NUMA架构下,CPU
core访问临近的内存时访问延迟更低。将应用程序绑在一个NUMA节点,可减少因访问远端内存带来的性能下降。
默认不绑定核立即生效yesyes
修改CPU预取开关内存预取在数据集中场景下可以提前将要访问的数据读到CPU cache 中,提升性能;若数据不集中,导致预取命中率低,则浪费内存带宽。on重启生效noyes
调整定时器机制nohz机制可减少不必要的时钟中断,减少CPU调度开销。不同OS默认配置不同
Euler:nf
重启生效yesyes
调整内存的页大小为64K内存的页大小越大,TLB 中每行管理的内存越多,TLB命中率就越高,从而减少内存访问次数。不同OS默认配置不同:
4KB或64K
重新编译内核、更新内核后生效yesyes
优化应用程序的线程并发数适当调整应用的线程并发数,使得充分利用多核能力和资源争抢之间达到平衡。由应用本身决定立即生效或重启生效(由应用决
定)
yesyes

原文:鲲鹏性能优化十板斧5.0.pdf

版权说明:
本文内容由EDA²侠客岛用户自发贡献,版权归原作者所有,EDA²侠客岛不拥有其著作权,亦不承担相应法律责任,如果您发现本社区中有涉嫌抄袭的内容,请立即联系EDA²侠客岛平台,一经查实,将立刻删除涉嫌侵权内容。

联系我们
EDA²侠客岛邮箱:xiakedao@eda2.com
联系人电话:18191069556
ISEDA官网
IDAS官网
EDA²公众号
企业微信

Powered by Discuz!

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表