CPU学习（Cache Coherence）-电子产品世界论坛

这些小活动你都参加了吗？快来围观一下吧！>>

电子产品世界 » 论坛首页 » 嵌入式开发 » MCU » CPU学习（Cache Coherence）

共1条 1/1 1 跳转至页

CPU学习（Cache Coherence）

8wy103405

工程师

2008-07-17 16:59:34 打赏

只看楼主 1楼

大多数现代CPU都One-die了L1和L2Cache。对于L1 Cache，大多是write though的；L2 Cache则是write BACK的，不会立即写回memory，这就会导致Cache和Memory的内容的不一致；另外，对于MP(MULTI Processors)的环境，由于Cache是CPU私有的，不同CPU的Cache的内容也存在不一致的问题，因此很多MP的的计算架构，不论是ccNUMA还是SMP都实现了Cache Coherence的机制,即不同CPU的Cache一致性机制。

　　Cache Coherence的一种实现是通过Cache-snooping协议，每个CPU通过对Bus的Snoop实现对其它CPU读写Cache的监控：

　　首先，Cache line是Cache和Memory之间数据传输的最小单元。

　　1. 当CPU1要写Cache时，其它CPU就会检查自己Cache中对应的Cache line,如果是dirty的，就write BACK到Memory,并且会将CPU1的相关Cache line刷新；如果不是dirty的，就Invalidate该Cache line.

　　2. 当CPU1要读Cache时，其它CPU就会将自己Cache中对应的Cache line中标记为dirty的部分write BACK到Memory,并且会将CPU1的相关Cache line刷新。

　　所以，提高CPU的Cache hit RATE,减少Cache和Memory之间的数据传输，将会提高系统的性能。

　　因此，在程序和二进制对象的内存分配中保持Cache line aligned就十分重要，如果不保证Cache line对齐，出现多个CPU中并行运行的进程或者线程同时读写同一个Cache line的情况的概率就会很大。这时CPU的Cache和Memory之间会反复出现Write BACK和Refresh情况，这种情形就叫做Cache thrashing。

　　为了有效的避免Cache thrashing,通常有以下两种途径：

　　1. 对于Heap的分配，很多系统在malloc调用中实现了强制的alignment.
2. 对于Stack的分配，很多编译器提供了Stack aligned的选项。

　　当然，如果在编译器指定了Stack aligned,程序的尺寸将会变大，会占用更多的内存。因此，这中间的取舍需要仔细考虑，下面是我在google上搜索到的一段讨论：

One of our customers complained about the additional code geneRATEd to
maintain the stack aligned to 16-byte boundaries, and suggested us to
default to the minimum alignment when optimizing for code size. This
has the caveat that, when you LINK code optimized for size with code
optimized for speed, if a function optimized for size calls a
performance-critical function with the stack misaligned, the
performance-critical function may perform poorly.

关键词：学习 Cache Coherence

共1条 1/1 1 跳转至页

发新帖

每日签到

有奖活动
2026年“我要开发板活动”第三季，开始了！
硬核工程师专属补给计划——填盲盒
“我踩过的那些坑”主题活动——第002期
【EEPW电子工程师创研计划】技术变现通道已开启~
发原创文章【每月瓜分千元赏金凭实力攒钱买好礼~】
【EEPW在线】E起听工程师的声音！
高校联络员开始招募啦！有惊喜！！
【工程师专属福利】每天30秒，积分轻松拿！EEPW宠粉打卡计划启动！

我要赚赏金打赏帖
window下生成compilecommands.json的的方法被打赏￥22元
【S32K3XX】GPIO中断配置被打赏￥26元
【分享开发笔记，赚取电动螺丝刀】WS2812B的RGB灯介绍以及驱动方法被打赏￥25元
PTC与NTC功能常规对比被打赏￥14元
【S32K3XX】核间通信MU使用被打赏￥27元
【分享开发笔记，赚取电动螺丝刀】关于3pin锂电池接口的介绍/使用被打赏￥16元
以启明云端ESP32P4开发板实现TF卡读写功能被打赏￥28元
【分享开发笔记，赚取电动螺丝刀】树莓派5串口UART0配置被打赏￥25元
【STM32F103ZET6】17:分享在Rtos项目中断管理的使用经验被打赏￥23元
【STM32F103ZET6】16:分享在中断中恢复串口任务，遇到的问题被打赏￥31元

热门分类
STM32	MCU
通讯及无线技术	物联网技术
电子DIY	板卡试用
基础知识	软件与操作系统
我爱生活	小e食堂

CPU学习 （Cache Coherence）

回复

CPU学习（Cache Coherence）