內核同步機制-優化屏障和內存屏障

優化屏障

編譯器編譯源代碼時，會將源代碼進行優化，將源代碼的指令進行重排序，以適合於CPU的並行執行。然而，內核同步必須避免指令重新排序，優化屏障（Optimization barrier）避免編譯器的重排序優化操作，保證編譯程序時在優化屏障之前的指令不會在優化屏障之後執行。
Linux用宏barrier實現優化屏障，gcc編譯器的優化屏障宏定義列出如下（在include/linux/compiler-gcc.h中）：
#define barrier() __asm__ __volatile__("": : :"memory")

上述定義中，“__asm__”表示插入了彙編語言程序，“__volatile__”表示阻止編譯器對該值進行優化，確保變量使用了用戶定義的精確地址，而不是裝有同一信息的一些別名。“memory”表示指令修改了內存單元。

內存屏障

軟件可通過讀寫屏障強制內存訪問次序。讀寫屏障像一堵牆，所有在設置讀寫屏障之前發起的內存訪問，必須先於在設置屏障之後發起的內存訪問之前完成，確保內存訪問按程序的順序完成。
讀寫屏障通過處理器構架的特殊指令mfence（內存屏障）、lfence（讀屏障）和sfence（寫屏障）完成，見《x86-64構架規範》一章。另外，在x86-64處理器中，對硬件進行操作的彙編語言指令是“串行的”，也具有內存屏障的作用，如：對I/O端口進行操作的所有指令、帶lock前綴的指令以及寫控制寄存器、系統寄存器或調試寄存器的所有指令（如：cli和sti）。
Linux內核提供的內存屏障API函數說明如表2。內存屏障可用於多處理器和單處理器系統，如果僅用於多處理器系統，就使用smp_xxx函數，在單處理器系統上，它們什麼都不要。
表2 內存屏障API函數說明

內存屏障的宏定義	功能說明
mb()	適用於多處理器和單處理器的內存屏障。
rmb()	適用於多處理器和單處理器的讀內存屏障。
wmb()	適用於多處理器和單處理器的寫內存屏障。
smp_mb()	適用於多處理器的內存屏障。
smp_rmb()	適用於多處理器的讀內存屏障。
smp_wmb()	適用於多處理器的寫內存屏障。

適合於多處理器和單處理器的內存屏障宏定義列出如下（在include/asm-x86/system.h中）：
#ifdef CONFIG_X86_32
/*指令“lock; addl $0,0(%%esp)”表示加鎖，把0加到棧頂的內存單元，該指令操作本身無意義，但這些指令起到內存屏障的作用，讓前面的指令執行完成。具有XMM2特徵的CPU已有內存屏障指令，就直接使用該指令*/
    #define mb() alternative("lock; addl $0,0(%%esp)", "mfence", X86_FEATURE_XMM2)
    #define rmb() alternative("lock; addl $0,0(%%esp)", "lfence", X86_FEATURE_XMM2)
    #define wmb() alternative("lock; addl $0,0(%%esp)", "sfence", X86_FEATURE_XMM)
#else
    #define mb() asm volatile("mfence":::"memory")
    #define rmb() asm volatile("lfence":::"memory")
    #define wmb() asm volatile("sfence" ::: "memory")
#endif

/*刷新後面的讀所依賴的所有掛起讀操作，在x86-64構架上不需要*/
#define read_barrier_depends() do { } while (0)

宏定義ead_barrier_depends()刷新後面的讀所依賴的所有掛起讀操作，後面的讀操作依賴於正處理的讀操作返回的數據。在x86-64構架上不需要此宏。它表明：在此屏障之前，沒有來自內存區域數據所依賴的讀曾經重排序。所有的讀操作處理此原語，保證在跟隨此原語的任何讀操作此原語之前訪問內存（但不需要其他CPU的cache）。此原語在大多數CPU上有比rmb()更輕的份量。
本地CPU和編譯器遵循內存屏障的排序限制，僅內存屏障原語保證排序，即使數據有依賴關係，也不能保證排序。例如：下面代碼將強迫排序，因爲*q的讀操作依賴於p的讀操作，並且這兩個讀操作被read_barrier_depends()分開。在CPU 0和CPU 1上執行的程序語句分別列出如下：

CPU 0                                      CPU 1
b = 2;
memory_barrier();
p = &b;                                    q = p;
                                                read_barrier_depends();
                                                d = *q;

下面的代碼沒有強制排序，因爲在a和b的讀操作之間沒有依賴關係，因此，在一些CPU上，如：Alpha，y將設置爲3，x設置爲0。類似這種沒有數據依賴關係的讀操作，需要排序應使用rmb()。

CPU 0                                        CPU 1

a = 2;
memory_barrier();
b = 3;                                         y = b;
                                                 read_barrier_depends();
                                                 x = a;

適合於多處理器的內存屏障宏定義列出如下（在include/asm-x86/system.h中）：
#ifdef CONFIG_SMP
#define smp_mb() mb()

    #ifdef CONFIG_X86_PPRO_FENCE
        # define smp_rmb() rmb()
    #else
      # define smp_rmb() barrier()
    #endif

    #ifdef CONFIG_X86_OOSTORE
      # define smp_wmb() wmb()
    #else
        # define smp_wmb() barrier()
    #endif

    #define smp_read_barrier_depends() read_barrier_depends()
    #define set_mb(var, value) do { (void)xchg(&var, value); } while (0)
#else
    #define smp_mb() barrier()
    #define smp_rmb() barrier()
    #define smp_wmb() barrier()
    #define smp_read_barrier_depends() do { } while (0)
    #define set_mb(var, value) do { var = value; barrier(); } while (0)
#endif

函數rdtsc_barrier用於加內存屏障阻止RDTSC猜測，當在一個定義的代碼區域使用讀取時間戳計數器（Read Time-Stamp Counter，RDTSC）函數（或者函數get_cycles或vread）時，必須加內存屏障阻止RDTSC猜測。其列出如下：

static inline void rdtsc_barrier(void)
{
alternative(ASM_NOP3, "mfence", X86_FEATURE_MFENCE_RDTSC);
alternative(ASM_NOP3, "lfence", X86_FEATURE_LFENCE_RDTSC);
}

內核同步機制-優化屏障和內存屏障

優化屏障

內存屏障

vue綁定對象，綁定的值不改變的問題

Spring Cloud 部署時如何使用 Kubernetes 作爲註冊中心和配置中心

KubeKey 部署 K8s v1.28.8 實戰

記一些CISP-PTE題目解析

nasm 中文手冊

（4）併發服務器設計原理及多進程服務器

Linux系統網絡服務器模型

Linux 性能監測工具及調優介紹

一個均勻綁定cpu的shell

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結