一文搞定JMM核心原理

作者：魯大猿 2024-01-09 08:24:47

您可以使用Java synchronized塊。同步塊保證在任何給定時(shí)間只有一個(gè)線程可以進(jìn)入代碼的給定關(guān)鍵部分。同步塊還保證在同步塊內(nèi)訪問的所有變量都將從主存儲(chǔ)器中讀入，當(dāng)線程退出同步塊時(shí)，所有更新的變量將再次刷新回主存儲(chǔ)器，無論變量是不是聲明為volatile。

JMM引入

從堆棧說起

JVM內(nèi)部使用的Java內(nèi)存模型在線程棧和堆之間劃分內(nèi)存。此圖從邏輯角度說明了Java內(nèi)存模型：

圖片

# 堆棧里面放了什么?

線程堆棧還包含正在執(zhí)行的每個(gè)方法的所有局部變量(調(diào)用堆棧上的所有方法)。線程只能訪問它自己的線程堆棧。由線程創(chuàng)建的局部變量對于創(chuàng)建它的線程以外的所有其他線程是不可見的。即使兩個(gè)線程正在執(zhí)行完全相同的代碼，兩個(gè)線程仍將在每個(gè)自己的線程堆棧中創(chuàng)建該代碼的局部變量。因此，每個(gè)線程都有自己的每個(gè)局部變量的版本。

基本類型的所有局部變量(boolean，byte，short，char，int，long，float，double)完全存儲(chǔ)在線程堆棧中，因此對其他線程不可見。一個(gè)線程可以將一個(gè)基本類型變量的副本傳遞給另一個(gè)線程，但它不能共享原始局部變量本身。

堆包含了在Java應(yīng)用程序中創(chuàng)建的所有對象，無論創(chuàng)建該對象的線程是什么。這包括基本類型的包裝類(例如Byte，Integer，Long等)。無論是創(chuàng)建對象并將其分配給局部變量，還是創(chuàng)建為另一個(gè)對象的成員變量，該對象仍然存儲(chǔ)在堆上。

圖片

局部變量可以是基本類型，在這種情況下，它完全保留在線程堆棧上。

局部變量也可以是對象的引用。在這種情況下，引用(局部變量)存儲(chǔ)在線程堆棧中，但是對象本身存儲(chǔ)在堆(Heap)上。

對象的成員變量與對象本身一起存儲(chǔ)在堆上。當(dāng)成員變量是基本類型時(shí)，以及它是對象的引用時(shí)都是如此。

靜態(tài)類變量也與類定義一起存儲(chǔ)在堆上。

線程棧如何訪問堆上對象?

所有具有對象引用的線程都可以訪問堆上的對象。當(dāng)一個(gè)線程有權(quán)訪問一個(gè)對象時(shí)，它也可以訪問該對象的成員變量。如果兩個(gè)線程同時(shí)在同一個(gè)對象上調(diào)用一個(gè)方法，它們都可以訪問該對象的成員變量，但每個(gè)線程都有自己的局部變量副本。

圖片

兩個(gè)線程有一組局部變量。其中一個(gè)局部變量(局部變量2)指向堆上的共享對象(對象3)。兩個(gè)線程各自對同一對象具有不同的引用。它們的引用是局部變量，因此存儲(chǔ)在每個(gè)線程的線程堆棧中(在每個(gè)線程堆棧上)。但是，這兩個(gè)不同的引用指向堆上的同一個(gè)對象。

注意共享對象(對象3)如何將對象2和對象4作為成員變量引用(由對象3到對象2和對象4的箭頭所示)。通過對象3中的這些成員變量引用，兩個(gè)線程可以訪問對象2和對象4.

該圖還顯示了一個(gè)局部變量，該變量指向堆上的兩個(gè)不同對象。在這種情況下，引用指向兩個(gè)不同的對象(對象1和對象5)，而不是同一個(gè)對象。理論上，如果兩個(gè)線程都引用了兩個(gè)對象，則兩個(gè)線程都可以訪問對象1和對象5。但是在上圖中，每個(gè)線程只引用了兩個(gè)對象中的一個(gè)。

線程棧訪問堆示例

那么，什么樣的Java代碼可以導(dǎo)致上面的內(nèi)存圖? 好吧，代碼就像下面的代碼一樣簡單：

public class MyRunnable implements Runnable() {

    public void run() {
        methodOne();
    }

    public void methodOne() {
        int localVariable1 = 45;

        MySharedObject localVariable2 =
            MySharedObject.sharedInstance;

        //... do more with local variables.

        methodTwo();
    }

    public void methodTwo() {
        Integer localVariable1 = new Integer(99);

        //... do more with local variable.
    }
}

public class MySharedObject {

    //static variable pointing to instance of MySharedObject

    public static final MySharedObject sharedInstance =
        new MySharedObject();


    //member variables pointing to two objects on the heap

    public Integer object2 = new Integer(22);
    public Integer object4 = new Integer(44);

    public long member1 = 12345;
    public long member1 = 67890;
}

如果兩個(gè)線程正在執(zhí)行run()方法，則前面顯示的圖表將是結(jié)果。run()方法調(diào)用methodOne()，methodOne()調(diào)用methodTwo()。

methodOne()聲明一個(gè)局部基本類型變量(類型為int的localVariable1)和一個(gè)局部變量，它是一個(gè)對象引用(localVariable2)。

執(zhí)行methodOne()的每個(gè)線程將在各自的線程堆棧上創(chuàng)建自己的localVariable1和localVariable2副本。localVariable1變量將完全相互分離，只存在于每個(gè)線程的線程堆棧中。一個(gè)線程無法看到另一個(gè)線程對其localVariable1副本所做的更改。

執(zhí)行methodOne()的每個(gè)線程也將創(chuàng)建自己的localVariable2副本。但是，localVariable2的兩個(gè)不同副本最終都指向堆上的同一個(gè)對象。代碼將localVariable2設(shè)置為指向靜態(tài)變量引用的對象。靜態(tài)變量只有一個(gè)副本，此副本存儲(chǔ)在堆上。因此，localVariable2的兩個(gè)副本最終都指向靜態(tài)變量指向的MySharedObject的同一個(gè)實(shí)例。MySharedObject實(shí)例也存儲(chǔ)在堆上。它對應(yīng)于上圖中的對象3。

注意MySharedObject類還包含兩個(gè)成員變量。成員變量本身與對象一起存儲(chǔ)在堆上。兩個(gè)成員變量指向另外兩個(gè)Integer對象。這些Integer對象對應(yīng)于上圖中的Object 2和Object 4。

另請注意methodTwo()如何創(chuàng)建名為localVariable1的局部變量。此局部變量是對Integer對象的對象引用。該方法將localVariable1引用設(shè)置為指向新的Integer實(shí)例。localVariable1引用將存儲(chǔ)在執(zhí)行methodTwo()的每個(gè)線程的一個(gè)副本中。實(shí)例化的兩個(gè)Integer對象將存儲(chǔ)在堆上，但由于該方法每次執(zhí)行該方法時(shí)都會(huì)創(chuàng)建一個(gè)新的Integer對象，因此執(zhí)行此方法的兩個(gè)線程將創(chuàng)建單獨(dú)的Integer實(shí)例。在methodTwo()中創(chuàng)建的Integer對象對應(yīng)于上圖中的Object 1和Object 5。

另請注意類型為long的MySharedObject類中的兩個(gè)成員變量，它們是基本類型。由于這些變量是成員變量，因此它們?nèi)耘c對象一起存儲(chǔ)在堆上。只有局部變量存儲(chǔ)在線程堆棧中。

JMM與硬件內(nèi)存結(jié)構(gòu)關(guān)系

硬件內(nèi)存結(jié)構(gòu)簡介

現(xiàn)代硬件內(nèi)存架構(gòu)與內(nèi)部Java內(nèi)存模型略有不同。了解硬件內(nèi)存架構(gòu)也很重要，以了解Java內(nèi)存模型如何與其一起工作。本節(jié)介紹了常見的硬件內(nèi)存架構(gòu)，后面的部分將介紹Java內(nèi)存模型如何與其配合使用。

這是現(xiàn)代計(jì)算機(jī)硬件架構(gòu)的簡化圖：

圖片

現(xiàn)代計(jì)算機(jī)通常有2個(gè)或更多CPU。其中一些CPU也可能有多個(gè)內(nèi)核。關(guān)鍵是，在具有2個(gè)或更多CPU的現(xiàn)代計(jì)算機(jī)上，可以同時(shí)運(yùn)行多個(gè)線程。每個(gè)CPU都能夠在任何給定時(shí)間運(yùn)行一個(gè)線程。這意味著如果您的Java應(yīng)用程序是多線程的，線程真的在可能同時(shí)運(yùn)行.

每個(gè)CPU基本上都包含一組在CPU內(nèi)存中的寄存器。CPU可以在這些寄存器上執(zhí)行的操作比在主存儲(chǔ)器中對變量執(zhí)行的操作快得多。這是因?yàn)镃PU可以比訪問主存儲(chǔ)器更快地訪問這些寄存器。

每個(gè)CPU還可以具有CPU高速緩存存儲(chǔ)器層。事實(shí)上，大多數(shù)現(xiàn)代CPU都有一些大小的緩存存儲(chǔ)層。CPU可以比主存儲(chǔ)器更快地訪問其高速緩存存儲(chǔ)器，但通常不會(huì)像訪問其內(nèi)部寄存器那樣快。因此，CPU高速緩存存儲(chǔ)器介于內(nèi)部寄存器和主存儲(chǔ)器的速度之間。某些CPU可能有多個(gè)緩存層(級別1和級別2)，但要了解Java內(nèi)存模型如何與內(nèi)存交互，這一點(diǎn)并不重要。重要的是要知道CPU可以有某種緩存存儲(chǔ)層。

計(jì)算機(jī)還包含主存儲(chǔ)區(qū)(RAM)。所有CPU都可以訪問主內(nèi)存。主存儲(chǔ)區(qū)通常比CPU的高速緩存存儲(chǔ)器大得多。同時(shí)訪問速度也就較慢.

通常，當(dāng)CPU需要訪問主存儲(chǔ)器時(shí)，它會(huì)將部分主存儲(chǔ)器讀入其CPU緩存。它甚至可以將部分緩存讀入其內(nèi)部寄存器，然后對其執(zhí)行操作。當(dāng)CPU需要將結(jié)果寫回主存儲(chǔ)器時(shí)，它會(huì)將值從其內(nèi)部寄存器刷新到高速緩沖存儲(chǔ)器，并在某些時(shí)候?qū)⒅邓⑿禄刂鞔鎯?chǔ)器。

JMM與硬件內(nèi)存連接 - 引入

如前所述，Java內(nèi)存模型和硬件內(nèi)存架構(gòu)是不同的。硬件內(nèi)存架構(gòu)不區(qū)分線程堆棧和堆。在硬件上，線程堆棧和堆都位于主存儲(chǔ)器中。線程堆棧和堆的一部分有時(shí)可能存在于CPU高速緩存和內(nèi)部CPU寄存器中。這在圖中說明：

圖片

當(dāng)對象和變量可以存儲(chǔ)在計(jì)算機(jī)的各種不同存儲(chǔ)區(qū)域中時(shí)，可能會(huì)出現(xiàn)某些問題。兩個(gè)主要問題是：

Visibility of thread updates (writes) to shared variables.
Race conditions when reading, checking and writing shared variables. 以下各節(jié)將解釋這兩個(gè)問題。

JMM與硬件內(nèi)存連接 - 對象共享后的可見性

如果兩個(gè)或多個(gè)線程共享一個(gè)對象，而沒有正確使用volatile聲明或同步，則一個(gè)線程對共享對象的更新可能對其他線程不可見。

想象一下，共享對象最初存儲(chǔ)在主存儲(chǔ)器中。然后，在CPU上運(yùn)行的線程將共享對象讀入其CPU緩存中。它在那里對共享對象進(jìn)行了更改。只要CPU緩存尚未刷新回主內(nèi)存，共享對象的更改版本對于在其他CPU上運(yùn)行的線程是不可見的。這樣，每個(gè)線程最終都可能擁有自己的共享對象副本，每個(gè)副本都位于不同的CPU緩存中。

下圖描繪了該情況。在左CPU上運(yùn)行的一個(gè)線程將共享對象復(fù)制到其CPU緩存中，并將其count變量更改為2.對于在右邊的CPU上運(yùn)行的其他線程，此更改不可見，因?yàn)橛?jì)數(shù)更新尚未刷新回主內(nèi)存中.

圖片

要解決此問題，您可以使用Java的volatile關(guān)鍵字。volatile關(guān)鍵字可以確保直接從主內(nèi)存讀取給定變量，并在更新時(shí)始終寫回主內(nèi)存。

JMM與硬件內(nèi)存連接 - 競態(tài)條件

如果兩個(gè)或多個(gè)線程共享一個(gè)對象，并且多個(gè)線程更新該共享對象中的變量，則可能會(huì)出現(xiàn)競態(tài)。

想象一下，如果線程A將共享對象的變量計(jì)數(shù)讀入其CPU緩存中。想象一下，線程B也做同樣的事情，但是進(jìn)入不同的CPU緩存。現(xiàn)在，線程A將一個(gè)添加到count，而線程B執(zhí)行相同的操作。現(xiàn)在var1已經(jīng)增加了兩次，每個(gè)CPU緩存一次。

如果這些增量是按先后順序執(zhí)行的，則變量計(jì)數(shù)將增加兩次并將原始值+ 2寫回主存儲(chǔ)器。

但是，兩個(gè)增量同時(shí)執(zhí)行而沒有適當(dāng)?shù)耐健o論線程A和B中哪一個(gè)將其更新后的計(jì)數(shù)版本寫回主存儲(chǔ)器，更新的值將僅比原始值高1，盡管有兩個(gè)增量。

該圖說明了如上所述的競爭條件問題的發(fā)生：

圖片

要解決此問題，您可以使用Java synchronized塊。同步塊保證在任何給定時(shí)間只有一個(gè)線程可以進(jìn)入代碼的給定關(guān)鍵部分。同步塊還保證在同步塊內(nèi)訪問的所有變量都將從主存儲(chǔ)器中讀入，當(dāng)線程退出同步塊時(shí)，所有更新的變量將再次刷新回主存儲(chǔ)器，無論變量是不是聲明為volatile

責(zé)任編輯：武曉燕來源：魯大猿

JMM 核心線程