【Modern C++】深入理解左值、右值
你好,我是雨樂!
作為C/C++開發(fā)人員,在平時的項(xiàng)目開發(fā)過程中,或多或少的聽過左值和右值的概念,甚至在編譯器報(bào)錯的時候,遇到過lvalue和rvalue等字樣;甚至使用過std::move(),但是不知道其含義。作為多年的C++開發(fā)人員,一直以來,對左值右值的理解沒有一個系統(tǒng)的認(rèn)識,總感覺似懂非懂。今天,借助本文,詳細(xì)的介紹下這些知識點(diǎn),并從代碼實(shí)例的角度去分析什么是左值或者右值,同時,也算是給自己知識點(diǎn)做一個總結(jié)。
背景
作為C++開發(fā)人員,相信我們都寫過如下代碼:
void?fun(int?&x)?{
//
}
int?main()?{
??fun(10);
??return?0;
}
在編譯的時候,會提示如下:
error:?invalid?initialization?of?non-const?reference?of?type?‘int&’?from?an?rvalue?of?type?‘int’
其中上述報(bào)錯中的rvalue就是10,也就是說10就是rvalue,那么到底什么是rvalue,rvalue的意義是什么?這就是本文的目的,通過本文,讓你徹底搞清楚什么C++下的值類別,以及如何區(qū)分左值、純右值和將亡值。
本文的主要內(nèi)容如下圖所示:

歷史
在正式介紹左值和右值之前,我們先介紹下其歷史。
編程語言CPL第一次引入了值類別,不過其定義比較簡單,即對于賦值運(yùn)算符,在運(yùn)算符左邊的為左值,在運(yùn)算符右邊的為右值。
C語言遵循與CPL類似的分類法,但是弱化了賦值的作用,C語言中的表達(dá)式被分為左值和其它(函數(shù)和非對象值),其中左值被定義為標(biāo)識一個對象的表達(dá)式。不過,C語言中的左值與CPL中的左值區(qū)別是,在C語言中l(wèi)value是locator value的簡寫,因此lvalue對應(yīng)了一塊內(nèi)存地址。
C++11之前,左值遵循了C語言的分類法,但與C不同的是,其將非左值表達(dá)式統(tǒng)稱為右值,函數(shù)為左值,并添加了引用能綁定到左值但唯有const的引用能綁定到右值的規(guī)則。幾種非左值的C表達(dá)式在C++中成為了左值表達(dá)式。
自C++11開始,對值類別又進(jìn)行了詳細(xì)分類,在原有左值的基礎(chǔ)上增加了純右值和消亡值,并對以上三種類型通過是否具名(identity)和可移動(moveable),又增加了glvalue和rvalue兩種組合類型,在后面的內(nèi)容中,會對這幾種類型進(jìn)行詳細(xì)講解。
表達(dá)式
C/C++代碼是由標(biāo)識符、表達(dá)式和語句以及一些必要的符號(大括號等)組成。
表達(dá)式由按照語言規(guī)則排列的運(yùn)算符,常量和變量組成。一個表達(dá)式可以包含一個或多個操作數(shù),零個或多個運(yùn)算符來計(jì)算值。每個表達(dá)式都會產(chǎn)生一些值,該值將在賦值運(yùn)算符的幫助下分配給變量。
在C/C++中,表達(dá)式有很多種,我們常見的有前后綴表達(dá)式、條件運(yùn)算符表達(dá)式等。字面值(literal)和變量(variable)是最簡單的表達(dá)式,函數(shù)的返回值也被認(rèn)為是表達(dá)式。
表達(dá)式是可求值的,對表達(dá)式求值可得到一個結(jié)果,這個結(jié)果有兩個屬性:
類型。這個我們很常見,比如int、string、引用或者我們自定義的類。類型確定了表達(dá)式可以進(jìn)行哪些操作。 值類別(在下節(jié)中會細(xì)講)。
值類別
在上節(jié)中,我們提到表達(dá)式是可求值的,而值類別就是求值結(jié)果的屬性之一。
在C++11之前,表達(dá)式的值分為左值和右值兩種,其中右值就是我們理解中的字面值1、true、NULL等。
自C++11開始,表達(dá)式的值分為左值(lvalue, left value)、將亡值(xvalue, expiring value)、純右值(pvalue, pure ravlue)以及兩種混合類別泛左值(glvalue, generalized lvalue)和右值(rvalue, right value)五種。
這五種類別的分類基于表達(dá)式的兩個特征:
具名(identity):可以確定表達(dá)式是否與另一表達(dá)式指代同一實(shí)體,例如通過比較它們所標(biāo)識的對象或函數(shù)的(直接或間接獲得的)地址 可被移動:移動構(gòu)造函數(shù)、移動賦值運(yùn)算符或?qū)崿F(xiàn)了移動語義的其他函數(shù)重載能夠綁定于這個表達(dá)式
結(jié)合上述兩個特征,對五種表達(dá)式值類別進(jìn)行重新定義:
lvalue:具名且不可被移動 xvaue:具名且可被移動 prvalue:不具名且可被移動 glvalue:具名,lvalue和xvalue都屬于glvalue rvalue:可被移動的表達(dá)式,prvalue和xvalue都屬于rvalue
用圖表示如下:

從glvalue和rvalue出發(fā),將具名(indentity)和可移動兩個特征結(jié)合起來,如下圖所示:

在上圖中,I代表indentity,M代表moveable。以xvalue為例,在上圖中xvalue為(I&M),即代表具名且可移動。
對于indentity,有些文章譯為
有身份的,有些文章譯為具名的,本文統(tǒng)一稱為具名的。
左值
左值(lvalue,left value),顧名思義就是賦值符號左邊的值。準(zhǔn)確來說,左值是表達(dá)式結(jié)束(不一定是賦值表達(dá)式)后依然存在的對象。
可以將左值看作是一個關(guān)聯(lián)了名稱的內(nèi)存位置,允許程序的其他部分來訪問它。在這里,我們將 "名稱" 解釋為任何可用于訪問內(nèi)存位置的表達(dá)式。所以,如果 arr 是一個數(shù)組,那么 arr[1] 和 *(arr+1) 都將被視為相同內(nèi)存位置的“名稱”。
左值具有以下特征:
可通過取地址運(yùn)算符獲取其地址 可修改的左值可用作內(nèi)建賦值和內(nèi)建符合賦值運(yùn)算符的左操作數(shù) 可以用來初始化左值引用(后面有講)
那么哪些都是左值呢?查了相關(guān)資料,做了些匯總,基本覆蓋了所有的類型:
變量名、函數(shù)名以及數(shù)據(jù)成員名 返回左值引用的函數(shù)調(diào)用 由賦值運(yùn)算符或復(fù)合賦值運(yùn)算符連接的表達(dá)式,如(a=b, a-=b等) 解引用表達(dá)式*ptr 前置自增和自減表達(dá)式(++a, ++b) 成員訪問(點(diǎn))運(yùn)算符的結(jié)果 由指針訪問成員( ->)運(yùn)算符的結(jié)果下標(biāo)運(yùn)算符的結(jié)果( [])字符串字面值("abc")
為了能夠更加清晰地理解左值,我們舉例:
int?a?=?1;?//?a是左值
T&?f();
f();//左值
++a;//左值
--a;//左值
int?b?=?a;//a和b都是左值
struct?S*?ptr?=?&obj;?//?ptr為左值
arr[1]?=?2;?//?左值
int?*p?=?&a;?//?p為左值
*p?=?10;?//?*p為左值
class?MyClass{};
MyClass?c;?//?c為左值
"abc"
對于一個表達(dá)式,凡是對其取地址(&)操作可以成功的都是左值
純右值
在前面有提過,自C++11開始,純右值(pvalue, pure ravlue)相當(dāng)于之前的右值,那么什么是純右值呢?
字面值或者函數(shù)返回的非引用都是純右值。
以下表達(dá)式的值都是純右值:
字面值(字符串字面值除外),例如1,'a', true等 返回值為非引用的函數(shù)調(diào)用或操作符重載,例如:str.substr(1, 2), str1 + str2, or it++ 后置自增和自減表達(dá)式(a++, a--) 算術(shù)表達(dá)式 邏輯表達(dá)式 比較表達(dá)式 取地址表達(dá)式 lambda表達(dá)式
為了加深對右值的理解,下面的例子是常見的純右值:
nullptr;
true;
1;
int?fun();
fun();
int?a?=?1;
int?b?=?2;
a?+?b;
a++;
b--;
a?>?b;
a?&&?b;
純右值特征:
等同于C++11之前的右值 不會是多態(tài) 不會是抽象類型或數(shù)組 不會是不完全類型
將亡值
將亡值(xvalue, expiring value),顧名思義即將消亡的值,是C++11新增的跟右值引用相關(guān)的表達(dá)式,通常是將要被移動的對象(移為他用),比如返回右值引用T&&的函數(shù)返回值、std::move的返回值,或者轉(zhuǎn)換為T&&的類型轉(zhuǎn)換函數(shù)的返回值。
將亡值可以理解為通過“盜取”其他變量內(nèi)存空間的方式獲取到的值。在確保其他變量不再被使用、或即將被銷毀時,通過“盜取”的方式可以避免內(nèi)存空間的釋放和分配,能夠延長變量值的生命期。(通過右值引用來續(xù)命)。
xvalue 只能通過兩種方式來獲得,這兩種方式都涉及到將一個左值賦給(轉(zhuǎn)化為)一個右值引用:
返回右值引用的函數(shù)的調(diào)用表達(dá)式,如 static_cast該表達(dá)式得到一個 xvalue(t); 轉(zhuǎn)換為右值引用的轉(zhuǎn)換函數(shù)的調(diào)用表達(dá)式,如:std::move(t)、satic_cast (t)
下面通過幾個代碼來詳細(xì)分析什么是將亡值:
std::string?fun()?{
??std::string?str;
??//?...
??return?str;
}
std::string?s?=?fun();
在函數(shù)fun()中,str是一個局部變量,并在函數(shù)結(jié)束時候被返回。
在C++11之前,s = fun();會調(diào)用拷貝構(gòu)造函數(shù),會將整個str復(fù)制一份,然后把str銷毀。如果str特別大的話,會造成大量額外開銷。在這一行中,s是左值,fun()是右值(純右值),fun()產(chǎn)生的那個返回值作為一個臨時值,一旦str被s復(fù)制后,將被銷毀,無法獲取、也不能修改。
自C++11開始,引入了move語義,編譯器會將這部分優(yōu)化成move操作,即不再是之前的復(fù)制操作,而是move。此時,str會被進(jìn)行隱式右值轉(zhuǎn)換,等價于static_cast,進(jìn)而此處的 s 會將 foo 局部返回的值進(jìn)行移動。
無論是C++11之前的拷貝,還是C++11的move,str在填充(拷貝或者move)給s之后,將被銷毀,而被銷毀的這個值,就成為將亡值。
將亡值就定義了這樣一種行為:具名的臨時值、同時又能夠被move。
混合類型
泛左值
泛左值(glvalue, generalized lvalue),又稱為廣義左值,是具名表達(dá)式,對應(yīng)了一塊內(nèi)存。glvalue有l(wèi)value和xvalue兩種形式。
一個表達(dá)式是具名的,則稱為glvalue,例子如下:
struct?S{
??int?n;
};
S?fun();
S?s;
s;
std::move(s);
fun();
S{};
S{}.n;
在上述代碼中:
定義了結(jié)構(gòu)體S和函數(shù)fun() 第6行聲明了類型為S的變量s,因?yàn)槠涫蔷呙模允莋lvalue 第七行同上,因?yàn)閟具名,所以為glvalue 第8行中調(diào)用了move函數(shù) ,將左值s轉(zhuǎn)換成xvalue,所以是glvaue 第10行中,fun()是不具名的,是純右值,所以不是glvalue 第11行中,生成一個不具名的臨時變量,是純右值,所以不是glvalue 第12行中,n具名,所以是glvalue
glvalue的特征如下:
可以自動轉(zhuǎn)換成prvalue 可以是多態(tài)的 可以是不完整類型,如前置聲明但未定義的類類型
右值
右值(rvalue, right value)是指可以移動的表達(dá)式。prvalue和xvalue都是rvalue,具體的示例見下文。
rvalue具有以下特征:
無法對rvalue進(jìn)行取地址操作。例如: &1,&(a + b),這些表達(dá)式?jīng)]有意義,也編譯不過。rvalue不能放在賦值或者組合賦值符號的左邊,例如: 3 = 5,3 += 5,這些表達(dá)式?jīng)]有意義,也編譯不過。rvalue可以用來初始化const左值引用(見下文)。例如: const int& a = 1。rvalue可以用來初始化右值引用(見下文)。 rvalue可以影響函數(shù)重載:當(dāng)被用作函數(shù)實(shí)參且該函數(shù)有兩種重載可用,其中之一接受右值引用的形參而另一個接受 const 的左值引用的形參時,右值將被綁定到右值引用的重載之上。
深入
經(jīng)過前面的內(nèi)容,我們對左值和右值(純右值和將亡值)有了一個初步的認(rèn)識,在本節(jié),我們借助一些例子,來加深對左值和右值的理解。
前置自增(減)是左值,后置自增(減)是純右值
代碼如下:
int?i?=?0;
++i;
--i;
i++;
i--;
在上面代碼中,我們定義了一個int類型的變量i,并初始化為0。
++i的操作是對i加1后再賦值給i,所以++i的結(jié)果是具名的,名稱就是i,所以++i是左值 對于i++而言,先將i的值進(jìn)行拷貝(此處假設(shè)拷貝到臨時變量ii),然后再對i加1,最后返回ii(其實(shí)不存在的,為了在此表述方便)。所以i++是不具名的,因此不是glvaue,所以i++是右值,又因?yàn)椴痪呙?,且是右值,所以i++是純右值 同理,--i是左值,i--是純右值
算術(shù)表達(dá)式是純右值
代碼如下:
int?x?=?0;
int?y?=?0;
x?+?y;
x?&&?y;
x?==?y;
在上述代碼中,x + y得到的是一個不具名的臨時對象,所以x+y是純右值;而x && y和x == y得到的是一個bool常量值,要么是true要么是false,所以是純右值。
解引用是左值,取地址是純右值
代碼如下:
int?x?=?0;
int?*y?=?&x;
*y?=?1;
&y;
*y得到的是y指向地址的實(shí)際值,所以&(*y)是合法的,因此*y是左值;對&y操作得到的是一個地址,即一個long值,所以是一個字面值,因此&y是純右值。
字符串字面值是左值
字符串字面值為左值,這個比較特殊。在前面提到過字面值都是純右值(字符串字面值除外),一個很重要的原因,就是可以字符串字面值可以獲取地址,
下面代碼在編譯器中可正常編譯且運(yùn)行:
std::cout?<&"abc"?<std::endl;
這是因?yàn)?code style="font-size: 14px;overflow-wrap: break-word;padding: 2px 4px;border-radius: 4px;margin-right: 2px;margin-left: 2px;background-color: rgba(27, 31, 35, 0.05);font-family: "Operator Mono", Consolas, Monaco, Menlo, monospace;word-break: break-all;color: rgb(239, 112, 96);">C++將字符串字面值實(shí)現(xiàn)為char型數(shù)組,實(shí)實(shí)在在地為每個字符都分配了空間并且允許程序員對其進(jìn)行操作。如果從存儲區(qū)的概念來理解,那就是字符串字面值存儲在常量區(qū)。
引用
既然提到了左值右值,就得提一下引用。
在C++11之前,引用分為左值引用和常量左值引用兩種,但是自C++11起,引入了右值引用,也就是說,在C++11中,包含如下3中引用:
左值引用 常量左值引用(不希望被修改) 右值引用
左值引用和常量左值引用,我們很常見,如下代碼:
std::string?str?=?"abc";
std::string?&s?=?str;
const?int?&a?=?10;
int?&b?=?10;?//?錯
在上述代碼中,s是一個左值引用,而a是一個const 左值引用。那么,為什么最后一句int &b = 10;編譯器會報(bào)錯呢?這是因?yàn)?0是常量,而常量是右值,一個右值怎么能夠被左值引用去引用呢。
那么什么是右值引用呢?右值引用就是引用右值的引用,這不廢話嘛??。
在C++11中引入了右值引用,因?yàn)橛抑档纳芷诤芏?,右值引用的引入,使得可以延長右值的生命周期。在C++中規(guī)定,右值引用是&&即由2個&表示,而左值引用是一個&表示。右值引用的作用是為了綁定右值。
為了能區(qū)分左值引用和右值引用,代碼如下:
int?a?=?1;
int?&rb?=?a;?//?b為左值引用
int?&&rrb?=?a;?//?錯誤,a是左值,右值引用不能綁定左值
int?&&rrb1?=?1;?//?正確,1為右值
int?&rb1?=?i?*?2;?//?錯誤,i?*?2是右值,而rb1位左值引用
int?&&rrb2?=?i?*?2;?//?正確
const?int?&c?=?1;?//?正確
const?int?&c1?=?i?*?2;?//?正確
在這里,我們需要特別注意的一點(diǎn)就是右值引用雖然是引用右值,但是其本身是左值,以下代碼為例:
int?&&a?=?1;
在上述代碼中,a是一個右值引用,但是其本身是左值,合適因?yàn)椋?/p>
a出現(xiàn)在等號(=)的左邊 可以對a取地址
我們在前面有提到過,一個表達(dá)式有兩個屬性,分別為類型和值類別。本節(jié)說的左值引用和右值引用就屬于類型,而左值和右值則屬于值類別范疇,這個概念很重要,千萬不能混淆。
可能有人會問,除了自己根據(jù)規(guī)則區(qū)分左值引用和右值引用,有沒有更快更準(zhǔn)確的方式來判斷呢?其實(shí),系統(tǒng)提供了API,如下:
std::is_lvalue_reference
is_rvalue_reference
??
int?a?=?1;
int?&ra?=?a;
int?&&b?=?1;
std::cout?<std::is_lvalue_reference<decltype(ra)>::value?<std::endl;
std::cout?<std::is_rvalue_reference<decltype(ra)>::value?<std::endl;
std::cout?<std::is_rvalue_reference<decltype(b)>::value?<std::endl;
輸出結(jié)果:
1
0
1
結(jié)語
這篇文章是在整理了大量資料,結(jié)合自己的理解之后完成的。左值右值這種本身就比較抽象,在寫文的過程中,發(fā)現(xiàn)有些東西,很難用文字來描述。在寫這篇文章的過程中,也糾正了自己長久以來對左值右值的疑惑,因?yàn)檫@塊確實(shí)比較復(fù)雜,所以文章中難免有出錯或者不周全的地方,希望您批評指正。
好了,今天的文章就到這里,我們下期見!
參考
https://en.cppreference.com/w/cpp/language/value_category https://www.internalpointers.com/post/understanding-meaning-lvalues-and-rvalues-c https://www.fatalerrors.org/a/left-value-reference-and-right-value-reference-of-c-c-class-and-object.html https://www.bogotobogo.com/cplusplus/C11/4_C11_Rvalue_Lvalue.php https://users.soe.ucsc.edu/~pohl/code/lvalue.htm
