转载自:https://kheresy.wordpress.com/2017/10/16/cpp17-variant/
std::variant
是 C++17 中,一個新加入標準函式庫的 template 容器;他的概念基本上是和 union一樣,是一個可以用來儲存多種型別資料的容器。
比如說:
std::variant<int, double> v;
就代表 v 這個变量,可以用來儲存 int
或 double
的資料,varian
t 內部自己會去記錄相關的資訊。
而和union
不同的地方,variant
是 type-safe
的,再加上有許多函式可以搭配使用,所以在使用上應該算是相對安全;另外也由於他是標準函式庫的template class
,在使用時不需要另外去宣告一個新的型別。
如果要使用 variant
的話,程式必須先include
這個 header
头文件;而之後呢,則就是以template
的形式,把要允許的型別指定好,就可以用了。
下面是一個簡單的例子:
std::variant<int, double, std::string> x, y;
// assign value
x = 1;
y = "1.0";
// overwrite value
x = 2.0;
這邊是宣告了 x、y
兩個變數,透過 variant
讓他們可以儲存int
、double
或 string
的資料。
而接下來,則是讓 x
去記錄一個int
的數字 1
、並讓 y
去記錄一個字串1.0
。
之後,則是把x
改為一個 double
的數字 2.0
;而這個時候,本來x
記錄的int
的數字 1
就會消失了。
實際上variant
在儲存資料的時候,內部還會有一個索引值,來記錄目前是儲存哪一種類型的資料,而透過他的index()
這個函式,也就可以知道目前是使用第幾種型別了。
例如,在上面的程式執行完後,再繼續執行下面的程式碼:
// check index
std::cout << "x - " << x.index() << std::endl;
std::cout << "y - " << y.index() << std::endl;
這樣就會得到 x
的 index
是 1
、y
的 index
是2
的結果了(同数组一样从0开始)。
當要讀取 variant
的資料的時候,需要透過 std::get<>()
這個 template
函式來在編譯階段決定讀取的型別。他有兩種方法可以指定,一個給一個數字當index
,或是直接告訴他是要用哪個型別。
下面就是簡單的範例:
// read value
double d = std::get<double>(x);
std::string s = std::get<2>(y);
像上面在讀取 y
的資料時候,是告訴系統是要把y
當成第2
號的資料型別來讀取,也就是std::string
了。
而如果是指定錯誤的型別的話,std::get<>()
則是會丟出一個例外狀況,沒處理的話就會讓程式當掉。下面就是這樣的例子:
// error type
try
{
int i = std::get<int>(x);
}
catch (std::bad_variant_access e)
{
std::cerr << e.what() << std::endl;
}
由於的 x
內部是儲存double
的資料,但是這邊卻試著把他當int
讀,所以在執行後就會丟出 std::bad_variant_access
這個例外狀況了。
而如果不想用 try-catch
來處理例外狀況的話,則可以使用 std::get_if<>()
這個函式,來取得值的指標;而如果型別不符合的話,則是會得到一個 nullptr
。下面就是一個簡單的例子:
// use get_if
int* i = std::get_if<int>(&x);
if (i == nullptr)
{
std::cout << "wrong type" << std::endl;
}
else
{
std::cout << "value is " << *i << std::endl;
}
如果只是透過上面提到的get<>()
來做存取,那其實 Heresy 個人會覺得用variant
的意義感覺不算很大。
個人覺得 variant 要好用,還要搭配 std::visit() 這個函式(參考)來使用。
visit()
基本上是一個用來處理 variant
类型的函式,讓開發者不用自己根據所有可能、一種一種去切換;在使用時,需要給他一個可以處理所有可能型別的可呼叫(callable)物件、來進行操作。
比如說,這邊要可以比較快輸出上面的x
和y
的話,可以定義一個 SOutput
如下:
struct SOutput
{
void operator()(const int& i)
{
std::cout << i << std::endl;
}
void operator()(const double& d)
{
std::cout << d << std::endl;
}
void operator()(const std::string& s)
{
std::cout << s << std::endl;
}
};
可以看到,這邊有針對所有有用到型別(int、double 和 string )
都去定義對應的function call operator
。之後要使用的時候,則只要调用:
std::visit(SOutput(), y);
這樣編譯器就會找到對應的函式來執行了!
由於這部分會在編譯階段做檢查,所以這邊的 SOutput
要確定有針對所有可能的型別,都撰寫對應的函式,如果有缺的話,在編譯階段就不會過了!這也是一種相對安全的程式寫法。
而這邊也可以透過 template
的方式,來減少重複的程式碼;像是上面的SOutput
就可以改寫成:
struct STOutput
{
template<typename TYPE>
void operator()(const TYPE& v)
{
std::cout << v << std::endl;
}
};
如此一來,只要寫一個函式,就可以對應所有狀況了~
而如果搭配 C++14 的Generic Lambda
,則可以更簡單地寫成:
std::visit(
[](const auto& v) {std::cout << v << std::endl; },
x);
這樣應該就算是相當方便了~
不過,如果有要透過不同的型別,做不同的處理,就不能這麼方便的 Generic Lambda
了…基本上,這邊就得回到前面,自己去定義一個callable object
,然後針對需求,各自去實作對應的函式。
下面就是一個簡單的例子:
struct STwice
{
template<typename TYPE>
void operator()(TYPE& v)
{
v *= 2;
}
template<>
void operator()(std::string& s)
{
s += s;
}
};
在這個STwice
裡,如果类型 std::string
的話,他會把字串重複兩次;而如果是其他的型別的話,則是會透過template
處理、直接乘二。
透過這樣的寫法,就可以根據不同的型別,做不同的處理了。
如果不想另外定義一個 struct
的話,其實在 cppreference
有提供一個使用多個 lambda
來組合的例子(參考);他的概念應該是使用parameter pack的多重繼承的方法來做的,但是他的語法在 msvc
無法正確編譯…
而他用的語法…恩,Heresy 也看不懂(應該是 User-defined deduction guides、參考)。 orz
不過,如果真的想要組合多個 lambda 的話,可以參考 lambda_util::compose() 這個實作(gist),這份程式在 MSVC2017 是可以正確運作的。
而如果把它直接拿來用的話,前面的 STwice 就可以變成下面這樣:
std::visit(
lambda_util::compose(
[](auto& v) { v *= 2; },
[](std::string& s) { s += s; }
), y);
基本上,算是好寫一點了。
這邊針對 std::variant 的介紹大概就先到這邊了。實際上,他還有一些其他函式可以用,不過這邊就先跳過了。
完整的範例程式,可以參考放在 GitHub 上的檔案:
不過,由於C++17
是相對新、還沒完全定案的標準,所以編譯器要相當新的版本才能支援;以MSVC
來說,就是需要 VisualStudio 2017
才能支援,而gcc
的libstdc++
則是要到 7.0
以後才支援。
而Boos
t 雖然也有提供 Variant
(網頁)這個函式庫,但是實際上他的語法和 C++17
的似乎是略有不同;像 Boost
的版本的visit()
就變成是 apply_visitor()
,也沒有get_if<>()
這個函式(似乎是直接用 get<>()
)…
所以以現階段來說,個人是覺得還不是很適合直接正式使用吧。
另外,在 Heresy 來看,std::variant
一個可能可以拿來實用的地方,就是透過它來讓不同的資料可以放在同一個容器內、批次處理。
下面就是一個簡單的範例:
// vector
using var_t = std::variant<int, double, std::string>;
std::vector<var_t> vData = { 1, 2.0, "hi" };
for (var_t& v : vData)
{
std::visit(STwice(), v);
std::visit(SOutput(), v);
}
要做這樣的事,以往大多是要用比較複雜的繼承、抽象化來解決的;而現在有了 variant,在某些狀況下應該是可以更簡單就可以做到同樣的事了!
而相較於使用繼承會把程式分散在個別的類別中,這邊的特色是,針對不同型別的處理的程式會都集中在一起,某方面來說算是各有優缺點了。
這部分可以參考《New Tools for a More Functional C++》這份投影片。而實際上,Heresy 也是因為看了這份投影片,才來研究 variant 的。