三年一度的C++标准文章这回在不到两年的时间点就开始了（请想象自嘲口吻），这次是一个持续更新形式，主要由于本就是利用业余时间写的，近两年家里又多了个小淘气，闲暇时间就越发少了，尽早更新完吧。这次看到中文维基百科上C++标准的条目内容有所缺失，所以同时还会持续更新这个页面维基百科 C++20，当然维基百科上不能像这篇文章里一样这么多废话。😂

新的语言特性

特性测试宏

或称功能特性测试，在c++标准中增加了预处理宏用以检测当前的c++功能支持情况，以往这些预处理都是根据编译器版本宏来控制，现在标准中增加了这些宏。
这些宏包含：

属性检测宏__has_cpp_attribute，形式是宏函数内传递属性token：

1
2
3

#if __has_cpp_attribute(nodiscard) > 201603L
#pragma message("nodiscard version is c++20")
#endif

语言功能特性宏，与属性函数宏不一样，功能宏是单个宏定义：

1
2
3

#if __cpp_concepts >= 201907L
#pragma message("support concepts")
#endif

标准库功能特性宏，同样是单个宏定义，但这些宏不是预定义，由<version>头文件定义：

#include <version>

#ifdef __cpp_lib_bitops
#pragma message("support bitops")
#endif

由以上可见这些宏定义都定义为了标准实现版本，可以根据其时间版本来确定具体的功能。完整的所有宏列表见cppreference

三路比较和比较操作符的默认

20标准新增三路比较操作符，其操作符为<=>，由于像个宇宙飞船也称为spaceship operator。以往标准中比较操作符有==, !=, <, >, <=, >=，可能标准委员会也厌烦了把六个都定义一遍，也就有了三路比较。三路比较返回一个对象，使得

如果a<b, (a <=> b) < 0
如果a>b, (a <=> b) > 0
如果a和b相等/等价，那么(a<=>b) ==0

具体来说三路运算符可以返回三种类型，std::strong_ordering、std::weak_ordering、std::partial_ordering，分别代表强、弱、部分比较类型，这里面细节很多，建议还是用到再来查手册，只要记住三路运算符逻辑即可：

double foo = -0.0;
double bar = 0.0;
auto res = foo <=> bar;
if (res < 0)
    std::cout << "-0 小于 0";
else if (res > 0)
    std::cout << "-0 大于 0";
else if (res == 0)
    std::cout << "-0 与 0 相等";
else
    std::cout << "-0 与 0 无序";

同时20标准新增特性，可以对七个比较运算符设置default，而默认比较行为自然是调用相应成员对象的相应操作符。而之所以说三路运算符可以减少代码量，源于以下两个行为：

如果类C没有显示声明任何名为operator==的成员或友元，编译器会负责对每一个定义为default的<=>操作符定义一个相同实现但是返回值为bool的operator==
三路操作符会作为其他比较操作符<、<=、>、>=的重写候选

也就是说如果没有特殊需求，只要定义一个=default的operator<=>即可省去定义其他比较操作符的麻烦。以gcc13 vector代码为例：

#if __cpp_lib_three_way_comparison
  /**
   *  @brief  Vector ordering relation.
   *  @param  __x  A `vector`.
   *  @param  __y  A `vector` of the same type as `__x`.
   *  @return  A value indicating whether `__x` is less than, equal to,
   *           greater than, or incomparable with `__y`.
   *
   *  See `std::lexicographical_compare_three_way()` for how the determination
   *  is made. This operator is used to synthesize relational operators like
   *  `<` and `>=` etc.
  */
  template<typename _Tp, typename _Alloc>
    _GLIBCXX20_CONSTEXPR
    inline __detail::__synth3way_t<_Tp>
    operator<=>(const vector<_Tp, _Alloc>& __x, const vector<_Tp, _Alloc>& __y)
    {
      return std::lexicographical_compare_three_way(__x.begin(), __x.end(),
                            __y.begin(), __y.end(),
                            __detail::__synth3way);
    }
#else
  /**
   *  @brief  Vector ordering relation.
   *  @param  __x  A %vector.
   *  @param  __y  A %vector of the same type as @a __x.
   *  @return  True iff @a __x is lexicographically less than @a __y.
   *
   *  This is a total ordering relation.  It is linear in the size of the
   *  vectors.  The elements must be comparable with @c <.
   *
   *  See std::lexicographical_compare() for how the determination is made.
  */
  template<typename _Tp, typename _Alloc>
    inline bool
    operator<(const vector<_Tp, _Alloc>& __x, const vector<_Tp, _Alloc>& __y)
    { return std::lexicographical_compare(__x.begin(), __x.end(),
                      __y.begin(), __y.end()); }


  /// Based on operator==
  template<typename _Tp, typename _Alloc>
    inline bool
    operator!=(const vector<_Tp, _Alloc>& __x, const vector<_Tp, _Alloc>& __y)
    { return !(__x == __y); }


  /// Based on operator<
  template<typename _Tp, typename _Alloc>
    inline bool
    operator>(const vector<_Tp, _Alloc>& __x, const vector<_Tp, _Alloc>& __y)
    { return __y < __x; }


  /// Based on operator<
  template<typename _Tp, typename _Alloc>
    inline bool
    operator<=(const vector<_Tp, _Alloc>& __x, const vector<_Tp, _Alloc>& __y)
    { return !(__y < __x); }


  /// Based on operator<
  template<typename _Tp, typename _Alloc>
    inline bool
    operator>=(const vector<_Tp, _Alloc>& __x, const vector<_Tp, _Alloc>& __y)
    { return !(__x < __y); }
#endif // three-way comparison

聚合体指派初始化

聚合体初始化的语法糖，在c++11的聚合体初始化基础上，增加了可以指派具体值的语法：

struct U {
  int a;
  float b;
};

U u1{ 1, 2.0 };
U u2{ .a = 1, .b = 2.0 };

以上代码中u1与u2等效，指派初始化仍然是聚合初始化，所以他符合聚合初始化规则，但需要注意以下几点：

指派顺序必须按照声明顺序，如果其中元素可以被统一初始化，可以不指派所有元素，如：

struct U {
  int a;
  string b;
  float c;
  short d;
};
U u{ .a = 1, .c = 2.0 }; // b被空构，d被{}为0

可以用于初始化联合体，但只能为联合的一个成员使用指派初始化，可以对匿名联合体进行指派：

union U {
  int a;
  float b;
  short c;
};

struct AU {
  union {
    int a;
    float b;
  };

  string c;
};

U u{ .b = 10 };

AU au{ .b = 1, .c = "asd" };

C语言从c99标准开始就支持了指派初始化，但是C++20开始的指派初始化与C的规则不同，具体来说乱序指派、嵌套指派、与常规初始化混用在c99标准后是可以的，但是在c++20标准中不允许：

struct A {
  int x, y;
};
struct B {
  struct A a;
};

struct A a = { .y = 1, .x = 2 };  // C 中合法，C++ 中非法（乱序）
int arr[3] = { [1] = 5 };  // C 中合法，C++ 中非法（数组）
struct B b = { .a.x = 0 };  // C 中合法，C++ 中非法（嵌套）
struct A a = { .x = 1, 2 };  // C 中合法，C++ 中非法（混合）

范围for中的初始化语句和初始化器

17标准中给if和switch语句加了初始化语句，20标准则给基于范围的for加了初始化语句：

std::initializer_list<int> il{ 1, 2, 3 };
for (size_t index{ 0 }; auto& i : il) {
  std::cout << std::format("index {} value is {}", index++, i) << std::endl;
}

该特性为了解决以下这种场景：

class UDC {
public:
  UDC() : items_{ 1, 2, 3, 4 } {}

  const std::vector<int>& ItemsRef() {
    return items_;
  }

private:
  std::vector<int> items_;
};

UDC foo() {
  return {};
}

for (auto& i : foo().ItemsRef()) {
  std::cout << std::format("current is {} ", i) << std::endl;
}

以上代码在c++20标准中会导致最后空悬引用，但在23标准中有所改善，23标准是后话了（比如这里使用23标准的clang19编译后就能正常输出见godbolt-compiler-explorer）。问题在于临时对象的生命周期问题，那这里就有了初始化语句的变通方式：

1
2
3

for (auto obj = foo(); auto& i : obj.ItemsRef()) {
  std::cout << std::format("current is {} ", i) << std::endl;
}

UTF8字符基础类型char8_t

新增了基础类型char8_t用以表示UTF8字符，与11标准中的char16_t、char32_t一样同为语言关键字，char8_t的出现主要是为了和旧有的char区分，专门用于表示utf8字符。相对应的标准库<string>增加了std::u8string的别名，以下来自gcc13：

#if __cplusplus >= 201703L && _GLIBCXX_USE_CXX11_ABI
#include <bits/memory_resource.h>
namespace std _GLIBCXX_VISIBILITY(default)
{
_GLIBCXX_BEGIN_NAMESPACE_VERSION
  namespace pmr {
    template<typename _CharT, typename _Traits = char_traits<_CharT>>
      using basic_string = std::basic_string<_CharT, _Traits,
               polymorphic_allocator<_CharT>>;
    using string    = basic_string<char>;
#ifdef _GLIBCXX_USE_CHAR8_T
    using u8string  = basic_string<char8_t>;
#endif
    using u16string = basic_string<char16_t>;
    using u32string = basic_string<char32_t>;
    using wstring   = basic_string<wchar_t>;
  } // namespace pmr
_GLIBCXX_END_NAMESPACE_VERSION
} // namespace std
#endif // C++17

新属性

no_unique_address

该属性适用于非位域非静态数据成员，指示编译器可以优化当前成员使其与其他非静态数据成员重叠，减少内存占用。如果该成员为空类型（不具有数据成员），则编译器优化为不占空间；如果该成员不为空，则其尾随填充空间可被其他数据成员占用。两个场景例子：

struct Empty {};

struct WithEmpty {
  int32_t x;  // 4字节
  Empty e;  // 1字节（填充至对齐）
};  // 总大小8（4+1+3填充）

struct WithEmptyAttri {
  int32_t x;  // 4字节
  [[no_unique_address]] Empty e;  // 优化为不占空间
};  // 总大小4字节

struct NonEmpty {
  int32_t x;  // 4 字节
  [[no_unique_address]] char y;  // 1字节，无法优化，仍需对齐，*注意这里指定了no_unique_address
  // 3 字节填充
};  // 总大小8字节

struct WithNonEmpty {
  NonEmpty ne;  // 8 字节，未指定no_unique_address，z不可复用ne空间
  char z;  // 1字节, 需对齐
  // 3 字节填充
};  // 总大小12字节

struct Optimized {
  [[no_unique_address]] NonEmpty ne;  // 8 字节
  char z;  // 可以复用 ne 的尾随填充
};

int main() {
  static_assert(sizeof(WithEmpty) == 8);
  static_assert(sizeof(WithEmptyAttri) == 4);
  static_assert(sizeof(NonEmpty) == 8);
  static_assert(sizeof(WithNonEmpty) == 12);
  static_assert(sizeof(Optimized) == 8);
  WithNonEmpty wn;
  assert(&wn.z == &wn.ne.y + 4);
  Optimized o;
  assert(&o.z == &o.ne.y + 1);

  return 0;
}

当然这个属性的具体实现是完全依赖编译器的，空类型的优化上gcc和clang表现都一致；但对于类型不为空时，以上代码在gcc14中NonEmpty内如果不给y指定no_unique_address，最后Optimized的大小仍然会是12，见godbolt，只有y也指定了才能优化。
到clang里，无论我如何写属性都无法将Optimized的大小减为8。
msvc当前版本就更有趣了，当前最新版本msvc 19.40只能使用[[msvc::no_unique_address]]，然后同样的无法通过这个属性来缩减这个Optimized的大小。

likely与unlikely

现代cpu有指令预取和分支预测功能，在gcc以往也有__builtin_expect，相对应的20标准新增了likely和unlikely属性作为c++标准的分支预测优化属性，用于给程序员协助编译器完成分支预测。
以这个例子来看，生成的汇编代码里把unlikely的代码放到了远离主干的地方；没有加likely属性的版本则没有这个优化，按照代码顺序生成了汇编。注意这个优化在gcc中需要开O1及以上的优化级别才能有。

lambda更新

lambda显式模板形参

C++14标准中增加了泛型lamda，但彼时标准只允许将形参声明为auto，20标准则明确了可以显式声明模板形参用以表示当前为泛型lambda。如：

1	auto print = []<typename T>(const T &t) { /.../ };

有趣的是以上<typename>的写法在gcc开14标准时是不会报错的，见godbolt_gcc_14.2_c++14，而clang还会报警称 explicit template parameter list for lambdas is a C++20 extension，见godbolt_clang_20.1_c++14。

lambda捕获参数包

template <typename... Args>
auto FactoryByValue(Args&&... args) {
  return [... args = std::forward<Args>(args)]() {
    ((std::cout << "Value:" << args << " Address:" << &args << std::endl), ...);
  };
}

template <typename... Args>
auto FactoryByRef(Args&&... args) {
  return [&... args = std::forward<Args>(args)]() {
    ((std::cout << "Value:" << args << " Address:" << &args << std::endl), ...);
  };
}

以上代码中分别按值和按引用捕获了参数包，并通过一元右折叠(c++17功能)打开了参数包，该特性的加入主要是考虑到元编程中的需要，示例代码见godbolt。

隐式按值捕获this的弃用

C++20开始以下代码编译会得到一串警告implicit capture of ‘this’ via ‘[=]’ is deprecated in C++20：

struct A {
  void Test() {
    auto f = [=]() { cout << this << endl; };
  }
};

理由比较简单，以往lambda编写时不清晰的表明当前是按值还是按引用捕获的this，程序员总是会混淆当前对this的捕获形式，从而造成指针空悬一类的惨案。17标准又新增了可以复制捕获*this，所以现在推荐明确显式表明this的捕获方式：

struct A {
  void Test() {
    auto f = [=, this]() { cout << this << endl; }; //无告警
  }
};

typename 关键字简化

以往标准中模板类型嵌套声明时，必须加上typename，20标准中做了简化，部分嵌套场景编译器可以识别为类型的可以无须typename：

struct Data {
  using ValueType = int32_t;
  using ValuePointer = int32_t*;
};

template <typename T>
struct Foo {
  using Type = T::ValueType;
  typedef T::ValuePointer Pointer;

  T::ValueType val_;

  T::ValueType Get();

  auto Get(size_t index) -> T::ValuePointer;

  template <typename U = T::ValuePointer>
  void Set(U u);
};

以上六处涉及嵌套类型的代码在17标准中都将通不过编译（godbolt)，但在20标准是可以的（godbolt）。另外需要注意的是函数中的部分场景仍然需要typename：

template <typename T>
T::ValueType Foo<T>::Get() {
  using Pointer = T::Valuepointer;
  typedef typename T::ValuePointer Pointer_;  // 仍需要typename

  typename T::ValuePointer p;  // 仍需要typename

  auto lam = [](T::ValueType) {};

  return static_cast<T::ValueType>(0);
}

编译见godbolt。

consteval与constinit

consteval

11标准中加入了constexpr关键字，当constexpr修饰函数时表明该函数在一定条件下其返回值是编译器计算的，但这并不是强制的，constexpr修饰的函数仍然可以是运行期计算的：

constexpr int sqr(int x) {
  return x * x;
}

int foo() {
    return sqr(2);
}

int main()
{
    int i = foo();
    return 0;
}

以上代码在gcc中-O0时，仍然会生成sqr的函数调用过程（见godbolt）。
consteval则是20标准中加入的强化版本的constexpr，consteval修饰的函数必须是编译期执行，并且consteval只能用于修饰函数，关键字的含义为const evaluation。
以上代码改用consteval后：

1
2
3

consteval int sqr(int x) {
  return x * x;
}

编译生成汇编中不再有sqr函数调用。
由于是语法层面的强制编译期函数，如果无法执行编译期运算则编译出错：

int sqr(int x) {
  return x * x;
}

consteval int foo(int x) {
    return sqr(x);
}

int main()
{
    int i = foo(2);
    return 0;
}

编译结果见godbolt。

constinit

constinit关键字仅可用于变量，表明该变量拥有静态初始化，即该变量的初值为编译期常量，亦即const initialize，仅可用于静态存储器和线程存储期的变量。听起来和constexpr变量有点像，同样是常量初始化，但其实有区别：

constexpr修饰的变量隐含该变量是const，constinit变量仅表示该变量初值为常量。如：

constinit int i = 1;  // 静态存储期

int main()
{
    constexpr int j = 1; // 不强制为静态或thread_local存储期
    i = 2;
    j = 2;  // 编译出错

    return 0;
}

编译结果godbolt。

c++20开始constexpr变量必须拥有常量析构，但是constinit变量不需要：

#include <memory>
#include <vector>

struct A {
    constexpr A(int i) : i_(i) {}
    constexpr ~A() = default;

    int i_;
};

constexpr A a{1};

// shared_ptr 不具有constexpr 析构
constexpr std::shared_ptr<int> p = nullptr;

constinit std::shared_ptr<int> ap = nullptr;

编译结果godbolt。

constexpr 改动

除了上面提到的constexpr变量的常量析构外，constexpr改动还包括：

constepxr函数可以使用try catch，但异常不允许出现在编译时：

#include <stdexcept>

constexpr int Divide(int a, int b) {
    if (b == 0)
        throw std::runtime_error("Division by zero");
    return a / b;
}

constinit int i = Divide(1, 2); // 正常编译期常量
//constinit int j = Divide(1, 0); // 编译报错，编译期不允许出现异常

int main()
{
    try {
        int k = Divide(1, 0); // 运行期执行Divide，正常处理异常
    } catch (std::runtime_error&) {
        return -1;
    }
    return 0;
}

编译结果godbolt。

支持在constexpr函数内使用new、delete动态分配内存，如果是编译期运行则内存不能流出编译期之外：

#include <numeric>

constexpr int* CreateArray(int size) {
    int* arr = new int[size];
    return arr;
}

constexpr void ReleaseArray(int* p) {
    delete[] p;
}

constexpr int Sum(int n) {
    int* p = CreateArray(n);
    std::iota(p, p + n, 1);  // constexpr since C++20
    auto t = std::accumulate(p, p + n, 0);  // constexpr since C++20
    ReleaseArray(p);
    return t;
}

constinit int i = Sum(10); // 正常编译期计算累计值55

// constinit int* p = CreateArray(100); // 编译出错，编译期内存不能出现在运行期
// int* ap = CreateArray(100);  // 当然这么写是可以的，constexpr函数可以是运行期函数

编译结果godbolt。以上代码最后的汇编会变为只有带有初值55的i，计算都在编译期完成；最后一行代码放开注释也是能通过编译的，为了更清晰看汇编就注释了。

constexpr编译期函数可以是虚函数，虽然这听起来很奇怪，编译期的constexpr与运行期的虚函数混在了一起：

#include <iostream>

class Parent {
public:
    constexpr virtual ~Parent() = default;

    constexpr virtual int GetID() {
        return 0;
    }
};

class Child : public Parent {
public:
    constexpr virtual ~Child() = default;

    constexpr int GetID() override {
        return 1;
    }
};

constinit int i = Parent().GetID();
constinit int j = Child().GetID();

编译结果godbolt，一句话概括就是编译器对于在编译期能确定的虚函数在编译期直接执行了。

现在constexpr函数允许修改union活跃成员：

union Test {
    int i;
    int j;
};

constexpr int Foo()
{
    Test t{.i = 1};
    t.j = 2;

    return t.j;
}

constinit int i = Foo();

编译结果godbolt

支持了动态内存、异常、虚函数，20中vector、string析构增加了constexpr后现在也就可以更方便的出现在编译时了，<algorithm>中大量算法函数在20标准后也声明为constexpr：

#include <vector>
#include <string>
#include <algorithm>

constexpr int Foo() {
  std::vector<int> v;
  v.emplace_back(9);
  v.emplace_back(99);
  v.emplace_back(123);  // vector::emplace_back 20起为constexpr

  std::sort(v.begin(), v.end()); // std::sort 20起为constexpr

  // std::remove_if 20起为constexpr
  const auto erase_start =
    std::remove_if(v.begin(), v.end(), [](auto& i) { return i < 100; } );
  v.erase(erase_start, v.end()); // vector::erase 20起为constexpr

  std::string n = "Joshua";

  return v.size() + n.size(); // 两个size 20起都为constexpr
}

constinit int i = Foo();

编译结果godbolt

有符号整数必须以补码表示

在20标准前，c++允许任意的有符号整数表示，对于反码表示的int8_t有范围-127到127，而补码表示的int8_t有范围-128到127，虽然编译器都是用补码表示，但是仍会造成一定问题。所以20标准从语言上规定有符号整数必须以补码表示，N位有符号整数的取值范围也就固定为-(2^N-1-1)到2^N-1-1。

移位运算符的行为变化

20标准前移位运算存在一些未定义行为，比如负数的移位操作、有符号数左移超过实际位数，虽然各编译期有自己的实现，20标准则规范了左移、右移操作行为：

左移即是逐位左移并舍弃移出目标类型的位
右移即是算术右移

以代码为例：

#include <iostream>

int main()
{
  short i = 0x7f00;
  // 发生整数提升，i << 4 实际结果类型为int
  // 即0x7f000，十进制520192
  std::cout << (i << 4) << std::endl;
  // 逐位左移占用符号位，i现在为0xf000
  // 解释为有符号补码即为十进制-4096
  i = i << 4;
  std::cout << i << std::endl;
  i = -7;
  // 算术右移 i/4，向下取整为-2
  std::cout << (i >> 2) << std::endl;
  // 算术右移 i/16，向下取整-1，注意不会移出
  std::cout << (i >> 4) << std::endl;
}

编译运行结果见godbolt

允许使用圆括号进行聚合初始化

#include <iostream>

struct U {
  int a;
  float b;
};

int main()
{
  U u(1,2);
  std::cout << u.a << " " << u.b << std::endl;
}

比较好理解了，20标准以上语法可以，但20以前不行。

协程

所谓“C++20 The Big Four”之一的功能，鉴于此篇文章的篇幅和这四个功能本身内容过多，会另开文章单独讨论，见C++20 协程详解

模块

同是“C++20 The Big Four”，见C++20 module模块详解

约束与概念

“C++20 The Big Four”，见 C++20 约束和概念(Constraint and Concept)详解

–TO BE CONTINUED

Joshua's Blog

C++20标准小结--语言特性改动（施工中）

新的语言特性

特性测试宏

三路比较和比较操作符的默认

聚合体指派初始化

范围for中的初始化语句和初始化器

UTF8字符基础类型char8_t

新属性

no_unique_address

likely与unlikely

lambda更新

lambda显式模板形参

lambda捕获参数包

隐式按值捕获this的弃用

typename 关键字简化

consteval与constinit

consteval

constinit

constexpr 改动

有符号整数必须以补码表示

移位运算符的行为变化

允许使用圆括号进行聚合初始化

协程

模块

约束与概念