P0070R0: Coroutines: Return Before Await
現在のコルーチン提案では、関数がコルーチンかどうかを宣言から判定できない。そのような判定をさせるタグ機能は議論の結果却下された。しかし、awaitかyieldをみるまで関数がコルーチンかどうかわからないのは不便なので、コルーチン関数では、通常のreturnキーワードを使ったreturn文のかわりに、特別なco_returnキーワードを使ったreturn文の使用を強制させるようにしようという提案に対して、その必要はないとする論文。
理由は、MSVCやGCCは、すでに最適化のために、関数の全体を見るまで意味解析を行わないようになっているので、そんな技術的制約上の機能は必要ないとのこと。
P0071R0: Coroutines: Keyword alternatives
現在のコルーチンの提案では、awaitとyieldに当たるキーワードが未定である。理想世界においては、awaitとyieldというキーワードは機能をこれ以上なく明白に指し示したものである。しかし、現実世界においては、awaitやyieldのような既存のコードと衝突するようなキーワードを導入できない。
これに対して、いくつかの解決策が示されている。
ソフトキーワード:std名前空間に暗黙に宣言されている名前で、他の名前と衝突しない場合、キーワードとして認識される。
マジック関数: std名前空間内にある特別な関数で、コンパイラーが認識する。
問題は、文法が関数呼び出し式になってしまうので、すこし汚い。
await expr ;
が、
std::await( expr ) ;
になってしまう。
その他のキーワード案: exportキーワードが余っているではないか。yieldexpr/yield_exprはどうか。coyield/co_yieldはどうか。
論文では、awaitとyieldに変わる良いキーワードはないとした上で、ソフトキーワードかマジック関数のどちらかを採用すべきだとしている。
[PDF] P0072: Light-Weight Execution Agents
スレッドよりも制約の強い実行媒体(Execution Agent、スレッドプール、ファイバー、GPGPU、SIMDなど)を扱うために、実行媒体とその保証について定義する提案。
[PDF] P0073R0: On unifying the coroutines and resumable functions proposals
コルーチンとレジューム可能関数を統合したことについて
P0074R0: Making std::owner_less more flexible
std::onwer_lessという関数オブジェクトがある。これは、2つのshared_ptrとweak_ptrが、同じオブジェクトを所有しているかを判定してくれる機能を提供している。しかし、このインターフェースが悪いため、とても単純な例でしか動かない。
shared_ptr<int> sp1;
shared_ptr<void> sp2;
shared_ptr<long> sp3;
weak_ptr<int> wp1;
owner_less<shared_ptr<int>> cmp;
cmp(sp1, sp2); // error, doesn't compile
cmp(sp1, wp1);
cmp(sp1, sp3); // error, doesn't compile
cmp(wp1, sp1);
cmp(wp1, wp1); // error, doesn't compile
最初の例は、owner_less<shared_ptr<void>>を使うことで解決できるが、単純にそれだけを使ってもコンパイルが通らない。なぜならば、sp1はshared_ptr<void>にもweak_ptr<void>にも変換可能だからだ。そのため、明示的に変換してやらなければならない。
owner_less<shared_ptr<void>> cmpv;
cmpv(shared_ptr<void>(sp1), sp2);
これは冗長でわかりにくいだけではなく、一時オブジェクトを作り出し、参照カウンターを増減させる。
shared_ptr::owner_beforeとweak_ptr::owner_beforeはどちらもshared_ptr<A>とweak_ptr<B>といった異なる型同士での比較を許しているのに、owner_lessは無用の制限をかけている。
owner_lessを改良して、上のコードが全てコンパイルが通るようにする提案。
[PDF] P0075R0: Template Library for Index-Based Loops
インデックスベースループの並列版をライブラリとしてParallelism TSに付け加える提案。
void ( int * p1, int * p2, std::size_t size )
{
std::for_loop( std::seq, 0, size,
[&]( auto i )
{
p1[i] = p2[i] ;
}
) ;
}
このコードは以下のように書くのと同等だ。
void ( int * p1, int * p2, std::size_t size )
{
for ( std::size_t i = 0 ; i != size ; ++i )
{
p1[i] = p2[i] ;
}
}
他のParalellism TSのアルゴリズムのように、std::secをstd::parに変更すると、並列実行版にある。
for_loop_stridedは、インクリメントの刻み幅を設定できる。
for_loop_strided( std::par, 0, 100, 2, []( auto i ) { } ) ;
iは0, 2, 4, 6とインクリメントされていく。
提案はfor_loopとともに使えるreductionとinductionをサポートしている。
reductionはOpenMPの文法を参考に、純粋にライブラリベースで使えるように設計されている。
float dot_saxpy(int n, float a, float x[], float y[]) {
float s = 0;
for_loop( par, 0, n,
reduction(s,0.0f,std::plus<float>()),
[&](int i, float& s_) {
y[i] += a*x[i];
s_ += y[i]*y[i];
});
return s;
}
reductionは、reduction( var, identity, op )のように使う。それぞれ、reductionの結果をうけとるlvalue, reduction操作のためのidentity value, reduction操作となる。
reductionの個別のsのコピーはfor_loopの関数オブジェクトに追加の引数として与えられる。for_loopはvariadic templatesを利用していて、reductionやinductionを受け取れるようになっている。最後の実引数が関数オブジェクトとなる。
ループのイテレーションごとに異なる可能性のあるsのコピーが渡され、それに対してreduction操作、最後にすべてのsのコピーがsに対してreduction操作が行われる。結果として、以下のコードを実行したのと同じ結果(ただしシーケンスとreductionの順序の制約がゆるい)が得られる。
float serial_dot_saxpy (int n, float a, float x[], float y[]) {
float s = 0;
for( int i=0; i<n; ++i ) {
y[i] += a*x[i];
s += y[i]*y[i];
}
return s;
}
簡便化のために、identitiy valueがreduction操作に合わせてT()やT(1)など無難なものになった上に、reduction操作も固定されている、reduction_plusなどが用意されている。上記の例は、reduction_plus( s ) と書くこともできる。
inductionもreductionと同じように指定する。
float* zipper(int n, float* x, float *y, float *z) {
for_loop( par, 0, n,
induction(x),
induction(y),
induction(z,2),
[&](int i, float* x_, float* y_, float* z_) {
*z_++ = *x_++;
*z_++ = *y_++;
});
return z;
}
この分野の知識が乏しいのでinductionの意味がよくわからない。以下のコードとシリアル実行という点を除いては同じ意味になるようだが、単にlambda式でキャプチャーしてはダメなのだろうか。
float* zipper(int n, float* x, float *y, float *z) {
for( int i=0; i<n; ++i ) {
*z++ = *x++;
*z++ = *y++;
}
return z;
}
[PDF] P0076R0: Vector and Wavefront Policies
Parallelism TS(STLのアルゴリズムに並列実行版のオーバーロードを追加する規格)に、新しい実行ポリシーとしてvecとunseqを追加する提案。
unseqはseqより実行時特性の制約がゆるいが、実行は単一のOSスレッド上に限定される。vecはシーケンスの制約がunseqより強い。vecはSIMDなどのベクトル演算を想定している。
P0077R0: is_callable, the missing INVOKE related trait
指定した型が指定した実引数型で呼び出して指定した戻り値の型を返すかどうかを調べられる、is_callable traitsの提案。
template <class, class R = void> struct is_callable; // not defined
template <class Fn, class... ArgTypes, class R>
struct is_callable<Fn(ArgTypes...), R>;
template <class, class R = void> struct is_nothrow_callable; // not defined
template <class Fn, class... ArgTypes, class R>
struct is_nothrow_callable<Fn(ArgTypes...), R>;
以下のように使う。
void f( int, double ) ;
constexpr bool b = std::is_callable< f ( int, double ), void >::value ; // true
is_callable< Fn( args ... ), R >は、INVOKE( declval<Fn>(), declval<args>()..., R )が合法かどうかを返す。
上記の条件に加えて、無例外保証も調べるis_nothrow_callableもある、
[PDF] P0078R0: The [[pure]] attribute
[[pure]]属性を追加する提案。
[[pure]]属性は関数に指定することができる。指定された関数はpureとなる。pure関数には様々な制約がある。
pure関数は、与えられた入力に対して出力を返す。同じ入力が与えられた場合、必ず同じ出力を返す。副作用を発生させてはならない。戻り値の型がvoidであってはならない(純粋に数学的な関数は常に戻り値を返す)
現在の文面案は以下の通り。
関数fがpureである場合、数学的な関数を実現している。すなわち、(a) 同じ値の実引数に対して、fは常に同じ答えを返す。(b) fはクライアントコードと実引数リストと戻り値のみを使ってやり取りする。(c) 常に呼び出し元に戻る。(d) fはその実行外において観測可能な副作用を発生させない。関数gの本体の中の文Sがpureである場合、Sが実行されたならば、pure gの挙動から外れた挙動を示してはならない。pure関数、あるいは文の反対は、impureである。すべての関数と文は、pureであると指定されない限り、impureとなる。
[ 例:関数fは、以下の場合、pureではない。
- 実引数が値で渡されていない
- グローバルメモリへの読み書きアクセス
- 戻り値の型がvoid
- impure関数を呼び出す
-
呼び出し元や他のスレッドがfによる変更を感知できること、たとえば、
- 関数にローカルではない変数やデータ構造に依存するか書き変える
- 動的にメモリーを確保する
- 例外をcatchしないで外に投げる
pure関数には様々な利点がある。pure関数を使った式は除去したりmemoizationにより簡易化できる。同期やスレッドセーフ、コード順序の変更も大胆に行えるので、最適化の余地が広がる。pure関数はテストしやすい。
pure関数には問題もある。副作用を発生させることができないので、I/Oや動的メモリ確保ができないし、impure関数を呼び出すこともできない。コンパイラーはpure指定された関数はpureであるという前提のもとコード生成を行うので、pure関数に副作用を発生させるバグがある場合、不可思議な挙動を示し、特定が困難になるかもしれない。
論文は既存のプログラミング言語におけるpure関数の実装例も紹介しているので興味のある人は読むと良い。
P0079R0: Extension methods in C++
統一感数記法に変わる軽量な拡張メソッドの提案。
統一感数記法は、メンバー関数呼び出しとフリー関数呼び出しの文法を統一し、どちらで呼び出しても良いようにするものであった。
struct A { } ;
void foo( A & ) ;
struct B { void foo() ; }
int main()
{
A a ;
a.foo() ; // OK
B b ;
foo(b) ; // OK
}
目的としては、ジェネリックなコードで、型によってメンバー関数とフリー関数によって呼び出す文法を変えなければならないのは面倒なので、どちらで呼び出してもコンパイラーが勝手に変換してくれるようにしようというものだ。
しかし、この機能はあまりにも大きすぎる変更なので、既存のコードに問題を引き起こす恐れがある。そこで、この提案では、もう少し軽量な、明示的なopt-inが必要となる機能、拡張メソッドを提案している。
拡張メソッドは、フリー関数で、第一引数として明示的なthisポインターを取る。仮引数名は必ずthisとする。
struct A { } ;
// 拡張メソッド
void foo( A * this, int ) ;
int main()
{
A a ;
a.foo( 0 ) ; // OK
}
オーバーロード解決では、メンバー関数と拡張メソッドでは、メンバー関数のほうが優先される。
struct A
{
void f() ;
} ;
void f( A * this ) ;
int main()
{
A a ;
a.f() ; // メンバー関数
}
拡張メソッドは、アクセス指定においては特別扱いされない。
struct A
{
private :
int x ;
} ;
void f( A * this )
{
this->x ; // エラー
}
コンセプトと組み合わせることで、メンバー関数を持っている場合のみ呼び出す拡張メソッドが書ける。
template < typename T >
concept bool has_foo()
{
return requires( T & t )
{
{ t.foo() } -> void ;
} ;
}
void foo( has_foo * this )
{
this->foo() ;
}
C#にある拡張メソッドを参考にしているらしい。
なんだか素朴な案だ。
ドワンゴ広告
ドワンゴは本物のC++プログラマーを募集しています。
CC BY-ND 4.0: Creative Commons — Attribution-NoDerivatives 4.0 International — CC BY-ND 4.0
パラレリズムの数字のインクリメンター(?)は関数を取ったほうがいいんじゃないですか?
ReplyDelete固定値でインクリメントされると必ず不整合が出るのでインクリメント関数オブジェクトを持たせた方が汎用的な気がします。
ちょっとゴツイですか?
他の言語に倣ってワンライナーのラムダが書ければだいぶん違うかもですけど。構文糖入れるのモナー。
それと、関数チェインがなんか迷走してますね。
すごいダッサイライブラリを妄想してるんですが、
まぁ、チェインできればうまいところに落としてほしいと思います。
案はシンプルなほうがいいですよ。
書くところがないので一応ここに勝手にメモさせてもらう。
ReplyDeleteC++標準の方法で型が桁あふれしたかどうかってわからないですよね?
CPUは大体キャリーフラグ持ってると思うのですが、それを参照するにはASMをいじるしか方法はないのでしょうか。
型を目いっぱい使いたい時に不便しているのでなんか解決策ないですかね。
s/統一感数記法/統一関数記法/
ReplyDeletepure関数についてですが、pure関数ならば必ずnoexceptな関数ってことですよね?
その場合noexcept式はどういう結果を返すんでしょう?暗黙にnoexceptがつくのでしょうか?