はじめに
この記事は正しく理解してないとハマりやすい set -e を正しく使う方法を解説しています。実はこの記事は前に書いた「シェルスクリプトのset -eを罠を避けて使う方法」の簡略版で前回は実際の動作を詳しく書いたのですが、内容がうまくまとまらなくて満足しておらず、私が set -e を使う時に気をつけてることを考えるともっとシンプルだよなということで新たに書き直すことにしました。普通に set -e を使うだけならこの記事の範囲の理解で十分だと思います。詳しい挙動については前回の記事を参照して下さい。
set -e とはなにか?
この記事を読むような人は知っているかと思いますが set -e とはコマンドの実行結果がエラー(= 終了ステータスが 0 以外)になった時にシェルスクリプトを自動的に中断させる機能です。自動でチェックが行われるためミスが減りコードもシンプルになるとても便利な機能ですが正しく理解する必要がある機能でもあります。一見他の言語でいう例外のような機能に見えると思いますが、シェルスクリプト独自の仕様を持っている機能であるため同じような動きだと思って使ってはいけません。
気をつけるポイント
set -e はコマンド実行後の終了ステータスによって中断処理を行います。そのため終了ステータスがいつどのように変わるか?も意識することが重要です。以下の 1. と 2. の話は実際には set -e の話ではなく終了ステータスの話です。しかし関連がありハマりやすい点なので紹介します。
1. コマンド置換の結果は変数に代入してから使う
# 間違い
echo "Hello $(get_name)."
# 正しい
name="$(get_name)"
echo "Hello ${name}."
set -e はコマンド実行時の終了ステータスを見て停止させるかどうかを判断しますが「間違い」の書き方をすると get_name がエラーになったとしても echo が実行され終了ステータスは echo の結果(つまり正常)になってしまうため停止しません。「正しい」書き方では変数への代入を行っているだけです。この場合はコマンド置換(get_name)の結果が行全体の終了ステータスとなります。また msg="$(get_greeting) $(get_name)" のような変数への代入を行っていても複数のコマンド置換を同時に実行するのも避けて下さい。最後に実行したコマンドの終了ステータスのみが意味を持ちます。
備考 コマンド置換で実行するコマンドがエラーになることはない、またはなっても良い場合は変数代入は必須ではありません。
余談 実は name="$(get_name)" のダブルクォートは必須ではありません。これはコマンド実行の引数ではないので単語分割は行われません。
2. コマンド置換が含まれる変数の代入は単独の行で行う
# 間違い
local name="$(get_name)"
# ^-^ SC2155: Declare and assign separately to avoid masking return values.
# 正しい
local name
name="$(get_name)"
補足 SC<nnnn>(n は数字)は ShellCheck を実行した時に警告される内容です。このような問題があるコードを指摘してくれるので、ぜひ導入しましょう。
実はこれは 1. と全く同じ話です。なぜなら local は echo と同じくコマンドだからです。echo name="$(get_name)" や echo "name=$(get_name)"を実行しているのと全く変わりません。同様の話は export コマンドや readonly コマンドにも当てはまります。get_name でエラーになったとしても local コマンドが実行されるためその終了ステータスで上書きされてしまいます。
備考 export VAR=123 のようにエラーにならないと断定できる場合は別々の行にする必要はありません。
他の言語を知っていると local コマンドや export コマンドは予約語だと勘違いしやすいですが、実際には変数に属性をつけるという処理を行うコマンドとして実行されます。属性付与と同時に値の代入機能があるだけです。(ちなみに値の代入機能は POSIX シェル以前の古い Bourne シェルにはなく export コマンドや readonly コマンドは本当に属性をつけるだけのコマンドでした。)シェルスクリプトの変数には型がありませんが代わりに属性をつけることが出来ます。POSIX シェルの範囲ではエクスポート属性とリードオンリー属性しかありませんが bash や ksh 等では配列属性、連想配列属性、整数属性などの型に近い属性もあり、これらの属性は typeset (declare) コマンドによって付与することが出来ます。(書き方によっては勝手に属性が付きます。)
余談ですがシェルスクリプトではほとんどのものがコマンドであり、コマンドではない単語(のうち最初の単語になるもの)は for, while, until, if, case の 5 つだけです(一部のシェルの拡張機能を除く)。これらは制御構造を実現するための予約語でそれら以外は全てコマンドです。例えば return, continue, break, shift などもシェルスクリプトではコマンド(ただし「特殊シェルビルトインコマンド - Special Built-In Utilities」というカテゴリ)として扱われています。cmd [args...] のような形式で cmd が実行されるのであれば、その cmd はコマンドなのです。
3. 条件文(&& や || を含む)と共に使うシェル関数は set -e の効果が無効になる
これが一番のハマりどころでしょう。まず以下の例を見て下さい。
set -e
if mycmd; then
echo "ok"
else
echo "error" >&2
fi
set -e をしていたとしても条件文(if / while / until)や条件演算子(&& / ||)とともに使った場合は、mycmd がエラーになったとしてもシェルスクリプトは中断されずに条件判定を行うことが出来ます。ここまではさほど違和感がない動作だと思います。
しかし mycmd がシェル関数の場合、そのシェル関数の内部すべて(間接的に呼ばれてるシェル関数も含む)で set -e が無効になります。また set -e を実行したとしても再度有効にすることは出来ません。
set -e
foo() {
set -e # 有効化出来ない
[ "a" = "b" ]
echo "foo" # 実行される
return 1
}
myfunc() {
# set -e されてないのと同じ動きになる
expr 'foobarbaz' + 2 # エラーは出力されるが停止しない
foo # 実行される
echo "myfunc" # 実行される
return 0
}
# ここならエラーで停止する
# expr 'foobarbaz' + 2
if myfunc; then
echo "ok" # こちらが実行される
else
echo "error" >&2
fi
この問題にハマらないようにするには?
a. 条件文と共に使うシェル関数は自分で判定して明示的に return する
条件文と共に使うシェル関数は set -e に頼らずに終了ステータスを自分で判定して明示的に return します。
set -e
foo() { ...; }
myfunc() {
if ! foo; then # 明示的に判定して return する
return 1 # これだと $? を保持できないので注意
fi
foo || return $? # || を使って書く場合($? を保持できる)
return 0
}
if myfunc; then
echo "ok"
else
echo "error" >&2
fi
「set -e は動きがよくわからないから使わない」という人もいますが、実は上記の書き方は set -e を使わない場合と同じです。つまり set -e を使うことで特定の場合のコードをシンプルにすることが可能になるが、動きがわからないなら今まで通り set -e を使わない場合の書き方をすれば良いので、とりあえず set -e を使っておいても問題ないということです。(set -e を使ってなおかつ動きはわからないが set -e は機能してるだろうという考えのコードはダメですが。)
b. シェル関数ではなく外部コマンドにする
set -e が無効になるのはシェル関数の内部の話なので、シェル関数にするのではなく(シェルスクリプトで実装した)外部コマンドにすることでこの問題から逃れられます。外部コマンドはまったく別のプロセスなので set -e が有効にできないようなことはありません。ただし外部コマンドはシェル関数に比べて遅いので注意が必要です。ループの中で多数の外部コマンドが呼ばれるような場合は致命的な速度低下を引き起こす場合があります。
c. シェル関数を条件文と共に使わない
シェル関数を条件文や条件演算子と共に使うから set -e が無効になるわけで、そもそも条件分岐と共に使わなければ set -e は無効になりません。そしてコードをシンプルにすることが出来ます。
set -e
foo() {
[ "a" = "b" ]
# もちろん必要ならば内部で明示的に比較して return しても構いません
# [ "a" = "b" ] && return 0
# echo "error" >&2
# return 1
}
myfunc() {
expr 'foobarbaz' + 2
foo
}
myfunc
echo "ok"
# 注意 エラーメッセージの出力はエラーが起きた場所で出力されるものとして考える
a. では明示的に判定して return すると書きましたが c. では逆に何もしません。この違いは「条件文と共に使うシェル関数なのか?」という点です。条件文と共に使う関数は、終了ステータスをエラーではなく戻り値として扱う関数であることを意味します。私はシェル関数の種類を大きく2つに分けて考えており「A. 終了ステータスをエラーとして使う関数」と「B. 終了ステータスを戻り値として使う関数」です。だいたいは A. に当てはまるのですが、ときどき B. に当てはまるものがあり、例えば引数が数字かどうかを判定する is_number 関数のようなものです。こういった関数はどんな引数を渡したとしてもエラーにならないように設計しています。
さてコードがどれだけ複雑であるかを計測する指標に循環的複雑度というものがあります。この理論の難しい話は置いといて計算するのは簡単で(関数毎に)条件分岐(if 等)とループ(for 等)の数を数えるだけです。c. では条件文を使わないので循環的複雑度の指標に照らし合わせるとコードの複雑度が下がったことを意味します。つまり set -e を有効活用にするには条件分岐を減らしてシンプルにすればいい、逆に言うと条件分岐を減らしてシンプルにすると set -e が有効活用できるというわけです。シンプル・イズ・ベスト、実によく出来ていると思いませんか?
まとめ
細かすぎる話をすればいろいろあるのですが、私が普段気をつけてるのはこれぐらいのもんです。意外と簡単と思ったのではないでしょうか? set -e を正しく使えるようになるとシェルスクリプトのコードはシンプルで安全になりますよ。
↧