中～大規模シェルスクリプトのためのメンテナンス性の高いディレクトリ構造

シェルスクリプトで高い移植性と生産性を両立させるシリーズタイトル第一弾なぜシェルスクリプトはPOSIXに準拠しても環境依存が激しいのか？第二弾高い移植性と生産性を両立するソフトウェアを書くのに必要な知識と考え方【第三弾】中〜大規模シェルスクリプトのためのメンテナンス性の高いディレクトリ構造第四弾互換性問題を解決し生産性を向上させるシェルスクリプトのデザインパターン第五弾（タイトル未定）はじめにシェルスクリプトである程度の規模のプロジェクトを作ろうとした時、メンテナンス性を向上させるために複数のファイルに分割することを考えると思います。しかし具体的なディレクトリ構造を解説した記事はあまりありません。この記事では複数のファイルで構成されるシェルスクリプトプロジェクトのためのディレクトリ構造を解説します。この記事で紹介するディレクトリ構造は FHS - Filesystem Hierarchy Standard に準拠しており、/usr または /usr/local ディレクトリ以下にインストールしやすい形にしています。 1. 共通ライブラリ例えばプロジェクト（project）の中に複数のコマンド（prog1、prog2）があり、共通処理が common.sh で定義されているものとします。このような場合は次のようなディレクトリ構造にします。（コマンドが一つだけでもメンテナンス性やテスト容易性や再利用のためにライブラリファイルを使うこと良い設計です。） project ├── bin │ ├── prog1 │ └── prog2 └── lib/project └── common.sh bin/prog1 #!/bin/sh set -eu basedir="$(cd -- "$(dirname -- "$0")/.." && pwd)" libdir="$basedir/lib/project" . "$libdir/common.sh" func # common.sh で定義されているコマンドが bin ディレクトリ以下に直接配置されているのに対してライブラリが lib/project 以下となっている理由は /usr ディレクトリにインストールしたときに bin ディレクトリのコマンドは PATH を通すことでコマンド名だけで実行できるようにするものに対して、ライブラリは project ディレクトリがないと他のプロジェクトと名前がかぶってしまう可能性があるからです。（もちろんコマンドも既存のコマンドとかぶらない名前にする必要があります。）補足ですが、実行可能ファイル名は prog1 のように拡張子なしにするのがベストです。なぜならコマンドは必ずしもシェルスクリプトで実装する必要はないからです。もし実装を他の言語に変更した場合にそれだけで拡張子が変わってしまうのはおかしな話です。例えば Debian では which コマンドはシェルスクリプトで実装されていますが macOS ではバイナリ形式です。しかしどの言語で実装されているかなんて気にしませんよね？実装を隠蔽するために実行可能ファイルには拡張子をつけません。（もちろん個人的に作ったシェルスクリプトであれば自由につけても構いません。）一方ライブラリに関しては拡張子をつけます。ライブラリは言語ごとに異なるものであるため、どの言語用のライブラリであるかがわかることは重要なことだからです。例えば gettext という多言語化ライブラリがありますが、シェルスクリプト用は gettext.sh です。同様に Python では gettext.py、Ruby では gettext.rb という名前が使用されているようです。 2. 単一のコマンドで受け取る上記のコードの問題点は prog1、prog2 の両方に同じコードが含まれてしまうというところです。行数は少ないのでこれぐらい許容範囲かもしれませんが例えば共通の初期化処理を行いたいなどの理由で共通のコードが増える場合があります。メンテナンス性を上げるために重複コードを減らすのは一般的な考え方です。そこで全てのコマンドを一つのコマンド（下記の libexec/prog）で受け取ってコマンド名で区別することで処理を分岐させるようにします。ウェブアプリケーションでは単一の index.php で全てのアクセスを受け取りルーティングによってそれぞれのモジュールに処理を分岐させる PoEAA のフロントコントローラーパターンがよく使われます。これはそのシェルスクリプト版実装といったところです。まず bin 以下のコマンドをシンボリックリンクにして全てのコマンドから共通の libexec/project/prog を呼び出します。そして libexec/project/prog はコマンド名を元に適切なモジュールを呼び出します。ちなみに libexec は内部で使用する補助コマンドを配置するために使われるディレクトリです。 project ├── bin │ ├── prog1 -> ../libexec/project/prog │ └── prog2 -> ../libexec/project/prog ├── lib/project │ ├── prog1.sh │ ├── prog2.sh │ └── common.sh └── libexec/project └── prog libexec/project/prog #!/bin/sh set -eu BASEDIR="$(cd -- "$(dirname -- "$0")/.." && pwd)" LIBDIR="$BASEDIR/lib/project" . "$LIBDIR/${0##*/}.sh" lib/project/prog1.sh . "$LIBDIR/common.sh" func # common.sh で定義されている前のコードと違い BASEDIR と LIBDIR を大文字にしているのはファイルをまたがって使用することを想定している変数だからです。 3. サブコマンドにするもう一つの解決方法は prog1、prog2 のような個別のスクリプトにするのではなくサブコマンドとして実装する方法です。サブコマンドを利用すると受け取るスクリプトが一つになるので前項のフロントコントローラーパターンを使わなくても自然な形で実装することが出来ます。一つのプロジェクトで多数のコマンドを提供する場合、既存のコマンドとかぶらないようにするのが大変で覚えにくいコマンドが多数出来てしまうことになるので、個別のコマンドではなくサブコマンドを使って実装することを検討した方が良いでしょう。 project ├── bin │ └── prog └── lib/project ├── cmd1.sh ├── cmd2.sh └── common.sh bin/prog #!/bin/sh set -eu BASEDIR="$(cd -- "$(dirname -- "$0")/.." && pwd)" LIBDIR="$BASEDIR/lib/project" . "$LIBDIR/$1.sh" lib/project/cmd1.sh . "$LIBDIR/common.sh" func # common.sh で定義されている 4. サブコマンドを補助コマンドにするサブコマンドを補助コマンドにする理由はサブコマンドの独立性を上げるためです。それにより拡張性やメンテナンス性が上がります。デメリットはサブコマンドが独立したプログラムになるためシェルに関する初期化処理（シェルオプションの設定など）を prog にまとめることができなくなることです。prog では環境変数に関する初期化処理とサブコマンドまでのオプションの解析処理だけを行うようにします。またサブコマンドを補助コマンドにすることでシェルスクリプト以外で記述することも可能となります。プラグインのような仕組みを追加すればユーザーが独自のサブコマンドを定義することも可能になります。例えば git や docker はそのような仕組みを備えています。補助コマンドには prog-cmd1 のようにサブコマンド名にコマンド名をプリフィックスとしてつけた名前がよく使われます。 project ├── bin │ └── prog ├── lib/project │ └── common.sh └── libexec/project ├── prog-cmd1 └── prog-cmd2 bin/prog #!/bin/sh set -eu export BASEDIR="$(cd -- "$(dirname -- "$0")/.." && pwd)" export LIBDIR="$BASEDIR/lib/project" export PATH="$BASEDIR/libexec/project:$PATH" exec "prog-$1" libexec/project/prog-cmd1 #!/bin/sh set -eu # 再度初期化処理が必要 . "$LIBDIR/common.sh" func # common.sh で定義されている BASEDIR 等の変数を export しているのは補助コマンドから参照できるようにするためです。また libexec を PATH に追加することで内部で補助コマンド名だけで実行できるようにしています。補助コマンドの呼び出し時に exec を使用しているのは、補助コマンドの処理が終わった後に戻ってくる必要がないからです。もし終了処理を行うなどの理由で戻る必要がある場合は exec を削除してください。余談ですが実は . コマンドは PATH が通ったディレクトリからも読み込むことが出来るので lib/projet を PATH に追加しておくと . command.sh だけでライブラリファイルも読み込むことが出来ます。例えば gettext.sh はこのような使い方を想定しており、Ubuntu では /usr/bin/gettext.sh というパスにインストールされます。ちなみに gettext.sh を . を使わずに直接実行すると . コマンドで読み込めという使い方が出力されます。 $ gettext.sh GNU gettext shell script function library version 0.21 Usage: . gettext.sh 応用シンボリックリンクから実行可能にする実は今までのコードには少し問題がありコマンドをシンボリックリンク経由で実行した場合にうまく動きません。/usr や /usr/local ディレクトリインストールしたり、プロジェクトディレクトリの bin を環境変数 PATH に追加すれば問題なく動作するのですがシンボリックリンクからも実行できると便利です。以下は /opt/project 以下にインストールして $HOME/bin/prog に作成したシンボリックリンクから起動する場合の例です。シンボリックリンク経由だと動かない理由は以下の例で $HOME/bin/prog を実行すると、シンボリックリンクファイルを基準にしてパスを参照するので、存在しない $HOME/lib/common.sh を読み込もうとしてしまうからです。 $HOME └── bin └── prog -> /opt/project/bin/prog /opt/project ├── bin │ └── prog └── lib/project └── common.sh readlink -f を使うこの問題を解決するには prog が実際にどのディレクトリにあるのかシンボリックリンクの実体のパスを取得する必要があります。そのためによく使われるのが readlink コマンドです。 bin/prog #!/bin/sh set -eu self=$(readlink -f "$0") libdir=${self%/*/*}/lib/project . "$libdir/common.sh" func # common.sh で定義されているシンボリックリンクのシンボリックリンクのシンボリックリンク・・・とネストする可能性があるので再帰したシンボリックリンクを全て解決する -f オプションが必要です。 readlinkf を使うしかしこの readlink コマンドは移植性がありません。POSIX でも規定されておらず -f オプションがサポートされてない環境（macOS 等）や readlink コマンドそのものがインストールされていない環境があります。そういう環境に対応する場合に readlink -f 相当の処理を POSIX 準拠のコマンドだけで実装した readlinkf を作成しています。GNU版の readlink -f と互換性があり入れ替えて使うことが出来ます。シェル関数としてソースコードの形で提供しているので必要な部分をコピーして使用してください。ライセンスは CC0 にしているのでどのようなプロジェクトにも使うことが出来ます。CC0 は権利の放棄であり著作権表記なども不要です。例 bin/prog #!/bin/sh set -eu readlinkf() { [ "${1:-}" ] || return 1 max_symlinks=40 CDPATH='' # to avoid changing to an unexpected directory target=$1 [ -e "${target%/}" ] || target=${1%"${1##*[!/]}"} # trim trailing slashes [ -d "${target:-/}" ] && target="$target/" cd -P . 2>/dev/null || return 1 while [ "$max_symlinks" -ge 0 ] && max_symlinks=$((max_symlinks - 1)); do if [ ! "$target" = "${target%/*}" ]; then case $target in /*) cd -P "${target%/*}/" 2>/dev/null || break ;; *) cd -P "./${target%/*}" 2>/dev/null || break ;; esac target=${target##*/} fi if [ ! -L "$target" ]; then target="${PWD%/}${target:+/}${target}" printf '%s\n' "${target:-/}" return 0 fi # `ls -dl` format: "%s %u %s %s %u %s %s -> %s\n", # <file mode>, <number of links>, <owner name>, <group name>, # <size>, <date and time>, <pathname of link>, <contents of link> # https://pubs.opengroup.org/onlinepubs/9699919799/utilities/ls.html link=$(ls -dl -- "$target" 2>/dev/null) || break target=${link#*" $target -> "} done return 1 } self=$(readlinkf "$0") libdir=${self%/*/*}/lib/project . "$libdir/common.sh" func # common.sh で定義されている応用サブコマンドのオプション解析サブコマンドを作る場合オプションの解析に工夫が必要です。具体的な解析コードは長くなるので省略しますが、おすすめの方法はオプション解析を 2 回に分けて行う方法です。例えば次のようなオプションを解析することを考えます。 prog --global cmd1 --option arg1 arg2 サブコマンド（cmd1）を堺にして左側がグローバルオプション、右側がサブコマンドのオプションと引数です。この時 prog で解析するのは cmd1 が登場する所までです。残りの引数は prog-cmd1 にそのまま渡して prog-cmd1 側で解析を行います。prog で解析したオプションの結果は環境変数に代入しておき prog-cmd1 に引き継ぎます。これを応用すればオプション解析を 3 回行うことでサブサブコマンドに対応することも出来ます。 prog --global cmd1 --option arg1 arg2 # prog で解析するのは↑ここまで ↑残りは prog-cmd1 で解析するこの処理を行うためにはオプション解析をサブコマンドが見つかった所で打ち切る必要があります。getopts や独自のオプション解析コードであればサブコマンドが登場したときに引数解析のループを打ち切るのは簡単ですが GNU 版の getopt を使う場合は注意が必要です。GNU 版の getopt はデフォルトではオプションではない引数の後にオプションを書いても解析されてしまうからです。引数の後にオプションが指定できるようになるため一般には便利な機能なのですが、サブコマンドを使う場合は、サブコマンドの後にあるオプションまで解析されてしまうためエラーになってしまいます。 getopt -o 'g' -l global -- "$@" # ↑ で -g --global cmd1 arg1 arg2 --option という引数を解析すると # getopt: unrecognized option `--option' というエラーが出てしまうこれを回避するにはショートオプションの文字列の前に + を追加します。 getopt -o '+g' -l global -- -g --global cmd1 arg1 arg2 --option # -g --global -- 'cmd1' 'arg1' 'arg2' '--option' この機能の詳細については GNU getopt の SCANNING MODES を参照してください。しかしながら getoptは移植性がなく getopts はロングオプションに対応しておらず、独自のオプション解析コードを書くのも大変なので getoptions を使うのをお勧めします。getoptions は既存の問題をすべて解決しており、サブコマンドにも対応しています。さいごにシェルスクリプトで中規模以上のソフトウェアを作ること例はあまりないからか、このような情報があまりないのでまとめてみました。シェルスクリプトではコードが大きくなっても一つのファイルにそのまま書いてしまいがちになる人が多いように思えます。そんな事をするとメンテナンス性は大きく下がってしまいます。シェルスクリプトでも他の言語と考え方は同じです。大きくなったら小さなファイルに分ける。それだけです。小さいままであればメンテナンス性が下がることはありません。シェルスクリプトが大きくなってメンテナンスが大変になるのはシェルスクリプト自体の問題ではなく正しいプログラミング手法を知らないからです。

中～大規模シェルスクリプトのためのメンテナンス性の高いディレクトリ構造

Trending Articles

和歌山市でマンションの部屋全焼

更新プログラムがインストールされません

井上貴博アナウンサー彼女や結婚の噂は？実家や親が話題？人気は？

宇宙運命数「８」　はくちょう座

カラオケ鉄板ネタになるの間違いなし「大塚愛から福原愛」って何！？

2016年1月22日号　山口銀行（1月4日付）

人気占い師・Sakkoが占う！今日のアナタの運勢と、ラッキーカラーは・・・

サキュバス戦記　攻略

この記事は表示できません

【ネタバレ感想】「7人目のスタンド使い」その18

上海問屋、7色に切り替えられるアイソレーションキーボード

【変更対戦カードのお知らせ】7.23『アマチュア全日本選手権大会』

Microsoft、最も議論を呼んだWindows 11のタスクバーの問題を修正中

野口興業（弘道会/山口組）

エンタープライズモードの設定方法について

【ディズニーランドパリ】日本にないオススメアトラクション13選【ウォルトディズニースタジオ】

サマータイムレンダ01

Article 2

【世界大学ランキング】第１位にジュリアード音楽院とウィーン国立音大、日本勢は？

株式会社アルテカ　代表　野村紘一