Top Diff List Source Search Help PDF RSS Login

No.207

 ADCからのお知らせ No.207 (2011/10/04)

NFS領域のファイル情報不整合問題について

天文データセンター解析システムのユーザーの皆様

7月18日に NFS領域において、長時間にわたってファイル情報の不整合が
 発生したとの報告があり、調査を行ってまいりました。その現状および
 対処方法などについてご連絡いたします。


 [現象]
  NFS領域にて、ファイル情報 (md5 や ctime など)に不整合が発生し、
  その状態が長時間継続していたことが報告されました。

 具体的には、/lfs04c 領域にあるファイルに対して、ana09 と ana11
  から "md5sum" や " ls -alc" を実行した場合に、返ってくる結果が
  異なるという現象が発生し、それが14分間ほど継続しました。


 [現象についての解説]
  NFS サーバ/クライアント環境において、特定のオプションを指定して
  いない場合は、NFS上のファイル情報は NFSクライアント上にある
  キャッシュを参照して取得します。
  そのため、キャッシュの更新タイミングによっては、最新のファイル
  情報を参照出来ず、NFS クライアント間でファイル情報の整合性が、
  短時間(60秒)取れなくなる場合があります。

 しかし、今回のように長時間にわたってファイル情報に不整合が発生する
  問題は、不具合として Red Hatコミュニティで認識されています。ただし、
  その発生自体が稀であり、現状では原因や再現方法が判明していません。


 [対処方法]
  上記のように再現方法が判明していないので、近いうちに解決方法が
  RedHat から提示されることは期待できません。したがって、ここでは
  同問題が発生した際の対処方法について説明いたします。

 #前述の特定のオプション("noac" オプション)を指定することで、
    同問題を回避できることは確認していますが、それをしてしまうと、
    NFS領域の read/write 性能が大幅に低下してしまうので、その
    対応はとりません。

 現状の設定において同現象が発生した場合、回避策として touch
  コマンド等でディレクトリ情報を更新することで、キャッシュが
  最新の情報に更新されます。具体的には以下の通りです。

 (1) 事象が発生しているサーバ上で、該当ディレクトリに任意の
    ファイルを作成する。
    (例)
    % touch /該当ディレクトリ/test

 (2) その後、"ls -l /該当ディレクトリ" を実行すれば、
    該当ディレクトリの情報を再度サーバへ問い合わせるため
    キャッシュが更新され最新の情報になる。


ユーザの皆様にはご不便をおかけしますが、
 ご理解ご協力をお願いいたします。

また、何か不具合等を感じましたら、consult[ at ]adc.nao.ac.jp
 までご連絡ください([ at ] を@に変換)。