2012/03/22

Windows Azureの停止を調査

InfoQ -
MicrosoftのAzureクラウドコンピューティングプラットフォームが最近、閏年バグのために、部分的なサービス停止を被った。サービスを 提供しているサーバーとソフトウェアが2月29日 00:00 USTになったら、障害が起き始めた。日付の変化が閏年を正しく考慮していないコードの欠陥を露呈した。そして追加のサーバーが配置されると、障害は Windows Azureクラウドプラットフォーム中に次々と伝搬し始めた。

では、障害の真因は何だったのか? Laing氏の説明 によると、アプリケーション仮想マシン(VM)は、このVMとホストOS間のセキュアな通信を容易にするために、転送証明書を使っている。転送証明書が生 成されると、1年間だけの寿命となるように設計されている。元々バグのあるコードは、現在の日付を取って、年フィールドに1を加えて、満了日としていた。 その結果、2012年2月29日に作成された転送証明書は、2013年2月29日が満了日になったが、これは存在しない日である。このエラーのために、新 しい転送証明書が作成できなくなり、ヒューズが燃えた。... 続きを読む

http://www.infoq.com/jp/news/2012/03/azure_outage

シェアする

Twitter Delicious Facebook Digg Stumbleupon Favorites More