2011/10/26

大規模データの分散処理を実現するHadoopはクラウドでこそ生きる?

http://cloud.watch.impress.co.jp/docs/column/cloud/20111026_486181.html

最近、注目をされているのがビッグデータを処理するHadoopだ。米国で開催されたMicrosoftのデータベースSQL Serverのユーザーカンファレンス「PASS Summit」では、HadoopをWindows ServerやWindows Azureに対応させると発表しているし、OracleもHadoopベースのアプライアンス「Oracle Big Data Appliance」を発表するなど、業界での関心はますます高まっている。 ...中略...

■Hadoopって何?
Hadoopは、もともとGoogleが検索エンジン用に開発したバッチ処理システムだった。このシステムでは、数千ものノードで、ペタバイトクラスのデータが処理できる。ただ、Googleは、Hadoopのコードをオープンにしたのではなく、自社の検索システムを紹介する論文中で、 データ処理のMapReduce、分散ファイルシステムのGoogle File Systemが解説していた。
この論文を見た米Yahoo!のエンジニアが、Yahoo!社内で利用するシステムとしてHadoopの開発を始め、その後コードを公開 した。現在、Hadoopは、Apache Software Foundationに移管され、オープンソースソフトとしてメンテナンスされている。...

クラウド Watch -
大規模データの分散処理を実現するHadoopはクラウドでこそ生きる?

シェアする

Twitter Delicious Facebook Digg Stumbleupon Favorites More