(セッション表へ)

マルチメディア,分散,協調とモバイル(DICOMO2007)シンポジウム

セッション 5G  分散処理・グリッド2(DPS)
日時: 2007年7月5日(木) 10:20 - 12:30
部屋: 展望サロンB
座長: 上原 稔 (東洋大学)

5G-1 (時間: 10:20 - 10:45)
題名並列相関関係抽出実行時のIP-SAN統合型PCクラスタの特性評価
著者*原 明日香, 神坂 紀久子, 小口 正人 (お茶の水女子大学)
Pagepp. 1055 - 1058
KeywordPCクラスタ
Abstract近年,発達する情報化社会では,データの蓄積と運用が非常に重要になってきている。また,情報システムにおいて処理されるデータ量が膨大になってきている。ユーザにとって重要なデータが蓄積されているにも関わらず,使いこなせていない場合が少なくない。そこでデータマイニングの中で,膨大なデータから有益な規則や関係を抽出する相関関係抽出に注目した。相関関係抽出のためのアルゴリズムとして代表的なものに,AprioriアルゴリズムとFP-growthアルゴリズムがある。Aprioriアルゴリズムは候補アイテムセットから頻出アイテムセットを抽出するという動作を繰り返していくもので,候補アイテムセットを格納するために大容量のメモリが必要となる,何度も繰り返しデータベースをスキャンする可能性があるといった問題が生じる。それに対しFP-growthアルゴリズムは巨大なトランザクションデータベースから相関関係抽出に必要な情報をコンパクトに圧縮したデータ構造であるFP-treeを利用することにより,候補パターンを抽出することで,Aprioriアルゴリズムの問題点を解決したアルゴリズムである。しかしいずれのアルゴリズムにおいても,パラメータの条件によっては相関関係抽出における計算量,データ処理量は非常に多くなるため,並列化が不可欠となる。各ノードが独立して動作するCPU,メモリ,二次記憶を保有し,ノードが必要に応じてネットワークを介し互いに通信することで全体として並列分散処理を実現する分散メモリ型並列計算機において,各ノードに汎用のパーソナルコンピュータとネットワークを用いたものをPCクラスタという。通常PCクラスタはノード間通信を行うFront-endはLAN,ストレージアクセスを行うBack-endはSANでネットワーク接続されている。そこで本研究室では,ネットワーク構築コストと管理コストの削減を目指し,Front-endとBack-endのネットワークを同じIPネットワークに統合したIP-SAN統合型PCクラスタの実現を考え,構築した。このIP-SAN統合型PCクラスタ上で2つのアルゴリズムを実行するためにはそれらのアルゴリズムを並列化しなければならない。PCクラスタ上などの環境においてマイニング処理を実行する並列相関関係抽出の研究は多数行われている。その中でAprioriをベースとした並列相関関係抽出のためのアルゴリズムはいくつか提案されているが,本研究ではハッシュ関数を使用してAprioriを並列化するHPA(Hash Partitioned Apriori)を用い,FP-growthの並列相関関係抽出アルゴリズムはHPAを元に行われた既存研究で提案されたPFP(Parallelized FP-growth)を用いる。HPAアルゴリズムとPFPアルゴリズムをローカルデバイスを用いたPCクラスタ,IP-SAN統合型PCクラスタ,IP-SAN非統合型PCクラスタ上で実行し,実行時間を測定したところFPFアルゴリズムの方が格段に速いということ,どのPCクラスタも同程度の性能であることが分かった。しかし現状の実験環境ではPFPアルゴリズムはマイニングを行うデータ量が非常に大きい場合には処理が実行できなかったため,その原因を解明し,より大規模なデータマイニングを行う。また,実行時間だけでなく,消費メモリ量,ネットワークスループット,CPU使用率などの測定も行い,これらの結果を元にIP-SAN統合型PCクラスタの最適化を行う。

5G-2 (時間: 10:45 - 11:10)
題名教育用端末を利用したHPCクラスタシステムの省電力化手法とその評価
著者*近堂 徹 (広島大学情報メディア教育研究センター)
Pagepp. 1059 - 1064
Keywordグリッド, HPC, 省電力
Abstract近年のネットワークの高速化,パーソナルコンピュータの低価格化などにより,PCクラスタ型のコンピュータが科学技術の分野で多く利用されるようになってきている。特に大学などの研究教育機関では,大規模・数値シミュレーション計算資源への要求も多く,これらを満たすための環境を構築するために様々な試みがなされている。広島大学でも,平成17年度から教育用PC端末の遊休時間を利用し,HPC(High Performance Computing)用の計算資源として活用する環境を構築し,実運用を行っている。その一方で,多数のPCを稼動させることによる電力消費量の増加が問題となっている。これらクラスタを構成するPCは,ジョブの実行状況に関係なく常に稼動させることが必要となるため,状況によっては無駄なアイドリングが生じることになる。そのため,PCクラスタとしての計算性能を維持しつつも省電力を考慮することが望ましい。本稿では,消費電力の削減を目的とした,計算ノードのプロセス実行状況に応じたCPUクロック周波数の動的制御やハードディスクサスペンド制御を取り入れた大規模PCクラスタについて述べ,その有効性について検証する。

5G-3 (時間: 11:10 - 11:35)
題名グリッドコンピューティングにおける科学技術計算を支援するワークフローシステム
著者*増田 慎吾, 池部 実, 藤川 和利, 砂原 秀樹 (奈良先端科学技術大学院大学)
Pagepp. 1065 - 1073
Keywordグリッド, シミュレーション, ワークフロー, 試行錯誤
Abstract本論文では,試行錯誤を考慮したグリッドシステム向けワークフローシステムを提案する. グリッドシステムによるコンピュータシミュレーションは多くの科学技術の研究に用いられている.このようなシミュレーションで精度の良い結果を得るためには,複数のプログラムの連携実行や,計算の途中結果を元にパラメータを修正し,試行を繰り返す試行錯誤が有効である.グリッドシステム上で複数のプログラムを連携して実行するには,ワークフローシステムが便利であるが,試行錯誤の考慮はなされていない.そのため,ワークフローシステムを用いて試行錯誤を行うと,記述するワークフローが増大するなど,ユーザへの負荷が大きい.そこで,本論文では試行錯誤において必要な機能を整理し,試行錯誤を考慮した新たなワークフローモデルとそれに基づくワークフロー言語と実行システムの提案を行う.また,ワークフロー言語と実行システムの実装を既存システムと比較することで,本提案の有効性を示す.

5G-4 (時間: 11:35 - 12:00)
題名大型・小型計算機を用いた処理連携システムのための処理記述言語
著者*出宮 健彦 (京都大学 大学院情報学研究科), 義久 智樹, 金澤 正憲 (京都大学 学術情報メディアセンター)
Pagepp. 1074 - 1081
Keyword処理記述言語, コンパクトグリッドシステム
Abstract 近年,ネットワークを介して接続された複数の計算機を用いて処理を行うグリッドコンピューティングに対する注目が高まっている. グリッドコンピューティングを実現するためのソフトウェアとして,GLOBUSやUNICOREが開発されている.これらのミドルウェアは,小型計算機を対象としていないが,多数の機器に組み込まれている小型計算機と連携させることで,計算資源や搭載されているセンサを有効利用できる.そこで,筆者らの研究グループでは,小型計算機を用いたグリッドコンピューティングのための基盤システムとしてコンパクトグリッドシステムの提案[1]を行っている.小型計算機と大型計算機を連携させて行う処理として次のようなものが考えられる. ・ケース1:ICレコーダーのようにマイクから音声データを入力し保存可能なものがある.これに大型計算機を利用することで逐次的な文字データへの変換や,ノイズ除去などの処理能力を必要とする処理を複合的に行うことができる. ・ケース2:小型計算機にはセンサノードや,各種機器に搭載されている温度センサを有するものがある.様々な場所の小型計算機を利用して大型計算機に温度センサの値を収集し,大規模または綿密な環境のモニタリングを行う. 近年,インターネット家電のようにインターネットに接続する機器が登場してきているものの,これらにおいては大型計算機と小型計算機の処理の連携は行われていない.しかしながら,ケース1やケース2のように大型計算機と小型計算機が処理を連携することは有効であり,コンパクトグリッドクライアントのような小型計算機単体では実現しえなかった処理が可能になる.  本研究では,このコンパクトグリッドシステムを利用して,小型計算機と大型計算機との処理の連携を容易に利用できるシステム基盤として簡便な処理記述言語を用いることを提案する.処理連携のための言語に必要な要件として次のようなものが挙げられる. ・簡潔な構造で記述できること  小型計算機を用いるため,連携処理記述言語は小型計算機でも処理できる程度に簡潔である必要がある. ・大型計算機や小型計算機の連携が容易なこと  連携させるために煩雑な設定の記述を要求せず,必要な項目のみの簡潔な記述である必要がある. ・小型計算機用の命令を簡単に使用できる  小型計算機の命令にはハードウェアリソースを操作できるものもあり,それを利用できる必要がある. ・柔軟な処理命令の記述が可能  これまで,使用してきた言語や言語規則に近いまたは同等の言語を利用できる必要がある. これらの要件を満たすための言語を提案する.定義部,大型計算機処理部,小型計算機処理部,出力部の大きく4つから構成される.次に,定義部で大型計算機と小型計算機に関する必要十分な設定を記述するだけで,各処理部に記述された内容が実行される仕組みとなっているので,連携が容易という要件を満たしている.また,小型計算機処理部に記述される処理命令は小型計算機の持つ機械語と1対1で対応するようになっており,小型計算機の命令を簡単に使用できるようになっている.大型計算機処理部にはシェルスクリプトを用いることができる.提案言語は手続き型の言語ではあるが各処理部においては,逐次処理の記述が可能なように設計しており,容易かつ柔軟性の高い処理命令の記述を実現している.  応用例として,例えば,提案言語を用いて,コンパクトグリッドクライアントに接続されたコンデンサマイクから音声を入力し,大型計算機にその音声データを送信し信号処理(FFT)を行う.結果をジョブ投入した中型計算機(ジョブを投入するユーザが使用するPC)に返す.  今後はこのスクリプトを利用した処理の最適化としてジョブスケジューリング,ストリームデータの内,音声や映像などの信号を大型計算機で処理することで高品質なメディアデータの提供について考えている. [1] 義久智樹, 金澤正憲, "小型計算機を用いたグリッドコンピューティングのための情報基盤システム," in Proc SwoPP2006, July, 2006.

5G-5 (時間: 12:00 - 12:25)
題名PlanetLabを用いたXCAST6オーバレイネットワークの構築
著者*櫻井 覚 (東京大学大学院 新領域創成科学研究科), 管 文鋭 (名古屋大学大学院 情報科学研究科), 松井 大輔 (北陸先端科学技術大学院大学 情報科学研究科), 今井 祐二 (富士通研究所 ITアーキテクチャ研究部), 村本 衛一 (松下電器産業株式会社 ネットワーク開発センター), 河口 信夫 (名古屋大学大学院工学研究科電子情報システム専攻)
Pagepp. 1082 - 1088
Keywordオーバレイネットワーク, 分散, 実験環境, マルチキャスト
Abstract インターネットとその上で動作するアプリケーションやサービスの実験を行うためのテストベッド「PlanetLab」が注目されている。  これまで、新しいネットワークプログラムを実験する場合、シミュレーションソフトやネットワーク接続されたマシンが使用されてきた。しかし、実際のインターネットは規模が大きく複雑で、これらの実験環境に信頼性の限界があると同時に、導入するリスクやコストも無視できない。また、インターネットが普及し、世界中の人々がそれに依存しているため、十分な機能検証を行う前に新しいサービスを直接インターネットに導入すると、安全に機能停止できないなど、様々な問題を生じる危険性がある。  これらの問題を解決するため、世界中に分散された多数のマシンをインターネット上に配置し、実際のインターネットに近い環境で実験をするという考えが生まれた。つまり、テストベッドを現行のインターネットにオーバーレイすることである。この考え方に基づいて考案されたテストベッドプロジェクトがPlanetLabである。しかし、一組織が数百台のマシンを世界中に持つことは難しいため、PlanetLabプロジェクトでは、参加組織が数台のマシンを提供する代わりに、すべてのPlanetLabマシンを共用できるようにした。現在、PlanetLabは分散された750以上のノードを有しており、まさしく地球規模のテストベッドだと言える。この完全に管理された環境の上で、同プロジェクトに参加する研究者はこれまでは規模が小さすぎて実験できなかったような分散アプリケーションの実験をはじめ、ウイルス・ワーム対策など、これまで試験が難しかったサービスの実験を行えるようになった。  しかしながら、PlanetLab上で実験をする上で問題となるのは、カーネルに手を加えることができないということがあげられる。また、本提案をしている時点において、PlanetLabはIPv6をサポートしていない。さらに、Planetlabカーネルは、実験者毎のルーティング機能を保持していないので、XCAST6のような特別なルーティング機能の実験を行うことができないという制限がある。なお、XCAST6とはIPv6のオプションヘッダを用いてマルチキャスト転送を実現する多地点間通信方式である。また、PlanetLabは実験用のノードを提供するが、オーバレイネットワークは実験者が各自で構築する必要があり、実験に本質的に関わらない部分に時間を費すことになる。  本研究では、User Mode Linux(UML)とトンネリングを用いて、PlanetLab上でオーバレイネットワークを容易に構築が出来る手法を提案する。この手法を実現するために「Orbit」と呼ぶソフトウェアを開発した。またUMLとOrbitを用いてPlanetLab上でIPv6とXCAST6の利用を可能にした。  PlanetLab上にUMLを配置することができる。UMLカーネルを修正することが可能なので、PlanetLabのユーザランド上で修正を加えたカーネルを動かすことができる。XCAST6 enableにしたUML同士を相互接続させるため、IPv4/UDPでカプセリングしたトンネルを用いた。これにより、UMLが転送するIPv6パケットはPlanetLabノードではIPv4パケット中にカプセル化される。このようにして、IPv6をサポートしていないPlanetLab上にXCAST6のオーバレイネットワークを構築した。  Orbitではトポロジ情報を記述した設定ファイルを用いてオーバレイネットワークを構築する。ただし、実験において、トポロジーの変更がしばしば要求される。その度に、設定ファイルを記述するのは骨が折れる作業である。そこで我々は、GUI操作でだれもが簡単に規定した形式のトポロジ設定ファイルを出力できるGUIツールを開発した。ユーザは設定ファイルの記述方法やOrbitの詳しい動作を知る必要はなく、GUIで容易にネットワークトポロジを組めるようになっている。  我々は、数台のPCで閉じられたPlanetLab環境を構築できるMyPLCを利用して、Orbitを実装しその動作を確認した。また、本実装の機能検証を大規模ネットワークテストベッドであるStarBEDを用いて実施した。12台の計算機を用いて米国Abilineのバックボーン上に配置されたPlanetLab環境を構築し、Orbitの機能を検証した。OrbitはUMLを利用するため、さまざまなオーバヘッドが生じると考えた。そこでOrbitを用いて構築したXCAST6オーバレイネットワークを用いた場合と、用いない場合の二点間のファイル転送時間を比較したところ、実際にオーバヘッドが観測された。たとえば、SCPで300MBのファイルを転送した場合、Orbitを用いた場合は258秒、用いない場合では38秒かかった。  今後の課題としてOrbitの細かい性能評価と外部接続性の確保がある。細かい性能評価を行うことでOrbitがどのような実験に適しているか判断する必要がある。また、外部接続性を確保するため、一般ユーザを巻きこんだ実験環境を実現する必要がある。