題名 | PLATON: 超分散環境におけるデータ共有のためのP2P多次元範囲検索システム |
著者 | *中台 慎二, 谷口 邦弘 (NEC インターネットシステム研究所) |
Page | pp. 173 - 184 |
Keyword | P2P, DHT, 空間充填曲線, 分布関数, de Bruijn |
Abstract | 実世界から得られるデータを利用して、ユーザに多様な付加価値を提供するユビキタス社会を実現するには、これを支えるデータ共有基盤に、汎用な検索機能とスケーラビリティが求められる。ここでの汎用な検索機能とは、文字列の前方一致検索や数値の範囲検索など、多様なアプリケーションが汎用に利用可能な検索式を提供する機能である。また、スケーラビリティとは、データを収集するセンサー、データを利用するユーザ、および共有されるデータの数が増加しても、システム負荷や検索性能が劣化しないことである。この種のスケーラビリティを有すデータ共有方式として、P2Pデータ共有技術がある。
初期のP2Pデータ共有技術であるGnutellaなどは、インターネット上に分散する膨大なホスト間で膨大な情報を共有できる可能性を示した。そこでは汎用な検索機能が提供されていたが、問題点としてネットワーク利用の非効率性と検索の不完全性、すなわち格納したデータが確実には検索できないという問題があった。一方、Chord, CAN, Pastry, Tapestry, Koordeといった先駆的研究で注目されているDHTは、スケーラブルにデータ欠落のない検索を可能とするが、完全一致検索しかサポートされない。
これに対しMAANやSENSといった先行研究は、それぞれChordやCANを、多次元属性に対する範囲検索が可能なようにデータのID算出方法を拡張した。具体的には、ChordやCANではHash関数を用いてデータのIDを算出するが、ここに各属性の分布関数を用いる。このように算出されたデータIDは均一性が保たれるだけでなく、属性値の連続性も保持されるため範囲検索が可能となる。
しかしながら、これら従来の分布関数を用いたID算出方式では、多次元属性値をID空間に写像する際に問題があった。MAANでは、多次元属性を構成する各属性値を個別にChord一次元ID空間に写像するため、テーブルに対して複数の単一インデックスが設定されている状態と同様、多次元属性値の分布を考慮した効率的な検索を行うことができない。具体的には検索時に、多次元検索式を構成する各属性について、その属性の分布関数を用いて検索条件の範囲をID範囲に変換する。そして、それらのID範囲の中から最も狭いID範囲を選択し、この範囲に到達するようにメッセージ転送を行う。このため、本来必要な多次元検索式を満たす集合要素数に比べてより大きな集合にメッセージ転送をする必要があり、効率的でない。一方、SENSでは、多次元属性の各属性値をCAN多次元ID空間に写像するため、データの均一配置に問題がある。具体的には、データ登録時に各属性の分布関数を用いて多次元IDを算出するが、この関数には多次元属性値の分布情報は含まれていないため、データが密に存在しない値域に対しても広いID空間が割り当てられてしまう。
スケーラビリティの観点では、いずれの技術にも一長一短がある。MAANがベースとするChordはO(logN)の次数でO(logN)ホップ数を実現する。これはピア数の増加に伴って、ホップ数は飽和するものの、ピア数が少ない状態からルーティングテーブルの管理負荷が大きいことを意味する。一方で、SENSがベースとするCANでは、次元数をdとしてO(d)の次数でO(dN1/d)ホップ数を実現する。すなわち、dを小さく設定した際には、ピア数に寄らずにルーティングテーブルの管理負荷は小さいものの、ピア数が増加するに従いホップ数が飽和しにくい。dを大きく設定した際には、ホップ数は飽和しやすいもののルーティングテーブルの管理負荷が大きくなる。
本提案システムPLATON (Planetary-scale Table on Overlay Network)は、これらの多次元属性の範囲検索に関する課題を解決する。すなわち、メッセージ転送負荷としては、多次元検索式を満たす値の集合と対応するピアにのみメッセージを転送するため、負荷が低く効率的である。データ配置の均一性としては、多次元属性値の分布に歪みがある場合でも均一にデータを配置することが可能となる。さらに、スケーラビリティとしてはO(logN)の次数でO(logN)のホップ数を実現する範囲検索方式に加えて、O(1)の次数でO(logN)のホップ数を実現する範囲検索も実現する。このことは、ピア数が増加してもルーティングテーブルの管理負荷は小さく、なおかつホップ数が飽和することを意味する。これらの提案方式は、検索式の入力として簡易SQL言語を持つシステムとして実装し、その効果検証を行った。 |
題名 | アプリケーション層マルチキャストプロトコルの設計開発および性能評価を支援するミドルウェアの設計と実装 |
著者 | *池田 和史, Thilmee, M. Baduge, 梅津 高朗, 山口 弘純, 東野 輝夫 (大阪大学大学院情報科学研究科) |
Page | pp. 185 - 193 |
Keyword | アプリケーション層マルチキャスト, ミドルウェア, PLanetLab, 設計開発, 性能評価 |
Abstract | 本稿では,アプリケ−ション層マルチキャスト(ALM)プロトコルの設計開発および性能評価を支援するためのミドルウェアを提案する.我々は既存のALMプロトコルを詳しく分析,そのオーバレイトポロジや制御方式によりそれらを分類し,共通に利用できる汎用的な機能を抽出し,提案ミドルウェアに実装した.提案ミドルウェアはトポロジ管理機能,通信支援機能,ALMプロトコル設計支援機能,性能評価支援機能などを提供することで,ALMプロトコルの開発および性能評価に必要な時間と労力を大幅に削減する.我々はミドルウェアの提供するこれらの機能を用いて,既存の著名なALMプロトコルであるALMI,NARADA,NICE,OMNIを実装し,実環境として世界中に配置されているサーバからなる実験用テストベットであるPlanetLab上で,これらのALMプロトコルの性能比較評価実験を行った.これらの実験を通して,提案ミドルウェアを利用することで,ALMプロトコルの実装にかかる労力が大幅に削減され,実環境での様々な性能評価試験を容易に行うことができることを確認した. |