題名 | ピュアP2Pネットワークにおける囮ピアを用いた検索ネットワークの制御によるファイル流通制御方式 |
著者 | *山崎 尭之 (東京農工大学大学院 技術経営研究科), 大坐畠 智, 川島 幸之助 (東京農工大学大学院 工学府情報工学専攻) |
Page | pp. 378 - 383 |
Keyword | P2P, 流出ファイル, セキュリティ, Winny |
Abstract | 1.はじめに 日本ではファイル共有ソフトWinnyによる著作権の存在するファイルの違法な流通および,ウィルスファイルの感染による情報流出が大きな社会問題となっている. 一度Winnyネットワークに流通したファイルの流通を制御するためには,Winny ネットワークに参加し内部から不適切なファイルの流通を防止することが必要である.本稿では非協力的なピアをWinny ネットワークに参加させることによって,流通するファイルの制御を行う方式を提案し,評価を行う. 2.Winny のファイル流通方式 Winnyネットワークでは“キー”と呼ばれるファイルのメタ情報をネットワーク上に流通させることでファイル流通を実現している.キーにはファイル実体をアップロードしているかまたは転送を中継しているピアのIP アドレス及びポート番号や,アップロードファイルの名前やファイルサイズなどの情報が記録されている. Winny のファイル流通方式の特徴的な点は,ピアの通信速度によってネットワークが階層化され,隣接ピア間で定期的にキーを拡散することや,ピアの検索キーワードによるクラスタリングを行うこと等から,ファイル検索クエリのフラッディングを行わずに実用的なファイル検索効率を実現している点が挙げられる. 3.提案する制御方式 本稿ではキーに含まれるタイマに着目した.タイマはキーの生存時間となっており,時間経過により値が0 となった時点(およそ25分)でキーはそれを保持しているピアから削除される.よって,Winny ネットワークにおけるファイル流通にはファイルをアップロードしているピアからの定期的なキーの拡散によるタイマが必要不可欠となっている.このことから,ファイルの1 次アップロード元からのキーの拡散を抑制することができれば,Winny ネットワークからファイルメタ情報が消滅し,アップロードファイルが検索によりネットワーク上から発見できなくなり,実質的にファイルが存在しない状況になると考えられる.そこで,ファイル流通制御機能を持ったピアをWinny ネットワークに参加させ,不適切なファイルのアップロードに加担しているピアと検索リンク,すなわち,キーの流通に関する通信を高い頻度でかつ継続的に接続させることによって,制御対象ピアからキーが他のピアに拡散することを抑制するという制御手法を提案する. 4.実験と結果 提案する制御方式の効果を評価するために提案方式をWinnyプロトコル互換ピアとして実装し,シミュレーション実験を行った.実験環境としてVMWare WorkStation5 を利用して仮想マシン55台にWinny2β7.1を動作させ,制御ピアと測定ピアをそれぞれ1台のPCに動作させた.2つの制御ピアを実行し,それぞれが制御対象ピアに対して継続して10 本のクライアント接続を行う.また,20 秒ごとにWinny コマンド10(拡散クエリ送信要求) を送信することで検索リンクを維持しつづけ,キーの拡散を抑えた. 実験中にネットワークに参加する各ピアのキーの保持状況を測定した.各ピアのファイルメタ情報の保持状況を調査する測定用ピアを実装し,ネットワーク上の全Winny ピアに対して一定間隔でWinny コマンド10(拡散クエリ送信要求) を1 個送信する事で,接続先から返答として得られるWinny コマンド13(検索クエリ) から抽出したキーを記録した.実験の結果,提案方式により,キーの流通がなくなることを確認した. また,提案制御方式によるファイル検索効率への影響についても評価を行った.測定にあたってはWinnyネットワークに対して実際にファイル検索クエリを送信し,この返答を調査する測定用ピアを実装した.測定用ピアは一定の時間間隔でWinnyネットワーク内のピアをランダムに選択してファイル検索クエリを送信し,返答を記録する.評価実験の結果,提案制御方式による制御によって,制御対象ピアのアップロードしているファイルはネットワーク上において検索しても発見できなくなることを確認した. 5.おわりに Winny ネットワークにおけるファイル流通を制御する手法として,検索リンクの制御によるキーの流通制御を行う方式を提案し,効果を示した.今後は現実のWinny ネットワークでの検証を行う予定である. |
題名 | P2Pネットワークにおけるクエリ統計情報を利用した自律分散型複製配置方式 |
著者 | *趙 勇, 渡辺 俊貴, 神崎 映光, 原 隆浩, 西尾 章治郎 (大阪大学大学院情報科学研究科マルチメディア工学専攻) |
Page | pp. 384 - 391 |
Keyword | P2P, 複製配置, データアクセス頻度, 検索成功率, 自律分散 |
Abstract | 近年,計算機の高性能化とネットワークのブロードバンド化に伴い,Peer-to-Peer(P2P)ネットワークサービスに対する注目が高まっている.P2Pネットワークサービスでは,クライアント・サーバモデルのように,サービスの提供者や利用者といった明確な区別を行わず,各端末(ピア)が両方の役割を担い,互いにサービスを提供しあう.このようなP2Pネットワークサービスは,クライアント・サーバモデルに比べ,サービス提供における負荷が分散されるため,スケーラビリティや耐障害性の面で優れているという特徴をもつ. P2Pネットワークでは,検索における負荷分散やデータの可用性向上のために,ネットワーク上の複数のピアにデータの複製を配置することが有効であり,様々な研究が行われている.ここで,各ピアが全てのデータの複製を所持すると,全てのデータアクセスが必ず成功する.しかし,実環境では,莫大な数のピアがデータを共有することが考えられるため,全てのデータの複製を保持することは現実的ではない.そのため,ピアに配置する各データの複製数に関する研究が数多く行われている.その中で,理想的な複製配置として,平方根配置モデルが挙げられる.平方根配置モデルでは,ネットワーク全体に配置する各データの複製数の比を,各データに対するアクセス頻度の平方根の比と等しくすることで,ネットワークトラフィックや検索成功率において最も良い性能が得られることを証明している.この平方根配置モデルを実現するために,筆者らの研究グループではこれまでに,データアクセス頻度を考慮した確率的な複製配置方式を提案している.この方式では,検索成功時にクエリが伝播したパス上のピアが,そのデータに対するアクセス頻度の順位を考慮して確率的に複製を配置することで,平方根配置モデルに近い数の複製をネットワーク上に配置する.しかし,この方式では,ネットワーク全体における各データへのアクセス頻度の分布が既知である環境を想定し,その環境に応じて各ピアの複製配置確率を決定するため,実環境への適用が困難である. そこで本研究では,各ピアの自律的な動作によって平方根配置モデルに近い数の複製配置を実現するために,クエリ統計情報を利用した自律分散型複製配置方式を提案する.提案方式では,各ピアが,自身が受け取ったクエリに関する情報を記録し,データごとのクエリ数を統計情報として保持する.また,統計情報を利用して,各データへのアクセス頻度を推測する.ここで,クエリの伝播には,TTLを設定したフラッディングを用いることが一般的であり,全てのピアが同じ数のクエリを受け取るとは限らない.そのため,各ピアが自身の統計情報のみを参照しても,正確なアクセス頻度を推測できない可能性がある.このことを考慮して,提案方式では,統計情報を隣接ピア間で互いに共有することで,より正確なデータへのアクセス頻度を推測する.このとき,一つのクエリを複数のピアで記録することによって起こるクエリ統計の重複を防ぐために,各ピアが,各データに対するクエリの送受信数を隣接ピアごとに記録し,重複クエリ情報として保持する. 各ピアは,全ての隣接ピアが所持する統計情報および重複クエリ情報を収集し,自身の周辺におけるより正確なデータアクセス頻度を推測する.その後,検索成功時にクエリが伝播したパス上のピアが,推測したデータアクセス頻度を基に各データに対する複製配置確率を決定する. ここで,データの検索は,アクセス頻度の高いデータに対して頻繁に行われる.そのため,これらのデータの複製が作成される機会が,アクセス頻度の低いデータより多くなる.このような環境では,各ピアにおける複製の置き換えによって,アクセス頻度の低いデータの複製数が減少し,これらのデータの発見が困難になる.そこで,提案方式では,アクセス頻度の高いデータの複製配置確率を減少させ,アクセス頻度の低いデータの複製配置確率を増加させることで,アクセス頻度の高いデータの複製が過剰に配置されることを抑え,アクセス頻度の低いデータの検索成功率を高く保つ. さらに本研究では,シミュレーション実験を行い,提案手法の有用性を評価する. |
題名 | P2Pネットワークにおけるユーザの嗜好特性を考慮した検索方法 |
著者 | *宮崎 知美, 渡辺 俊貴, 神崎 映光, 原 隆浩, 西尾 章治郎 (大阪大学 大学院情報科学研究科 マルチメディア工学専攻) |
Page | pp. 392 - 399 |
Keyword | P2P, 検索 |
Abstract | 近年,計算機の高性能化とネットワークインフラの高度化により,Peer-to-Peer (P2P)ネットワークモデルを用いたネットワークサービスに注目が集まっている.既存のネットワークサービスとして最も一般的なクライアント・サーバモデルとは異なり,P2Pネットワーク上では各計算機(ピア)が 互いにサービスを提供しあう.そのため,高い耐障害性やスケーラビリティを実現できる. P2Pモデルを用いたネットワークサービスでは,データを検索する場合,ユーザがデータの特徴を表す単語(キーワード)を指定したクエリを発行することが一般的である.このとき,クエリを受け取ったピアは,クエリ内のキーワードを含むデータを所持していた場合,クエリを発行したピアに自身の所持するデータを返す.一方,ネットワーク規模の拡大や,ネットワーク上のデータ数の増加により,キーワード検索に対する正確性の課題が指摘されている.一般的に,ユーザは,多義語のように複数の意味をもつキーワードを使用する場合でも,その中の一つの意味を想定してデータを検索する.しかし,キーワード検索では,ユーザの希望するデータだけでなく, 意図していない意味でキーワードが使われているデータも,検索結果として返されてしまう可能性が高い.この問題を解決するための単純な方法として,キーワードを複数入力することで検索の精度を高めることが考えられる.しかし,追加されたキーワードが複数の意味をもつ場合や,ユーザの意図を表現しきれない場合は,受信するデータ数が減少せず,単一のキーワードを利用する場合と同様の問題が発生する. そこで本研究では,P2Pネットワークにおけるユーザの嗜好特性を考慮した 検索手法を提案する.提案手法では,各データに特徴となるキーワードが あらかじめ複数付与されている環境を想定し,各ピアが,自身のもつデータや,過去にユーザがアクセスしたデータに付与されたキーワードに基づいて,ユーザの嗜好を推測する.また,各ピアが推測したユーザの嗜好を検索時に利用することで,ユーザの嗜好に応じたデータのみを効果的に取得する. 各ピアは,ユーザの嗜好を推測するために,データに付与されたキーワードのうち,関連するものを連結したグラフ(キーワードグラフ)を生成,管理する.ここで,キーワード間の関連性は予め定められているものとし,ピアごとに独自の関連性が設定されることはないものとする.さらに,各ピアは,自身のキーワードグラフに含まれる各枝に重み(関連度)を設定することで,ユーザの嗜好をより詳細に推測する. データ検索時には,嗜好の似たユーザから優先的にデータを取得するために,各ピアのキーワードグラフを利用する.クエリを発行するピアは,ユーザが入力したキーワード(メインキーワード)と,自身のキーワードグラフにおいて,メインキーワードを含む部分的なキーワードグラフをクエリ内に含めて送信する.クエリを受け取ったピアは,自身のキーワードグラフと クエリ内に含まれているキーワードグラフの類似度を計算する.ここで,類似度の計算は,二つのキーワードグラフにおいて共通なキーワード数,および,共通の枝に設定された重みの差異を考慮する.その後,計算した類似度の高いピアのみ,クエリを発行したピアに,データを返信する.これにより,クエリを発行したユーザが,自身の嗜好とかけはなれたピアからデータを受信することを防ぐ.また,クエリを発行したピアは,受信したデータをユーザが選択した場合に,そのデータの特徴を表すキーワードを調べ,自身のキーワードグラフを更新する.キーワードグラフを更新する際には,ユーザが選択したデータに付属するキーワードグラフを参照し,自身のキーワードグラフ内に存在しないキーワードの追加や,キーワード間の関連度の変更を行う.各ピアは,検索およびキーワードグラフの更新を繰り返すことで, ユーザの嗜好を学習する. さらに本研究では,シミュレーション実験を行い,提案手法の有効性を検証する. |
題名 | P2P情報検索における単語の重みに基づいたデータ配置手法 |
著者 | *倉沢 央 (東京大学大学院), 若木 裕美 (東芝 研究開発センター), 正田 備也 (長崎大学), 高須 淳宏, 安達 淳 (国立情報学研究所) |
Page | pp. 400 - 408 |
Keyword | Peer-to-Peer, 情報検索, 単語の重み, データ配置, データ分割 |
Abstract | Peer-to-Peer(P2P)ネットワークを用いた情報検索では,低コストでありながら負荷分散や高いスケーラビリティが簡単に実現可能である.しかしながら既存のP2Pネットワークを用いた情報検索手法のデータ配置法は,全ての文書のデータが単語に対して均等な重み付けに割り当てられている.つまり,既存の手法では個々の文書のデータは内容に無関係に配置されているため,ユーザは問い合わせに対する適合度の大小に関わらず同じだけの手間をかけて文書を取得しなければならない.そこで我々は,P2P情報検索における索引とデータの分散配置手法,Concordiaを提案する.文書のデータを単語の重みに基づいて配置することで,問い合わせとの適合度の高い文書ほど収集を容易にした.さらに,文書と関係する単語のハッシュ値に該当するノードすべてに,(k,n)閾値法でエンコードした分散情報を単語の重みに基づいて配置することで,ノードの突如の離脱が起こりうる状況でも安定した文書の収集を実現した. |