人工知能学会第27回全国大会

このページはしましま人工知能学会全国大会2013に参加してとったメモです.私の主観や勘違いが含まれていたり,私が全く分かってなかったりしていますので,その点を注意してご覧ください.誤りがあれば,指摘してください.

  • 日時:2011年6月4日(火)〜 6月7日(金)
  • 会場:富山国際会議場,富山市民プラザ など

1A3 International Organized Session「IOS-3 INTELLIGENT DATA ANALYSIS AND APPLICATIONS-1」

1A3-IOS-3a-1 Unsupervised Sense Clustering of Related Chinese Words

Chia-Ling Lee, Yen-Ling Kuo, Chia-Mau Ni, Yu-Ju Chen, Chao-Lin Liu, Jane Yung-Jen Hsu (National Taiwan University)

1A3-IOS-3a-2 Graphical Interface that Supports Users’ Trial-and-Error Process of Text Mining

Naoya Otsuka, Mitsunori Matsushita (Kansai University)

  • TETDM:GUI を用いたエキスとマイニングのインターフェース
    • モジュールの機能を整理し,機能の理解をし易いようにした

1A3-IOS-3a-3 A Proposed Supervised Clustering Approach for the Identification of Concerned HIV-Related Messages in Web Forums

Chaochang Chiu (Yuan Ze University), Nan-Hsing Chiu (Chien Hsin University of Sci. and Tech.), Re-Jiau Sung (Yuan Ze University), Chih-Hao Hsiao (Yuan Ze University)

  • Web上のHIVに関する発言を重要かそうでないかを分類するもんだい
  • 遺伝的アルゴリズムとk-meansを組み合わせた方法の提案

1A3-IOS-3a-4 Proposal of User Modeling Method Employing Reputation Analysis on User Reviews Based on Personal Values

服部 俊一, 高間 康史(首都大学東京大学院システムデザイン研究科)

  • 利用者のモデリングを,特徴への重み付けで行う

1A3-IOS-3a-5 How Much Calories People Burn? Physical Activity Recognition Using Acceleration Data with Mobile Phones

Sio Fong Hoi, Yi-ting Chiang, Jane Yung-Jen Hsu (National Taiwan University)

  • 携帯の加速度センサーによって利用者の6種類の行動パターンを推定
  • その結果に基づいて,カロリー消費量を推定する.

1C4 データマイニングデータマイニング-2」

1C4-1in センサ環境を利用したオフィスワーカーの行動パターン分析

岡田 将吾(東京工業大学 大学院総合理工学研究科 知能システム科学専攻) 神谷 祐樹(日本電気株式会社  C&Cイノベーション推進本部) 佐藤 裕作(東京工業大学 大学院総合理工学研究科 知能システム科学専攻) 藤田 善弘(日本電気株式会社  C&Cイノベーション推進本部) 山田 敬嗣(日本電気株式会社  C&Cイノベーション推進本部) 新田 克己(東京工業大学(院)総合理工学研究科知能システム科学専攻)

  • オフィス内の位置を数秒間隔で,PC作業のログ
    • PC作業,ミーティング,その他の三つに行動を分類しその時系列変化を取得
  • 全員に共通の主成分を使って,個人の寄与率を求めたときそれが小さいと,固有の行動をしているとした
  • ストレスの度合はアンケート調査
  • ストレスと,固有の行動があることの間には高い相関があった

1C4-2 複数文書から抽出したイベントの時間関係処理に関する研究

井上 晃太(法政大学情報科学研究科情報科学専攻) 佐藤 真(法政大学情報科学部) 赤石 美奈(法政大学・情報科学部)

  • 記事の中から,イベントの日時や内容の情報を取得する

1C4-3 マルコフモデルを仮定した位置情報開示のためのアドバーザリアルプライバシ

川本 淳平(筑波大学システム情報系) 福地 一斗(筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻) 佐久間 淳(筑波大学 大学院システム情報工学研究科 コンピュータサイエンス専攻)

  • グラフ上で移動する人の頻度の変化に対するプライバシ保護
  • 事前知識のみから予見される行動は特に隠さない
  • ある事象 T が生じる事前の確信度 p(T) と,出力情報 O を観測後の確信度 p(T|O) の比 p(T) / p(T|O) ≦ exp(ε) と抑えられる

1C4-4 頑健線形射影法の特性評価

小林 えり(静岡県立大学 経営情報学部 経営情報学科) 伏見 卓恭(静岡県立大学大学院経営情報イノベーション研究科) 斉藤 和巳(静岡県立大学 経営情報学部) 池田 哲夫(静岡県立大学)

  • 頑健線形射影法:PCAの二乗距離を絶対距離にした

1C4-5 レビューサイトにおける異種情報に基づく変化点検出法

山岸 祐己(静岡県立大学大学院経営情報イノベーション研究科) 斉藤 和巳(静岡県立大学大学院経営情報イノベーション研究科)

  • レビューサイトの評点の評価は,内部・外部の要因で時系列的に大きく変化する場合がある
  • レビューの評点分布を多項分布で,投稿間隔を指数分布,あとファイルサイズをモデル化.分布が前後で変わる点を変化点とする

1E5 機械学習機械学習-3」

1E5-1 Repulsive Parallel MCMC アルゴリズムによる塩基配列のモチーフ探索

池端 久貴(総合研究大学院大学 複合科学研究科 統計科学専攻,独立行政法人 科学技術振興機構 CREST ) 吉田 亮(情報・システム研究機構 統計数理研究所 (モデリング研究系),独立行政法人 科学技術振興機構 CREST,総合研究大学院大学 (複合科学研究科/統計科学専攻))

  • 非符号領域では独立に多項分布,モチーフ部分は長さKのそれぞれの位置で別の多項分布に従う
  • 一つの系列には複数のモチーフがあるので分布は多峰性
  • 多峰性の分布で,並列にMCMCをすると一つの峰に引き寄せられてしまう
    • 固まらないように互いに反発させるようにする
  • Reversible Jump MCMC:モチーフの長さも固定長 K ではなく,適応的に決める

1E5-2 社会知としての消費者価値観構造モデルと類型「Societas」の構築

馬場 彩子(シナジーマーケティング株式会社システム開発部研究開発グループ) Bertin Mathieu(シナジーマーケティング株式会社 システム開発部 研究開発グループ) 谷田 泰郎(シナジーマーケティング株式会社システム開発部研究開発グループ)

  • 顧客の同一性を保持して行動を追跡したい → Societas:顧客の類型パターン,このパターンの同一性による追跡を行う
  • Societas はベイジアンネットで分類.アンケート調査により,価値観などの項目
  • Societas による分類の方が,個人属性情報に基づく分類よりマーケティングに有効だった

1E5-3 ネットワーク上の情報に対する拡散現象と潜在的トピックの同時学習

吉川 友也(奈良先端科学技術大学院大学 情報科学研究科 情報科学専攻) 岩田 具治(NTTコミュニケーション科学基礎研究所) 澤田 宏(日本電信電話(株) NTTコミュニケーション科学基礎研究所)

  • ネットワーク上の拡散モデル:データを受け取ったら,それがベルヌーイ分布で次に伝わる Independent Cascade モデル + LDA によるクラスタリング
  • TwitterのRTされる文章の内容≒情報の影響力に基づいてトピックが決まり,そのトピックで拡散確率が決まる

1E5-4 スペクトラルクラスタリングを用いたアンケートデータの回答者分類に関する検討

稲垣 和人(名古屋大学大学院工学研究科計算理工学専攻) 吉川 大弘(名古屋大学大学院工学研究科計算理工学専攻) 古橋 武(名古屋大学大学院工学研究科計算理工学専攻)

1E5-5 多数のエージェントを利用した行動モデルの学習

市瀬 龍太郎(国立情報学研究所) 森山 甲一(大阪大学 産業科学研究所) 沼尾 正行(大阪大学 産業科学研究所)

  • 行動クローニング:行動履歴から人間を模倣する行動モデル
  • 低頻度の事象を無視する傾向があるので多数のエージェントの行動からクローニングをする
  • 行動クローニング:最終目標と現在の状態を入力として,最適な行動原理を見つける
    • GAを使ったエージェントシミュレーションで解く
  • 行動クローニングは,強化学習のような定量モデルではなくて,シンボリックな説明を重視

オーガナイズドセッション「OS-07 ヒューマンコンピュテーションとクラウドソーシング」

まえふり

鹿島 久嗣

人間計算:計算資源としての人間の労働力を明確に意識し,コンピュータのみでは解決できないような問題を解決

  • ReCAPTCHA:人間には読めるが,機械には認識できないCAPCHA画像.認証を行っているつもりで,不完全な自動文字認識をして,書物のデジタル化を手伝っている.
  • ESP ゲーム:ゲームを手伝っているつもりで,図形認識させる
  • 遺伝子の3次元たたみ込み

クラウドソーシング:ネットを通じて不特定多数の人に仕事を依頼すること,もしくはその仕組み

  • アウトソーシングとは異なり,委託先については分からない
  • 安価で大量だが,品質は不確か
  • 自然言語処理(アノテーション)画像認識(アノテーション)
  • 人間計算をうまく使うための技術:能力の推定,タスクの割り当て,報酬の最適化
  • 関連研究の論文数は増加:AAAI, IJCAI, AAMAS, NIPS, ICML, CHI, CSCW, UIST, WWW, VLDB
    • 今年から HCOMP が始まる

ヒューマンコンピュテーションは挫折

  • AIは人間と同様にふるまうことが目標だったが,それをあきらめた?
  • そうみるより,人間 + 機械のチームによる能力の補完とみる

(OS招待講演)Crowd4U: アカデミアと応用分野専門家が構築する高度クラウドソーシングプラットフォーム

森嶋 厚行(筑波大学知的コミュニティ基盤研究センター)

クラウドソーシング:クラウド(群衆)+ アウトソーシング(外注)

  • Yahoo知恵袋などは日本のさきがけ
  • 人と計算機の得意・不得意がある
    • コンピュータ:高速計算,記憶,長時間処理
    • 人間:パターン認識,常識の利用
  • クラウドソーシングが唯一の選択肢:アルゴリズムはあるがソフトの開発期間がない → 人間に手分けしてやってもらう
    • Jim Gray さんの探索:衛星画像を分割して,多くの人に分担して探してもらった

Crowd4U:アカデミア用のクラウドソーシングプラットフォーム

  • 非営利・学術・公益での利用,エンジンコードの開発を自由に開発したい,実験プラットフォームとしての利用
  • 授業の資料をダウンロード,大学サークルページなどで,簡単なタスクが出る
  • 最近 2012/10 で1000 → 1013/05 で 50000
  • 匿名の人が非常に多数だが,一方でわずかなヘビーワーカーもいて,両方とも必要
  • 最初は少ないが,授業に組み込むと急激に上昇

FusionCOMPプロジェクト

  • VLDBでも2011年に紹介された
  • 計算が計算機の中で閉じていない:
  • Cylog:クラウドソーシングのためのプログラミング言語:開始の第一歩 (2009)
    • 人間計算をfirst class component:計算のうち人間計算の部分を明示
      • 最初は人間にやらせておいて,あとで機械に実装したりもできる
    • 宣言的:手続き型ではなくて,宣言型の言語
      • 手続き型にすると非同期の人間計算に合わない,最適化が容易
    • 閉世界仮説がない
  • 入力の品質をあげる3段階:信頼できる人を使う,多数決を使う,フィードバックを与える
  • 宣言的な言語では実行順序は不定だが,それを人間が介入できる
    • 人間は,答え自体を入れても,答えを導くルールも入力できる
  • 災害対策クラウド:写真をつかった現状把握,写真には時刻や位置がなかったりする
    • 人間は比較の結果は結構正しく判断できる

図書館とクラウドソーシング

  • 書誌データのクリーニング:ISBN の使い回しがある → リファレンスマッチングを人間計算で行う

Croud4U

ワーカーの類似性を考慮したクラウドソーシングデータからの学習

梶野 洸(東京大学大学院情報理工学系研究科数理情報学専攻) 坪井 祐太(IBM東京基礎研究所) 鹿島 久嗣(東京大学大学院情報理工学系研究科数理情報学専攻)

  • 事例のラベル付けをクラウドソーシングで行う
  • 既存研究
    • Raykarの潜在ラベル法:真のラベルを潜在変数として,そこからクラウドラベルが生じる
    • 梶野の識別器統合法:各ワーカーは識別器だが,それは真の識別器に摂動を加えたもの
  • [Welinder 2010] ワーカーの判断には幾つか類型があり,クラスタに分けることができる
    • このクラスタをグループlasso的に扱う方法を今回は提案(分類器の重みをペアごとに近づける)
    • 精度が向上すると共に,ワーカーのクラスタリングができる

クラウドソーシングにおけるオンライン学習

Tran Quang Khai(筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻) 佐久間 淳(筑波大学 大学院システム情報工学研究科 コンピュータサイエンス専攻)

  • 梶野式の真のパラメータにワーカーのパラメータを近づける制約化項を採用
  • この方法をリグレット最小化のオンライン学習にして,途中でワーカーの精度が変わっても追随できるようにした.

クラウドソーシングによって得られた順序データの統合

松井 都志子(東京大学) 馬場 雪乃(東京大学大学院情報理工学系研究科) 神嶌 敏弘(産業技術総合研究所) 鹿島 久嗣(東京大学大学院情報理工学系研究科数理情報学専攻)

  • [Dawid&Skene 1979] EMを使った回答の統合方法 Raykar法とかで利用されている
  • ラベル付けではなく,全順序を返してくる
  • 距離ベースモデルで,Spearman距離を使い,各ワーカーの散らばりパラメータがその能力を表すとする
  • 散らばりパラメータの推定と,全体のモード順位付けとの推定とを交互に行う

クラウドソーシングを用いた順序統合

石川 真太郎(筑波大学 情報学群 情報科学類) 佐久間 淳(筑波大学 大学院システム情報工学研究科 コンピュータサイエンス専攻)

  • 順序の統合問題:順序対が大量に与えられる場合
  • 統合順序とワーカーの能力の推定を反復する点は同じ
  • 順序の決定は,Cohen法ににた方法

非定型出力をもつクラウドソーシングタスクにおける成果物の統計的品質推定

馬場 雪乃(東京大学大学院情報理工学系研究科数理情報学専攻) 鹿島 久嗣(東京大学大学院情報理工学系研究科数理情報学専攻)

  • ラベル付けのような定型ではない,Webのデザインのようなタスクの品質の評価
    • 評価もクラウドソーシングで行う
  • 被評価者と評価者の能力を考慮して重み付けするグラフィカルモデルを構成
  • 1位の成果物は高精度で発見できた

クラウドソーシングにおけるワーカーの確信度を用いた高精度なラベル統合

小山 聡(北海道大学大学院情報科学研究科複合情報学専攻) 馬場 雪乃(東京大学大学院情報理工学系研究科数理情報学専攻) 櫻井 祐子(九州大学大学院システム情報科学研究院) 鹿島 久嗣(東京大学大学院情報理工学系研究科数理情報学専攻)

  • ワーカーに自身のアノテーション結果の確信度も,ラベルと共に入力してもらう
  • 正解率と確信度は 0.4 程度の相関はあったので情報として利用する
    • 心理では,メタ認知と呼ばれるものにあたるが,自分の確信度などは信頼できないといわれているが,一応正相関があるので,利用する.
  • この自身の確信度を,ワーカーの自己評価の正しさのパラメータを導入してモデル

Accurate Entity Resolution using Crowdsourcing

王 晶晶(北海道大学大学院情報科学研究科複合情報学専攻) 小山 聡(北海道大学大学院情報科学研究科複合情報学専攻) 栗原 正仁(北海道大学大学院情報科学研究科複合情報学専攻) 鹿島 久嗣(東京大学大学院情報理工学系研究科数理情報学専攻)

  • 実世界の同じ対象に言及している表現を求める entity resolution
    • 同じ表現かどうかをラベル付けする
  • locality preserving射影を使う.
    • ワーカーごとに表現間の類似性を求め,それらを重み付け,それらを全ワーカーについて和をとる.

特別講演「説明と予測: 科学的発見からレジリエンスへ」

井上克巳(国立情報学研究所)

科学哲学

  • フランシス・ベーコン「学問の進歩」:科学における帰納法
  • 黒なー度・ベルナール「実験医学研究序説」:実験の必要性,実験とは探求者に変化させられた現象の ***能動的*** な探求
  • ポワンカレ「科学と仮説」(1902)
  • ファインマン「物理法則はいかにして発見されたか」(1964) 物理法則発見に至る道筋
  • ポパー「科学的発見の論理」(1934) 反証主義・仮説主義
    • 反証できなければ科学ではない,帰納主義の否定

人工知能による発見と予測

  • 科学の自動化:科学的探求を自動化する考えはコンピュータ誕生と共に
    • DENDRAL:有機化合物の発見
  • 生化学における自動発見
    • Robot Scientist (2004-2009) 自分で仮説を立てて,実験して,検証するロボット
    • Chemical Turing Machine (2006) データの整理能力のブースト
  • 人工知能による科学知識の発見
    • データマイニングなどは帰納主義
    • 本来の発見はまだ人工知能では十分には実現できていない,思いつきはまだ無理
  • パース「Scientific Discovery」:演繹・帰納・アブダクションの三つがある
    • 演繹→実験→帰納→発想→演繹 のサイクルが科学知識の発展サイクル
  • 仮説生成への論理:結論発見法,節 C を加えることで説明可能になるような C を見つける
    • ミッシングリンクの発見

オーガナイズドセッション「OS-06 情報の保護と中立性に配慮したデータ分析-1」

中立性・公正性に配慮したデータ分析

神嶌 敏弘(産業技術総合研究所)

質問

  • どの属性を要配慮特徴に選ぶのか? → 法律・多数決
  • 考慮してもいい特徴 → 条件付き差別
  • 情報中立の視点はどうするのか? → 積極的に特定の情報を排除
  • 推薦の偏りの検出 → 無限の状況を想定するのはむりだが,予め候補があれば偏っている視点は検出できる

分類問題における視点中立化

福地 一斗(筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻) 佐久間 淳(筑波大学 大学院システム情報工学研究科 コンピュータサイエンス専攻) 神嶌 敏弘(産業技術総合研究所)

  • 公正配慮型分類で,要配慮特徴の値自体が与えられておらず,それ自体も予測モデルをもつ場合を想定した η-中立 の提案

Privacy-preservation for Stochastic Gradient Descent

呉 双(筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻) 照屋 唯紀(筑波大学システム情報系) 川本 淳平(筑波大学システム情報系) 佐久間 淳(筑波大学 大学院システム情報工学研究科 コンピュータサイエンス専攻) 菊池 浩明(東海大学情報通信学部)

  • ラベル y と,その特徴 x が別の参加者に保持されている場合
  • ロジスティック回帰をオンラインで行う
  • Pailliar暗号を使った

Collusion-Resistant Privacy-Preserving Data Mining

楊 斌(東京大学・情報理工学系研究科・) 中川 裕志(東京大学情報基盤センター)

  • 分散データ保持環境下でEMやk-meansを計算するときには,クラスタがサイトに分散していると秘密に計算する場合 (x1+x2)/(y1+y2) を計算する
    • しかも共謀がある状況を想定する
  • 各参加者に x と y の他に乱数で z も生成 (x1+x2)(z1+z2) と (y1+y2)(z1+z2) を出せば,結託されても z が掛かっていて,しかもランダムシェアがあるので x1/y1 は復元できない
  • 問題として X=(x1+x2)(z1+z2) と Y=(y1+y2)(z1+z2) を公開してるので実は値は分からないけど範囲は絞れてしまう
  • そこで Y の割り算の形なのでまずいので 1/Y=1+(1-Y)^2+… のようにテイラー展開すると,

生体情報のプライバシーを守るテンプレート保護型生体認証技術

大木 哲史(早稲田大学理工学研究所) 甲藤 二郎(早稲田大学理工学術院)

  • バイオメトリクス:網膜・諮問・顔などの認証
    • 漏洩したら交換できない
  • テンプレート保護型生体認証:生態情報をサーバに保管したまま認証
    • 入力バターンの分散が大きいので暗号化すると,テンプレートパターンとの比較ができない
  • 対策
    • 暗号化の代わりにテンプレートを決まった秘密の方法でひずませる
    • 誤り訂正符号を使ってマッチングをする

(OS招待講演)官庁統計の情報保護基準

星野 伸明(金沢大学経済学類)

公的統計における情報保護の考え方(SDCの背景)

個体識別が不可能という判定の精密化+客観化

  • 統計法の情報保護
    • 公的統計:行政機関とかが作る統計情報(集計結果)
    • 公的統計の秘密 (confidentiality):個人情報保護法と違って,個人も法人も保護の対象で,権利の保護ではなく統計の真実性の確保が目的
    • 統計目的以外での利用は基本的に禁止:教育と研究は例外的
      • 守秘義務と匿名化技術(公開されて使える匿名化データは法制化されていない)
  • 匿名データの作成の目標:個体識別ができない(他の情報との照合を含むと明示してあるのは日本のみ,海外は運用で対処)

個体識別と秘密性

  • 個体識別ができない場合でも,l-diversity のように内容の情報が漏洩する
    • 立法の文言の定義は難しい.これがあるとデータの有用性はかなり低下する

個体識別の判定

  • 日本:統計委員会が匿名化の方法の方針を決める.海外でも,board に丸投げタイプ.
    • board の意思決定過程を明確化した方がいい

個体識別の判定(理論)

  • 個体識別の危険性(開示リスク)はデータの分析(有用性)はトレードオフ
    • リスクの限度を決めて,その制限下で有用性を判定する
    • データ表現以外も要因としてモデル化したい

個体識別モデルの公正

  • 識別される事故がほとんどない → 事例がないので,***実社会*** の個体識別能力について情報が不足
  • 識別が可能でも実際に識別されるかどうかは確率的事象なので,確率分布を考えるべき

個体識別の難易度概念

  • データ表現の実数特性値 δ がしきい値αを超えれば個体識別が可能
    • このαはどうやって推定
    • n件の事例があって,一度も過去に個体識別事故がなかった → 一番困難な状況のδよりもαは小さかった

個体識別の難易度測定 Marshらの議論

  • 公開ファイルと照合ファイルの擬識別子が一致 + 公開ファイルに個体が含まれる + 個体が母集団一意 + 識別される
    • この議論は破綻しているが,母集団一意という概念は法律家にも広まっているので生かしたい
  • 母集団一意の量が多い方が予測はし易いはずなので,識別はやりやすい

(OS招待講演)差分プライバシについての暗号理論的な考察

松田 隆宏(産業技術総合研究所 セキュアシステム研究部門)

  • 差分プライバシはメカニズムの有用性を考えないと意味がない

暗号分野

  • セキュリティパラメータについて,多項式時間で計算可能でないことが安全性の基本
    • 暗号の要素技術は多項式時間で計算できる
  • 安全性の定義:無視できる関数(N に対して非常に小さくなる)確率的に識別不能,1方向関数

差分プライバシになると

  • 攻撃者の攻撃能力が無限の計算能力があったとしても安全
  • 安全性のためにはより多くの犠牲が必要だが,DPでの犠牲は?
    • [Mironov+ 2009] 攻撃者の能力が多項式時間 → これでも元のDPと同じぐらいの犠牲が必要になりあまり意味がなかった
  • [Ulman 13] クエリを複数回送る場合のDPの充足条件を考察
  • クエリ・回数・ノイズにいろいろトレードオフがある

(OS招待講演) プライバシを考慮した防犯カメラ映像処理

舩冨 卓哉(京都大学学術情報メディアセンター) 川西 康友(京都大学学術情報メディアセンター) 美濃 導彦(京都大学学術情報メディアセンター) 森村 吉貴(京都大学物資細胞-統合システム拠点) 満上 育久(大阪大学 産業科学研究所)

  • 街中にはカメラがいっぱい
    • 画像のプライバシ保護処理

一般公開画像のプライバシ保護処理

  • 一般公開画像
    • 観光地などのライブカメラ:引きの画像で顔などはわからないように
    • Googleストリート・ビュー:Googleストリートビュー:公共の場で撮影,非リアルタイム(数ヶ月前)顔やナンバープレートのぼかし
    • 防犯カメラのオープン化:人やナンバープレートは移っている
  • 自動検出型のぼかし処理にはミスがある:検出ミス・位置のミス
  • フェイルセーフなプライバシ処理
    • 確実に映り込まない「背景」画像を生成(検出はしない)
    • 検出した人はなにか人工物を描くだけでぼかしなどはしない
  • 背景画像生成
    • 変化:照明の変化 (太陽の移動) + 構造の変化 (ものが置かれる)
    • 防犯カメラでは長期間の画像が膨大に蓄積されている
    • 画像=不変成分 + 照明 + 構造 + 前景 → 前景以外の画像を取り出す
      • 既存手法:長時間の平均,固有画像 → 提案手法はゆがみなどがない
  • 防犯カメラに対する意識調査:防犯目的なら
    • この保護処理をしたことについてアンケートしたが,防犯カメラと比べて相対的に保護されていると思うが,絶対的なところは気持ち悪さとか

人物画像解析システムの開発

  • 犯罪・テロ対策としての,人物画像の検索システム
  • 導入すべき制限
    • 検索の目的は社会システムで判断すべき + 検索されなかった画像は閲覧されないように
  • 検索対象が同じ人ごとに鍵を作り,その鍵を使って検索対象外の画像を保護
  • 検索に使う特徴は画像認識では一般的なもの
  • 検索クエリが正当と認められたら,鍵を発行することで,検索者の正当性を認証

(OS招待講演) 位置情報サービスにおけるプライバシ保護技術

川本 淳平(筑波大学システム情報系)

位置情報

  • GPS付き携帯やカーナビ
  • ここでは位置情報のサービスを二つ
    • 位置情報サービス (location-based service; LBS):近所の飲食店などを探す
    • プライバシを考慮した位置情報出版 (分析用のために個人の位置は秘匿したまま公開)

LBS

  • 中間サーバを用いてそこでk匿名性を達成する
    • 位置を広めにとって,k人その領域にいればk匿名性が達成できる
    • クエリには広めにとった領域を使う
    • 移動速度を使った攻撃など,いろいろな攻撃が考えられる
  • プライベート情報検索(クエリを秘匿した検索)の技術を使う
    • ヒルベルト曲線などの空間を埋め尽くす曲線をつかって近さを求める
    • パターンと組み合わせて,集合演算がうまく使って距離クエリにする

プライバシ保護データ出版

  • 矩形ぐりっとに区切ってDPでする
    • 矩形の細かさが問題で,グリッドが細かいと正確な問合せが可能だが,大きなノイズを加える必要
  • 位置の移動履歴の出版:長い履歴ほど大きなノイズを加える必要 → 頻出しない系列は削除
  • 移動先の予測:最終目的地が秘匿したい場所
    • まずそうな目的地への経路を検出して削除する
  • 事前知識を使う方法
    • 絶対的に情報を秘匿するのではなく,事前分布と,公開情報を知ったあとの事後分布との差が小さければOKとする

オーガナイズドセッション「OS-16 金融情報学」

市場間連成を考慮した人工市場によるリスクヘッジ行動の影響分析

川久保 佐記(東京大学工学系研究科システム創成学専攻) 和泉 潔(東京大学大学院 工学系研究科 システム創成学専攻) 吉村 忍(東京大学工学系研究科システム創成学専攻)

  • 原資産市場からオプション市場へのモデルはあるが,逆の影響を人工市場で考える
  • デルタヘッジ:原資産をδ,オプションをγ で逆の取引をしてヘッジする
    • 原資産を買う・売る側はそれぞれ,市場に対して逆の影響促進と抑制の働きがある

人工市場を用いた大規模誤発注が価格変動に与える影響の分析

水田 孝信(スパークス・アセット・マネジメント株式会社,東京大学大学院 工学系研究科 システム創成学専攻) 和泉 潔(東京大学大学院 工学系研究科 システム創成学専攻,JSTさきがけ) 八木 勲(神奈川工科大学 情報学部) 吉村 忍(東京大学工学系研究科システム創成学専攻)

  • 誤発注による変動を人工市場で検証
    • ファンダメンタルにもどるまで振動的な振る舞いがみられる
    • ファンダメンタル戦略とテクニカル戦略をとるエージェント数が振動する
  • 市場混乱を防ぐには,誤発注期間より短い期間の値幅制限をすればよい

Indirect Factors to the Stock Price Prediction via Google Trends

王 鵬(東京大学) 和泉 潔(東京大学大学院 工学系研究科 システム創成学専攻) 吉村 忍(東京大学大学院 工学系研究科)

  • ある株に関連する語を抽出し,それらの語の Google Trends での変化を入力として,株価を回帰で予測

複利型強化学習の株式取引への応用

後藤 卓(三菱東京UFJ銀行 融資企画部) 松井 藤五郎(中部大学生命健康科学部臨床工学科) 大澄 祥弘(中部大学工学部情報工学科)

  • 複利型強化学習:報酬が複利式に積の形で増加する
  • 従来の複利型強化学習は売り買いの幅が一定だったのを,シグナル強弱で変化させる

(OS招待講演)金融バブルの大規模データ解析

高田 輝子(大阪市立大学 経営学研究科)

金融バブル

  • 金融バブル崩壊は繰り返す
  • 低頻度で大きな変動 → 少ないデータ
  • 相転移現象としての金融バブル:センチメントの変化,系列相関(AR1),分散,歪度の増加

金融データ:社会行動分析の中では最も大きなデータ

  • マクロ:市場・社会の数値データ ⇔ ミクロ:Webなどの個人の発言
  • 金融システムの安定性:時系列上の価格の分布の形状が重要
  • 取引量-株価変化率:分布は単峰性ではなく,単純なパラメトリックモデルでは記述できない
  • 異なるスケールを利用:長期の変動は少ないので,それを短期間の変動の拡大とみなして,異なるスケールのデータを利用する

気配値の分布

  • 買い注文・売り注文の分布 → 参加者の心理が現れる,あまり売り買いは対称な分布になる
    • バブル状態になると分布は対称になりやすく,崩壊とともに定常状態にもどる

特別講演「コンパクトシティ富山におけるスマートICTを活用した付加価値創生」

堀田 裕弘(富山大学)

富山市の概要と現状

  • 1241km^2,42万人,全国で2番目に大きな県庁所在地
  • 鉄道:富山駅を中心とした放射状ネットワーク
  • 人口減少と高齢化の進行,都市の中心部の人口減少
  • コンパクトなまちづくり:自動車依存を抑えて公共交通の利用を促進 → 徒歩圏を公共交通で結ぶ
    • セントラム (Light Rail Transit) の延伸 → システム開発にとりくんでいる

セントラムのシステム

  • トラムデジPOP:サイネージに場所や時間に応じた広告
  • トラムAR:スマート端末を利用し,社内でのみ閲覧できる
  • トラムNAVI:路面電車のリアルタイムな位置情報をスマート端末に

システムの詳細

  • システムの開発体制: デジPOP+AR=インテック,NAVI=堀田先生
  • 広告の発信:店舗が発信した情報が車 内広告に短時間で → タイムセールなどの広告も出せる
  • ARシステム:AndroidアプリでAR的に風船を重ね合わせ,風船は街の情報に対応
    • 路線地図画面,AR背景画像での情報表示,トラムの現在位置から店舗などまでのNAVI
    • 地域に限ったの詳細情報
  • NAVIシステム:リアルタイムの位置表示,系統の違いの可視化
  • 2012年調査イベント:体験ツアー,ARで街中で黄色い風船を探して貰い,トラムと徒歩で商店街を通ってもらったりする
    • 若年層にはアミューズメントとして受け入れられたが,ARで外側を写すといった操作になれない人も
    • NAVI・サイネージの端末からは音を出すことができない → 注意を引くのが難しい
  • 平日は高齢者が多いので文字を大きくしたりする必要
  • 広告価値としては,セールのアナウンス効果は確かにある
  • アプリの有効性:スマホのGPS精度,ARで外を写すインターフェースの問題,高齢者対策 → インターフェースの課題は多い

今後の方向

  • 町歩き情報の提供,歩行者の動態情報の収集・分析

トップ   編集 凍結 差分 バックアップ 添付 複製 名前変更 リロード   新規 一覧 単語検索 最終更新   ヘルプ   最終更新のRSS
Last-modified: 2013-06-07 (金) 14:12:16 (1282d)