* 人工知能学会第28回全国大会 [#n8837d6d]

このページはしましまが人工知能学会全国大会2014に参加してとったメモです.私の主観や勘違いが含まれていたり,私が全く分かってなかったりしていますので,その点を注意してご覧ください.誤りがあれば,指摘してください.

- 開催日:2014年5月12日(月)~5月15日(木)
- 場所:ひめぎんホール他(愛媛県,松山市)

#contents

* 5月12日 (月) 1日目 [#m01940ec]

* 1I2 「ウェブマイニング(1)」 [#e648d43a]

** 1I2-1in 冗長な情報要求観点の集約によるウェブ検索結果の集約 [#lc34f27e]
井上 祐輔(筑波大学大学院システム情報工学研究科 知能機能システム専攻宇津呂研究室)
今田 貴和(筑波大学大学院システム情報工学研究科 知能機能システム専攻宇津呂研究室)
守谷 一朗(筑波大学大学院システム情報工学研究科 知能機能システム専攻宇津呂研究室)
陳 磊(筑波大学大学院システム情報工学研究科 知能機能システム専攻宇津呂研究室)
宇津呂 武仁(筑波大学 大学院 システム情報工学研究科 知能機能システム専攻)
河田 容英(ログワークス)
神門 典子(国立情報学研究所)

- 検索のサジェストで,探したい目的の語で現れる語を,多くの人が同時に関心を持つ事柄と考える
- サジェストされた語をグルーピングすることで,部分的な話題を知ることができる
-- グルーピングは各サジェストで検索されるページの類似性に基づいて行う

** 1I2-2in ウェブ検索者の情報要求観点の集約と俯瞰におけるトピックモデルの有効性の評価 [#g7da89a8]
守谷 一朗(筑波大学大学院システム情報工学研究科 知能機能システム専攻宇津呂研究室)
今田 貴和(筑波大学大学院システム情報工学研究科 知能機能システム専攻宇津呂研究室)
宇津呂 武仁(筑波大学 大学院 システム情報工学研究科 知能機能システム専攻)
河田 容英(ログワークス)
神門 典子(国立情報学研究所)

- 前の発表のようにサジェストに関連したWebページの類似度からグルーピングをする
-- このグルーピングにLDAを使うと,Wikipediaなどにない観点が

** 1I2-3in ソーシャルメディアの情報統合によるエキスパート検索エンジンに関する研究 [#pe994385]
大澤 昇平(東京大学工学系研究科技術経営戦略学専攻)
松尾 豊(東京大学工学系研究科技術経営戦略学専攻)

- Social Expert Search Engine:専門家の検索を行う → ここではGitHubの情報を利用
- タスクの遂行能力と,エキスパートとしての信頼性,実際に仕事を依頼したいか
- 各GitHubアカウントについて,遂行能力や信頼性をアンケート調査して分析した
-- 実際に仕事を依頼したいかどうかでは,遂行能力と信頼性では後者を重視していた

** 1I2-4 時系列文書における話題追跡のためのトピックモデルに関する検討 [#lb5fccde]
佐々木 謙太朗(名古屋大学大学院工学研究科計算理工学専攻)
吉川 大弘(名古屋大学大学院工学研究科計算理工学専攻)
古橋 武(名古屋大学大学院工学研究科計算理工学専攻)

- 時変データに対するトピックモデル
- 各時刻でのトピック数可変のトピックモデルを作り,トピック間の依存度を考慮する
- 従来法と違ってトピック間の依存は複数のトピックを考慮できるようにした

* 1A3 「テキストマイニング(1)」 [#y6464bca]

** 1A3-1 トピックモデルを利用したソーシャルテキスト上の同名他者推定 [#cee8751d]
原田 智彦(筑波大学大学院 システム情報工学研究科)
津田 和彦(筑波大学大学院)

- twitter の分析で,関連ツイートを抽出するキーワードが多義語の場合無関係なものが分析対象に入る
- 利用者を過去のツイートによりLDAで分類
- 利用者のトピック所属情報から,多義語のキーワードのどちらの意味で使いやすいかを分類する

** 1A3-2 特許構成を考慮した文書類似度に基づく特許からの課題分類・手段分類推定システム [#oe6a3afb]
槫松 理樹(岩手県立大学ソフトウェア情報学部ソフトウェア情報学科)

- 特許文書を分類する問題を扱う
-- 特許のメタ情報に加えて,特許の文書中の単語ベクトルを特徴に用いる

** 1A3-4 萌芽研究領域特定のための大規模論文情報を用いた引用予測に関する研究 [#w3f6b1d3]
森 純一郎(UT)
榊 剛史(東京大学)
梶川 裕矢(東京大学大学院工学系研究科総合研究機構 イノベーション政策研究センター)
坂田 一郎(東京大学)

- リンク予測を用いた予測
- テキスト情報はあまり効かない

** 1A3-5 トピックによる習慣行動抽出手法の評価 [#l7a86fd4]
鈴木 信雄(株式会社KDDI研究所)
津田 和彦(筑波大学大学院)

- 習慣行動を表す文章表現を見つける
- 頻度,動作,対象などが何かを構文解析せずに抽出する

* 1J4-OS-18a オーガナイズドセッション「OS-18 ヒューマンコンピュテーションとクラウドソーシング (1)」 [#j0317ace]

** 1J4-OS-18a-1 ヒューマンコンピュテーションにおけるタスク割り当て手法の提案 [#c4ef01ce]
巻口 誉宗(NTTサービスエボリューション研究所)
東 正造(NTTサービスエボリューション研究所)
下村 道夫(NTTサービスエボリューション研究所)
金丸 直義(NTTサービスエボリューション研究所)

- 過去のタスクの結果とテストタスクの正解率を基づいてタスク割り当てを決定
- 固有用言のアノテーションタスク:結構難しい
- NMF で因子を抽出し,過去のタスクから同様の因子を持つ利用者にテストタスクをやってもらい,成績の良かった因子をもつ利用者から最終タスクの依頼先を決める

** 1J4-OS-18a-3 クラウドソーシングでのタスク選択に関する行動モデリング [#ibd42653]
松原 繁夫(京都大学)
伊奈 祐輔(京都大学工学部情報学科)

- 難易度や報酬の異なるタスクをワーカはどう選択するのか → 依頼者に選択権はないので,特定のタスクをする人がいなくなるような報酬設定に使える
- 易タスクと難タスクの2種類,ワーカは各タスクの処理コストで記述.報酬 - 処理コスト の大きさでワーカはタスクを選択
- 報酬の選択確率をサンプルから予測して,適切な価格設定をする方法の提案

** 1J4-OS-18a-4 クラウドソーシングにおけるマイクロタスクの質問文の改善手法の提案 [#c0982b8b]
丹治 寛佳(筑波大学システム情報工学研究科コンピュータサイエンス専攻)
清水 伸幸(ヤフー株式会社 Yahoo!JAPAN 研究所)
森嶋 厚行(筑波大学知的コミュニティ基盤研究センター)
北川 博之(筑波大学システム情報系)

- タスクの質問文によって誤解が生じて適切な回答が得られない場合
-- 適切な回答が得られるような質問文自体をクラウドソーシングで集め,適切な解集合を導くような文を選ぶ
-- 知識ベース:回答の包含関係から,回答対象の is-a 関係を導く → is-a 関係と質問文のDBから新たな質問文を生成

** 1J4-OS-18a-5 成果報酬によるクラウドワーカの制御 [#qb57d6e1]
堀田 裕理(京都大学大学院情報学研究科社会情報学専攻)
松原 繁夫(京都大学)

- 不誠実ワーカは,成果報酬ではなく,定額報酬を選ぶ ← 結果を問わないから適当な入力でも収入が得られる
-- しかし,成果報酬は不確実な報酬(時間割引のある報酬)なので,誠実ワーカでも定額報酬を選ぶかもしれない → どんな報酬設定をすればいい?
- 報酬の判定は多数決でやるので,参加人数が多いと判定の精度は上がるが遅延は大きくなる → 成果報酬に不利
- 途中でも判定するようにするとこの問題は改善される

** 1J4-OS-18a-6in 国内ウェブサービスでの投稿画像検閲における HC/CS 活用事例 [#fbfd4de4]
林 佑樹(株式会社IkkyoTechnology)
横川 毅(株式会社IkkyoTechnology)

- 機械分類と人力分類を組み合わせて画像の判断
- 確実に除去できる分だけは除去
- あとのOCRや特定物体認識など認識系の技術の確信度を利用して人間計算に生かす

** 1J4-OS-18a-7 クラウドソーシングによる食事画像データセットの自動構築 [#de2662d0]
河野 憲之(電気通信大学情報理工学研究科総合情報学専攻)
柳井 啓司(電気通信大学 総合情報学専攻)

- 食事画像へのラベル付けと,食事領域の指定のタスク
- ノイズ除去やサンプル画像の選択などでタスクの正解率を改善

* 1J5-OS-18b オーガナイズドセッション「OS-18 ヒューマンコンピュテーションとクラウドソーシング (2)」 [#ya08ed3c]

** 1J5-OS-18b-1 クラウドソーシングの現状と課題 [#o7018441]
清水 伸幸(ヤフー株式会社 Yahoo!JAPAN 研究所)

- 人間にタスクを依頼するのは難しい
- Y!のクラウドソーシング:累計で20万人の登録
- マイクロタスク:ある『対象物』についての『質問文』が必要
-- 目標に対して適切なタスクを設定する + タスクの質の保証
- 適切なタスク設定
-- 質問の曖昧さ:質問文の守勢,具体例の提示,コメント欄などのフィードバック
-- 対象物によって生じる曖昧さ:特定の対象物では曖昧性が生じる
-- 単調な回答を避ける:同じ回答が続くと精度が下がる
-- ダミー質問:正解率の低いダミー質問になってしまう
- 組織 vs クラウド:質問文だけで依頼,タスク設定時間と削減時間

** 1J5-OS-18b-2 データ解析コンペティションを用いたクラウドソーシングによる予測モデルの構築 [#wd8cf7ee]
馬場 雪乃(国立情報学研究所ビッグデータ数理国際研究センター)
則 のぞみ(京都大学 情報学研究科 知能情報学専攻)
齊藤 秀(株式会社オプト データサイエンスラボ)
鹿島 久嗣(京都大学大学院情報学研究科知能情報学専攻)

- 予測精度を競わせるデータ分析コンペ:Kaggle, 国内(CrowdSolving, Deep Analytics)
- Wikipediaの記事間のハイパーリンクの存在の有無のタスク
-- 標準的な解法よりもよい方法は容易に得られた
-- 上位モデルのスタッキングでより高精度のモデルが得られた

** 1J5-OS-18b-3 遺伝子構造キュレーションのクラウドソーシング・タスク設計 [#daf301b3]
神沼 英里(国立遺伝学研究所 生命情報研究センター)
馬場 雪乃(国立情報学研究所ビッグデータ数理国際研究センター)
藤澤 貴智(国立遺伝学研究所)
鹿島 久嗣(京都大学大学院情報学研究科知能情報学専攻)
中村 保一(国立遺伝学研究所)

- 膨大な遺伝子情報の注釈情報のキュレーション ← 専門家がやっていたものを非専門家にもできるように
- 発現量と遺伝子領域の重なりを調べてもらう単純化
- タスクの難易度を調べるのに,readability 評価を応用

** 1J5-OS-18b-4 プライベートクラウドソーシングにおける精度向上手法 [#w88be21c]
芦川 将之((株)東芝 研究開発センター)
川村 隆浩((株)東芝 研究開発センター)
大須賀 昭彦(電気通信大学大学院情報システム学研究科)

- 結果を保証するため,ワーカをフィルタリング
-- 事前アンケートのフィルタリング
-- 作業中に正解率が低くなるとバンすると提示 → 容易なタスクで正解率を稼いで報酬の良い難タスクで低品質な仕事をする
-- タスクの結果から,ワーカに得意なタスクを割り当てる
-- タスクの精度が分からない ワーカ と タスク の対を行列の補完問題として解く

** 1J5-OS-18b-5 予測市場を応用した商品コンセプト評価システムの設計と検証 [#kecb9e60]
今井 未来(青山学院大学)
水山 元(青山学院大学)

- コンジョイント分析は高コスト → 魅力的な商品コンセプトを提案したら高い報酬が得られる予測市場

** 1J5-OS-18b-6 プライバシ保護クラウドソーシング [#jf48c07c]
梶野 洸(東京大学大学院情報理工学系研究科数理情報学専攻)
馬場 雪乃(国立情報学研究所ビッグデータ数理国際研究センター)
鹿島 久嗣(京都大学大学院情報学研究科知能情報学専攻)

- 画像中の顔を隠すタスク
-- 画像を小さな領域に分けて処理してもらう.小さな領域なので顔の全体は分からない.
- 切り抜き領域の大きさでプライバシと精度はトレードオフの関係

* 5月13日 (火) 2日目 [#y055d998]

* 2A2 招待講演: 「情報共有」の新しいトレンド [#q4bb1610]
青野 慶久(サイボウズ株式会社)

- グループウェアの社数シェアは 31.5%.売上ベースのシェアはこれより少ない
- グループウェア:あらゆる情報を挙有し,効果,効率,満足,学習を向上
-- 情報共有の土台がある会社がグループウェアをいれると,さらに情報共有が進む → 土台がないと無理
-- 「チームあるところにサイボウズあり」チームワークの向上をめざす
-- アプリの会社だがインフラも運用している → どこかのサービスを使うとその基盤以上の品質は出せない
-- salesforce.com より社数ベースでは多い

情報共有
- 情報共有はあまり代わっていない
-- ファイル共有だけで多くの問題:端末の多様化,セキュリティ,検索,コラボレーション… → 目的を見失う
- 人はなぜ「情報共有」をしたがるのか? 共同作業 と それ以外 → 共同作業に注目
- チームワーク:ピーター・ビン船具,野中郁次郎など → 研究が少ない
- チームとは? 共通のビジョン,メンバーの境界,役割分担,相互依存関係
- チームワークの良さの基準:メンバー+仕事 → チームワーク → 効果,効率,満足,学習(ホーゲルとゲムンデン, 2001)
- チームワーク形成のメカニズム:7要素のプロセスにより形成 (ディッキンソンとマッキンタイア, 1997)
- チームワークの可視化:プロセスの各要素の進行度合いで分かる
- チームワークのシステム要件:プロセスを稼働させるための道具立て
- kinone:データベース + ワークフロー管理 + コミュニケーション支援のセット
-- APIを通じた連携,アプリストアによるエコシステム

* 2M3 「情報推薦(1)」 [#raec04b3]

** 2M3-1in グループ推薦のため非線形行列分解 [#sb632f39]
吉川 友也(奈良先端科学技術大学院大学 情報科学研究科 情報科学専攻)
岩田 具治(日本電信電話株式会社 NTTコミュニケーション科学基礎研究所)
澤田 宏(日本電信電話(株) NTTコミュニケーション科学基礎研究所)

- グループは固定で,行列分解型だけど,KorenみたいなMAP推定ではなく,GPを使ったベイズ推定にする

** 2M3-2 推薦そのものがユーザに与える影響を考慮した情報推薦 [#h12cac6e]
大知 正直(東京大学工学系研究科技術経営戦略学専攻)
関 喜文(東京大学工学系研究科技術経営戦略学専攻)
川上 登福(株式会社 経営共創基盤)
小野木 大二(リクルート)
野村 眞平(リクルート)
吉永 恵一(リクルート)
松尾 豊(東京大学工学系研究科技術経営戦略学専攻)

- 最もコンバージョンしそうなものを推薦する推薦システム
-- コンバージョンにいたるまでに,コンバージョンに繋がるようなものを推薦したい
- 不動産情報サイトの行動ログ:コンバージョンするユーザは頻繁にアクセスする
-- 利用者はコンバージョンに近くなると調べる不動産の範囲が狭くなる
- 過去ログから,数個先でのコンバージョンする確率に基づいて推薦する方法

** 2M3-3 協調フィルタリングにおけるアイテムベースとユーザベースの統合型推薦システムに関する検討 [#c2af2fbe]
伊藤 寛明(名古屋大学大学院工学研究科計算理工学専攻)
吉川 大弘(名古屋大学大学院工学研究科計算理工学専攻)
古橋 武(名古屋大学大学院工学研究科計算理工学専攻)

- 一度に一つずつ推薦する状況
- 相関ルールを利用した推薦 → 条件があるのでそれを推薦の説明に使う
-- 推薦対象がある特徴を持つことと,ある利用者がある推薦対象を好むとしたことをアイテムと考えて,結論部が利用者がある推薦対象を好むとするアイテムになるようなルールを見つける
- アイテムの人気度も考慮した推薦も行う

** 2M3-4 トピックモデルと協調フィルタリングに基づくユーザ興味を反映した情報推薦システム [#b23d5d1d]
渡邊 恵太(名古屋工業大学大学院工学研究科情報工学専攻)
加藤 昇平(名古屋工業大学大学院 工学研究科 情報工学専攻)

- twitterで,ある利用者のツイートを一つの文書と考えてLDAを適用し,利用者の各トピックへの関連性を求める
- 一様分布以下の生起確率のトピックは否定評価,以上のものは肯定評価として,あとは利用者間型のメモリベースの推薦をする

* 2B4-OS-15a オーガナイズドセッション「OS-15 プライバシに配慮したデータ利活用 (1)」 [#u393a5a2]

** 2B4-OS-15a-1 個人データの自律分散管理によるサービスのイノベーション [#m67c1b1c]
橋田 浩一(東京大学大学院情報理工学系研究科ソーシャルICT研究センター)

- 個人データを管理するストレージ・クラウドを個人で管理し,それを複数の病院に持っていって使ってもらう枠組み.

** 2B4-OS-15a-2 会員カードユーザが「プライバシ侵害」を感じる理由とは? [#qb0b0234]
小松 孝徳(明治大学 総合数理学部 先端メディアサイエンス学科)
菊池 浩明(明治大学総合数理学部)

- 個人データの収集で,データ所有者と事業者側の意識のギャップ
- カードの所有状況:ポイントカード系でもあまり抵抗はない
- 顔写真など40項目について提供に対する対価がいくらか? → 決済関係は出したくない.全般的に高額の対価を要求.
-- メールアドレスとLINEアカウントは異なるプライバシ嗜好因子(独居と隔離)と関連
-- 比較的個人情報に深く関わるような架空の推薦システムを考えてみて質問したが特に嫌われたものはなかった

** 2B4-OS-15a-3 医療データ利用におけるプライバシ保護の課題とその解決策の提案 [#w4523d17]
森田 瑞樹(東京大学大学院情報理工学系研究科ソーシャルICT研究センター)
荒井 ひろみ(理化学研究所)

- 医療情報のプライバシ保護の問題
- 医療での匿名化:個人を識別できないようにすること.場合によって代わる.アメリカは18項目で固定
- 連結可能:二つの表のレコードにランダムなIDを割り振り,そのIDの対応付けを破棄すれば連結不可能になったとする → 匿名情報として扱える
- レセプトデータベース,患者・症例登録,商用のもある
- 遺伝子分析での必要性から連結可能な状態でデータが扱われるようになってきた
- 医療データは日常診療のためのデータとして収集していて,分析に使うと名寄せなどの問題を生じる
- 緊急時・災害時:持病や自分の処方されている薬が分からない → 医療関係者だけに

** 2B4-OS-15a-4 匿名化の実社会での利用へ向けての技術課題 [#y898930e]
中川 裕志(東京大学情報基盤センター)

- EU Data Protection Directive / Report to the President Big Data and Privacy, USA
-- EUの個人情報保護基準に日本の法制度がおいついていないのでゲノム情報などは日本には禁輸
- 匿名化が有効な場合
-- 疑識別子の存在 と DBにある人が含まれるかどうかの外部可知
-- サンプリング=確率的可知,k匿名化=確定的可知
-- 外部確定的可知だと擬識別子の有無にかかわらず匿名化は無力
- 古典的なとらえ方の場合の自己情報コントロール:訂正消去
-- k匿名化されてるともうどれか分からない

* 2B5-OS-15b オーガナイズドセッション「OS-15 プライバシに配慮したデータ利活用 (2)」 [#mf57feac]

** 2B5-OS-15b-1 滞在場所のk-匿名化法 [#i2dad800]
角野 為耶(東京大学)
中川 裕志(東京大学情報基盤センター)

- 地理情報k匿名化で,センシティブな地点を含む領域を含む領域に割り当てられてしまったなどの濡れ衣問題
-- その匿名グループでセンシティブな地点に実際に行っている人が多いとその影響を被りやすい
- この濡れ衣の影響を受けにくいようなクラスタリング手法

** 2B5-OS-15b-2 匿名化データからのロバスト分類学習とその汎化誤差解析 → 理論的な誤りがあったので内容変更 [#c734e041]
小林 星平(筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻)
佐久間 淳(筑波大学 大学院システム情報工学研究科)

- k匿名化したデータでの回帰分析の誤差に与える影響 → バイアス=バリアンス分解をするとバリアンスが低下する

** 2B5-OS-15b-3 プライバシを保護した尤度比検定 [#cdfaec07]
川崎 将平(筑波大学情報学群情報科学類)
呉 双(筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻)
佐久間 淳(筑波大学 大学院システム情報工学研究科)

- 分散環境+暗号化を用いて,ロジスティック回帰の尤度比を求める
- 対数の計算が級数展開になるので大変

** 2B5-OS-15b-4 垂直分割モデルにおけるプライバシ保護ロジスティックス回帰分析 [#sd540e30]
呉 双(筑波大学大学院システム情報工学研究科コンピュータサイエンス専攻)
川崎 将平(筑波大学情報学群情報科学類)
菊池 浩明(明治大学総合数理学部)
佐久間 淳(筑波大学 大学院システム情報工学研究科)

- ロジスティック回帰の再重み付け最小二乗法を秘密関数評価で求める

** 2B5-OS-15b-5 情報中立推薦システムの高速化 [#b0a06dff]
神嶌 敏弘(産業技術総合研究所)
赤穂 昭太郎(産業技術総合研究所)
麻生 英樹(独立行政法人産業技術総合研究所知能システム研究部門)
佐久間 淳(筑波大学 大学院システム情報工学研究科)

- 複数の視点変数があったら → それらを一つの変数にまとめて処理する

* 5月14日 (水) 3日目 [#veaf89a8]

* 3A2 「特別講演: 第五世代コンピュータからスキルサイエンスへ - 論理プログラミング・アプローチ」 [#o37b3341]
古川 康一(嘉悦大学)

第5世代プロジェクト
- 1982〜1992の11年で,IBM に対抗しようとした
- FGCS1981:1981.10.19-22 に国際会議を開催
-- 渕 vs ファイゲンバウム論争:LISP派のファイゲンバウムに対し論理言語の渕
-- チューリングの構想:AIの実現の可能性の道筋 (1950),1)プログラミング,2)学習,3)論理や確率 → 3を有望視した
- 並行論理プログラミング:並行処理がPrologはできない → PARLOG や Concurrent Prolog などの並列化があった → 上田 和紀の Guarded Horn Clauses (1984) をターゲットに(並列の単位が細かい)
-- ハード(瀧),並列OS PIMOS (近山) が同時に進行できるように
- 定理照明器 (Bry の SATCHMO) をGHCで実装 → 探索機能が並列化できなくなっていたが,それを回避できた
- Prolog の部分計算 (竹内・藤田)
- 総括:キラーアプリがなく実用化に至らなかった ⇔ 研究成果や人材育成,国際的なイニシアティブ

スキルサイエンス (1995〜)
- 慶応に移ったことと,自身がチェロをやっていたことから始めた
- チェロのスピッカートというものの練習を対象
- メタ認知による上達の加速:専門家のミニレッスン → メタ目標に対して具体的な動作を得た
- アブダクション:A→B にいたる過程で,それらの間に欠落しているものを見つける

* 3M3 「情報推薦(2)」 [#l4865d3c]

** 3M3-1 業務連携を支援する社内ブログ記事推薦システム [#k949d1e7]
佐藤 政寛(富士ゼロックス株式会社 研究技術開発本部)
出雲 英剛(富士ゼロックス株式会社 研究技術開発本部)

- 社員の協業度で社員間の関連を求め,投稿者と協業度の高い人を推薦候補とする
- その協業度の高い人が書いた記事で,さらに関連する業務の記事を推薦

** 3M3-2 営業活動支援のための商談情報推薦システム [#s92e7612]
出雲 英剛(富士ゼロックス株式会社 研究技術開発本部)
佐藤 政寛(富士ゼロックス株式会社 研究技術開発本部)

- 営業データ:出向いた先などのデータ
- 部門ごとに個別にデータベースがあり対応付けができない
-- 同じ属性値でjoinするのだが,欠損しているときに,デフォルト値みたいなのを入れる
- 対応付けをするスコア関数を定義

** 3M3-3 商品レビューを用いたプレゼント支援の検討 [#b6ec6984]
田口 拓明(岐阜大学工学部)
田村 哲嗣(岐阜大学工学部)
速水 悟(岐阜大学工学部)

- 商品レビュー記事中の単語に基づいてプレゼントとして適切なアイテムかどうかを判定
- 単語を選ぶときに,プレゼントに関連する商品レビューの種集合からえた単語を使う

** 3M3-4 Webニュースサイトのランキング情報を用いた小学生のためのWebニュースの推薦 [#g36ae444]
田中 翔也(香川大学工学部信頼性情報システム工学科)
安藤 一秋(香川大学工学部)

- ニュース記事を使った教育 → 教育に適切な記事を選ぶ
- ランキング上位の記事は多くの人の関心をもつので子供も関心をもつだろう + 子供向けニュースサイトの記事との類似性から子供向けのものを選ぶ
- 学習への重要性,子供の関心トレンド,新聞社のランキングを考慮して全体のランキングを決める

** 3M3-5 WWWからの楽曲情報と評判情報の獲得に基づく楽曲データベースの作成 [#le94a32a]
中島 洋樹(東京工業大学総合理工学部知能システム)
岡田 将吾(東京工業大学 大学院総合理工学研究科 知能システム科学専攻)
新田 克己(東京工業大学(院)総合理工学研究科知能システム科学専攻)

- 楽曲とアーティストから類似楽曲を推薦:Wikipediaの楽曲のメタ情報とLast.fm のタグ情報を利用した内容ベース

* 3F4 「人間・行動と機械学習」 [#c543d079]

** 3F4-1in マルチタスク学習と誘因両立性 [#n1018050]
大岩 秀和(東京大学情報理工学系研究科数理情報学専攻)
中川 裕志(東京大学情報基盤センター)

- 誘因両立性:自分の都合に合ったような結果が得られるように,本来とは違う意味でのアノテーションをすることがある
- ユーザ数より少ない分類器でのマルチタスク学習で解く
- それぞれの利用者にとって不適切な分類がなされないようなリスクを小さくするので,誘因両立性はないようにする → この条件でのリスクの上界を論じる

** 3F4-2 スパム分類器への認知特性の付加とその分類の特徴 [#s69b054d]
谷口 英貴(東京電機大学大学院理工学研究科)
甲野 佑(東京電機大学大学院 先端科学技術研究科 情報学専攻)
清水 隆宏(東京電機大学理工学研究科情報学専攻)
高橋 達二(東京電機大学 理工学部 情報システムデザイン学系)

- Loosely Symmetric:p→q が成立するとき,q→p と逆も成立すると思う認知バイアス
- この判断を補正した式があって,それを条件付き確率として扱った単純ベイズを作る

** 3F4-3 日常行動識別のための文字列カーネルを用いた時系列データの分節 [#odd5e042]
佐土原 健((独)産業技術総合研究所)

- 行動を表すシンボル系列から,それらの系列を教師なしで分類して,一般的な行動パターンを見つけたい
- 文字列カーネルを使うことで,系列に欠損や挿入があっても対応できるように

** 3F4-4in 少数の正解ラベルを用いた移動履歴からの移動手段判定 [#v144ec07]
数原 良彦(日本電信電話株式会社 NTTサービスエボリューション研究所)
鈴木 雅大(北海道大学 大学院情報科学研究科 複合情報学専攻)
戸田 浩之()
鷲崎 誠司(日本電信電話株式会社 NTTサービスエボリューション研究所)

- 移動履歴から,移動手段の違いによるセグメント化と,各セグメントでの移動手段
- 速度を推定してその変化からセグメントに分割 → 各セグメントを個別に分類
- 大規模なアノテーションがないと無理っぽい
- 半教師あり学習 (self-training) で少数ラベルでどうにかしようとしたが効果はわずかだった

** 3F4-5 半教師あり擬RVMによる加速度データからの行動推定 [#sa4433e9]
松重 龍之介(関西学院大学)
角所 考(関西学院大学 理工学部 人間システム工学科)
岡留 剛(関西学院大学 理工学部 )

- 半教師ありカーネルロジスティック回帰:ラベルなしデータのラベルを潜在変数で表す
-- ラベルなしデータがありすぎると性能低下 → 使うデータ数をコサイン類似度に基づいて選別する(擬RVM法)

* 5月14日 (木) 4日目 [#cd130ec5]

* 4G1 「機械学習の応用」 [#lde838bd]

** 4G1-1 確率的トピックモデルとSVMを用いたプラント建設における設計変更箇所予測 [#o6458200]
今沢 慶(日立製作所 横浜研究所 生産技術研究センタ)

- プラントは作ってるときに設計変更が生じると,他の部分に影響が多いので,どれくらいの費用が生じるか見積りが必要になる
-- 自然言語で書かれた変更の仕様から,CADの何を変更しているかを判断する
- 過去のデータからトピックモデルと,トピックとCADの要素の対応付けのモデルを作っておき,新規の仕様書で予測する
-- CADの要素の変更の有無を,LDAで抽出したトピックを特徴として,SVMで分類した

** 4G1-2 マイクロクラスタリングを用いた概念化による分類モデルの構築 [#c49f0451]
中原 孝信(関西大学 データマイニング応用研究センター)
宇野 毅明(国立情報学研究所)
羽室 行信(関西学院大学 経営戦略研究科)

- 店舗の横断データから,健康志向(アンケートによる)に対する正例・負例での頻出パターンを抽出
-- それらのパターンの間に類似性を定義してグラフを作り極大クリークをクラスタとする
-- グラフ研磨:極大クリークの数が出すぎないように辺の疎や密を強める方法

** 4G1-3 多次元時系列データ解析によるアクセシビリティ可視化システムの開発 [#re203614]
岩澤 有祐(上智大学大学院理工学研究科理工学専攻情報学領域)
矢入 郁子(上智大学理工学部情報理工学科)

- Quantified Self:人間の行動や状態を定常的に観測して知見を得る
-- 車椅子行動のヒヤリハット事例を集めて路面の危険性の推定や可視化を行う
-- 速度の違いなどの要因から,行動目的も分かるので,そうした情報もとることが必要
-- iPod touch の加速度センサーを四つ使って記録
- スライディング時間窓が坂道とか,段差の乗り越え中などを識別する
-- 特徴は平均と標準偏差で,振動周期はあほとんど効かなかった

** 4G1-4 利用者の行動特性を用いたサイバー攻撃における成りすまし対策技術 [#he49db4b]
片山 佳則(富士通株式会社)
寺田 剛陽(富士通研究所 セキュアコンピューティング研究部)
津田 宏(富士通研究所 ソフトウェアシステム研究所 )

- 標的型攻撃メールへの対策
-- 送信者の認証は正規の送出元が乗っ取られているとダメ → 受信側で本当に送信者の人間が送ったものかをチェックできるようにしたい
- 送信者の送信者がメールを送信するときに行った行動も送信する
-- サブジェクトの語の使い方や,打鍵の組み合わせ,宛先ごとの高頻度フレーズなど

** 4G1-5 音楽理論に基づいたメロディ生成システム [#f93d5ca4]
矢澤 櫻子(筑波大学大学院システム情報工学研究科知能機能システム専攻)
浜中 雅俊(筑波大学 システム情報系)

- 音楽理論:音と音楽に関する諸現象を記述,コード進行などを扱って,暗黙的に音の列に埋め込まれた意図で,この音楽理論に従っていることで音列は音楽として認知される
- 暗意実現モデル[Narmour]:人間の認知理論に基づいていて,音符の細かい集まりを基本類型と呼ぶものい分類し,こをベースに構築
- 基本類型の遷移モデルを作り,そこから音に変換することで音楽にする

* 4A2 「招待講演: いい加減の交通制御を目指して」 [#oc8dd9ad]
吉井 稔雄(愛媛大学)

- システムを設計するときに,どこまでを機械にさせるか
-- 最後は人間:人間の能力を機械が補完する → 自動車 vs 最後は機械:不都合がおきたら人間が介入(後始末)する → 飛行機はほぼ

交通制御:信号制御
- 利点:導線分離で安全性と効率を向上が
- 欠点:無駄な待ち時間,切り替え時は危険,エラーがあると危険
- 昭和40年代に信号,ガードレール,歩道橋を整備したおかげで16kの死者が半分に
-- その後は事故の発生件数は増えているが,死亡者数は減っている(救急医療のおかげ)
- 信号サイクル長と文明の程度は反比例する:ニューヨークは60秒で非常に短い,東京は日本で一番短く80秒〜100秒
- 交差点に近づいたときに,通過するか停止するかの判断を迫られる
-- 速度とまでの空間をとって,通常の減速で停止できる範囲と,現状の速度で通過することも両方できるゾーンをオプションゾーン,急ブレーキや急加速でないと止まれないのがジレンマゾーン
-- オプションゾーンは周囲の車の判断と違う判断をすると
-- ジレンマゾーンやオプションゾーンが生じないように黄色信号の時間は定めている
- 信号機のトラブル(停電など)→ 安全性が大きく低下
- 交差点信号制御:警察官が行う,管制官が制御,信号機(機械)が行う
-- 人手による運用は,流れが途切れないと止めにくい → スループットが悪くなる
-- 車両が思う通りに動く(信号無視とか)なら信号機の完全自動がよいが,柔軟さが必要なら管制する必要

交通制御:流入制御
- 高速道路に入れる車の数を調節してスムーズに流れるように
-- 高速道路の入り口に信号機を制御する:アメリカでは多いが,日本にはない
- グリッドロック:渋滞が伸びていって,ぐるっと回って渋滞の先頭に繋がると全く車が動かなくなる
- 高速道路で流入制御をすると高速道路だけでなく,一般道路の効率も向上する
-- 入り口のランプでの待ち行列が長いと一般道路にも流れる → 制御して制限を実施した方が一般道路に流れる車が減る(高速の混雑がなくなるので混在を迂回する車が代わりに減る)
-- 制御することで高速道路を通れる車の数も増える

運転支援:経路案内
- 自動運転は実現するか? → 近々実現することはないだろう
-- インフラが整備されていないと車単独では今はできない
-- 制度的な問題
-- 自動化の普及率の割合が100%なら高速道路の効率は良いが,1〜2%なら逆にまずい
-- 歩行者の行動が読めない
- カーナビによる制御
-- 実際の道をみて,曲がる交差点が分からない → 100mぐらい先だと免許を取れる視力でも読めない
- 安価で見やすい案内:アルファベット1文字だけ大きく書いた補助の標識を入れる.ローカルで一意に定まればいい
-- 高知市内ではすでに使われている → カーナビに記号も出るようにすると,ナビの注視時間も減った(1回のターンで4〜5回→1回)

交通事故のリスク
- 一般道路のリスクは高速道路の5〜10倍だが,高速道路の方が危ないと思われている

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS