#freeze
* 第11回人工知能学会データマイニングと統計数理研究会 [#k73cfa69]

このページはしましまが[[第11回人工知能学会データマイニングと統計数理研究会>DMSM#DMSM011]] に参加してとったメモです.私の主観や勘違いが含まれていたり,私が全く分かってなかったりしていますので,その点を注意してご覧ください.誤りがあれば,指摘してください.

* 10月18日 [#w77e1229]

** Blog情報を利用した書籍需要予測モデル [#r4f879c2]
○菊田剛,文健哲,寺野隆雄(東京工業大学)

- 出版も,取り次ぎも業績悪化
-- 10年で2.5兆→2.0兆
-- 返品率 40%

国内のBlog情報とAmazonの売上げの関連
- Ammazonについて研究を適用
- 売上げと言及数の相関は高いものがあるが,そうでないものもが,
- 時間遅れ lag は正負があり,ひろがりがある.

** 産業連関表の数理的な分析をめぐる話題について [#r959ea67]
○ 田村肇 (筑波大学)

- 産業連関表:5年ごとに1年間などの財・サービスの産業間の取引量を示したもの
-- 波及効果の調査:需要の連鎖を調べることができる
-- 産業の入れ替えなどがあるので,時系列比較には問題も
-- 統計的手法が確立した60〜70年の歴史があるが,作成手法はあまり変化がない

- 20年ぐらい連続してデータが入手できるようになったので,より高度な分析をしたい
-- 産業構造の変化とかを検出したい
-- 産業部門をまとめる→次元削減・テンソル分解・グラフマイニング

- http://www.rieti.go.jp/jp/database/d01.html
- http://www.meti.go.jp/statistics/tyo/kanieio/result-2.html#menu2

** 安全工学領域へのテキストマイニング技術の利用計画 [#g46d0f5b]
○ 嶋津恵子 (慶應義塾大学)

- 原発の安全性に関するインタビュー調査 → 人手がかかる → 情報技術で,安全性を確保しつつ効率化したい
- 大規模複雑システムの事故 → ヒューマンエラーがおおきい
-- ヒューマンエラー は個人の問題ではなく,組織とプロセスの問題
-- 事前解決をしたい

そのための,訪問調査
- 表現の幅の検討や,発話の様子なども調べるので 20〜30人 で半年とかかかってしまう

** 隠れ状態の継続時間長を考慮した確率モデルに関する調査 [#b16b3ede]
○黒川茂莉,横山浩之 (KDDI研究所),吉井和佳,麻生英樹 (産業技術総合研究所)

ライフログ:隠れ状態の継続時間に広がりがあるモデルが必要
- 離散隠れマルコフ
- 連続隠れマルコフ:遷移確率の時間極限=推移率→遷移確率が計算できる
- 隠れセミマルコフ:継続時間が直前の状態に依存
- VT(variable transition)隠れマルコフ:遷移確率が状態の継続時間に依存
- 隠れマルコフモデルのトポロジーの拡張もいくつか

** 統計的学習による演奏表情付け [#m1a169d5]
○寺村佳子,前田新一 (京都大学)

演奏表情付け:楽譜以外の強弱や抑揚
- 今は,音楽を打ち込むときに,表情を知って,それをデータ化する必要 → 自動化したい

ルールベース
- 演奏と楽譜の対応関係を明示できる
- ルールを人間が作らないといけない,それらの整合性の問題

事例ベース
- 明示的にルール化しにくい特徴
- 類似性尺度の定義が難しい,データの量に関するトレードオフの発生

機械学習を導入すると
- パラメータ探索などは省力化できる
- 学習事例に似せるだけで,オリジナルの導入

Usapiモデル:著者の提案モデル,ガウス過程を使った回帰

CrestMustPEDB:自動演奏用のデータベース

** 確率モデルを用いたテンソル因子化法の拡張に関するサーベイ [#gf37dc03]
○林 浩平,池田和司 (奈良先端科学技術大学院大学)

テンソル
- いわゆる多次元配列

テンソル因子化
- 元のテンソルを少数のパラメータで記述する
- Tucker分解
 x_ijk≒ΣΣΣ t_qrs u_iq v_jr z_ks
U,V,Z が基底のようなもの,Tがコアテンソル.
-- 分解の一意性は通常はない
- PARAFAC:Tuckerの特殊な場合
コアテンソルは立方体で,対角要素が 1 で他は 0 のもの
-- 分解が一意になる十分条件が存在
- Tensor PCA:テンソルが n 個観測されたとき
-- コアテンソルは各サンプルにあるが,UVZの基底は共通
- アルゴリズム:2乗誤差を ALS (Alternating Least Square; 各変数を交互に最適化) で最小化する

確率モデルへの拡張
- pTucker:コアテンソル+ガウスノイズ
- probabilistic 2D PCA:Tensor PCAの確率をいれたもの
- Bayesian Tensor 分析:UVZの精度パラメータが異なるprobabilistic 2D PCA
- Dynamic Exponential Familty Matrix Factorization:PARAFACモデルで,テンソル X と z の間に状態空間モデル

** 順序の距離と確率モデル [#v118c26e]
○神嶌 敏弘 (産業技術総合研究所

質問
- 順序間や他の尺度との変換に許される制約は定式化できるか
- 群論と順序の関係についての参考文献

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS