しましま/IBIS2006
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
* 人工知能学会 第64回 人工知能基本問題研究会 (SIG-FPAI) [...
* 第9回 情報論的学習理論ワークショップ (IBIS 2006) [#qfa5...
このページはしましまがIBIS2006に参加してとったメモです.
私の主観や勘違いが含まれていたり,私が全く分かってなかっ...
-[[FPAIホームページ>http://www-ikn.ist.hokudai.ac.jp/sigf...
*マルコフネットワークとベイジアンネットワーク [#sec1d4df]
鈴木譲(大阪大学)
** 条件付独立 [#rc7298cc]
I(X,Z,Y) は Z が与えられたときに,X と Y は独立.
- 無向グラフで条件付独立を表すのがマルコフネット
- 有向グラフで条件付独立を表すのがベイジアンネット
それぞれ,どのようなモデルが表現できて,どのようなものが...
** マルコフネット [#qee8234b]
X と Y の間に Z 中のノードが必ずある.
X,Y は Z でブロックされる <X|Z|Y>
X,Y,Z∈V の要素を確率変数に対応付け
I(X,Z,Y) ⇒ <X|Z|Y> ... D-map
<X|Z|Y> ⇒ I(X,Z,Y) ... I-map
I-map + D-map = Perfect-map
一個削ると I-map でなくなる極小 I-map がマルコフネット.
** ベイジアンネット [#e1d7d27f]
ブロックは,依存性の→が X→{z∈Z}→Y,X←{z∈Z}→Y,X→{z¬∈Z}←Y
I(F1,{M1,M2},F2) & I(M1,{F1,F2},M2) のパターンはマルコフ...
*** 木構造の場合 [#xf75ad99]
ベイジアンネットはノード数に比例する時間で計算できる.
クリーク(完全部分グラフ)をノードとするジャンクションツリ...
*** chordalなマルコフネット:たかだか3角形のループしかで...
ジャンクションツリーの生成が容易で,比較的計算は容易.
このchordalであることが,マルコフとベイジアンの両方で表現...
* 因果的差分検出手法の振舞いの検証 [#qd7deb8c]
村上知子 (株式会社東芝)
** 差分の分析 [#n9c756a5]
データ集合 A と B の差分
- 複数の対象間の差分:地域別の商品売り上げ
- 時間的変化によって生じる差分:トレンドの変化
手法: クロス集計,χ2乗検定,相関ルール
因果的差分:差分が生じた原因を調べる
** Causal Difference Detection using Bayesian Networks (C...
専門家がグラフを定義→パラメター学習によりベイジアンネット...
- 原因生起確率の差分,因果関係の差分 の二つの差分を考える.
- 情報量規準に基づく検出
* 複写機の障害診断における確率推論アルゴリズムの実験評価 ...
山田紀一、足立康二(富士ゼロックス)、本村陽一(産総研)
障害診断モデルの構築
- 画質トラブルを,黒点や黒スジのような11のタイプ別に,方...
- 故障診断箇所ノードを画質トラブルノードにリンク
- 親ノードが増えるときはサブカテゴリを作る
- 故障診断箇所への,内部状態からのリンクを生成
- CPT はデータから特定.
内部状態とトラブルの症状から,交換する部分(故障診断箇所...
ジャンクションツリーより,LoopBP は同等の予測精度で,メモ...
* ダイナミックベイジアンネットワークを用いた麻酔行為の表...
白鳥成彦、奥出直人(慶應義塾大学 政策・メディア研究科)
麻酔情報の提供によって手術をサポート:事前のwarining,eme...
- 麻酔には多くの専門が関与する多次元処理が必要.(麻酔専門...
- 麻酔は,時間・状況に大きく依存する動的特性 (分単位で対...
- 患者や他のスタッフの要因や,計測機器のノイズによる不確...
+ 時間幅が一定のベイジアンネットでは時間幅が一定だと表現...
+ 個人のモデルをより柔軟に表現できるべき
階層的ベイジアンネットでモデル化
-Activity Bayesian Network: 全体の目標
-Action Bayesian Network: 各スタッフ
-Operation Bayesian Network: 各医療機器の状態
細分化によって,適切な粒度でのモデリングが可能.
* ベイズネット分類器による重要文書推定における構造学習の...
磯崎隆司(富士ゼロックス(株)研究本部)
半教師ありの学習をするベイジアンネット.
-利用者のプロファイル,行動をそれぞれ違ったノードで表し,...
-単純ベイズ
-tree argumented 単純ベイズ (TAN): 単純ベイズの属性ノード...
- 修正TAN:ツリー(単一MST) ではなく複数のMSTを許す緩和
* 携帯電話ユーザのための映画嗜好モデル構築と映画推薦シス...
小野智弘(株式会社KDDI研究所)、黒川茂莉(慶應義塾大学)...
個人化 + 状況依存性 + 即時性を考慮した映画の推薦 → 複数の...
-構造の決定:おおまかには与える.データを使って精錬
-各ノードの内容
--利用者のデモグラフィックやライフスタイルの特徴や映画の...
--推薦される映画の特徴:紹介文から抽出したものと,アンケ...
-ノードをクラスタリングしてまとめ,Bayonetで構造推定
* ベイジアンネットワークを用いた消費者の金融商品選択モデ...
田中隆博、金子泰敏、末吉英範、瀧川孝幸(株式会社 野村総合...
デモグラフィックな特徴に加え,心理的なサイコグラフィック...
-主観的判断を考慮するサイコグラフィックの導入背景:ライフ...
顧客分析の問題
- データ数などデータサンプリングの問題→1万人の大規模調査
- モデルの表現が現場には複雑すぎ,データの欠損などへの対...
保険型,貯蓄型,投資型に分けて,定性的な考察に基づきネッ...
* パネル「因果モデリングへの期待」 [#uc654acb]
司会:本村陽一氏 パネリスト:植野先生(電通大)、黒木先生(...
** 因果モデル構築のためのソフトウェア「Bayesian Discovery...
- ハイパーパラメータにより利用者の事前知識を表現し,因果...
- 重要な変数発見こそ重要ではないか? 変数集合の発見を中心...
** 「因果の発見と検証に関して」(黒木先生) [#j5fb367b]
-- 方法論…無作為化実験←実際には実行しにくい
- 因果情報は物理的なモデルが分かっていれば検出可能
- causal diagram: 変数の依存性を矢印で表したグラフ.依存...
- intervention:特定の変数を外的に操作できる関数と置き換...
- X3 にintervention したときのX4への因果的効果(causal eff...
- 因果的効果と条件付分布:X にinterventionしたときのYへの...
-- Z→Y→X&Z→X では一致,Y←Z→X や Y←Z→X&X→Y では不一致
-- 不一致になる基準=バックドア基準:X と Y を結ぶ道への...
-- FrontDoor 基準:(Z,Y),(X,Z)のそれぞれに対し,Xと空集合...
フロントドア基準を満たす Z の観測値だけ調べればXからYへの...
- joint intervention:複数の変数に同時にintervention,結...
-- admissible condition: 因果ダイヤグラムで Xi+1...Xn に...
-- 拡張front door基準:因果ダイヤグラムで Xi+1...Xn に配...
* 招待講演:情報統計力学の深化と展開〜情報学でも“More is ...
樺島祥介先生(東京工業大学)
** モノの科学(情報科学)とコトの科学(自然科学) [#t84b3da0]
- 熱力学: 熱機関の最大効率は?
-- マクロな経験則(永久機関の否定)がスタート点
-- 熱効率が最大なのは「可逆過程」のとき→これを特徴付ける...
- 統計力学
-- ミクロな気体の性質からマクロな気体の性質を導く → ミク...
-- 気体分子の法則:エネルギー関数を与える
--- 絶対温度 T のマクロ熱平衡状態における微視的(ミクロな)...
-- すると,熱力学の F=U - TS (F:自由エネルギー, U:内部エ...
- 情報理論
-- 一意に復号可能な符号で平均符号長を考えるとその上限は,...
** More is differnt (P.W.AndersonのScience(1972)の論文) ...
- 自然の階層性 素粒子→原子→分子→細胞→器官→生物→
-- 下位階層を支配する法則が明らかになっても,上位階層の集...
ーーー 予言力の高い法則は階層ごとに異なる.下位→上位を導く研...
-- モノの科学には「量が増えれば(階層があがれば)質が変わる...
例:磁石のモデル
- イジングスピン Si=±1 で表す.これらのインタラクション ...
- これは,磁石になるか?→対称性により磁石にはならない
- ここで more is different.大量に集めると磁石になる.
- 少数の自由度では:確率的(ボルツマン分布) ⇔ 大自由度極限...
-- 予期しない現象の創発 [ 対称性の破れ → 不連続性が生じる...
-- 少数のマクロ変数にカンする自己無撞着法廷手引き帰着される
** 情報学における more is different [#eb6d3e8f]
- CDMAマルチユーザ復調問題:複数の端末と一つのアンテナの...
-- 端末は,自身の乱数で復調してアンテナへ.
→アンテナでは複数の信号+ノイズを受信.
--- 復調問題:利用者の乱数と受信系列から,各利用者の元の...
ビット列なので,線形方程式では解けず,離散最適化になりNP...
- そこで,個々のビットはベイズ的に推定する.確率的な基礎...
-- more is different になって,100個ぐらい集めると,決定...
* オーガナイズド・セッション「確率モデルと集団最適化」 [#...
* 「確率モデルと集団最適化入門」 [#me7322d8]
赤穂昭太郎(産総研)
** 複雑な最適化問題 [#ob65673e]
- 複雑な関数 (探索範囲が広く,局所解は多い,関数形は未知)...
- ボルツマン分布:pT(x)=1/ZT exp(-f(x)/T) を使って,ちょ...
-- 正規化定数の ZT の計算は大変 → サンプリングは無理? → ...
- MCMC: 候補を確率的に生成 & 確率的な採択
-- 全体の分布は不要で局所的に計算可能.収束性の保証 ⇔ MCM...
-- 測度面の工夫:提案分布,温度パラメータの工夫,集団の利用
** 提案分布での工夫 [#aa8c9b7c]
- 探索の広さ (exploration) ⇔ 採択率を上げたい (exploitati...
- 温度パラメータの工夫
-- 温度は対数的に下げると理論的にはよいが,それでは遅い
- 集団の利用
-- MCMC の集団拡張→一般化:マルチテンパリング法
-- マルチテンパリング法:違う温度で複数のMCMCを実行 & 個...
** 最小値探索と期待値計算 [#i7951b70]
- 共通部分が多い
- 重点サンプリング:目的 p とは違う分布 r でサンプリング...
- 再サンプリング:w(x)に従って再サンプリングすると,p(x)...
** GA [#pf325cf7]
+選択:p(x)に従ってサンプリング
+ 突然変異:q(x'x)で個体を移動
+ 交差:(?)
** 構造獲得と最適化 [#c4868c66]
- 学習による構造獲得:
-- pT(x) は全体のモデル化 (平均場近似)
-- pT(x) の値が大きいところのモデル化 (EDA):最適解があり...
**関連研究 [#f94d06f6]
- 能動学習:サンプルをコントロールしている点は類似してい...
- Bandit problem,強化学習:最適化と確率同定の両方が目的...
- 平均場近似,確率伝播法:あるタイプのグラフィカルモデル...
* 「確率的学習と進化論的手法の統合」 [#nfdaa29b]
伊庭斉志(東大)
** 遺伝的アルゴリズム [#a6c3f334]
GAの構成要素:集団による多様性維持,選択,交差と突然変異...
- 交差 と 突然変異 をなくすとどうなるか?
GAの長所・短所
-長所:並列化,事前知識が不要
-短所:変数間のinteractionを考えられない←交差,突然変異
** EDA (estimation of distribution algorithm) [#dceb49e1]
- GA: 交差や突然変異 → EDA: 確率分布の推定と再サンプリング
-アルゴリズム(UMDA):分布に従ってサンプルを生成→目的関数...
確率分布のモデルと更新規則の違いでいろいろな種類:UMDA, P...
-UMDA (univariate marginal distribution algorithm):~
変数間は独立→その変数をゆるめた方法がいくつかある:MIMIC,...
** EDP [#w22ddc45]
GA→EDA から GP→EDP
- プログラム木を表す
-- PIPE: プログラム木の各ノードの要素を独立に決める
--- 独立に決めるとまともなプログラムにならないことが多い...
- 確率文法を用いてプログラムを生成:GMPE
*オーガナイズド・セッション「自然言語とゲノム言語への統計...
* 「ゲノム言語と確率モデル」 [#a88667a8]
浅井潔(東大)
-自然言語: 構文解析は,背景や文脈が明確でないと実行できない
-ゲノム言語: コドンからアミノ酸への変換は分かっているが,...
ゲノムの構造:promoter→TSS→start codon→{exon→5'splice sit...
- ほぼ自然言語解析と似ている:ただし,1文字違うと全く異な...
その後は:mRNA→タンパク質の一次構造→立体構造→転写を制御
- ncRNA (non-coding RNA) タンパク質に翻訳されないが,他の...
* 「RNA配列解析のためのカーネル関数の設計と応用」 [#ycf8f...
榊原康文(慶大)
** DNA配列をベクトルに [#o4f56969]
非コードRNA: 98%が非コードRNA.RNAi(RNA干渉)による発現制...
→ シグナルが弱く,部位の特定が難しい.
進化すると,転写されない領域(人:55%),転写されるが翻訳さ...
非コードRNAは2次構造を持つ→この2次構造を導く配列を手がか...
この2次構造パターンはどうやって見つけるか?→こうした非数...
- カウントベクトル:配列中の塩基/アミノ酸の出現度数を表す...
- k-スペクトラムベクトル: 2-スペクトラム なら連続した2文...
- 部分配列ベクトル: 連続していない一定長の部分配列の出現...
→ベクトルの次元数が,文字数に対して指数的に増加してしまう...
→高次元を効率的に計算するため,カーネルの導入.ベクトルを...
** RNA配列用ステムカーネル [#lee54e1d]
ステムベクトル:アミノ酸列が折れ曲がった突起状の構造をス...
必ずしも連続していない候補の列を数える:長さ2の例 (A-(A-T...
ステムカーネル:全ての長さのステムベクトルの内積を計算....
マイナーな改良
-gap重み λの導入.ギャップ長 i について λ^i のペナルティ
-深い入れ子構造は重要視
-ステムの先端部になるループの下限Lの導入.これが短すぎる...
-突然変異に対して,構造が頑健になるようなスコアの導入
-ホモロジーの高い配列の分類問題:文字列カーネルと比較する...
-リモートホモログ検索:ncRNAには類似したfamilyがある.そ...
* 「非整列RNA配列群からの頻出ステムパターンのマイニング」...
浜田道昭(みずほ情総研) 津田宏治(Max Planck Institute) 工...
問題設定
-入力:アラインメントや2次構造が未知のRNA配列群
-出力:2次構造モチーフ(頻出パターン)
2次構造パターン:ステムのパターン
モデル
-RNA配列群:ステムグラフ+ラベルtaxonomy
-2次構造パターン:ステムパターン
-ステムグラフ:ステムをノードとするグラフ
--ステム間関係:parallel(並列),nested(同じステムにループ...
→これらの関係がある場合にノード間にラベル付の辺を生成
--2次構造は未知:どうしよう?~
→base pairing probability matrix 任意の塩基のペアについて...
→塩基対になりやすい高確率な部分をステム候補とする~
→ステムの代わりにステム候補をノードとしたグラフにする.た...
-ラベルtaxonomy
--ステム候補間の類似性を離船的に表現.デンドログラムで表...
-ステムパターン
--2次構造を,ノードのステムをラベルタクソノミのラベル付け...
目標:支持度がminsupport以上でと,ノードのコストの総和がm...
グラフマイニングのgSpanアルゴリズムが基本:深さ優先探索....
-さらなる探索空間の制限:DFSコードの拡張の制限,自明な非...
-すでに論文で報告されている共通モチーフを見つけることに成功
* 「Knowledge discovery and hypothesis generation from bi...
小池麻子(日立)
要求
- MEDLINEに登録された文献が多すぎて,目的の論文を検索でき...
- 文献からの自動知識抽出.
- 文献の断片的な知識から仮説生成や知識発見.分野が細分化...
タンパク質/遺伝子名認識
-その難しさ
-- 同義語が多い:あとになって同じものと分かる場合がある
-- 複数の遺伝子が同一の省略名をもつ
-- 他の一般の語彙と同じ綴りのものがある.
-- 綴りにばらつきがある
-- などなど
-遺伝子名の収集:標準tagger + 人手ルール + 接尾辞などを利...
機能用語の開発:Gene Ontoroly (GO) を基盤に
- GO termと共起性の高い語を関連語
- GO termと同じ文脈のものを抽出
- (?)
- 遺伝子/タンパク質名の曖昧性の除去
** 潜在的知識発見と仮説生成 [#e7008f49]
Open Discovery: 発表されている文献の関係を組み合わせて発...
-潜在的知識発見の例:レイノー病→○→魚油の例
知識発見の難しさ
- 概念の関連付けをするには語彙やクラスの統一が必要
- 概念間をいろいろな類似度で関連付け.よい類似度について...
*特別講演:「脳情報復号化によるブレイン−マシン・インター...
神谷之康(ATR脳情報研究所)
脳から心を読むにはどうすればよいのか
符号化・復号化:perception, 認知,行動 ←→ 脳活動=code
-こう見なすことで,mind-readingを考える
fMRIによるニューロイメージング
- 生きたヒトの脳全を体非侵襲的(電極とかを脳にささない)な...
- 解像度は数mmオーダなので,単一の神経細胞の活動は計測で...
知覚内容のデコーディング
- 脳の信号を観察して,何を知覚しているかどうかを求める.
古典的コーディング解析 http://viperlib.york.ac.uk/
- 線の傾きそれぞれに応じて反応する視覚細胞があることを見...
fMRI画像で観測すると,fMRI画像の画素一つに複数のコラム(特...
アンサンブル特徴選択性
- いくつかの画素を集めたとき,それらの集団的な活動から知...
- 複数の入力画素の輝度から,各傾きに応じて反応する識別器(...
- 8種類の傾きを見せた反応の脳信号から,傾きを検出できた.
- 数ヶ月の時間がたってもデコードはできた.
- 視覚野には低次〜高次のものがある:最初に信号がくる視覚1...
- 傾きの判別について,画像そのものは線形分離できないが,...
fMRIの画素が対応する部位を脳の表面にマップする → ヒトによ...
右斜めと左斜め縞が重なった画像を見せ,どちらかの縞を意識...
運動方向の選択性と,傾きの選択性を比べると,1次→4次の視覚...
- 印象主義と超現実主義の絵画を判別させる:75%ぐらいの正解...
- グー・チョキ・パーの判別:90%以上の正解率.運動野の反応...
- 発生内容のコーディング:運動野は子音に,小脳は母音に反...
変分ベイズを用いた画素選択:デコードに利用する画素(特徴)...
脳のデコーディング
- オンラインで解析 → brain machine interface:脳から直接...
- オフライン →マーケティング,人材評価
BMI (brain machine interface)
- 外界に信号を送るにあたっての壁である「身体」を超える
- 侵襲型:Cyberkinetics by Schwartz
-- 神経細胞から精度の高い信号
-- 感染などのリスク,限局される(狭い)記録部位
- 非侵襲型
-- 感染などの危険なし
-- 精度が低い.神経活動の変化から血流の変化までのタイムラ...
-conventional neural modeling: 刺激 S から予測応答 ^r
-neural decoding:応答から刺激を予測
→ 予測刺激から刺激を生成するループなどを使った実験へ発展
終了行:
* 人工知能学会 第64回 人工知能基本問題研究会 (SIG-FPAI) [...
* 第9回 情報論的学習理論ワークショップ (IBIS 2006) [#qfa5...
このページはしましまがIBIS2006に参加してとったメモです.
私の主観や勘違いが含まれていたり,私が全く分かってなかっ...
-[[FPAIホームページ>http://www-ikn.ist.hokudai.ac.jp/sigf...
*マルコフネットワークとベイジアンネットワーク [#sec1d4df]
鈴木譲(大阪大学)
** 条件付独立 [#rc7298cc]
I(X,Z,Y) は Z が与えられたときに,X と Y は独立.
- 無向グラフで条件付独立を表すのがマルコフネット
- 有向グラフで条件付独立を表すのがベイジアンネット
それぞれ,どのようなモデルが表現できて,どのようなものが...
** マルコフネット [#qee8234b]
X と Y の間に Z 中のノードが必ずある.
X,Y は Z でブロックされる <X|Z|Y>
X,Y,Z∈V の要素を確率変数に対応付け
I(X,Z,Y) ⇒ <X|Z|Y> ... D-map
<X|Z|Y> ⇒ I(X,Z,Y) ... I-map
I-map + D-map = Perfect-map
一個削ると I-map でなくなる極小 I-map がマルコフネット.
** ベイジアンネット [#e1d7d27f]
ブロックは,依存性の→が X→{z∈Z}→Y,X←{z∈Z}→Y,X→{z¬∈Z}←Y
I(F1,{M1,M2},F2) & I(M1,{F1,F2},M2) のパターンはマルコフ...
*** 木構造の場合 [#xf75ad99]
ベイジアンネットはノード数に比例する時間で計算できる.
クリーク(完全部分グラフ)をノードとするジャンクションツリ...
*** chordalなマルコフネット:たかだか3角形のループしかで...
ジャンクションツリーの生成が容易で,比較的計算は容易.
このchordalであることが,マルコフとベイジアンの両方で表現...
* 因果的差分検出手法の振舞いの検証 [#qd7deb8c]
村上知子 (株式会社東芝)
** 差分の分析 [#n9c756a5]
データ集合 A と B の差分
- 複数の対象間の差分:地域別の商品売り上げ
- 時間的変化によって生じる差分:トレンドの変化
手法: クロス集計,χ2乗検定,相関ルール
因果的差分:差分が生じた原因を調べる
** Causal Difference Detection using Bayesian Networks (C...
専門家がグラフを定義→パラメター学習によりベイジアンネット...
- 原因生起確率の差分,因果関係の差分 の二つの差分を考える.
- 情報量規準に基づく検出
* 複写機の障害診断における確率推論アルゴリズムの実験評価 ...
山田紀一、足立康二(富士ゼロックス)、本村陽一(産総研)
障害診断モデルの構築
- 画質トラブルを,黒点や黒スジのような11のタイプ別に,方...
- 故障診断箇所ノードを画質トラブルノードにリンク
- 親ノードが増えるときはサブカテゴリを作る
- 故障診断箇所への,内部状態からのリンクを生成
- CPT はデータから特定.
内部状態とトラブルの症状から,交換する部分(故障診断箇所...
ジャンクションツリーより,LoopBP は同等の予測精度で,メモ...
* ダイナミックベイジアンネットワークを用いた麻酔行為の表...
白鳥成彦、奥出直人(慶應義塾大学 政策・メディア研究科)
麻酔情報の提供によって手術をサポート:事前のwarining,eme...
- 麻酔には多くの専門が関与する多次元処理が必要.(麻酔専門...
- 麻酔は,時間・状況に大きく依存する動的特性 (分単位で対...
- 患者や他のスタッフの要因や,計測機器のノイズによる不確...
+ 時間幅が一定のベイジアンネットでは時間幅が一定だと表現...
+ 個人のモデルをより柔軟に表現できるべき
階層的ベイジアンネットでモデル化
-Activity Bayesian Network: 全体の目標
-Action Bayesian Network: 各スタッフ
-Operation Bayesian Network: 各医療機器の状態
細分化によって,適切な粒度でのモデリングが可能.
* ベイズネット分類器による重要文書推定における構造学習の...
磯崎隆司(富士ゼロックス(株)研究本部)
半教師ありの学習をするベイジアンネット.
-利用者のプロファイル,行動をそれぞれ違ったノードで表し,...
-単純ベイズ
-tree argumented 単純ベイズ (TAN): 単純ベイズの属性ノード...
- 修正TAN:ツリー(単一MST) ではなく複数のMSTを許す緩和
* 携帯電話ユーザのための映画嗜好モデル構築と映画推薦シス...
小野智弘(株式会社KDDI研究所)、黒川茂莉(慶應義塾大学)...
個人化 + 状況依存性 + 即時性を考慮した映画の推薦 → 複数の...
-構造の決定:おおまかには与える.データを使って精錬
-各ノードの内容
--利用者のデモグラフィックやライフスタイルの特徴や映画の...
--推薦される映画の特徴:紹介文から抽出したものと,アンケ...
-ノードをクラスタリングしてまとめ,Bayonetで構造推定
* ベイジアンネットワークを用いた消費者の金融商品選択モデ...
田中隆博、金子泰敏、末吉英範、瀧川孝幸(株式会社 野村総合...
デモグラフィックな特徴に加え,心理的なサイコグラフィック...
-主観的判断を考慮するサイコグラフィックの導入背景:ライフ...
顧客分析の問題
- データ数などデータサンプリングの問題→1万人の大規模調査
- モデルの表現が現場には複雑すぎ,データの欠損などへの対...
保険型,貯蓄型,投資型に分けて,定性的な考察に基づきネッ...
* パネル「因果モデリングへの期待」 [#uc654acb]
司会:本村陽一氏 パネリスト:植野先生(電通大)、黒木先生(...
** 因果モデル構築のためのソフトウェア「Bayesian Discovery...
- ハイパーパラメータにより利用者の事前知識を表現し,因果...
- 重要な変数発見こそ重要ではないか? 変数集合の発見を中心...
** 「因果の発見と検証に関して」(黒木先生) [#j5fb367b]
-- 方法論…無作為化実験←実際には実行しにくい
- 因果情報は物理的なモデルが分かっていれば検出可能
- causal diagram: 変数の依存性を矢印で表したグラフ.依存...
- intervention:特定の変数を外的に操作できる関数と置き換...
- X3 にintervention したときのX4への因果的効果(causal eff...
- 因果的効果と条件付分布:X にinterventionしたときのYへの...
-- Z→Y→X&Z→X では一致,Y←Z→X や Y←Z→X&X→Y では不一致
-- 不一致になる基準=バックドア基準:X と Y を結ぶ道への...
-- FrontDoor 基準:(Z,Y),(X,Z)のそれぞれに対し,Xと空集合...
フロントドア基準を満たす Z の観測値だけ調べればXからYへの...
- joint intervention:複数の変数に同時にintervention,結...
-- admissible condition: 因果ダイヤグラムで Xi+1...Xn に...
-- 拡張front door基準:因果ダイヤグラムで Xi+1...Xn に配...
* 招待講演:情報統計力学の深化と展開〜情報学でも“More is ...
樺島祥介先生(東京工業大学)
** モノの科学(情報科学)とコトの科学(自然科学) [#t84b3da0]
- 熱力学: 熱機関の最大効率は?
-- マクロな経験則(永久機関の否定)がスタート点
-- 熱効率が最大なのは「可逆過程」のとき→これを特徴付ける...
- 統計力学
-- ミクロな気体の性質からマクロな気体の性質を導く → ミク...
-- 気体分子の法則:エネルギー関数を与える
--- 絶対温度 T のマクロ熱平衡状態における微視的(ミクロな)...
-- すると,熱力学の F=U - TS (F:自由エネルギー, U:内部エ...
- 情報理論
-- 一意に復号可能な符号で平均符号長を考えるとその上限は,...
** More is differnt (P.W.AndersonのScience(1972)の論文) ...
- 自然の階層性 素粒子→原子→分子→細胞→器官→生物→
-- 下位階層を支配する法則が明らかになっても,上位階層の集...
ーーー 予言力の高い法則は階層ごとに異なる.下位→上位を導く研...
-- モノの科学には「量が増えれば(階層があがれば)質が変わる...
例:磁石のモデル
- イジングスピン Si=±1 で表す.これらのインタラクション ...
- これは,磁石になるか?→対称性により磁石にはならない
- ここで more is different.大量に集めると磁石になる.
- 少数の自由度では:確率的(ボルツマン分布) ⇔ 大自由度極限...
-- 予期しない現象の創発 [ 対称性の破れ → 不連続性が生じる...
-- 少数のマクロ変数にカンする自己無撞着法廷手引き帰着される
** 情報学における more is different [#eb6d3e8f]
- CDMAマルチユーザ復調問題:複数の端末と一つのアンテナの...
-- 端末は,自身の乱数で復調してアンテナへ.
→アンテナでは複数の信号+ノイズを受信.
--- 復調問題:利用者の乱数と受信系列から,各利用者の元の...
ビット列なので,線形方程式では解けず,離散最適化になりNP...
- そこで,個々のビットはベイズ的に推定する.確率的な基礎...
-- more is different になって,100個ぐらい集めると,決定...
* オーガナイズド・セッション「確率モデルと集団最適化」 [#...
* 「確率モデルと集団最適化入門」 [#me7322d8]
赤穂昭太郎(産総研)
** 複雑な最適化問題 [#ob65673e]
- 複雑な関数 (探索範囲が広く,局所解は多い,関数形は未知)...
- ボルツマン分布:pT(x)=1/ZT exp(-f(x)/T) を使って,ちょ...
-- 正規化定数の ZT の計算は大変 → サンプリングは無理? → ...
- MCMC: 候補を確率的に生成 & 確率的な採択
-- 全体の分布は不要で局所的に計算可能.収束性の保証 ⇔ MCM...
-- 測度面の工夫:提案分布,温度パラメータの工夫,集団の利用
** 提案分布での工夫 [#aa8c9b7c]
- 探索の広さ (exploration) ⇔ 採択率を上げたい (exploitati...
- 温度パラメータの工夫
-- 温度は対数的に下げると理論的にはよいが,それでは遅い
- 集団の利用
-- MCMC の集団拡張→一般化:マルチテンパリング法
-- マルチテンパリング法:違う温度で複数のMCMCを実行 & 個...
** 最小値探索と期待値計算 [#i7951b70]
- 共通部分が多い
- 重点サンプリング:目的 p とは違う分布 r でサンプリング...
- 再サンプリング:w(x)に従って再サンプリングすると,p(x)...
** GA [#pf325cf7]
+選択:p(x)に従ってサンプリング
+ 突然変異:q(x'x)で個体を移動
+ 交差:(?)
** 構造獲得と最適化 [#c4868c66]
- 学習による構造獲得:
-- pT(x) は全体のモデル化 (平均場近似)
-- pT(x) の値が大きいところのモデル化 (EDA):最適解があり...
**関連研究 [#f94d06f6]
- 能動学習:サンプルをコントロールしている点は類似してい...
- Bandit problem,強化学習:最適化と確率同定の両方が目的...
- 平均場近似,確率伝播法:あるタイプのグラフィカルモデル...
* 「確率的学習と進化論的手法の統合」 [#nfdaa29b]
伊庭斉志(東大)
** 遺伝的アルゴリズム [#a6c3f334]
GAの構成要素:集団による多様性維持,選択,交差と突然変異...
- 交差 と 突然変異 をなくすとどうなるか?
GAの長所・短所
-長所:並列化,事前知識が不要
-短所:変数間のinteractionを考えられない←交差,突然変異
** EDA (estimation of distribution algorithm) [#dceb49e1]
- GA: 交差や突然変異 → EDA: 確率分布の推定と再サンプリング
-アルゴリズム(UMDA):分布に従ってサンプルを生成→目的関数...
確率分布のモデルと更新規則の違いでいろいろな種類:UMDA, P...
-UMDA (univariate marginal distribution algorithm):~
変数間は独立→その変数をゆるめた方法がいくつかある:MIMIC,...
** EDP [#w22ddc45]
GA→EDA から GP→EDP
- プログラム木を表す
-- PIPE: プログラム木の各ノードの要素を独立に決める
--- 独立に決めるとまともなプログラムにならないことが多い...
- 確率文法を用いてプログラムを生成:GMPE
*オーガナイズド・セッション「自然言語とゲノム言語への統計...
* 「ゲノム言語と確率モデル」 [#a88667a8]
浅井潔(東大)
-自然言語: 構文解析は,背景や文脈が明確でないと実行できない
-ゲノム言語: コドンからアミノ酸への変換は分かっているが,...
ゲノムの構造:promoter→TSS→start codon→{exon→5'splice sit...
- ほぼ自然言語解析と似ている:ただし,1文字違うと全く異な...
その後は:mRNA→タンパク質の一次構造→立体構造→転写を制御
- ncRNA (non-coding RNA) タンパク質に翻訳されないが,他の...
* 「RNA配列解析のためのカーネル関数の設計と応用」 [#ycf8f...
榊原康文(慶大)
** DNA配列をベクトルに [#o4f56969]
非コードRNA: 98%が非コードRNA.RNAi(RNA干渉)による発現制...
→ シグナルが弱く,部位の特定が難しい.
進化すると,転写されない領域(人:55%),転写されるが翻訳さ...
非コードRNAは2次構造を持つ→この2次構造を導く配列を手がか...
この2次構造パターンはどうやって見つけるか?→こうした非数...
- カウントベクトル:配列中の塩基/アミノ酸の出現度数を表す...
- k-スペクトラムベクトル: 2-スペクトラム なら連続した2文...
- 部分配列ベクトル: 連続していない一定長の部分配列の出現...
→ベクトルの次元数が,文字数に対して指数的に増加してしまう...
→高次元を効率的に計算するため,カーネルの導入.ベクトルを...
** RNA配列用ステムカーネル [#lee54e1d]
ステムベクトル:アミノ酸列が折れ曲がった突起状の構造をス...
必ずしも連続していない候補の列を数える:長さ2の例 (A-(A-T...
ステムカーネル:全ての長さのステムベクトルの内積を計算....
マイナーな改良
-gap重み λの導入.ギャップ長 i について λ^i のペナルティ
-深い入れ子構造は重要視
-ステムの先端部になるループの下限Lの導入.これが短すぎる...
-突然変異に対して,構造が頑健になるようなスコアの導入
-ホモロジーの高い配列の分類問題:文字列カーネルと比較する...
-リモートホモログ検索:ncRNAには類似したfamilyがある.そ...
* 「非整列RNA配列群からの頻出ステムパターンのマイニング」...
浜田道昭(みずほ情総研) 津田宏治(Max Planck Institute) 工...
問題設定
-入力:アラインメントや2次構造が未知のRNA配列群
-出力:2次構造モチーフ(頻出パターン)
2次構造パターン:ステムのパターン
モデル
-RNA配列群:ステムグラフ+ラベルtaxonomy
-2次構造パターン:ステムパターン
-ステムグラフ:ステムをノードとするグラフ
--ステム間関係:parallel(並列),nested(同じステムにループ...
→これらの関係がある場合にノード間にラベル付の辺を生成
--2次構造は未知:どうしよう?~
→base pairing probability matrix 任意の塩基のペアについて...
→塩基対になりやすい高確率な部分をステム候補とする~
→ステムの代わりにステム候補をノードとしたグラフにする.た...
-ラベルtaxonomy
--ステム候補間の類似性を離船的に表現.デンドログラムで表...
-ステムパターン
--2次構造を,ノードのステムをラベルタクソノミのラベル付け...
目標:支持度がminsupport以上でと,ノードのコストの総和がm...
グラフマイニングのgSpanアルゴリズムが基本:深さ優先探索....
-さらなる探索空間の制限:DFSコードの拡張の制限,自明な非...
-すでに論文で報告されている共通モチーフを見つけることに成功
* 「Knowledge discovery and hypothesis generation from bi...
小池麻子(日立)
要求
- MEDLINEに登録された文献が多すぎて,目的の論文を検索でき...
- 文献からの自動知識抽出.
- 文献の断片的な知識から仮説生成や知識発見.分野が細分化...
タンパク質/遺伝子名認識
-その難しさ
-- 同義語が多い:あとになって同じものと分かる場合がある
-- 複数の遺伝子が同一の省略名をもつ
-- 他の一般の語彙と同じ綴りのものがある.
-- 綴りにばらつきがある
-- などなど
-遺伝子名の収集:標準tagger + 人手ルール + 接尾辞などを利...
機能用語の開発:Gene Ontoroly (GO) を基盤に
- GO termと共起性の高い語を関連語
- GO termと同じ文脈のものを抽出
- (?)
- 遺伝子/タンパク質名の曖昧性の除去
** 潜在的知識発見と仮説生成 [#e7008f49]
Open Discovery: 発表されている文献の関係を組み合わせて発...
-潜在的知識発見の例:レイノー病→○→魚油の例
知識発見の難しさ
- 概念の関連付けをするには語彙やクラスの統一が必要
- 概念間をいろいろな類似度で関連付け.よい類似度について...
*特別講演:「脳情報復号化によるブレイン−マシン・インター...
神谷之康(ATR脳情報研究所)
脳から心を読むにはどうすればよいのか
符号化・復号化:perception, 認知,行動 ←→ 脳活動=code
-こう見なすことで,mind-readingを考える
fMRIによるニューロイメージング
- 生きたヒトの脳全を体非侵襲的(電極とかを脳にささない)な...
- 解像度は数mmオーダなので,単一の神経細胞の活動は計測で...
知覚内容のデコーディング
- 脳の信号を観察して,何を知覚しているかどうかを求める.
古典的コーディング解析 http://viperlib.york.ac.uk/
- 線の傾きそれぞれに応じて反応する視覚細胞があることを見...
fMRI画像で観測すると,fMRI画像の画素一つに複数のコラム(特...
アンサンブル特徴選択性
- いくつかの画素を集めたとき,それらの集団的な活動から知...
- 複数の入力画素の輝度から,各傾きに応じて反応する識別器(...
- 8種類の傾きを見せた反応の脳信号から,傾きを検出できた.
- 数ヶ月の時間がたってもデコードはできた.
- 視覚野には低次〜高次のものがある:最初に信号がくる視覚1...
- 傾きの判別について,画像そのものは線形分離できないが,...
fMRIの画素が対応する部位を脳の表面にマップする → ヒトによ...
右斜めと左斜め縞が重なった画像を見せ,どちらかの縞を意識...
運動方向の選択性と,傾きの選択性を比べると,1次→4次の視覚...
- 印象主義と超現実主義の絵画を判別させる:75%ぐらいの正解...
- グー・チョキ・パーの判別:90%以上の正解率.運動野の反応...
- 発生内容のコーディング:運動野は子音に,小脳は母音に反...
変分ベイズを用いた画素選択:デコードに利用する画素(特徴)...
脳のデコーディング
- オンラインで解析 → brain machine interface:脳から直接...
- オフライン →マーケティング,人材評価
BMI (brain machine interface)
- 外界に信号を送るにあたっての壁である「身体」を超える
- 侵襲型:Cyberkinetics by Schwartz
-- 神経細胞から精度の高い信号
-- 感染などのリスク,限局される(狭い)記録部位
- 非侵襲型
-- 感染などの危険なし
-- 精度が低い.神経活動の変化から血流の変化までのタイムラ...
-conventional neural modeling: 刺激 S から予測応答 ^r
-neural decoding:応答から刺激を予測
→ 予測刺激から刺激を生成するループなどを使った実験へ発展
ページ名: