しましま/DMSS2007
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
* The International Workshop on Data-Mining and Statistic...
このページはしましまが [[The International Workshop on Da...
* 招待講演:Scale-free network priors in Bayesian inferen...
Paul Sheridan, Takeshi Kamimura, Hidetoshi Shimodaira
- マイクロアレイデータ X:実験数×遺伝子数,要素は反応量の...
- スケールフリーネットワーク:ノードの度数に対して,その...
- 遺伝子ネットワーク(反応のパターンの類似していれば辺が...
- グラフの事前分布 p(G) と,遺伝子からの p(G|X) から p(X|...
- SFネットの生成モデル
-- Poison-Barabasi-Albertモデル:ノードを一つずつ追加.新...
-- Promote growthモデル:ノードとそれに繋がった辺を複製....
-- Staticモデル:最初にノードは全部あり重みが割り当てられ...
- MCMCで,これらのモデルを用いて p(G) や p(G|X) を計算す...
* Bayesian data analysis for identification and estimatio...
Koki Kyo
- Hick-Hymanの法則:n種のランプが点灯する刺激に対して,そ...
- Fittの法則:二つの白黒の矩形を並べて,どちらかを選択場...
- Fittの実験で,実験条件を変えながら,複数の被験者につい...
* Kullback-Leibler importance estimation procedure for co...
Masashi Sugiyama, Shinichi Nakajima, Hisashi Kashima, Pau...
- 共変量シフト:訓練とテストデータの分布はサンプリングの...
- テスト分布/訓練分布 の比で,エラー関数を重み付すること...
- さらに重みのきき具合を調整するパラメータを交差確認で決...
- 重みを,独立に求めたテスト/訓練分布の比ではなく,線形モ...
* Prediction of protein-protein interactions and disease ...
Thanh Phuong Nguyen, Tu Bao Ho
- 遺伝病:一つの遺伝子が原因のものと,複数の遺伝子の複合...
- 複数の遺伝子の影響を,タンパク質の相互作用に基づいて,...
Mixed factors analysis: Unsupervized statistical discrimi...
Ryo Yoshida, Tomoyuki Higuchi, Seiya Imoto, Satoru Miyano
- カーネル混合因子モデルを用いたクラスタリング
- 各クラスタごとに部分空間に射影した生成モデルベース
- 混合因子解析: Σ αg φ(W μg, W^T Σg W + r I) の形の混合...
* 招待講演:Statistical learning with graph kernels [#tb1...
Jean-Philippe Vert
- 個々のグラフをクラスに分類する問題.
- グラフを特徴量に変換して解くと …… 表現力と次元数の増大...
- グラフカーネル:ラベル付グラフの集合について定義
- 完全なグラフカーネル:任意の同形でないカーネルを識別で...
-- 完全グラフカーネルの計算は,少なくともグラフの同形判定...
- 部分グラフカーネル:φH(G)=Gの部分グラフでラベルがHのも...
K(G1,G2)=Σ{H∈XX} λH φH(G1) φH(G2)
(XXは可能なグラフの集合)計算はNP困難.
- パスグラフカーネル:任意の部分集合ではなく,パスだけを...
- ウォーク:パスとにているが,途中で同じノードを通っても...
- ウォークカーネル:SS_n:可能な,長さnのウォーク上のラベ...
φs(G)=Σ{w∈W(G)} λw 1(sがwのラベル系列)
カーネルは K(G1,G2)=Σ{s∈SS} φs(G1) φs(G2)
- 積グラフ:二つのグラフについて,二つの頂点集合の直積の...
-- 同じラベル系列の二つのウォークは,積グラフ上のウォーク...
-- この積ブラフを使うと,ウォークカーネルは多項式時間で計...
- ウォークカーネルの拡張
-- totteringウォーク:一歩進んで,同じところに戻るウォー...
-- 部分木カーネル
- Open-source kernels for chemoinformatics: http://chemcp...
* Online learning of approximate maximum margin classifie...
Kosuke Ishibashi, Kohei Hatano, Masayuki Takeda
SVMのオンライン化
- 既存手法の更新数のオーダ O(R^2/γ^2):γはマージンまで,R...
- 定義:(u,b):方向 uと原点からの距離で決まる超平面
- 一般のオンライン学習:予測したラベルが新しい事例と違う...
- ROMMA:超平面のバイアスがなく,予測誤りがパラメータδを...
- このROMMAにバイアス項を導入して予測精度を上げるROMMAbの...
* 招待講演:maximum margin matrix factorization for colla...
[[Alexander J. Smola>http://sml.nicta.com.au/~smola/]]
''協調順位付け''
- Netflixの協調フィルタリングのコンテストの問題:全アイテ...
- 要求:目的関数,少なくとも凸上限を最適化,特徴量なしに...
- 関連事項
-- 凸上限:順位損失の条件 NDCG@k directly via convex rank...
-- 低次元順位行列分解:Srebroらの特徴量行列分解 F=M U: M...
-- 特徴の考慮:F = M U + f_m・w_m + wu fu + f_mu・w_mu (...
-- Bundle Method Solver:利用者上で並列化可能
- 問題
-- 評価 Yij∈{1..5},i,jはアイテムと利用者
-- 目標:Fij のスコア a(π)^T b(y) によって順位付けする,...
DCG@k(π,y)=Σi^k [ 2^yi - 1] / log[πi + 1]
NDCG@k(π,y)=DCG@k(π,y) / DBG@k(argsort(y),y)
yiはアイテムiの利用者の評価で,πは順列,πi はアイテムiの...
''順位付けの凸上限 (a convex upper bound for ranking)''
- DCG@kの最大化は凸でないことが多い
- 代わりに,j について単調減少な cj を使い G(π,f)=Σj c_π...
argsort f について最大化する
- Δ(y,π) 真の値と上限の差
- 解き方方針のまとめ
l(y,f)=max_π Δ(y,π) + G(π,f) - G(argsort y, f)
この最適化は Linear Assignment Problemになる.
-- 累積上限 L(Y,F)=l(Y_i., F_.j)
''低次元順位分解 (low rank factorization)''
- L(Y,MU)+λ(1/2)[‖U‖^2 + ‖M‖^2]を最小化するように F を M ...
-- L(Y,MU)+λ(1/2)[‖U‖^2] と L(Y,MU)+λ(1/2)[‖M‖^2]の最適化...
- 特徴の考慮:F = M U + f_m・w_m + wu fu + f_mu・w_mu~
fm,fu,fmuはアイテム,利用者,両者に依存した特徴
''Bundle法による凸最適化''
- 目的関数に接する超平面を使う(?)
Rt[w] = max{j≦t} <at,w>+bt≦Remp[w]
at=∂w Remp[W_t-1] and bt=R_emp[W_t-1] - <at,w_t-1>
- 手続き:重みwtの更新と,at & bt の更新を反復する
* マーケティングにおけるストリームデータと文字列解析 (Str...
Katsutoshi Yada
- マーケティング:誰が,いつ,どこで,何を,いくらで買う...
- 場所については未開拓:売り場の場所の影響
- cross-marchantize:関連商品を並べてうる → 不十分:顧客...
- カートにRFIDを付けて顧客の行動データを取得:カートには...
- 九州のスーパーマーケットで2006年9月に実地実験
- 直線的な行動をするのは珍しく,途中いったりきたりするパ...
- 1秒以上立ち止まった「立ち寄り」を中心にする
- 立ち寄った売り場をシンボルで表し,それを時系列順に並べ...
- EBONSAI:系列をクラス分類する手法を適用 → 購入量の多い...
- 解釈可能な行動パターンは珍しい
* カスケードモデルによる特徴的ルール導出:一般化と高速化 ...
Yu Nakano, Takashi Okada
- カスケードモデル:複数の相関ルールをまとめてラティスに...
- 相関を Apriori ではなく,FP-Growth で抽出するようにした
* 遺伝子発現データからの接尾辞木に基づく疑似バイクラスタ...
Tetsuro Namba, Makoto Haraguchi, Yoshiaki Okubo
- ホヤの発生段階:14時期の時系列のマイクロアレイデータ
- 部分区間での挙動が類似した遺伝子をまとめたクラスタを作る
- 反応量を離散化しシンボルで表す.一定期間のシンボル変化...
- suffix treeの辺には,まさにこの情報が現れている
* A game theoretical analysis of combining classifiers fo...
Yuichi Shiraishi, Kenji Fukumizu, Shiro Ikeda
2値識別器で多値識別を行う
- 二つのクラスを識別する1対1と,あるクラスとそれ以外に分...
- J個の識別結果をまとめる方法
- ECOC (error correcting output code):そのクラスに最も適...
- ハミング距離を考える代わりに,予測結果と正しい答えの間...
- ECOCとこの学習による決定には何らかの関係がある → ゲーム...
- ゲーム理論で捉えると
-- 予測結果ベクトルに基づいて,意思決定者は,出力符号を決...
-- 環境側は,あるクラスである確率 Pr(y=i)と,予測結果の分...
-- minimaxになることが示せる条件や符号化の方法を示した
* Multi-entity-topic models with who-entities and where-e...
Hitohiro Shiozaki, Koji Eguchi, Takenao Ohkawa
- 文書と語が関係する状況の解析→トピックモデル(例:latent D...
- さらにnamed-entityを扱えるようにする
-- SwitchLDA: topic内でのentityの割合を表す拡張
-- 提案手法:W2SwitchLDSは,誰とどこを表す2種類のentityを...
* Fast PSD matrix estimation by column reductions [#s6b7b...
Hiroshi Kuwajima, Takashi Washio
- 巨大なグラム行列の計算をさぼる方法
* Merging particle filterにおける重みの設定について (On w...
Shin'ya Nakano, Genta Ueno, Kazuyuki Nakamura, Tomoyuki H...
- データ同化:シミュレーションモデルに,観測結果を取り込...
- データが与えられたときに逐次的にモデルを修正する逐次デ...
- merging particle filter:粒子フィルタで,N個のサンプル...
* 目的変数が範囲で与えられる回帰問題に対するEM法 [#q96032...
Hisashi Kashima, Kazutaka Yamasaki, Hiroto Saigo, Akihiro...
- 回帰問題で,従属変数の訓練データが,値そのものではなく...
- アルゴリズム:次のステップを繰り返す
-- 現在の予測分布での,与えられた範囲での期待値を求める
-- この期待値を代表値として,モデルを更新する
- 与えられた範囲にデータが入る確率を考え,積分ができない...
終了行:
* The International Workshop on Data-Mining and Statistic...
このページはしましまが [[The International Workshop on Da...
* 招待講演:Scale-free network priors in Bayesian inferen...
Paul Sheridan, Takeshi Kamimura, Hidetoshi Shimodaira
- マイクロアレイデータ X:実験数×遺伝子数,要素は反応量の...
- スケールフリーネットワーク:ノードの度数に対して,その...
- 遺伝子ネットワーク(反応のパターンの類似していれば辺が...
- グラフの事前分布 p(G) と,遺伝子からの p(G|X) から p(X|...
- SFネットの生成モデル
-- Poison-Barabasi-Albertモデル:ノードを一つずつ追加.新...
-- Promote growthモデル:ノードとそれに繋がった辺を複製....
-- Staticモデル:最初にノードは全部あり重みが割り当てられ...
- MCMCで,これらのモデルを用いて p(G) や p(G|X) を計算す...
* Bayesian data analysis for identification and estimatio...
Koki Kyo
- Hick-Hymanの法則:n種のランプが点灯する刺激に対して,そ...
- Fittの法則:二つの白黒の矩形を並べて,どちらかを選択場...
- Fittの実験で,実験条件を変えながら,複数の被験者につい...
* Kullback-Leibler importance estimation procedure for co...
Masashi Sugiyama, Shinichi Nakajima, Hisashi Kashima, Pau...
- 共変量シフト:訓練とテストデータの分布はサンプリングの...
- テスト分布/訓練分布 の比で,エラー関数を重み付すること...
- さらに重みのきき具合を調整するパラメータを交差確認で決...
- 重みを,独立に求めたテスト/訓練分布の比ではなく,線形モ...
* Prediction of protein-protein interactions and disease ...
Thanh Phuong Nguyen, Tu Bao Ho
- 遺伝病:一つの遺伝子が原因のものと,複数の遺伝子の複合...
- 複数の遺伝子の影響を,タンパク質の相互作用に基づいて,...
Mixed factors analysis: Unsupervized statistical discrimi...
Ryo Yoshida, Tomoyuki Higuchi, Seiya Imoto, Satoru Miyano
- カーネル混合因子モデルを用いたクラスタリング
- 各クラスタごとに部分空間に射影した生成モデルベース
- 混合因子解析: Σ αg φ(W μg, W^T Σg W + r I) の形の混合...
* 招待講演:Statistical learning with graph kernels [#tb1...
Jean-Philippe Vert
- 個々のグラフをクラスに分類する問題.
- グラフを特徴量に変換して解くと …… 表現力と次元数の増大...
- グラフカーネル:ラベル付グラフの集合について定義
- 完全なグラフカーネル:任意の同形でないカーネルを識別で...
-- 完全グラフカーネルの計算は,少なくともグラフの同形判定...
- 部分グラフカーネル:φH(G)=Gの部分グラフでラベルがHのも...
K(G1,G2)=Σ{H∈XX} λH φH(G1) φH(G2)
(XXは可能なグラフの集合)計算はNP困難.
- パスグラフカーネル:任意の部分集合ではなく,パスだけを...
- ウォーク:パスとにているが,途中で同じノードを通っても...
- ウォークカーネル:SS_n:可能な,長さnのウォーク上のラベ...
φs(G)=Σ{w∈W(G)} λw 1(sがwのラベル系列)
カーネルは K(G1,G2)=Σ{s∈SS} φs(G1) φs(G2)
- 積グラフ:二つのグラフについて,二つの頂点集合の直積の...
-- 同じラベル系列の二つのウォークは,積グラフ上のウォーク...
-- この積ブラフを使うと,ウォークカーネルは多項式時間で計...
- ウォークカーネルの拡張
-- totteringウォーク:一歩進んで,同じところに戻るウォー...
-- 部分木カーネル
- Open-source kernels for chemoinformatics: http://chemcp...
* Online learning of approximate maximum margin classifie...
Kosuke Ishibashi, Kohei Hatano, Masayuki Takeda
SVMのオンライン化
- 既存手法の更新数のオーダ O(R^2/γ^2):γはマージンまで,R...
- 定義:(u,b):方向 uと原点からの距離で決まる超平面
- 一般のオンライン学習:予測したラベルが新しい事例と違う...
- ROMMA:超平面のバイアスがなく,予測誤りがパラメータδを...
- このROMMAにバイアス項を導入して予測精度を上げるROMMAbの...
* 招待講演:maximum margin matrix factorization for colla...
[[Alexander J. Smola>http://sml.nicta.com.au/~smola/]]
''協調順位付け''
- Netflixの協調フィルタリングのコンテストの問題:全アイテ...
- 要求:目的関数,少なくとも凸上限を最適化,特徴量なしに...
- 関連事項
-- 凸上限:順位損失の条件 NDCG@k directly via convex rank...
-- 低次元順位行列分解:Srebroらの特徴量行列分解 F=M U: M...
-- 特徴の考慮:F = M U + f_m・w_m + wu fu + f_mu・w_mu (...
-- Bundle Method Solver:利用者上で並列化可能
- 問題
-- 評価 Yij∈{1..5},i,jはアイテムと利用者
-- 目標:Fij のスコア a(π)^T b(y) によって順位付けする,...
DCG@k(π,y)=Σi^k [ 2^yi - 1] / log[πi + 1]
NDCG@k(π,y)=DCG@k(π,y) / DBG@k(argsort(y),y)
yiはアイテムiの利用者の評価で,πは順列,πi はアイテムiの...
''順位付けの凸上限 (a convex upper bound for ranking)''
- DCG@kの最大化は凸でないことが多い
- 代わりに,j について単調減少な cj を使い G(π,f)=Σj c_π...
argsort f について最大化する
- Δ(y,π) 真の値と上限の差
- 解き方方針のまとめ
l(y,f)=max_π Δ(y,π) + G(π,f) - G(argsort y, f)
この最適化は Linear Assignment Problemになる.
-- 累積上限 L(Y,F)=l(Y_i., F_.j)
''低次元順位分解 (low rank factorization)''
- L(Y,MU)+λ(1/2)[‖U‖^2 + ‖M‖^2]を最小化するように F を M ...
-- L(Y,MU)+λ(1/2)[‖U‖^2] と L(Y,MU)+λ(1/2)[‖M‖^2]の最適化...
- 特徴の考慮:F = M U + f_m・w_m + wu fu + f_mu・w_mu~
fm,fu,fmuはアイテム,利用者,両者に依存した特徴
''Bundle法による凸最適化''
- 目的関数に接する超平面を使う(?)
Rt[w] = max{j≦t} <at,w>+bt≦Remp[w]
at=∂w Remp[W_t-1] and bt=R_emp[W_t-1] - <at,w_t-1>
- 手続き:重みwtの更新と,at & bt の更新を反復する
* マーケティングにおけるストリームデータと文字列解析 (Str...
Katsutoshi Yada
- マーケティング:誰が,いつ,どこで,何を,いくらで買う...
- 場所については未開拓:売り場の場所の影響
- cross-marchantize:関連商品を並べてうる → 不十分:顧客...
- カートにRFIDを付けて顧客の行動データを取得:カートには...
- 九州のスーパーマーケットで2006年9月に実地実験
- 直線的な行動をするのは珍しく,途中いったりきたりするパ...
- 1秒以上立ち止まった「立ち寄り」を中心にする
- 立ち寄った売り場をシンボルで表し,それを時系列順に並べ...
- EBONSAI:系列をクラス分類する手法を適用 → 購入量の多い...
- 解釈可能な行動パターンは珍しい
* カスケードモデルによる特徴的ルール導出:一般化と高速化 ...
Yu Nakano, Takashi Okada
- カスケードモデル:複数の相関ルールをまとめてラティスに...
- 相関を Apriori ではなく,FP-Growth で抽出するようにした
* 遺伝子発現データからの接尾辞木に基づく疑似バイクラスタ...
Tetsuro Namba, Makoto Haraguchi, Yoshiaki Okubo
- ホヤの発生段階:14時期の時系列のマイクロアレイデータ
- 部分区間での挙動が類似した遺伝子をまとめたクラスタを作る
- 反応量を離散化しシンボルで表す.一定期間のシンボル変化...
- suffix treeの辺には,まさにこの情報が現れている
* A game theoretical analysis of combining classifiers fo...
Yuichi Shiraishi, Kenji Fukumizu, Shiro Ikeda
2値識別器で多値識別を行う
- 二つのクラスを識別する1対1と,あるクラスとそれ以外に分...
- J個の識別結果をまとめる方法
- ECOC (error correcting output code):そのクラスに最も適...
- ハミング距離を考える代わりに,予測結果と正しい答えの間...
- ECOCとこの学習による決定には何らかの関係がある → ゲーム...
- ゲーム理論で捉えると
-- 予測結果ベクトルに基づいて,意思決定者は,出力符号を決...
-- 環境側は,あるクラスである確率 Pr(y=i)と,予測結果の分...
-- minimaxになることが示せる条件や符号化の方法を示した
* Multi-entity-topic models with who-entities and where-e...
Hitohiro Shiozaki, Koji Eguchi, Takenao Ohkawa
- 文書と語が関係する状況の解析→トピックモデル(例:latent D...
- さらにnamed-entityを扱えるようにする
-- SwitchLDA: topic内でのentityの割合を表す拡張
-- 提案手法:W2SwitchLDSは,誰とどこを表す2種類のentityを...
* Fast PSD matrix estimation by column reductions [#s6b7b...
Hiroshi Kuwajima, Takashi Washio
- 巨大なグラム行列の計算をさぼる方法
* Merging particle filterにおける重みの設定について (On w...
Shin'ya Nakano, Genta Ueno, Kazuyuki Nakamura, Tomoyuki H...
- データ同化:シミュレーションモデルに,観測結果を取り込...
- データが与えられたときに逐次的にモデルを修正する逐次デ...
- merging particle filter:粒子フィルタで,N個のサンプル...
* 目的変数が範囲で与えられる回帰問題に対するEM法 [#q96032...
Hisashi Kashima, Kazutaka Yamasaki, Hiroto Saigo, Akihiro...
- 回帰問題で,従属変数の訓練データが,値そのものではなく...
- アルゴリズム:次のステップを繰り返す
-- 現在の予測分布での,与えられた範囲での期待値を求める
-- この期待値を代表値として,モデルを更新する
- 与えられた範囲にデータが入る確率を考え,積分ができない...
ページ名: