しましま/DMSS2009
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
* The 4th International Workshop on Data-Mining and Stati...
このページはしましまが[[The 4th International Workshop on...
* 7月7日 [#yecd842c]
* DMSS: Session 1 [#m4b7396f]
** Efficient Exploration through Active Learning for Valu...
Takayuki Akiyama, Hirotaka Hachiya, and Masashi Sugiyama ...
- 強化学習の枠組みで,現在の政策とは異なる政策の下で収集...
** Visual Inspection of Precision Instruments by Least-Sq...
Masafumi Takimoto, Masakazu Matsugu (Canon), and Masashi ...
- 画像処理を用いた製品検査:不良事例は非常に少なく,その...
- 通常分布からのはずれ値を不良と見なす → テスト密度の通常...
-- この比を,線形モデルで記述して,2乗誤差を最小化するこ...
- Gaborフィルタとピラミッド法の組み合わせで画像から特徴抽出
** Extracting Phases of Financial Markets [#w255a834]
Teruko Takada (Osaka City University)
- 金融の時系列データからの層転移の検出
- [Breiman+,1977]の適応的カーネル密度推定,fat-tailにも強い
- 系列変化の,分散でリスクを,リターンを平均値で評価
* Invited Talk: Recent Topics on BDDs/ZDDs for Data Minin...
Shin-ichi Minato (Hokkaido University)
- BDD:出力が同じノードを併合,0/1が同じところに行ってい...
-- 変数の順序を決めるとBDDは一意に決まるが,その大きさは...
-- 0/1 を出力する関数によって,1になる組み合わせ変数によ...
- ZDD (zero-surpress BDD):縮約のルールが,0/1出力が同じ...
-- 無関係なノードが自動的に省略,疎なデータに対して有効
- ZDDによる頻出アイテム集合の抽出
-- 各アイテム集合の頻度を2進数で表し,2進数の全てのビット...
-- 深さ優先型のアルゴリズムで効率化を図ったのが LCM
* DMSS: Session 3 [#zbd4bca6]
** Dimensionality Reduction for Density Ratio Estimation ...
Masashi Sugiyama (Tokyo Institute of Technology), Motoaki...
- 密度比を線形モデルで直接推定するときに,次元削減もする
-- 次元削減は,局所性を反映させた局所Fisher判別分析(LFDA)...
-- 削減後の次元数決定にLOO交差確認を使う
** Sufficient Dimension Reduction via Squared-loss Mutual...
Taiji Suzuki (University of Tokyo) and Masashi Sugiyama (...
- Squared loss mutual information
Is(Y,Z)=[1/2] ∫ [ {p_yz(y,z) / py(y)pz(z) } - 1 ]^2 dpy...
-- 比になってるところを線形モデルで密度推定
- 次元削減も同時に行う反復法も提案
* 7月9日 [#hf5e8f37]
* DMSS: Session 4 [#u81c9b29]
** Identification of an Exogenous Variable in a Linear no...
Shohei Shimizu (Osaka University), Aapo Hyvarinen (Univer...
- 因果分析の仮定:データの生成過程はSEMモデル(因果関係が...
-- 線形モデル+ガウスノイズだと x1→x2 と x2→x1 が両方出て...
-- 非ガウスにしたのが LiNGAM モデルでこの問題に対処
-- 観測変数 x をより前の原因になるように並び替えると対角0...
-- 他の変数の影響を受けず,ノイズ項だけを入力とする変数を...
-- 観測データから,変数の順序とBを求めるのが目標
- ICA:非ガウス入力からもとの信号を求める x=W^{-1} e
- x=(I-B)^{-1} e と書き換えると I-B を W とみなしてICAで...
-- 求めた W を置換行列 P,スケーリング D を用いて P D (I ...
-- ICAの局所解の問題と,置換行列を求める計算量の問題
- 外部因子のみに依存する exogenous 変数を順番に見つけてい...
-- 線形回帰したときの残差と,回帰の目的変数の独立性から,...
** Maximum Likelihood Estimation for Failed-Link Detectio...
Shohei Hido (Kyoto University, IBM Research) and Yutaka T...
- 通信ネットワーク中のリンクに故障がある.ネットワークの...
- probe パケットで,ターミナル間の経路の遅延時間が分かる...
-- 最速経路が,以前より遅くなっていたら故障が考えられる.
-- 遅延時間の揺らぎをガウス分布にして,MAP推定をする
** Gaussian Mixture Models and VC Dimensions [#ybad6f1f]
Yohji Akama (Tohoku University)
- データ面と平面の間の距離の2乗和で測るPCAの損失や,d次元...
- PCAのVC次元は,ガウス分布のVC次元の下限を決めることなど...
- さらに,N要素の混合ガウス分布はそのN倍が下限となると主張
* Invited Talk: 小売マーケティング分野でのデータマイニン...
Katsutoshi Yada (Kansai University)
10年前
- 相関ルール:野菜ジュースは健康志向の高い人が飲む → 野菜...
- DBはRDB,データ収集は受動的 → 発見科学とアクティブマイ...
5〜6年前
- アクティブマイニング:能動的データ収集,顧客中心
- 購買商品の系列をグラフで表し,グラフマイニングを適用
- ビール販売のケーススタディ:野菜や鮮魚売り場でクールケ...
- 遺伝子分析手法を系列データに適用
-- 回数券クーポン:ビールのブランドロイヤリティには3回連...
-- カップラーメン市場で新製品のしめる割合は大きく,数ヶ月...
現状
- データ数の大規模化(小規模地方ストアでも100GB/年,0.5Gレ...
- 時系列(POS,クリックストリーム,センサーデータ)
- 高次元データ(広告を見た,センサー情報)
系列データ
- RFIDでショッピングカートの移動を追跡
-- 移動と停滞を繰り返す
-- 単純な軌跡の顧客は希で,いったり来たりの往復を繰り返す...
-- 購入量の多い顧客と,少ない顧客での,行動系列パターンの...
--- 前者の方が寄り道が多い
- TVや広告などの広告の刺激は重要
- MUSASHI: http://musashi.sourceforge.jp
- DMLab: http://www2.ipcku.kansai-u.ac.jp/~yada/DSI/engli...
* DMSS: Session 6 [#r58a9ef3]
** Monolithic and Partial Compilation Methods for Probabi...
Daisuke Tokoro, Kiyoharu Hamaguchi, Toshinobu Kashiwabara...
- ベイジアンネットをZDDで表現する
-- 各変数が有効かどうかを示す指示変数と,BNのCPT中の値でB...
** Pattern Discovery from a Single Graph with Quantitativ...
Yuuki Miyoshi, Tomonobu Ozaki, and Takenao Ohkawa (Kobe U...
- ノードが定量的な特徴で記述された大きなグラフあ一つある...
- QFMinerとgSpanの組み合わせ
** Mining Frequent Patterns from Linear Graphs [#zba1faf2]
Yasuo Tabei, Daisuke Okanohara (University of Tokyo), and...
- グラフの集合から,これらのグラフに頻出する部分グラフパ...
-- ノードに順序がある線形グラフを扱う.非連結になってもOK.
- LGM (Linear Graph Miner):深さ優先で頻出パターンを列挙...
-- 遺伝子の三次元構造データや,係り受け解析を使ったsentim...
終了行:
* The 4th International Workshop on Data-Mining and Stati...
このページはしましまが[[The 4th International Workshop on...
* 7月7日 [#yecd842c]
* DMSS: Session 1 [#m4b7396f]
** Efficient Exploration through Active Learning for Valu...
Takayuki Akiyama, Hirotaka Hachiya, and Masashi Sugiyama ...
- 強化学習の枠組みで,現在の政策とは異なる政策の下で収集...
** Visual Inspection of Precision Instruments by Least-Sq...
Masafumi Takimoto, Masakazu Matsugu (Canon), and Masashi ...
- 画像処理を用いた製品検査:不良事例は非常に少なく,その...
- 通常分布からのはずれ値を不良と見なす → テスト密度の通常...
-- この比を,線形モデルで記述して,2乗誤差を最小化するこ...
- Gaborフィルタとピラミッド法の組み合わせで画像から特徴抽出
** Extracting Phases of Financial Markets [#w255a834]
Teruko Takada (Osaka City University)
- 金融の時系列データからの層転移の検出
- [Breiman+,1977]の適応的カーネル密度推定,fat-tailにも強い
- 系列変化の,分散でリスクを,リターンを平均値で評価
* Invited Talk: Recent Topics on BDDs/ZDDs for Data Minin...
Shin-ichi Minato (Hokkaido University)
- BDD:出力が同じノードを併合,0/1が同じところに行ってい...
-- 変数の順序を決めるとBDDは一意に決まるが,その大きさは...
-- 0/1 を出力する関数によって,1になる組み合わせ変数によ...
- ZDD (zero-surpress BDD):縮約のルールが,0/1出力が同じ...
-- 無関係なノードが自動的に省略,疎なデータに対して有効
- ZDDによる頻出アイテム集合の抽出
-- 各アイテム集合の頻度を2進数で表し,2進数の全てのビット...
-- 深さ優先型のアルゴリズムで効率化を図ったのが LCM
* DMSS: Session 3 [#zbd4bca6]
** Dimensionality Reduction for Density Ratio Estimation ...
Masashi Sugiyama (Tokyo Institute of Technology), Motoaki...
- 密度比を線形モデルで直接推定するときに,次元削減もする
-- 次元削減は,局所性を反映させた局所Fisher判別分析(LFDA)...
-- 削減後の次元数決定にLOO交差確認を使う
** Sufficient Dimension Reduction via Squared-loss Mutual...
Taiji Suzuki (University of Tokyo) and Masashi Sugiyama (...
- Squared loss mutual information
Is(Y,Z)=[1/2] ∫ [ {p_yz(y,z) / py(y)pz(z) } - 1 ]^2 dpy...
-- 比になってるところを線形モデルで密度推定
- 次元削減も同時に行う反復法も提案
* 7月9日 [#hf5e8f37]
* DMSS: Session 4 [#u81c9b29]
** Identification of an Exogenous Variable in a Linear no...
Shohei Shimizu (Osaka University), Aapo Hyvarinen (Univer...
- 因果分析の仮定:データの生成過程はSEMモデル(因果関係が...
-- 線形モデル+ガウスノイズだと x1→x2 と x2→x1 が両方出て...
-- 非ガウスにしたのが LiNGAM モデルでこの問題に対処
-- 観測変数 x をより前の原因になるように並び替えると対角0...
-- 他の変数の影響を受けず,ノイズ項だけを入力とする変数を...
-- 観測データから,変数の順序とBを求めるのが目標
- ICA:非ガウス入力からもとの信号を求める x=W^{-1} e
- x=(I-B)^{-1} e と書き換えると I-B を W とみなしてICAで...
-- 求めた W を置換行列 P,スケーリング D を用いて P D (I ...
-- ICAの局所解の問題と,置換行列を求める計算量の問題
- 外部因子のみに依存する exogenous 変数を順番に見つけてい...
-- 線形回帰したときの残差と,回帰の目的変数の独立性から,...
** Maximum Likelihood Estimation for Failed-Link Detectio...
Shohei Hido (Kyoto University, IBM Research) and Yutaka T...
- 通信ネットワーク中のリンクに故障がある.ネットワークの...
- probe パケットで,ターミナル間の経路の遅延時間が分かる...
-- 最速経路が,以前より遅くなっていたら故障が考えられる.
-- 遅延時間の揺らぎをガウス分布にして,MAP推定をする
** Gaussian Mixture Models and VC Dimensions [#ybad6f1f]
Yohji Akama (Tohoku University)
- データ面と平面の間の距離の2乗和で測るPCAの損失や,d次元...
- PCAのVC次元は,ガウス分布のVC次元の下限を決めることなど...
- さらに,N要素の混合ガウス分布はそのN倍が下限となると主張
* Invited Talk: 小売マーケティング分野でのデータマイニン...
Katsutoshi Yada (Kansai University)
10年前
- 相関ルール:野菜ジュースは健康志向の高い人が飲む → 野菜...
- DBはRDB,データ収集は受動的 → 発見科学とアクティブマイ...
5〜6年前
- アクティブマイニング:能動的データ収集,顧客中心
- 購買商品の系列をグラフで表し,グラフマイニングを適用
- ビール販売のケーススタディ:野菜や鮮魚売り場でクールケ...
- 遺伝子分析手法を系列データに適用
-- 回数券クーポン:ビールのブランドロイヤリティには3回連...
-- カップラーメン市場で新製品のしめる割合は大きく,数ヶ月...
現状
- データ数の大規模化(小規模地方ストアでも100GB/年,0.5Gレ...
- 時系列(POS,クリックストリーム,センサーデータ)
- 高次元データ(広告を見た,センサー情報)
系列データ
- RFIDでショッピングカートの移動を追跡
-- 移動と停滞を繰り返す
-- 単純な軌跡の顧客は希で,いったり来たりの往復を繰り返す...
-- 購入量の多い顧客と,少ない顧客での,行動系列パターンの...
--- 前者の方が寄り道が多い
- TVや広告などの広告の刺激は重要
- MUSASHI: http://musashi.sourceforge.jp
- DMLab: http://www2.ipcku.kansai-u.ac.jp/~yada/DSI/engli...
* DMSS: Session 6 [#r58a9ef3]
** Monolithic and Partial Compilation Methods for Probabi...
Daisuke Tokoro, Kiyoharu Hamaguchi, Toshinobu Kashiwabara...
- ベイジアンネットをZDDで表現する
-- 各変数が有効かどうかを示す指示変数と,BNのCPT中の値でB...
** Pattern Discovery from a Single Graph with Quantitativ...
Yuuki Miyoshi, Tomonobu Ozaki, and Takenao Ohkawa (Kobe U...
- ノードが定量的な特徴で記述された大きなグラフあ一つある...
- QFMinerとgSpanの組み合わせ
** Mining Frequent Patterns from Linear Graphs [#zba1faf2]
Yasuo Tabei, Daisuke Okanohara (University of Tokyo), and...
- グラフの集合から,これらのグラフに頻出する部分グラフパ...
-- ノードに順序がある線形グラフを扱う.非連結になってもOK.
- LGM (Linear Graph Miner):深さ優先で頻出パターンを列挙...
-- 遺伝子の三次元構造データや,係り受け解析を使ったsentim...
ページ名: