しましま/DMSM012
をテンプレートにして作成
[
トップ
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
開始行:
* 第12回 人工知能学会 データマイニングと統計数理研究会 (S...
このページはしましまが[[第12回人工知能学会データマイニン...
* 3月 29日 (月) [#l7f45bda]
** コンテンツ評価情報の類似度を用いたユーザの嗜好推測とコ...
○鈴木 健太,濱川 礼(中京大学)
- 本のレビューの類似度に基づく内容ベース推薦
- Wikipediaから抽出した固定語集合中の語彙の出現頻度と,形...
** 小売サービスにおけるカテゴリマイニング 〜大規模データ...
○石垣 司,竹中 毅,本村 陽一(産業技術総合研究所)
- pLSA型と類似しているが,潜在変数が利用者とアイテムの二...
- 別途,アンケート調査をしており,因子分析したときのスコ...
** Lasso調整型確率化平衡樹木による回帰解析 [#v0fab70f]
中村将俊(大日本住友製薬),○下川敏雄(山梨大学),後藤昌...
- ランダム・フォレストは分類ではいいが,回帰では良くない
- 単純に平均をとる代わりに,各要素予測器の線形結合にL1正...
** 科学可視化のポスト処理 [#k858b7e4]
○白山 晋(東京大学)
- http://blog.goo.ne.jp/visualbase
- 2015 ごろには,128などのマルチコアになる → 地球シミュレ...
- シミュレーション:モデルと実世界のすりあわせ → 検証が問...
-- Sargent の検証のモデル
- 第3の科学的手法 (Arthur J. Freeman):計算物理学者はプロ...
- 可視化:恣意性,定量性,解釈の個人差 → 可視化の良さは定...
- どうにかしないといけない
** 分類ルール評価指標を用いたデータセット類似度分析 [#eca...
○阿部秀尚,津本周作(島根大学)
- メタ学習:実際に決定木をつくって,その決定木から抽出し...
** 確率勾配ブースティングを用いたテレコムの契約者行動予測...
○小林 淳一,高本 和明(金融エンジニアリング・グループ)
- 匿名化のされた,通話記録データから,解約するかなどを予...
- Freedmanの確率勾配ブースティングを利用.変数寄与度での...
** Catoni流の帰納的PAC-Bayesian学習に関する一考察 [review...
○綾野 孝則,鈴木 譲(大阪大学)
- 事前と事後確率の間をKLダイバージェンスで測り,誤差の上...
** PCAを用いた2群の有意差検定 [#i234d115]
○田口 善弘(中央大学)
- それぞれ数百ある二つサンプル群を,遺伝子への反応とかを...
-- サンプル群の分け方が複数あるとき,それらを組み合わせて...
- 識別問題に落としてカーネルトリックなどを使うと,変数選...
- PCAを使って,変数選択と変数の適切な線形結合を同時に推定...
* シンポジウム「データセントリックサイエンスがつくる未来...
** 大量大規模データを活かす科学が予言する未来社会 [#w9554...
北川 源四郎(統計数理研究所所長/分科会委員長)
- 情報技術・情報社会の発展 → 大規模・大量のヘテロデータが...
- (工業化社会 → 情報化社会 + 資本主義 → ポスト資本主義)...
-- ドラッカー:ポスト資本主義社会における資源は,資本でも...
- [ 知識:普遍の真理,モデル:実体の表現 ] ⇒ [ 知識:予測...
- 科学研究の拡大:物理世界 → 物理+進化世界 → 物理+進化+Cy...
- 第3の科学=計算科学の確立:理論科学(原理主導・演繹)と実...
30年後の未来予想
- 個別対応社会:マスからの転換
-- サービス産業の革新(医療・福祉・教育・情報提供・観光)
-- センシング用インフラ整備:大量データがリアルタイムに(...
- 経済・社会体制の変革
-- 大量データの瞬時処理:価格決定メカニズム,保険・年金制...
- 民主主義の新しい形態:世論把握,複雑な系の実世界シミュ...
- 予測・シミュレーションへの活用:リアルタイム活用,大規...
- 安心・安全:センサーによる災害・事故防止,常時観測情報...
- 必要になる技術:センシング,データ中心科学(データ同化...
第4の科学
- データ中心の科学,シミュレーションとともに計算機が可能...
- モデル:普遍なものから情報抽出の道具に(いろいろな知識...
-- モデリングと知識のスパイラル上昇
- 個人化:過去の統計から離れる 平均を見る→個性を捉える
-- 究極の個人化は他のデータとの関連性がみれなくなる → 究...
- データ同化:方程式を解く → データを活用してシミュレーシ...
- 能動的モデリング,個人化,データ同化 → どれもベイズモデ...
時系列における情報統合
- 状態空間モデル:状態は過去と未来の交わり
- 歴史:パラメトリックなあてはめ → パラメータが多すぎる新...
-- 正則化項 でどうにかなったが,その重みの決定問題はベイ...
- 状態空間モデルの発展,積分→粒子近似,
海底地震計 (OBS)
- 観測時系列データを普通にみると水中の反射しか見えず役に...
-- その情報を除去して,地震の情報を取り出したい
- (地下 + 水中 + ノイズ) の三つの要素 + 隣接センサーの干...
** マルチエージェントシミュレーションで描く都市交通の未来...
中島 秀之(公立はこだて未来大学学長/分科会副委員長)
- Jim Grey: the Fourth Paradigm
- 情報は,物質・エネルギーに続く第3の世界観(アービン・ト...
スマートシティはこだて(はこだて未来大 + IBM)
医療との連携
- 患者視点のIT:待ち時間削減・周知,交通手段の確保・連携...
フルデマンドバス
- 固定経路や時刻表をもたないバス.GPSとかのデータを使う.
- 高知 中村市で実現された
-- 高知市でもやったけど,大きな街では難しい.
- 乗客は,出発地と目的地を伝えると,何分後かにバスがくる
- 人数が少ないと回り道が少なくて効率がいいけど,増えると...
大規模カーナビゲーション
- VICS を装着した車が20%ぐらいだとVICSをつけると早く付け...
-- みんなが集まりすぎないような制御が必要 → 人が動いたあ...
- 経路情報を共有して,大域最適すると,装着率が上がってもV...
- 問題:みんなが位置情報を出してくれるか → 秘密関数計算?...
スマートシティ函館:交通と医療
- フルデマンドバスを10台ぐらい:病院に行く人のバスを対象に
-- 診察券とバスの精算を一体化,個人の一致性はチェックでき...
-- バス運行の中央制御:中央の計算機からデータをダウンロー...
-- 患者さんの情報はGPS付き携帯で収集
-- 渋滞情報を集める問題,法律の規制,料金設定の問題
- 中心部(第2期)→もっとIT化(第3期)
- 意外だが,通勤・通学のようなタイプの大量移動でもシミュ...
- 技術課題:シミュレーションの検証,最適ルート計算(到着...
* 3月 30日 (火) [#p48d32c6]
** 離散や連続を仮定しないノンパラメトリック推定とオンライ...
○鈴木 譲(大阪大学)
- 符号長の負の指数 Q が真の確率 P とのKLダイバージェンス...
-- 同じようなことが連続な場合でもできた → 離散と連続が混...
- KLダイバージェンスはRadon-Nykdom微分を含んだものとも考...
D(μ‖ν)=∫_ω dμ log[dμ / dν]
- 空間を有限分割の系列にすることで,測度が定義でき,符号...
** 重みつき窓を用いた適応型オンライン予測 [#l11e0157]
吉田 真一,○畑埜 晃平,瀧本 英二,竹田 正幸(九州大学)
- スライド窓の大きさを適応的に変化させられるweighted-aver...
- スライド窓に,大きさが異なる複数部分窓を考え,それらを...
- さらに,有効期間の異なるスライド窓が複数ある場合にも適...
** 密度比推定の理論的解析 [#c35316c1]
○金森 敬文(名古屋大学),鈴木大慈(東京大学),杉山 将(...
- 密度比推定の3方法:上下を個別に推定,ロジスティック回帰...
** ラベル無しデータを用いた回帰の改良 [#u9a3dcc0]
○川喜田 雅則,竹内 純一(九州大学)
- サンプルの重要度を,ラベルなしデータから推定して密度で...
** Incremental Mining of Closed Frequent Subtrees [#g1ba5...
○Viet Anh NGUYEN,Akihiro YAMAMOTO(京都大学)
- 少しだけDBが更新されたとき,頻出飽和木パターンを抽出す...
- 候補集合の更新を効率的に行うヒューリスティック
** 大規模健診データに関するナイーブベイズ分類器のノンパラ...
○山本 けい子,速水 悟,亀山 敦之,内山 良一,紀ノ定 保臣...
- 単純ベイズで部分的に同時分布を導入
** テキストマイニングによる個人Blogデータからの性格推定手...
○南川 敦宣,横山 浩之(KDDI研究所)
- エゴグラム:エリック・バーン
-- 五つの基本要素 Critical Parent, Nurturing Parent, Adul...
-- 行動的診断(表情,しぐさ),質問紙法(東大式エゴグラム...
- ブログからエゴグラムを作る
--
** 主成分分析の固有値の一致性について [#je8f94d9]
○赤間 陽二,上野 康隆(東北大学)
- データ数と次元数を同時に大きくすると,固有値がまともに...
** 指数族テンソル因子化法による欠損値予測と異常検知 [#a98...
○林 浩平,竹之内 高志,柴田 智広(奈良先端大),神谷 祐樹...
- 軸が一つヘテロな,すなわち,適切な分布が異なるようなテ...
- EMで解くが,解析解が求められない → ラプラス近似 + ガウ...
** 多様体学習と非線形次元縮約 [review発表] [#gc42aff1]
○西森康則(産業技術総合研究所)
- 高次元空間中の多様体を低次元に展開する方法のサーベイ
** 半環に基づく前向き後ろ向きアルゴリズムの一般化 [#xf313...
○東 藍,新保 仁,松本裕治(奈良先端大)
- トレリスのパスをかけ算,パスに渡る方を足し算と考えて半...
- Viterbiなどがこの一般的な枠組みで捉えられる
** 拡散現象を媒介するネットワークのプロファイリング [#c29...
○前野 義晴(ソーシャル・デザイン・グループ)
- 確率的な変化をもち,空間的にヘテロなネットワークを伝播...
- 確率微分方程式の近似でとく
** 頂点により誘導される頻出グラフ系列パターンのマイニング...
○猪口 明博,鷲尾 隆(大阪大学)
- 文字列に変換して頻出パターンマイニングをするが,以前の...
- パターンの,連結誘導部分グラフに元のグラフがなっている...
- 系列上に現れるグラフの和グラフに共通するパターンを手が...
終了行:
* 第12回 人工知能学会 データマイニングと統計数理研究会 (S...
このページはしましまが[[第12回人工知能学会データマイニン...
* 3月 29日 (月) [#l7f45bda]
** コンテンツ評価情報の類似度を用いたユーザの嗜好推測とコ...
○鈴木 健太,濱川 礼(中京大学)
- 本のレビューの類似度に基づく内容ベース推薦
- Wikipediaから抽出した固定語集合中の語彙の出現頻度と,形...
** 小売サービスにおけるカテゴリマイニング 〜大規模データ...
○石垣 司,竹中 毅,本村 陽一(産業技術総合研究所)
- pLSA型と類似しているが,潜在変数が利用者とアイテムの二...
- 別途,アンケート調査をしており,因子分析したときのスコ...
** Lasso調整型確率化平衡樹木による回帰解析 [#v0fab70f]
中村将俊(大日本住友製薬),○下川敏雄(山梨大学),後藤昌...
- ランダム・フォレストは分類ではいいが,回帰では良くない
- 単純に平均をとる代わりに,各要素予測器の線形結合にL1正...
** 科学可視化のポスト処理 [#k858b7e4]
○白山 晋(東京大学)
- http://blog.goo.ne.jp/visualbase
- 2015 ごろには,128などのマルチコアになる → 地球シミュレ...
- シミュレーション:モデルと実世界のすりあわせ → 検証が問...
-- Sargent の検証のモデル
- 第3の科学的手法 (Arthur J. Freeman):計算物理学者はプロ...
- 可視化:恣意性,定量性,解釈の個人差 → 可視化の良さは定...
- どうにかしないといけない
** 分類ルール評価指標を用いたデータセット類似度分析 [#eca...
○阿部秀尚,津本周作(島根大学)
- メタ学習:実際に決定木をつくって,その決定木から抽出し...
** 確率勾配ブースティングを用いたテレコムの契約者行動予測...
○小林 淳一,高本 和明(金融エンジニアリング・グループ)
- 匿名化のされた,通話記録データから,解約するかなどを予...
- Freedmanの確率勾配ブースティングを利用.変数寄与度での...
** Catoni流の帰納的PAC-Bayesian学習に関する一考察 [review...
○綾野 孝則,鈴木 譲(大阪大学)
- 事前と事後確率の間をKLダイバージェンスで測り,誤差の上...
** PCAを用いた2群の有意差検定 [#i234d115]
○田口 善弘(中央大学)
- それぞれ数百ある二つサンプル群を,遺伝子への反応とかを...
-- サンプル群の分け方が複数あるとき,それらを組み合わせて...
- 識別問題に落としてカーネルトリックなどを使うと,変数選...
- PCAを使って,変数選択と変数の適切な線形結合を同時に推定...
* シンポジウム「データセントリックサイエンスがつくる未来...
** 大量大規模データを活かす科学が予言する未来社会 [#w9554...
北川 源四郎(統計数理研究所所長/分科会委員長)
- 情報技術・情報社会の発展 → 大規模・大量のヘテロデータが...
- (工業化社会 → 情報化社会 + 資本主義 → ポスト資本主義)...
-- ドラッカー:ポスト資本主義社会における資源は,資本でも...
- [ 知識:普遍の真理,モデル:実体の表現 ] ⇒ [ 知識:予測...
- 科学研究の拡大:物理世界 → 物理+進化世界 → 物理+進化+Cy...
- 第3の科学=計算科学の確立:理論科学(原理主導・演繹)と実...
30年後の未来予想
- 個別対応社会:マスからの転換
-- サービス産業の革新(医療・福祉・教育・情報提供・観光)
-- センシング用インフラ整備:大量データがリアルタイムに(...
- 経済・社会体制の変革
-- 大量データの瞬時処理:価格決定メカニズム,保険・年金制...
- 民主主義の新しい形態:世論把握,複雑な系の実世界シミュ...
- 予測・シミュレーションへの活用:リアルタイム活用,大規...
- 安心・安全:センサーによる災害・事故防止,常時観測情報...
- 必要になる技術:センシング,データ中心科学(データ同化...
第4の科学
- データ中心の科学,シミュレーションとともに計算機が可能...
- モデル:普遍なものから情報抽出の道具に(いろいろな知識...
-- モデリングと知識のスパイラル上昇
- 個人化:過去の統計から離れる 平均を見る→個性を捉える
-- 究極の個人化は他のデータとの関連性がみれなくなる → 究...
- データ同化:方程式を解く → データを活用してシミュレーシ...
- 能動的モデリング,個人化,データ同化 → どれもベイズモデ...
時系列における情報統合
- 状態空間モデル:状態は過去と未来の交わり
- 歴史:パラメトリックなあてはめ → パラメータが多すぎる新...
-- 正則化項 でどうにかなったが,その重みの決定問題はベイ...
- 状態空間モデルの発展,積分→粒子近似,
海底地震計 (OBS)
- 観測時系列データを普通にみると水中の反射しか見えず役に...
-- その情報を除去して,地震の情報を取り出したい
- (地下 + 水中 + ノイズ) の三つの要素 + 隣接センサーの干...
** マルチエージェントシミュレーションで描く都市交通の未来...
中島 秀之(公立はこだて未来大学学長/分科会副委員長)
- Jim Grey: the Fourth Paradigm
- 情報は,物質・エネルギーに続く第3の世界観(アービン・ト...
スマートシティはこだて(はこだて未来大 + IBM)
医療との連携
- 患者視点のIT:待ち時間削減・周知,交通手段の確保・連携...
フルデマンドバス
- 固定経路や時刻表をもたないバス.GPSとかのデータを使う.
- 高知 中村市で実現された
-- 高知市でもやったけど,大きな街では難しい.
- 乗客は,出発地と目的地を伝えると,何分後かにバスがくる
- 人数が少ないと回り道が少なくて効率がいいけど,増えると...
大規模カーナビゲーション
- VICS を装着した車が20%ぐらいだとVICSをつけると早く付け...
-- みんなが集まりすぎないような制御が必要 → 人が動いたあ...
- 経路情報を共有して,大域最適すると,装着率が上がってもV...
- 問題:みんなが位置情報を出してくれるか → 秘密関数計算?...
スマートシティ函館:交通と医療
- フルデマンドバスを10台ぐらい:病院に行く人のバスを対象に
-- 診察券とバスの精算を一体化,個人の一致性はチェックでき...
-- バス運行の中央制御:中央の計算機からデータをダウンロー...
-- 患者さんの情報はGPS付き携帯で収集
-- 渋滞情報を集める問題,法律の規制,料金設定の問題
- 中心部(第2期)→もっとIT化(第3期)
- 意外だが,通勤・通学のようなタイプの大量移動でもシミュ...
- 技術課題:シミュレーションの検証,最適ルート計算(到着...
* 3月 30日 (火) [#p48d32c6]
** 離散や連続を仮定しないノンパラメトリック推定とオンライ...
○鈴木 譲(大阪大学)
- 符号長の負の指数 Q が真の確率 P とのKLダイバージェンス...
-- 同じようなことが連続な場合でもできた → 離散と連続が混...
- KLダイバージェンスはRadon-Nykdom微分を含んだものとも考...
D(μ‖ν)=∫_ω dμ log[dμ / dν]
- 空間を有限分割の系列にすることで,測度が定義でき,符号...
** 重みつき窓を用いた適応型オンライン予測 [#l11e0157]
吉田 真一,○畑埜 晃平,瀧本 英二,竹田 正幸(九州大学)
- スライド窓の大きさを適応的に変化させられるweighted-aver...
- スライド窓に,大きさが異なる複数部分窓を考え,それらを...
- さらに,有効期間の異なるスライド窓が複数ある場合にも適...
** 密度比推定の理論的解析 [#c35316c1]
○金森 敬文(名古屋大学),鈴木大慈(東京大学),杉山 将(...
- 密度比推定の3方法:上下を個別に推定,ロジスティック回帰...
** ラベル無しデータを用いた回帰の改良 [#u9a3dcc0]
○川喜田 雅則,竹内 純一(九州大学)
- サンプルの重要度を,ラベルなしデータから推定して密度で...
** Incremental Mining of Closed Frequent Subtrees [#g1ba5...
○Viet Anh NGUYEN,Akihiro YAMAMOTO(京都大学)
- 少しだけDBが更新されたとき,頻出飽和木パターンを抽出す...
- 候補集合の更新を効率的に行うヒューリスティック
** 大規模健診データに関するナイーブベイズ分類器のノンパラ...
○山本 けい子,速水 悟,亀山 敦之,内山 良一,紀ノ定 保臣...
- 単純ベイズで部分的に同時分布を導入
** テキストマイニングによる個人Blogデータからの性格推定手...
○南川 敦宣,横山 浩之(KDDI研究所)
- エゴグラム:エリック・バーン
-- 五つの基本要素 Critical Parent, Nurturing Parent, Adul...
-- 行動的診断(表情,しぐさ),質問紙法(東大式エゴグラム...
- ブログからエゴグラムを作る
--
** 主成分分析の固有値の一致性について [#je8f94d9]
○赤間 陽二,上野 康隆(東北大学)
- データ数と次元数を同時に大きくすると,固有値がまともに...
** 指数族テンソル因子化法による欠損値予測と異常検知 [#a98...
○林 浩平,竹之内 高志,柴田 智広(奈良先端大),神谷 祐樹...
- 軸が一つヘテロな,すなわち,適切な分布が異なるようなテ...
- EMで解くが,解析解が求められない → ラプラス近似 + ガウ...
** 多様体学習と非線形次元縮約 [review発表] [#gc42aff1]
○西森康則(産業技術総合研究所)
- 高次元空間中の多様体を低次元に展開する方法のサーベイ
** 半環に基づく前向き後ろ向きアルゴリズムの一般化 [#xf313...
○東 藍,新保 仁,松本裕治(奈良先端大)
- トレリスのパスをかけ算,パスに渡る方を足し算と考えて半...
- Viterbiなどがこの一般的な枠組みで捉えられる
** 拡散現象を媒介するネットワークのプロファイリング [#c29...
○前野 義晴(ソーシャル・デザイン・グループ)
- 確率的な変化をもち,空間的にヘテロなネットワークを伝播...
- 確率微分方程式の近似でとく
** 頂点により誘導される頻出グラフ系列パターンのマイニング...
○猪口 明博,鷲尾 隆(大阪大学)
- 文字列に変換して頻出パターンマイニングをするが,以前の...
- パターンの,連結誘導部分グラフに元のグラフがなっている...
- 系列上に現れるグラフの和グラフに共通するパターンを手が...
ページ名: