#author("2022-11-27T10:02:32+00:00","default:ibisforest","ibisforest") * 朱鷺の社 (ibis shrine) [#zfcaacca] 朱鷺の杜Wikiの一意な神さまである朱鷺神さまをお祀りする神社です. //CENTER:COLOR(#00AA00){SIZE(18){本日は朱鷺の杜Wiki11回目の誕生日なので,朱鷺の杜祭を開催しています}} //CENTER:COLOR(#00AA00){SIZE(18){みなさん,いろいろ機械学習ネタを奉納してください}} //CENTER:COLOR(#00AA00){なお,朱鷺神さまのお気に召さなかったネタは問答無用で削除されることがあります} 毎年,朱鷺の杜Wikiの誕生日 10/5 には,あなたにもいろいろ奉納することが許されます. 奉納すると,[[絶滅危惧種>朱鷺の杜Wiki]]になれるという御利益があります. //毎年,朱鷺の杜Wikiの誕生日 10/5 には,あなたにもいろいろ奉納することが許されます. //奉納すると,[[絶滅危惧種>朱鷺の杜Wiki]]になれるという御利益があります. > -- 神主 //* 今年の奉納品 [#o92b833e] * 奉納品 [#e356fcc7] ** 定理 [#ee781f75] - 米酢の定理:「こめずのていり」と読むと,朱鷺神さまの祟りで次元に呪われる. ** アルゴリズム・手法 [#n380a43e] - 魔神ラーニング:最強の機械学習アルゴリズム.しかし,宇宙の全てを予測できるほど強力であり,全宇宙の生命体にとって脅威とみなされため,情報の海の深淵に封印されたと伝えられる - パブロフ連鎖モンテカルロ:条件反射で行動する人たちの連鎖で,状況がウダウダになること - 蝉-supervised lerning:教師信号を人間ではなく,蝉が与える機械学習の枠組み - SMアルゴリズム:SステップとMステップを交互に繰り返すアルゴリズム.SステップとMステップが何であるかを記すには,この余白はせますぎる. - バックプロパゲーション:伝言ゲームにおいて,最後の人から逆方向に「元々はどういう言葉だったの?」と伝言することで誤りを修正するアルゴリズム. - ドープ・ラーニング:いけない情報を使っているので,異様に予測性能がいいが,後でその反動で全く予測ができなくなる. - ビープ・ラーニング:学習中にずっとピーと音がする手法 - ロープ・ラーニング:古代アンデスで用いられていたという縄目による記録を使った学習方法 - カープ・ラーニング:鯉の脳に電極を差し,並列に接続して利用する機械学習マシン.この方法を機械学習と呼ぶのがふさわしいかについては議論がある. - シープ・ラーニング:モデルパラメータを羊の数で記述する手法.しかし,羊の数を数えているあいだにスリープモードに移行することがよくあるという問題がある. - キープ・ラーニング:いつまでも学習中の機械学習手法. - ドロップアウト:訓練中に中間層をランダムに削除すること.ディープニューラルネットで行われると思われていたが,現実社会でも行われていることが確認された - アレキライ合成:コレスキー分解で得た因子を合成すること ** 確率分布 [#k93a0950] - 正起分布:挫折したあとに,立ち直れる確率を示す分布 - 耐数正起分布:あらゆる困難があっても挫折から立ち直れる確率を表す分布 - 切断正起分布:過去の一切を断ち切られても立ち直れる確率を表す分布 - 一応分布:とりあえず何も分からないときに全ての可能性が一応えらばれるようにしておく分布 - フカイ二乗分布:大人の深い事情により,たいして違わない二つの群が区別される確率を表す分布 - スチューデントがt分布:卒論・修論から学生がtoubouする確率を表す分布.自由度が無限大のとき,正起分布に等しくなる. - 指数(ゆびかず)型分布族:たかだか指であらわせる数を扱う分布族 - 多幸分布:多くの幸せに囲まれている人が,今日はその中のどの幸せに恵まれるかを表す分布 - 不の二幸分布(略称 不幸分布):ある試行で幸せになる確率をパラメータとして,幸せをつかむまでに挫折する回数の分布. - 極地分布:人生最大級のピンチが今後10年にやってくる危険性などを評価する極地統計で使われる分布 - アーメン分布:腹痛でトイレの空きをまっているときに、神様に祈り始めるまでの待ち時間を表す分布 - ベタ分布:ひねり(skewness)がゼロである分布の総称 - ガマン分布:挫折事象への抵抗力の分布.正起分布における分散パラメタに関する自然共役分布としても知られる. - コーシー分布:期待値が存在せず,ものごとに何も期待できなくなってしまう確率を表す分布 - 次善分布:本当は違う分布の方が理屈的にはいいのだけど,計算が大変なので代わりに使っている分布 ** 確率過程 [#wab924f3] - 雲隠れMarkovモデル:遷移しているうちに,心にすきま風が吹き,どこか知らない状態に行ってしまう確率過程 - 懐石料理過程:中華料理店過程で \(\alpha\) が∞の場合に相当する.名前の由来は,客一人に一つの膳が新たに用意されることから. - pithole-yo過程:中華料理店過程と似ているが,ワナに落ちる裾の部分がやや重いのが特徴 - heart breaking process:心が無限に砕けてゆく確率過程.新たに生じるこころのかけらの大きさがベータ分布に従う - 確率固てぇ:確率過程があまりに理解困難で,攻略できないさまを表す ** モデル [#ja53cd50] - n-グラム -- ユニグラム:1g(質量の単位)のこと -- バイグラム:2g(質量の単位)のこと -- トライグラム:仏の顔も三度まで - hiden layer:ディープニューラルネットには多くの隠れ層があるが,それらを調整するには多くの『秘伝』の技が使われていることをいう ** その他 [#n6d8624c] - Я:ロシアで新たに開発された統計用言語.KGB謹製のライブラリが利用出来る.ウェブ検索で必要な情報が出てこないことで有名. - ピッグデータ:アングリーバードのゲームプレイおよびプレイヤーに関するデータ - 今年のIBISは怖くない:周辺領域の研究者に例年の[[IBIS]]の怖さを知らしめるために広められた標語 - パターン認識と機械学習の学習:2015年に出版された「パターン認識と機械学習の学習の学習」が解説の対象とした書籍 - 得意値分解:簡単にできるとこだけ処理して,他のデータは異常値として見なかったことにする手法 - 変数革命:独立変数と従属変数の役割を入れ替えること - 蛭ベルト空間:蛭がまとわりつく空間 - 第1種誤り確立:誤用が定着してしまった誤りのこと.例として「確信犯」「御存知」など. - 第2種誤り確立:よく知られているミスと分かっていながらもついついやってしまう誤りのこと.例として「確立が高い」「機会学習」など. - コルト・パイソン:COLTにてPythonで計算した結果を発表する様子.プログラミングを頑張るも定理や証明部分でつっこまれることもしばしば. - ベッカムの剃刀:イギリスのサッカー選手デイビッド・ベッカムが愛用する剃刀.その切れ味は素晴らしく,複雑度の高い髭も一毛打尽である. - データマイニング:すでに蓄積されている大量のデータ中に地雷(マイン)を敷設すること.地雷には主に,対象の黒歴史が用いられる.発掘したものは恥ずかしさのあまり死ぬ. - 次元の呪い:嫁空間の次元が増えるのに対して指数関数的に問題が大きくなること.しかし,1次元では嫁と認識できないため,2次元が最適といわれている. - 生息化:すでに終わったと思われた研究分野が息を吹き返すこと.線形分離可能な場合しか扱えないため終わったと思われたパーセプトロンが,カーネルトリックによって復活した例などが知られる - データ・サイエンティスト:多くの謎を解き明かすが,その一方で謎多き存在 - データ・サディスト:パラメータを少しずつきつくしながら,じりじりとテスト誤差が締め付けられる様に喜びをおぼえる人達 * 番外 [#b4362b07] ** Wesnoth マルチプレイヤーシナリオ「データサイエンス大陸」 [#a727107d] データサイエンス大陸は五つの大国が支配しており,各国は大陸の統一をめざし互いにしのぎを削っている.後の歴史家はこの激動の時代を「ビッグデータ時代」と呼ぶことになる. - 神聖統計神官領:かつて理論的統計帝国であったこの国は,現在ではコルモ教の神官が治める宗教国家. - ニューラルネット帝国:新たに深層学習要塞を建設し,アンデッド軍を侵攻させ始めた. - ベイジアン自由都市同盟:二つの大河を結ぶ交易と,マルコフランダム草原の収穫から得た富を集積した経済大国. - 連合カーネリアン王国:伝説の聖剣コンベックスカリバーを所持するフィーチャー王が率いる. - ルールベース共和国連邦:三つの共和国による連邦.ランダム森の富により他国に対抗する. インストールの詳細は [[Data Science Land (Multiplayer scenario for Wesnoth)>http://www.kamishima.net/wesnoth/]] を参照して下さい. ** 機械学習戦隊:クラシファイジャー [#wccdd1e0] - SVMレッド:「機械学習を知らない人でも知っている」ほどの花形 - ノンパラベイズブルー:生成モデルのホープで,エレガントな理論を携えた,SVMのライバルという立ち位置.でも,なぜかいつもレッドの日陰に… - 決定木イエロー:古風で質実剛健.ランダムフォレストなどで地味ながら,データマイニング系コンテストではトップに食い込み実力を発揮. - ロジスティックピンク:ユーティリティプレイヤー.シグモイド曲線がフェミニン.一般化線形モデル繋がりのグリーンと交際中. - ニューラルネットグリーン:ラスボス『ザ・ビッグデータ』の最終分析を前に「この分析が終わったらピンクにプロポーズするんだ」とフラグを立ててしまったため,分析の途中で局所解に陥り還らぬ人に… ** 対戦カードゲーム『機械学習王』 [#l067b47a] - 攻撃アルゴリズム:2クラスの分類問題を解く学習アルゴリズム.超パラメータデフォルト値で実行.規定CPU時間を超えても計算が終了しない場合は攻撃は無効になる.多クラス問題は 1-vs-rest で解く. - 守備データ:2クラスのデータ集合.守備データをランダムに 2/3 の訓練データと,1/3 のテストデータに分割し,守備しきい値以上の正解率になると守備側は破壊される. - プレイヤー:フィールドにモンスターカードがない場合にのみ攻撃される.互いに同じ守備データをもち,破壊されるとゲームの敗北となる. - デッキ:40枚,同じカードは3枚まで.手札はなくデッキから任意のカードをフィールドに出せる - フィールド:10枚まで出せる.モンスターは最大5枚まで. - 墓地:破壊されたモンスターカードや,使用後のマジック・トラップカードを置く *** モンスターカード [#r4fdd614] 攻撃アルゴリズムと守備データを装備,レベルによって召喚に生け贄が必要になる. *** 魔法カード [#g5c33129] 攻撃時やモンスターカードに装備して使う - 低次元の争い:フィールド,次元増加トラップを無効化 - ブースター:装備,攻撃アルゴリズムを用いたブースティングで攻撃する. - 運命の天秤:通常,不均衡データ対策で,少数派データをオーバサンプルする - あまい見通し:通常,攻撃時に相手の防御しきい値を5%下げる - 福袋:装備,攻撃アルゴリズムを使ったバギングで攻撃する - 匠の技:超パラメータを交差確認で調整する - デスマーチ:通常,規定CPU時間の制限がなくなるが,過労により使用後にモンスターカードは破壊される - バックアップ:通常,墓地から任意のカードを1枚デッキに戻す - マルチコア:通常,通常の攻撃に加え,生け贄1枚につき同じ攻撃アルゴリズムで追加攻撃を実行できる *** 罠カード [#m077ffc5] 攻撃されたときなど,決められた条件で発動 - 次元の呪い:守備データに10次元分のランダムな特徴を加える - 厳しい決断:防御しきい値を5%増やす - 節電モード:規定CPU時間が半分になる