文字列 "cat" と "cart" で,gapを含めた共通部分文字列は
c, a, t, ca, at, ct, cat
gapを含めた二つの文字列のそれぞれの全長は
c:1/1, a:1/1, t:1/1, ca:2/2, at:2/3, ct:3/4, cat:3/4
割引係数 \(\lambda<1\) で減少する指数関数を用いて,罰則を
\[c:(\lambda^1 \lambda^1),\ldots,cat:(\lambda^3 \lambda^4)\]
とする.カーネル関数はこれらの和である次式.
\[k(cat, cart)=3\lambda^2+\lambda^4+\lambda^5+2\lambda^7\]
-- しましま
関連項目†
リンク集†
関連文献†
- 基本文献
H.Lodhi, C.Saunders, J.Shawe-Taylor, N.Cristianini and C.Watkins "Text classification using string kernels" JMLR, vol.2, pp.419-444 (2002)
GoogleScholarAll:Text classification using string kernels
C.Watrins "Dynamic Alignment Kernels" Technical Report CSD-TR-98-11, Dept. of Computer Science Royal Holloway, Univ. of London, 1999
GoogleScholarAll:Dynamic Alignment Kernels
- 津田宏治 "カーネル設計の技術" IBIS2002, pp.1-10 (2002)
- 松本裕治 "自然言語処理におけるカーネル法の利用" IBIS2002, pp.19-24 (2002)
- 構造化データのためのカーネルのサーベイ KDD Explorations, vol.5, issue 1
(タイトルがなぜか"Kernel-based Learning in Multi-Relational Data Mining"になっている)
T.Gärtner", "A Survey of Kernels for Structured Data", SIGKDD Explorations, vol.5, issue 1, pp.49-58 (2003)
- Book/学習システムの理論と実現 3.7.2節