画像認識で画素の値そのもの,音声認識で音声の波形そのもの,自然言語処理で文字列そのものなどの『生データ』から直接,推定や分析を行うのは難しい. そこで,推定や分析に有用と思われる情報を,この生データから抽出し,特徴として使えるようにするのが特徴抽出.
画像認識であれば,移っている物体の縁にあたると予測される部分を取り出すエッジ検出などが代表的な処理.
-- しましま
識別したりクラスタリングしたりするのは難しい作業なので,生のデータからあらかじめ不要な情報は取り除いておいたほうがよい. 後の処理と独立した方が汎用性はあるが,識別性能を上げるためには後の処理と関連させたほうがよく,その辺りの兼ね合いは難しい.
-- あかほ