人間が読み書きや話しに使う言語で書かれた文書や,文書の集まり(コーパス)をコンピュータで処理すること. コーパス中の語の頻度に基づく統計的自然言語処理や,テキスト中から再利用可能な知識を見つけるテキストデータを対象としたデータマイニングであるテキストマイニングは機械学習と関連が深い.
-- しましま