* 匿名化 (anonymization) [#ubb327f8]

//ここには %項目の説明を書いてください.よろしければ署名しておいてください.

官庁などがアンケート調査などで収集した個々のデータを ''個票 (microdata)'' という.
個票を公開する場合には,氏名や電話番号などの,個人を直接識別できる項目は取り除かれる.
しかし,公開した他の項目の組み合わせが母集団の中で一意に決まり,個人が特定できてしまう場合もある.
こうした開示リスクを統計的に低くするため,属性値をIDなどに変えたり,属性値をまとめたりして開示しても問題がないようにするのが ''匿名化 (anonymization)''.

データ工学においても,文献1 のように同じ組み合わせをもつレコードが,少なくとも \(k\) 個存在するようにする \(k\)-匿名性 (\(k\)-annonimity) や,プライバシ上問題とならない属性が同じであるレコードの,問題となる特徴が \(l\) 種類以上あるようにする \(l\)-多様性 (\(l\)-diversity) の他 などの研究がある.

これらの研究をまとめて''プライバシー保護データ公開 (privacy-preserving data publication) などとも呼ぶ.''

> -- しましま

** 関連項目 [#a01fb685]

//英語や同義語のあとに,#brで区切って関連する項目をリストしてください.

-[[anonymization]]
#br
-[[個票]]
-[[microdata]]
#br
-[[プライバシー保護データマイニング]]
-[[データベースセキュリティ]]
#br
-[[検索:匿名 個票]]

** リンク集 [#ged282ef]

//関連するWWW資源があればリンクしてください.
-[[プライバシ保護データ利用技術>http://groups.google.co.jp/group/ppdu]] @ Googleグループ
-[[製表関連国際用語集>http://www.nstac.go.jp/services/words.html]] @ 統計センター
#br
-[[Wikipedia:Anonymization]]

** 関連文献 [#lb20b674]

//この%項目%に関連する書籍や論文を紹介してください.

- [[特集「個票開示問題の統計理論」統計数理,vol.51, no.2 (2003)>http://www.ism.ac.jp/editsec/toukei/tokeisuri-51j.html#NO2]]
- 文献1:L.Sweeney "k-Anonymity: A Model for Protecting Privacy" Int'l J. of Uncertainty Fuzziness and Knowledge Based Systems, vol.10, no.5 (2002)~
[[GoogleScholarAll:k-Anonymity: A Model for Protecting Privacy]]
- B.C.M.Fung "Privacy-preserving data publishing: A survey of recent developments", ACM Computing Surveys, vol.42, issue 4 (2010)~
[[GoogleScholarAll:Privacy-preserving data publishing: A survey of recent developments]]
- 佐久間 淳「プライバシ保護データマイニング」人工知能学会誌, vol.24, no.2 (2009)

トップ   編集 差分 履歴 添付 複製 名前変更 リロード   新規 一覧 検索 最終更新   ヘルプ   最終更新のRSS