DataSet
Top
/
DataSet
[
トップ
] [
編集
|
凍結
|
差分
|
履歴
|
添付
|
リロード
] [
新規
|
一覧
|
検索
|
最終更新
|
ヘルプ
|
ログイン
]
テスト用データ集合
†
アルゴリズム
の比較検証に利用できるテスト用データについてまとめましょう.
ID は
ibis
でパスワードは
VC 次元の V のフルスペルです(頭だけ大文字)
テスト用データ集合
総合
関連情報
機械学習,データマイニング
統計
自然言語処理
画像認識
ネットワーク
その他
書籍で使われていたデータ
↑
総合
†
UCI Machine Learning Repository
UCI KDD Repository
Awesome Public Datasets
@ GitHub
Google Dataset Search
Amazon Web Services Hosted Public Data Sets
Microsoft Research Open Data
Datasets for Data Mining @ kdnuggets
kdnuggetts のデータ集合のリンク集記事
Pew Research Center
社会調査データ
mldata.org
StatLib --- Datasets Archive
Quandl
:市場・社会データの検索
CSV on the Web: Use Cases and Requirements
情報学研究データリポジトリ@国立情報学研究所
情報検索
コンペのNTCIRや,国内ネット企業のデータ
↑
関連情報
†
Where can I get large datasets open to the public?
@ Quora
Myriad Data Generator Toolkit
:人工データの生成フレームワーク
zenodo
:CERN/EUが運営する研究用コード・データの共有レポジトリ
OpenPsych
:心理系のオープンデータなど
国内の政府統計などオープンデータ&公開データのまとめ
ACM KDDCup
↑
機械学習
,
データマイニング
†
TunedIT
:分析コンペのサイト.arff で検索すると arff 形式のデータが得られる
UCR Time Series Classification/Clustering
Internet Traffic Archive
:Webのログファイル
GroupLens
:協調フィルタリング
Frequent Itemset Mining Dataset Repository
:頻出パターン抽出問題のためのテストデータ
Matrix Market
:行列形式のデータのポータル
Market-Basket Synthetic Data Generator
↑
統計
†
The Royal Statistical Society Datasets Website
UCLA Statistics Data Sets
CHANCE Data Sets
Regression DataSets
Time Series Data Library
総務省統計局 匿名データの提供サービス
↑
自然言語処理
†
The LDC (Linguistic Data Consortium) Corpus Catalog
TREC (Text Retrieval Conference)
Use of corpora in translation studies @ Lees大
:多言語コーパス
Web日本語Nグラム第1版
日本語WordNet
CLUTO data set
:文書
クラスタリング
ソフトのテスト用.downloadより
David D. Lewis
:Reuters-21758など
Reuters Corpus
:
自然言語処理
,最も有名なコーパス
20 Newsgroups
Ohsumed
:
自然言語処理
WebKB
:
自然言語処理
LETOR: Benchmark Data Sets for Learning to Rank
:
自然言語処理
,3段階適合度評価
code and data
@ Andrew MaCullum:SRAAデータ集合,Coraの論文関係のデータなど
personalBib
:Citeseer 引用データ
Multi-Label Classification
:
マルチラベル
文書分類
↑
画像認識
†
Database Overview
@ ベルリン工科大
Datasets for Computer Vision Research
@ イリノイ大
Computer Vision Test Images
:テスト画像データへのリンク集
Real World Image Database
:キャリブレーション情報付の画像データ
Caltech 101
:一般画像認識のスタンダード
The Berkeley Segmentation Dataset and Benchmark
:領域分割を目的とした人物画像
Large-Scale Concept Ontlogy for Multimedia (LSCOM)
一般画像認識・画像検索のコンペ
CLEF Cross Language Image Retrieval Track (ImageCREF)
The PASCAL Visual Object Classes
TREC Video Retrieval Evaluation
顔画像認識
Face Recognition Database
@ MIT
Labeled Faces in the Wild
:正面以外も含む
database @ Face Recognition Homepage
↑
ネットワーク
†
Stanford Large Network Dataset Collection
:ソーシャルネットなどのデータ
Arizona State Univ. Network Data
Koblenz Network Collection
↑
その他
†
EMU Speech Database System
:音声データにアクセスするソフト
VoxForge
:ヨーロッパ系言語の読み上げ音声データ
Million Song Dataset
@ Columbia University,楽曲の波形情報とメタデータ
EDGE Datasets
Livedoor Clip のデータ (研究機関向け)
Data for Evaluating Learning in Valid Experiments
:
回帰分析
Enron Email Dataset
ICDM2007 Data Mining Contest
:電波強度データからの位置推定
MNIST DATABASE of handwritten digits
:手書き文字の分類
Predictive Toxicology Challenge
:化合物の毒性の予測
SUSHI Preference Data Set
:寿司の嗜好についての調査データ.順序変量や協調フィルタリング.
単語感情極性対応表
similarity learning
文字に回転や拡大縮小変換をしたもののの類似性を学習
視覚像再構成fMRIデータ
:fMRIのイメージと視覚刺激のデータ.fMRIの出力から見ているものを予測.
楽天データ公開
:商品データ・利用者評価データ
CAIDA Data
@ The Cooperative Association for Internet Data Analysis
EconData
:経済
時系列
GeoDa
:地理空間データ
DataSetRDFDumps
:Linked Open Data へのリンク集
OpenNEX
:地球科学
Peoject TYCHO
:過去100年ぐらいの医療統計データ
↑
書籍で使われていたデータ
†
Categorical Data Analysis
The Elements of Statistical Learning
Pattern Recognition and Machine Learning
朱鷺の杜Wiki
機械学習
学会・研究会
書籍・資料
論文英語
フリーウェア
python
numpy
テストデータ
日本語版PRML本
カーネル多変量解析
人気ページ
今日の人気ページ
ページ一覧
↑
参加しよう
Wiki超入門
練習用ページ
数式の表示
こびとさん
編集用ID:
ibis
パスワード
: 「VC次元」のVのフルスペルで最初だけ大文字
最新の30件
2025-01-31
PRML/errata2
PRML/errata1
2024-12-21
しましま/IBISML055
2024-11-07
しましま/IBIS2024
2024-11-04
IBIS
2024-05-31
人工知能学会全国大会
しましま/人工知能学会全国大会2024
2024-04-13
python
2024-04-09
K-NEL
K-NEL/errata
2023-11-01
しましま/IBIS2023
2023-06-11
しましま/人工知能学会全国大会2023
2023-03-28
Book
2022-11-27
朱鷺の社
2022-11-24
しましま/IBIS2022
2022-07-08
AutoTicketLinkName
2022-06-17
しましま/人工知能学会全国大会2022
2021-11-13
しましま/IBIS2021
2021-10-29
回帰分析
2021-06-11
しましま/人工知能学会全国大会2021
2021-03-07
MenuBar
2021-02-15
python/numpy
2020-12-22
特異値分解
2020-12-18
complement naive Bayes
2020-11-27
しましま/IBIS2020
2020-10-17
Paper/bias-on-the-web
2020-07-16
F値
2020-06-30
DataSet
2020-06-24
バイアス-バリアンス
2020-06-10
Paper
↑
カウンタ
累計: 124244
今日: 3
昨日: 3
Last-modified: 2020-06-30 (火) 04:11:55
Link:
回帰分析
MenuBar
機械学習
FrontPage
時系列
クラスタリング
自然言語処理
情報検索
マルチラベル
データマイニング
アルゴリズム
PRML/content