Sansanの名刺データセット
Last Update:August,16,2018 Created:August,16,2018
Comment
Like
Favorite
Public
Profile
| Title of the dataset | Sansanの名刺データセット |
|---|---|
| Provenance of the dataset | 国立情報学研究所、Sansan株式会社 |
| How were the data collected/created? What was the cost? | 名刺を画像データとして実際にスキャナやカメラで取り込んだもの(氏名等の内容は実在しないサンプル) |
| Data sharing policy | Under particular condition. |
| Data sharing policy |
About data analysis and simulation
| Type of data: Check all that apply. Use "Other" to specify other types so that we can include them in further updates. | text number image table |
|---|---|
| Variable labels of dataset (the names of the variables) | X軸|Y軸|郵便番号|役職|携帯番号|住所|会社名|E-MAILアドレス|URL|FAX番号|名前 |
| Outline of data | 国立情報学研究所により提供されている、Sansan株式会社がクラウド名刺管理サービスのデータ化技術検証用に作成したダミーの名刺画像データ。データ分析コンテスト「人工知能は名刺をどこまで解読できるのか」で使用されたもの。氏名等の内容は実在しないサンプルだが、画像データは実際にスキャナやカメラで取り込んだものであり、学習用に2480枚、テスト用に1001枚をPNG形式で提供している。 各画像データにつき平均して9領域(学習用に25358領域、テスト用に8918領域)の位置座標が与えられており、各領域に対し「会社名」「氏名」「役職」「住所(郵便番号を含む)」「電話番号」「FAX番号」「携帯番号」「E-mailアドレス」「HPのURL」の各項目が含まれるか否かのラベルが付与されている。 |
| Simulation process | 画像認識、画像解析。テキストマイニング |
| Expected outcome of the process (obtained knowledge, analysis results, output of tools) | 名刺に書かれている項目を推定し、自動でラベリングする。 |
| Anticipation for analyses/simulations other than the typical ones provided above |
Other
| Comments | 詳細は国立情報学研究所の情報学研究データリポジトリを参照 https://www.nii.ac.jp/dsc/idr/sansan/sansan.html |
|---|---|
| What kind of data/tools do you wish to have? | |
| Visualized information | |
| Sample data |



February,13,2022
Comment form