CASIA-WebFace人脸数据库:人工智能深度学习自动驾驶测试训练验证数据集
CASIA-WebFace 数据集的简介
CASIA-WebFace数据集包含了10575 个人的494414 张图像。CASIA-webface数据库,压缩包有4个多g,里面包含了10000个人,一共50万张人脸图片,无论是做SVM,DNN还是别的训练,都是非常好的数据库。
CASIA-WebFace人脸数据库的网盘链接.docx
(12.07 KB, 需要: RMB 79 元)
(含4.1GB海量文件数据库)
用现有的人脸识别方法来提取特征然后聚类人脸是一种常用的方法,一般的聚类方法需要计算所有样本之间的相似矩阵,这个矩阵会很大,无法加载入内存,因此作者使用了一种更快的聚类方法:
1.通过人脸识别方法提取人脸特征;
2.使用每个名人的mainphoto作为它的种子(因为mainphoto一般都是正脸,而且不会出现其他人);
3.使用那些只有1个人脸的图片去增加每个名人的种子的数量;
4.在photo gallery剩下的图片中,通过与种子的相似度来找到属于每个名人的其余照片。
5.裁剪人脸,将同一个名人的脸单独存入一个路径内,之后再进行人工纠错,进一步提高数据集纯度。
最终得到了10,575人\494,414照片的数据集 CASIA-WebFace。最终组成了国内人脸识别届颇具盛名的人脸训练集 CASIA-WebFace
通过一些常见的人脸数据集的统计数据以比较,可以看出 CASIA-WebFace是当时人脸数据集中数据量最大的公开数据集,为人脸识别技术的发展做出了很大贡献。


雷达卡




京公网安备 11010802022788号







