当数据量很大以后,可视化就成了问题,如何展示100个点是容易的,展示100万个点就不是一个概念了。当学术界还坚守主成分分析的阵地时,工业界已经用流形分析的方法了,例如t-SNE。这篇文章则提出了基于 UMAP 与 LargeVis 的深入散点图来二维可视化巨量数据,作者也将代码开源了。所谓学科前沿是一个很模糊的东西,我感觉只要没完美解决的问题在哪里,哪里就是前沿。
链接:http://creatingdata.us/techne/deep_scatterplots/
|
楼主: 魏金宝
|
1152
0
[休闲其它] 推荐9:大数据可视化 |
|
已卖:24份资源 博士生 99%
-
|
| ||
|
|
jg-xs1京ICP备16021002号-2 京B2-20170662号
京公网安备 11010802022788号
论坛法律顾问:王进律师
知识产权保护声明
免责及隐私声明


