楼主: dili_dili
1992 0

[每天一个数据分析师] SmartMining的测量类型:标志,名义,连续等的含义说明 [推广有奖]

  • 0关注
  • 0粉丝

初中生

23%

还不是VIP/贵宾

-

威望
0
论坛币
14 个
通用积分
0
学术水平
0 点
热心指数
0 点
信用等级
0 点
经验
82 点
帖子
9
精华
0
在线时间
5 小时
注册时间
2017-2-22
最后登录
2017-3-10

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币

连续:用来描述数字值,如范围 0 - 100 或 0.75 - 1.25。连续值可以是整数、实数或日期/时间。

分类:用于字符串值(可取的值的确切数量未知时)。这是一种非实例化数据类型,表示有关数据存储类型和用法的所有可用信息均未知。读取数据后,测量级别将为标志、名义或无类型,具体取决于“流属性”对话框中指定的最大名义字段数量。

标志: 用于带两个不同之的数据,表示存在或不存在一个特性,如 真和假、是和否、或 0 和 1。所用值可能有所不同,但其中总会有个值代表“真”值,另一个代表“假”值。 数据可表示为文本、整数、实数、日期、时间或时间戳。

名义: 用于描述具有多个不同值的数据,其中的每个值都被视为集合的一个成员,如初级/中级/高级。名义数据可具有任何存储—数值、字符串或日期/时间。请注意,将测量级别设置为名义不会自动将值更改为字符串存储。

有序:用于描述具有顺序固定的不同值的数据。例如,工资类别或满意度排序可以归类为有序数据。顺序由数据元素的自然排列顺序定义。例如,1、 3、 5 是某个整数集合的默认排列顺序,而高级、中级 、初级(按字母升序)是某个字符串集合的顺序。使用有序测量级别可以将一组分类数据定义为有序数据,以进行可视化处理、模型构建以及导出到将有序数据识别为不同类型的其他应用程序。您可以在任何能够使用名义字段的位置使用有序字段。此外,可以将任何存储类型(实数、整数、字符串、日期、时间等等)的字段定义为有序。

无类型:用于不属于任何上述类型的数据,具有单个值的字段,或集合的成员数超过定义的最大值的名义数据。当测量级别为包含许多成员(如ID编号)的集合时,这种类型也将十分有用。


补充一点:

上面是存储类型,而何为测量类型呢

测量类型用于描述某个给定字段中数据的特征。最大的作用是为了放宽对字段存储类型的限制。比如说,通常条形图的分类字段必须为字符型,但是对于一个取值不是很多的整型字段作为分类,统计该字段每个整数值的计数并可视化展现有时也是很合理的,所以通过类型节点无需转换字段的存储类型,只要将该字段的测量类型改为名义型即可以使用条形图进行展现。


可以手动指定测量级别,也可以由<类型>算法节点根据所读取的值确定其测量级别。

如果有多个连续数据字段需视为类别数据,也即存储类型需要改变,可以使用<类型转换>节点来转换它们。


存储类型与测量类型主要的区别是:存储类型表明数据是以字符串、整数、实数、日期、时间还是时间戳存储。


二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:smart 测量类型 Mini Mart ning 测量类型 存储类型

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加好友,备注cda
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-5-1 13:02