SPSS Modeler用于高级预测数据挖掘的两个版本-经管之家官网!

人大经济论坛-经管之家 收藏本站
您当前的位置> 数据>>

数据挖掘

>>

SPSS Modeler用于高级预测数据挖掘的两个版本

SPSS Modeler用于高级预测数据挖掘的两个版本

发布:不是热门 | 分类:数据挖掘

关于本站

人大经济论坛-经管之家:分享大学、考研、论文、会计、留学、数据、经济学、金融学、管理学、统计学、博弈论、统计年鉴、行业分析包括等相关资源。
经管之家是国内活跃的在线教育咨询平台!

经管之家新媒体交易平台

提供"微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯"等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

提供微信号、微博、抖音、快手、头条、小红书、百家号、企鹅号、UC号、一点资讯等虚拟账号交易,真正实现买卖双方的共赢。【请点击这里访问】

本表比较了两个SPSSModeler版本的特性:SPSSModelerProfessional和SPSSModelerPremium。这两个版本以及服务器版本都为企业用户提供企业级数据访问和部署等功能。注:JapaneseLanguageExtractor许可要求使用SPSSModel ...
扫码加入金融交流群


本表比较了两个 SPSS Modeler 版本的特性:SPSS Modeler Professional 和 SPSS Modeler Premium。这两个版本以及服务器版本都为企业用户提供企业级数据访问和部署等功能。
注:Japanese Language Extractor 许可要求使用 SPSS Modeler Premium 版。
  • SPSS Modeler Professional 和 Premium 共同特性
  • SPSS Modeler Premium 独有特性
  • SPSS Modeler 服务器版本独有特性
SPSS Modeler Professional 和 Premium 版共同特性了解数据
  • 通过自动协助创建广泛的交互式图形。
  • 使用可视化链接分析查看数据中的各种关联。
  • 通过在图表上选择地区或项目并查看所选的信息来与数据进行互动;或选择用于分析的关键数据。
  • 从 SPSS Modeler 界面直接访问 SPSS Statistics 图形和报告工具。


数据准备
  • 通过 zDB2 和 IBM Classic Federation Server 支持访问来自 Cognos Business Intelligence、IBM DB2、Oracle、Microsoft SQL Server、Informix、IBM Netezza、mySQL (Oracle) 和 Teradata 数据源的运营数据以及各种大型机数据
  • 导入带分隔符的、固定宽度的文本文件、SPSS Statistics 文件、SPSS Data Collection 数据源、Excel、SAS 或 XML。
  • 从 SPSS Modeler 提供的多个数据清除选项中进行选择,删除或更换无效数据,自动填充遗漏值并减少异常值和极值。
  • 将自动数据准备应用到询问和条件数据工作中,这样只用一个步骤便可进行分析。
  • 从 SPSS Modeler 直接访问在 SPSS Statistics 中执行的数据管理和转换。
  • 使用字段过滤、命名、派生、分级(binning)、重新分类、值置换和字段重新排序。
  • 应用记录选择、抽样(包括群集和分层抽样)、合并(包括内连接、全外连接、部分外连接和反连接)、排序、聚合和平衡。
  • 从各种选项中进行选择,进行数据重组、分区和变换。
  • 从广泛的字符串功能中进行选择:字符串创建、置换、搜索和匹配、空格删除和截断。
  • 应用 RFM 评分:聚合客户的各种截断,以提供近因、频率和货币值,并将其合并在一起,生成完整的 RFM 分析。
  • 将数据导出到数据库、IBM Cognos Business Intelligence 软件包、SPSS Statistics、SPSS Data Collection、带分隔符的文本文件、Excel 表格、SAS 或 XML。


包含的建模算法
  • 异常检测 - 使用一种基于群集的算法检测不寻常的记录
  • Apriori - 带有高级评估功能的流行关联发现算法
  • 贝叶斯网络 - 图形概率模型
  • C&RT、C5.0、CHAID 和 QUEST - 决策树算法,包括交互树构建
  • CARMA - 关联算法,支持多个结果
  • Cox 回归 - 计算某个事件的可能发生时间
  • Decision List - 交互式规则构建算法
  • Factor/PCA、Feature Selection - 数据简化算法
  • K-Means、Kohonen、Two Step、Discriminant、支持向量机 (SVM) - 群集和分割算法
  • KNN - 最近邻居建模和评分算法
  • Logistic 回归 - 用于二进制结果
  • 神经网络 - 多层感知器,带有逆向传播学习法和径向基本函数网络
  • 回归、线性、GenLin (GLM)、广义线性混合模型 (GLMM) - 线性方程建模
  • 自学响应模型(SLRM) - 带增量学习功能的贝叶斯模型
  • Sequence - 顺序关联算法,用于对顺序敏感的分析
  • 支持向量机(Support Vector Machine) - 准确建模广泛数据集的高级算法
  • 时间序列 - 生成并自动选择时间序列预测模型


建模和评估
  • 采用具有许多高级功能的广泛数据挖掘算法,通过您的数据获得最好的结果。
  • 使用自动分类(二进制和数值)和群集功能来选择各个算法。
  • 使用交互式模型和方程浏览器查看高级统计输出内容。
  • 使用交互式模型和方程浏览器查看高级统计输出内容。 • 通过可变重要性图表显示数据属性对预测结果的相对影响。
  • 在地理地图上可视化分析结果。
  • 合并多个模型(整体建模)或使用一个模型分析另一个模型。
  • 使用 SPSS Modeler 组件级扩展框架 (CLEF) 集成各种自定义算法。
  • 通过 SPSS Statistics 集成,使用 R 来扩展分析选项。


部署
  • 使用 SQL 或 PMML(针对预测模型的基于 XML 的标准格式)导出模型。
  • 利用 IBM SPSS 协作和部署服务实现创新分析管理、流程自动化和部署功能。
SPSS Modeler Premium 独有特性数据准备
  • 使用实体分析来合并或分隔记录,从而得到更整洁的数据用于建模。
  • 识别数据中的群组,并通过 Group 分析识别群组的领导者。
  • 使用改动(churn)信息确定改动器可能影响的其他人,以便与扩散分析相结合。


特定于文本的了解和准备工作
  • 从文件、运行数据库和 RSS 源(即博客、web 源)提取文本数据。
  • 为荷兰语、英语、法语、德语、意大利语、葡萄牙语、西班牙语或日语选择本机语言提取器选项,或使用第三方翻译软件翻译几乎任何语言的内容。
  • 提取特定于域的概念,如单项、表达式、缩写、缩略语等。
  • 使用复杂的语言算法和嵌入式或用户指定的语言资源计算同义词。
  • 按人、组织、术语、产品、地点和其他用户定义的类型来命名概念。
  • 提取非语言实体,如地址、货币、时间、电话号码和社会保险号。
  • 使用并自定义预构建的模板和库,从而进行情感分析、CRM、安全和智能、市场情报、生命科学和 IT。
  • 利用针对最常见业务应用的预打包文本分析包 (TAP),或创建自己的分析包。
  • 使用概念群集算法并根据术语共现来创建群集,提供主要主题及其关联方式的一览子视图。
  • 使用文本分类算法并根据内容对文本文档和记录进行智能分组。
  • 支持在预测建模中使用高级概念选择和取消选择功能。
  • 使用基于文本的可视化报告来查询概念关系、发生率、频率和类型。


文本链接分析
  • 从荷兰语、英语、法语、德语和西班牙语文本中识别并提取情感因素信息(如喜欢和不喜欢)。
  • 识别人和事件或疾病和基因之间的链接与关联。
  • 通过 URL 从博客内识别并提取内容。
  • 在可部署的预测模型中包括各种观点、语义关系和链接的事件。
  • 通过交互式图表揭示复杂的关系,显示两个概念之间的多个语义链接。
SPSS Modeler 服务器版独有特性
  • 使用领先的数据库技术,通过数据库内挖掘在数据库中创建模型,并充分利用高性能的数据库实现。
  • 通过 SQL 推回功能来推动数据转换,并将建模算法直接选入到运行数据库中。
  • 通过 IBM SPSS Modeler Server Scoring Adapter 在数据库内对数据评分,显著提高性能。
  • 利用高性能硬件(包括 IBM System z 机器)更快实现解决方案,通过并行执行流和多个模型实现更好的 ROI。
  • 通过安全套接字层 (SSL) 加密,在 SPSS Modeler 客户端和 SPSS Modeler 服务器之间安全地传输敏感数据。
  • 针对 IBM InfoSphere 的数据库内挖掘算法:关联、群集、决策树、Logistic 回归、Naive Bayes、回归、序列、时间序列。
  • 针对 IBM Netezza 的数据库内挖掘算法:Bayes Net、决策树、分群法、广义线性、K-Means、KNN、线性回归、Naive Bayes、PCA、回归树、时间序列。
  • 针对 Microsoft SQL 服务器的数据库内挖掘算法:关联规则、群集、决策树、线性回归、Naive Bayes、回归、神经网络、序列群集、时间序列。
  • 针对 Oracle 的数据库内挖掘算法:自适应贝叶斯、Apriori、人工智能 (AI)、决策树、一般线性模型 (GLM)、KMeans、最小描述长度 (MDL)、Naive Bayes、非负矩阵分解、O-Cluster(正交分区群集)、支持向量机。

「经管之家」APP:经管人学习、答疑、交友,就上经管之家!
免流量费下载资料----在经管之家app可以下载论坛上的所有资源,并且不额外收取下载高峰期的论坛币。
涵盖所有经管领域的优秀内容----覆盖经济、管理、金融投资、计量统计、数据分析、国贸、财会等专业的学习宝库,各类资料应有尽有。
来自五湖四海的经管达人----已经有上千万的经管人来到这里,你可以找到任何学科方向、有共同话题的朋友。
经管之家(原人大经济论坛),跨越高校的围墙,带你走进经管知识的新世界。
扫描下方二维码下载并注册APP
本文关键词:

本文论坛网址:https://bbs.pinggu.org/thread-2883233-1-1.html

人气文章

1.凡人大经济论坛-经管之家转载的文章,均出自其它媒体或其他官网介绍,目的在于传递更多的信息,并不代表本站赞同其观点和其真实性负责;
2.转载的文章仅代表原创作者观点,与本站无关。其原创性以及文中陈述文字和内容未经本站证实,本站对该文以及其中全部或者部分内容、文字的真实性、完整性、及时性,不作出任何保证或承若;
3.如本站转载稿涉及版权等问题,请作者及时联系本站,我们会及时处理。
经管之家 人大经济论坛 大学 专业 手机版