楼主: 可人4
1071 42

[量化金融] 在线评论可以预测个股的长期回报 [推广有奖]

11
大多数88 在职认证  发表于 2022-6-23 21:06:05
(2016年)利用年度客户满意度得分,获得了15年来约300家公司的样本,并利用这些样本构建了一个投资战略,15年来累计回报率为518%。与本研究类似,Huang(2018)发现有证据表明在线消费者评论包含股票定价的新信息;此外,长期投资于异常客户评级较高的股票,而短期投资于异常客户评级较低的股票的利差投资组合,每月的异常回报率约为55.7至73.0个基点。然而,这些里程碑式的研究很少有人致力于探索在线评论与股票定价之间的联系,这激发了本研究的灵感,他们对在线评论的预测能力给予了足够的关注。关于在线评论是否可以用于长期股票预测,目前仍缺乏全面的调查和明确的结论。因此,缺乏个别股票收益预测的利基解决方案。本文补充了这些研究,强调了与产品相关的消费者评论是一个重要的信息来源,可用于个人层面的长期股票回报预测。数据在本节中,将详细说明如何检索和收集以客户为导向的公司及其在线产品评论和股价。3.1. 以客户为导向的公司为了确保消费者评论的可用性,我们首先必须收集客户市场中的公司列表。新浪财经是中国最大的金融新闻门户网站。自1999年8月成立以来,该网站持续提供金融行业的新闻和信息,占金融网站市场的三分之一以上。新浪财经根据股票的特点,将整个股票市场划分为多个板块。

12
kedemingshi 在职认证  发表于 2022-6-23 21:06:08
根据行业分类原则,家电行业、服装行业、葡萄酒行业和食品行业代表了与消费品最相关的四个行业,我们检索了新浪财经上显示的每个行业的所有部门和股票。在这四个行业中,有177家公司的市值从数十亿到数千亿不等,涵盖了各种市场资本化公司。我们注意到这些股票的名称和代码是Botonline审查爬网和股票价格数据采集的种子。3.2. 京东在线评论。comJD是中国最大的两家B2Conline零售商之一,2017年商品总额达1930亿美元。随着3C产品线于2008年完工,客户开始对他们购买的产品产生评论。自那时以来,已有3亿多客户购买了onJD。com,以及超过10亿条评论。根据JDs review创建指南,通过为其他消费者提供有关购物决策和商业决策的参考,消费者可以在交易完成后对订单做出公正、客观和真实的评估。评论由文本和评分组成,评分范围从1分到5分,其中5分为最高分。所有评论的日期都是在第一次发布时,这样就可以跟踪消费者的意见。这些审查不仅涉及产品本身,还涉及卖方的所有方面,包括运输和交付经验,以及任何反映客户对品牌印象的东西,这些印象可能会影响投资者的决策业务对客户的影响计算机、通信和消费电子商务nicshttps://rule.jd.com/rule/ruleDetail.action?ruleId=2395(Chevalier和Mayzlin,2006;Li和Hitt,2008)。

13
何人来此 在职认证  发表于 2022-6-23 21:06:12
此外,京东是中国最大的自营电子商务平台,这意味着京东在该平台上销售的产品最多;因此,没有利益冲突,没有paidreviews或卖家对自己的产品发表正面评论或对竞争产品发表负面评论(Malbon,2013;Zhang等人,2016)。还采用了验证码(captcha)等复杂的技术手段来防止可能的机器人程序和垃圾邮件。所有这些都确保了京东的产品评论质量高、可靠。为了确定177家种子公司中对京东有客户产品评论的上市公司,我们首先检查该公司是否在京东上销售其产品。通过手动搜索公司名称。然后,我们从JD检索到品牌列表。并确定种子中拥有这些品牌的公司。我们总共获得了109家在京东上有客户产品评论的上市公司。通用域名格式。表1:JD汇总统计。102家上市公司的com评论评论数量产品数量最终样本数量18008415 164715 102家电行业7245982 44059 25服装行业5365380 75774 27食品行业402617 22964 29葡萄酒行业1375436 21918 21收集上市公司样本的评论,我们开发了一个网络绘图程序,将一家公共公司拥有的品牌名称作为JD的搜索词。com并生成品牌名称与搜索词完全匹配的所有产品的列表。对于每个产品,我们通过查看界面检索与之相关的所有Reviews,方法是遍历所有星号和页面。

14
大多数88 在职认证  发表于 2022-6-23 21:06:14
从评论界面,除了一篇评论的数字星级、日期和文本外,我们还可以获得订单日期和评论日期之间的天数、无用和有用的票数、卖家对该评论的评论、附带的图像列表、制作该评论的客户端(如iPhone、iPad、Android或Web),图A.1中可以找到收集的视图片段。我们爬网的评论样本涵盖了从2008年11月到2017年12月的这段时间,我们删除了对同一产品发布的具有相同评论ID的重复评论。为了减少样本数据中的噪音,我们要求一家公司至少有1000条在线评论,并且一家公司的评论时间跨度应超过12个月。表1报告了最终样本以及四个行业部门的评论、产品和公司数量。表A.1列出了本文所用公司的详细信息。发布了对样本公司生产的164715种产品的1800多万条评论。就产品评论数量而言,排名前两位的行业是家电行业(720万条评论)和服装行业(530万条评论),占我们获得评论的70%。按照审查日期对其进行排序后,我们将所有公司产品审查合并为一个时间序列。如图A.2所示,我们使用半年作为演示的时间窗口;2014年之前,京东上发布的评论数量相对较少。com在我们的四个种子部门。这一数量有限的原因是,互联网在中国还没有普及,人们在这一时期还不熟悉网上购物。然而,2014年前后,由于移动互联网行业的普遍存在,在线购物呈指数级增长,这导致产品评论迅速积累。3.3.

15
mingdashike22 在职认证  发表于 2022-6-23 21:06:18
股票价格数据一只股票的价格通常受市场参与者的供求关系的影响。然而,一些公司行为也会影响股票价格,需要在这些行为之后进行调整,例如股票分割、分拆或分配和权利分配。当许多产品链接到同一页面时,调整后的价格是一个有用的工具,许多评论将从同一产品页面重复爬网。CNNIC第35次中国互联网发展统计报告,http://www.cac.gov.cn/2015-02/03/c_1114222357.htmexamining历史回报,因为它提供了一个企业股权价值的准确表示,超出了简单的市场价格。我们从Tushare获得了调整后的每日价格数据,Tushare是一个免费、开源的Python财务数据接口包,由新浪财经、腾讯财经、上海证券交易所和深圳证券交易所支持。4、特征与目标本节描述了从在线评论中提取的13类特征和作为长期目标的12类每周股票收益率。通过皮尔逊相关分析,还将确定描述在线审查与企业股权价值之间关系的最佳目标。4.1. 特征除了与企业权益有显著关系的已知特征外,我们还提取了反映消费者体验和消费者图像的其他特征。要聚合审查数据以进行特征提取,请将单个审查转换为固定周数据。对于每家公司,不同产品的所有评论都会按时间进行整合。表2列出了如何从每个企业的固定周数据中提取13类基本特征,所有特征每周都有一个时间点。

16
kedemingshi 在职认证  发表于 2022-6-23 21:06:20
注意,在表2中,N是N周内的评审次数,N∈ [1, 12]; M是【i】中的审查数量-n-m、 我-n] 周,其中m是相对历史数据窗口的长度,m是∈ {4、6、8、10、12、16、20、24 | m>n}。除了基本特征外,我们还可以对基本特征进行各种转换,以丰富来自评论的信号,如表A.2所示。对于每个基本特征的含义,每个类别都在其各自的部分中进行了详细描述。在早期的研究中,研究人员研究了在线评论的几个属性,如容量、语义极性、评分和情绪。

17
nandehutu2022 在职认证  发表于 2022-6-23 21:06:24
此外,在线评论和企业权益之间的重要关系以及意外利润表ilityhttp://tushare.orgTable2:基本审阅功能功能定义WnReview NWnStarsPNi=1{1如果stari==s,则为0}WnStarDiff WnStari- WnStariWnDefaultPNi=1{1如果isDefaulti==T rue else 0}WnScorePs=1(s×WnStarsi)WnReviewwnetionepni=1{1如果ReviewMotioni==e else 0}WnMotionpe=0WnMotionewnegativepni=1如果ReviewMotioni∈ {0,1,3,4}其他0}WnT endencyposWPNi=1查看Wp osiWnT endencynegWPNi=1查看WnT endencywordWnT endencypos-WnT endencynegWnT endencypos+WnT endencynegWnT endencyposRPNi=1{1如果ReviewP osi>ReviewNegElse 0}WnT endencynegPNi=1{1如果ReviewP osi<ReviewNegElse 0}WnT endencyposPNi=1{ReviewT EniewP osi>ReviewNegElse 0}WnT endencynegPNi=1{ReviewT eniif ReviewP<ReviewNegElse 0}t endencypos+WnT EndencyNeggwnDayspni=1 DaysiWnReviewWnuseverpni=1可用的OteCountiWnuseverpni=1{1如果usef ulV oteCounti>0 else 0}WnUselessPNi=1如果usef Oteccounti>0 else 0{1如果usef Oteccounti>0 else 0}WnImagePNi=1如果imgi>0 else 0}WnReplyPNi=1如果replyCounti>0 else 0}WnClientcPNi=1{1如果userClienti=c else 0}WnMobilePNi=1}{1如果isM obilei==T rue else 0}也可以从这些特征中发现异常评级。参考这些早期成果,我们提取的六类特征如下所示。(1) 审查。评论类别由描述评论数量的特征组成。Chen等人(2012);Luo等人(2013年)表明,在线信息量与企业权益之间存在显著关系。这一类别的基本特征是WnReview,它表示n周内的评论数。附录表A.3列出了与审查相关的所有特征。(2) 明星。

18
可人4 在职认证  发表于 2022-6-23 21:06:27
星级类别包含从审查评级中提取的特征,这表明客户对购买体验的满意度。黄(2018);罗和张(2013);Luo等人(2013)证明了审查评级对股票收益的影响力。该类别的基本功能是WnStars,其中∈ [1,5]和WnStar,表示n周内前5名评级审查和低于1的评级审查之间的数量差异。附录表A.4列出了与Star相关的所有特性。(3) 默认值。默认类别包含根据评论窗口关闭时系统是否自动生成评论而提取的特征,评论窗口关闭时由isDefault表示。该类别的基本功能是WnDefault,它表示n周内排名前五星级的默认评论数。附录表A.5列出了所有与违约相关的特征。(4) 得分。分数类别由基于几周平均值的特征组成,反映了n周内所有购买的平均客户满意度。Huang(2018)展示了一个利差投资组合,该组合可以缓解分数变化,并提供异常回报。该类别的基本特征是WnScore。附录表A.6列出了与得分相关的所有特征。(5) 情感。情感类别包括从每次评论所传达的情感中提取的特征,这些特征代表了对购买体验的特定态度。最近的研究成功地将来自社交媒体的投资者情绪纳入股票价格预测中(Wang等人,2019年;Zhou等人,2018年;Sun等人,2017年;Ruan等人,2018年;Li等人,2014年)。根据这些研究,本文采用了(Zhou等人,2018)的情绪测量方法,将简短的评论文本分为愤怒、厌恶、喜悦、悲伤和恐惧五类,分别表示为0、1、2、3和4。

19
可人4 在职认证  发表于 2022-6-23 21:06:30
每个复习者的情绪由复习动作表示。这一类别的基本特征是情绪化、情绪化和消极情绪化,分别是n周内拥有情绪化的评论数量、情绪化评论数量以及传递消极情绪的评论数量,包括愤怒、厌恶、悲伤和恐惧。请注意,对消极情绪的强调来自于(Luo,2009;BambauerSachse和Mangold,2011)中证明的证据,即负面评论可能会以持续数月的方式破坏品牌形象。此外,表A.7进一步说明了情绪类别的特殊变体,即RatioE、RatioDiff和RatioDiffhm。附录表A.8列出了所有与情绪相关的特征。(6) 趋势。倾向性类别由根据评论文本中的倾向性词提取的特征组成。不同的趋势评估与股票回报之间存在着不同的关系(Tirnililai和Tellis,2012;Luo,2009)。评论中的肯定词数量由ReviewP os表示,而评论中的否定词数量由ReviewEng表示。审查趋势用ReviewT en=ReveiwP os表示-当本评论中至少有一个倾向性词语时,请回顾egReviewP os+ReveiwN EG;否则为0。

20
mingdashike22 在职认证  发表于 2022-6-23 21:06:33
这一类的基本特征分别是WnT-endencyposW、WnT-endencynegW、WnT-endencyword、WnT-endencyposR、WnT-endencynegR、WnT-endencypos、WnT-EndencyNegaand WnT-endency,n周内所有评论中的肯定词数量、n周内所有评论中的否定词数量、词水平的阶段性趋势,包含积极趋势词多于消极趋势词的评论数量、包含消极趋势词多于积极趋势词的评论数量、积极评论的累积趋势、消极评论的累积趋势以及n周内的整体趋势。附录表A.9列出了与趋势相关的所有特征。先前对消费者和营销的研究表明,当消费者搜索、购买、检查、评估和消费产品时,就会产生体验(Arnold和Price,1993;Holbrook,2000;Hoch,2002)。Huffemanand Houston(1993)和Hoch and Deighton(1989)都揭示了产品体验对产品判断、态度、偏好、购买意图和召回的影响。此外,客户与销售人员互动,这会影响客户的感受、品牌态度和满意度(Grace andO\'Cass,2004)。鉴于消费者体验在品牌态度形成中的重要性,但很少讨论消费者体验与企业资产之间的关系,以下列出了从onlinereviews中提取的五类新特征,作为消费者体验的代表。(1) 天。天数类别由从Days字段提取的特征组成,Days字段描述了相应产品从订单日期到评论日期的日期差异。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-16 06:39