楼主: 大多数88
502 18

[量化金融] 新颖、热门的商业新闻及其对股市的影响 [推广有奖]

  • 0关注
  • 3粉丝

会员

学术权威

67%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
64.4541
学术水平
0 点
热心指数
4 点
信用等级
0 点
经验
23324 点
帖子
3819
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

相似文件 换一批

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Novel and topical business news and their impact on stock market
  activities》
---
作者:
Takayuki Mizuno, Takaaki Ohnishi, Tsutomu Watanabe
---
最新提交年份:
2015
---
英文摘要:
  We propose an indicator to measure the degree to which a particular news article is novel, as well as an indicator to measure the degree to which a particular news item attracts attention from investors. The novelty measure is obtained by comparing the extent to which a particular news article is similar to earlier news articles, and an article is regarded as novel if there was no similar article before it. On the other hand, we say a news item receives a lot of attention and thus is highly topical if it is simultaneously reported by many news agencies and read by many investors who receive news from those agencies. The topicality measure for a news item is obtained by counting the number of news articles whose content is similar to an original news article but which are delivered by other news agencies. To check the performance of the indicators, we empirically examine how these indicators are correlated with intraday financial market indicators such as the number of transactions and price volatility. Specifically, we use a dataset consisting of over 90 million business news articles reported in English and a dataset consisting of minute-by-minute stock prices on the New York Stock Exchange and the NASDAQ Stock Market from 2003 to 2014, and show that stock prices and transaction volumes exhibited a significant response to a news article when it is novel and topical.
---
中文摘要:
我们提出了一个指标来衡量特定新闻文章的新颖程度,以及一个指标来衡量特定新闻项目吸引投资者注意的程度。新颖性度量是通过比较特定新闻文章与早期新闻文章的相似程度来获得的,如果之前没有类似的文章,则该文章被视为新颖。另一方面,我们说,一条新闻受到很多关注,因此,如果它同时被许多新闻机构报道,并被许多从这些机构接收新闻的投资者阅读,那么它就具有高度的话题性。新闻项目的话题性度量是通过计算内容与原始新闻文章相似但由其他新闻机构发布的新闻文章的数量来获得的。为了检验这些指标的表现,我们实证研究了这些指标与日内金融市场指标(如交易数量和价格波动)的相关性。具体而言,我们使用了一个数据集,其中包括9000多万篇英文商业新闻文章,以及一个数据集,其中包括2003年至2014年纽约证券交易所和纳斯达克股票市场上每分钟的股票价格,并显示,当新闻文章新颖且具有主题性时,股票价格和交易量表现出显著的反应。
---
分类信息:

一级分类:Quantitative Finance        数量金融学
二级分类:Statistical Finance        统计金融
分类描述:Statistical, econometric and econophysics analyses with applications to financial markets and economic data
统计、计量经济学和经济物理学分析及其在金融市场和经济数据中的应用
--
一级分类:Computer Science        计算机科学
二级分类:Computers and Society        计算机与社会
分类描述:Covers impact of computers on society, computer ethics, information technology and public policy, legal aspects of computing, computers and education. Roughly includes material in ACM Subject Classes K.0, K.2, K.3, K.4, K.5, and K.7.
涵盖计算机对社会的影响、计算机伦理、信息技术和公共政策、计算机的法律方面、计算机和教育。大致包括ACM学科类K.0、K.2、K.3、K.4、K.5和K.7中的材料。
--
一级分类:Physics        物理学
二级分类:Physics and Society        物理学与社会
分类描述:Structure, dynamics and collective behavior of societies and groups (human or otherwise). Quantitative analysis of social networks and other complex networks. Physics and engineering of infrastructure and systems of broad societal impact (e.g., energy grids, transportation networks).
社会和团体(人类或其他)的结构、动态和集体行为。社会网络和其他复杂网络的定量分析。具有广泛社会影响的基础设施和系统(如能源网、运输网络)的物理和工程。
--

---
PDF下载:
--> Novel_and_topical_business_news_and_their_impact_on_stock_market_activities.pdf (242.43 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:Quantitative Transactions SIMULTANEOUS Econophysics Applications

沙发
nandehutu2022 在职认证  发表于 2022-5-8 15:08:23 |只看作者 |坛友微信交流群
新颖和热门的商业新闻及其对股市活动的影响*§*k,大西隆明+k,渡边昌夫k*东京国立信息研究所,Japanmizuno@nii.ac.jp+日本东京东京大学信息科学与技术研究生院。takaaki@i.u-东京。ac.jp——东京大学经济研究生院,东京,Japanwatanabe@e.u-东京。ac.jp§日本东京SOKENDAI(高级研究生大学)信息学系日本东京日本科学技术厅PRESTO日本东京佳能全球研究所摘要:我们提出了一个指标来衡量某一新闻文章的新颖程度,以及衡量特定新闻项目吸引投资者兴趣程度的指标。通过比较某篇新闻文章与早期新闻文章的相似程度,可以得出新颖性度量。如果之前没有类似的文章,则该文章被视为新颖。另一方面,我们说,一条新闻受到很多关注,如果它同时被许多新闻机构报道,并被许多从这些机构收到新闻的投资者阅读,那么它就是高度话题化的。一条新闻的话题性度量是通过计算内容与原始新闻相似但由其他新闻机构发布的新闻文章的数量来获得的。为了检验这些指标的表现,我们实证研究了这些指标与日内金融市场指标(如交易数量和价格波动)的相关性。

使用道具

藤椅
kedemingshi 在职认证  发表于 2022-5-8 15:08:26 |只看作者 |坛友微信交流群
具体而言,我们使用了一个数据集,该数据集包含9000多万篇英文商业新闻报道,以及一个数据集,该数据集包含2003年至2014年纽约证券交易所和纳斯达克股票市场上每分钟的股票价格,并显示,当新闻文章新颖且热门时,股票价格和交易量表现出显著的响应。新颖性;话题性;外部冲击;金融市场;商业新闻;金融市场可以被视为一个非均衡系统。对于金融、经济学和统计物理学的研究人员来说,理解它们是如何工作的仍然是一个巨大的挑战。金融市场价格的波动有时是由内生力量驱动的,有时是由外生力量驱动的。商业新闻是外来力量的典型例子。不经意的观察表明,股票价格对有关公司情况新发展的新闻报道作出反应。研究人员在多个不同领域[1]–[13]对市场对新闻的反应进行了广泛研究,一些研究人员试图构建模型,捕捉对内生和外生冲击的静态和/或动态反应[14],[15]。新古典金融经济学家的出发点通常是他们所说的“有效市场假说”,这意味着股票价格在消息传递给市场参与者的那一刻做出反应。

使用道具

板凳
mingdashike22 在职认证  发表于 2022-5-8 15:08:30 |只看作者 |坛友微信交流群
许多实证研究试图确定这种对新闻的即时价格反应,但发现几乎没有证据支持有效市场假说[16]–[21]。投资者试图预测不久的将来会发生什么,并根据这些预测买卖证券。通过这个过程,一些有新闻价值的事态发展在发生之前就被纳入了市场价格的因素中,这样股价在被报道时根本不会做出反应[22]。这意味着,研究人员在检测对新闻的即时反应时,区分预期新闻和意外新闻并只关注意外新闻是很重要的。为此,我们需要衡量新闻文章对市场参与者的新颖程度,这是我们将在本文中讨论的第一个问题。另一方面,即使某一条新闻出乎意料,市场反应也会因该条新闻对市场参与者的重要性而有所不同。具体而言,市场对新闻的反应取决于市场参与者的解读方式[23],媒体的报道方式(即,是在悲观还是乐观的背景下报道)[24],以及同一新闻的报道次数[25]。研究还表明,在互联网上搜索次数较多的股票,其交易量往往较大[26]。所有这些证据都表明,我们需要将吸引大量注意力的新闻与市场参与者和很少受到关注的新闻区分开来,并将重点放在吸引大量注意力的新闻上,以评估市场对此类新闻的反应。

使用道具

报纸
mingdashike22 在职认证  发表于 2022-5-8 15:08:33 |只看作者 |坛友微信交流群
这意味着我们需要衡量一条新闻吸引市场参与者注意的程度,这是本文将讨论的第二个问题。我们衡量新闻新颖性和话题性的方法与最近关于文本挖掘技术在金融市场活动分析中的应用的研究密切相关。具体而言,研究表明,使用文本挖掘技术提取的新闻文章的语言和统计特征包含有用的信息,可以预测未来的股价和交易量[27]–[32]。此外,在信息过滤方面,已经开发了几种新方法来检测和消除博客和twitter上的冗余文本,并将其应用于社交网络服务(SNS)文本的新奇内容识别[33]–[37]。我们的论文与汤森路透公司(Thomson Reuters Corporation)的研究关系最为密切,该公司提出通过计算在特定时间段内新闻产品中发现的语言相似的新闻文章数量来衡量新闻的新颖性[38],[39]。根据这种方法,金融市场活动对后续新闻的反应比对初始新闻的反应更强烈[40]。另一项研究与我们的isref[41]密切相关,该研究试图通过计算一条推文的转发次数来衡量一篇新文章的重要性[41]。在本文中,我们通过比较一篇新闻文章与该文章之前报道的其他新闻文章的语言相似性来衡量其新颖性:如果之前没有语言相似的新闻文章,则该文章被视为新颖。这种方法与之前的研究几乎相同。

使用道具

地板
何人来此 在职认证  发表于 2022-5-8 15:08:36 |只看作者 |坛友微信交流群
另一方面,我们说,一条新闻吸引了很多注意力,因此如果它被多家新闻机构同时报道,并被许多从这些机构获取新闻的投资者阅读,那么它就具有高度的话题性。一篇新闻文章的话题性度量是通过计算与原始新闻文章内容相似但由其他新闻机构发布的新闻文章的数量来获得的。这项措施与参考文献[41]提出的措施类似,但与之不同的是,我们的措施能够捕捉到新闻文章在交付后立即出现异象的程度,而参考文献[41]提出的措施并不能很快起作用,因为提及文章的推特的转发次数只是逐渐增加。为了检查指标的表现,我们实证研究了它们与日内金融市场指标(如交易数量和价格波动率)的相关性。具体而言,我们使用adataset,其中包括9000多万篇英文商业新闻文章,以及一个由2003年至2014年纽约证券交易所(NYSE)和纳斯达克股票市场上每分钟的股票价格组成的数据集,并显示股票价格和交易量对新闻文章的新颖性和主题性的显著反应。论文的其余部分组织如下。我们首先对包含9000多万篇英语商业新闻文章的数据集进行了详细描述,并表明突发新闻比其他新闻对股价和交易量的影响更大。接下来是图1。通用汽车股票的市场活动围绕通用汽车的警告和标题显示。什么时候t=0,RTRS电子交易平台上显示关键字为“GM.N”的新闻文章。右上角的图显示了半对数图。

使用道具

7
能者818 在职认证  发表于 2022-5-8 15:08:40 |只看作者 |坛友微信交流群
实线和虚线分别显示市场对警报和标题的反应。黑线遵循指数函数(=0.45 exp(-0.073t) +1)。研究关于新闻文章中语言相似性的统计规律,并提出衡量新闻文章新颖性和文章主题性的标准。然后,我们研究这些指标与日内金融市场指标的相关性。二、新闻数据集汤森路透公司(RTRS)和道琼斯公司(DJ)通过电子系统[42]、[43]在几分之一秒内向世界各地的市场参与者发布新闻。RTRS的电子交易平台上展示了300多家第三方发布的新闻。在本文中,我们仅使用RTRS平台上RTRS、商业通讯社新闻服务(BSW)、加拿大通讯社新闻服务(CNW)、Marketwire新闻服务(MKW)、PR新闻通讯社新闻服务(PRN)和市场新闻出版公司(VMN)发布的英语新闻文章,以及DJ在2003年至2014年发布的所有英语新闻文章。新闻文章总数超过9000万篇。记者在RTRS平台上的文章中加入关键词。例如,通用汽车公司(GeneralMotors Company,LLC)的新闻文章有一个关键字GM.N,where。n指纽约证券交易所(NYSE)。RTRS平台上有三种类型的新闻事件。ALERTarticles以红色显示,提供突发新闻的一行摘要。标题文章提供了非突发新闻的一行摘要。警告和标题最长可达80-100个字符。ASTORY展示了一篇完整的新闻文章。在我们的数据集中,专家和标题的百分比分别约为12%和42%。另一方面,DJ新闻也有GM这样的关键词。在本文中,我们使用DJ新闻的提醒、标题和标题。三、

使用道具

8
何人来此 在职认证  发表于 2022-5-8 15:08:43 |只看作者 |坛友微信交流群
市场对警报和头条新闻的反应为了观察市场对新闻的日内反应,我们通过波动性、交易数量来衡量市场活动,如图2所示。在警报和标题显示后,78只股票的市场活动持续了三分钟。每个股票编号的股票代码在表I中。表I与图2中的股票代码相对应。股票编号股票编号股票编号股票编号股票编号股票编号股票编号股票编号股票编号股票编号股票编号股票编号股票编号AA 1 ABT 2 AET 3 AIG 4 AMD 5 APC 7 AXP 8 BA 9 BAC 10 BBT 11 BBY12 BHI 13 BK 14 BLK 15 BMY 16 C 17 CAT18 CHK 19 COF 20 COP 21 CVS 22 DD 23 DIS24 DOW 25 EMC 26 F 27 FCX 28 GD 29 GE30 GM 31 GS 32 HAL 33 IBM 34 JCP 35 JNJNJ36 JPM 37 KO 38 LLY 39 LMT 40 MDT 41 MO42 MRK 43 MRO 44 NEM 45 NOC 46 NOK 47 PFE49 PG 50 PNC 51 S 52 SLB 53 TWX54 UNH 55 UPS 56 USB 57 UTX 58 VIP 59 VLO60 WFC 61 WLP 62 WMT 63 XOMNASDAQ64 AAPL 65 AMGN 66 AMZN 67 BIIB 68 BRCM 69 CMCSA70 CSCO 71 DELL 72 DISH 73 EBAY 74 INTC 75 MSFT76 QCOM 77 YHOO和每只股票每分钟的交易量。波动率由一分钟内股票价格对数返回的绝对值确定:V′(d,t)=对数P(d,t+1)- logp(d,t)|,(1)其中d和t分别表示日期和一天中的时间[分钟](例如,d=2015年5月18日,t=上午9:30)。市场活动有季节性和日间变化。我们将其从典型的市场周期中移除,通过引入标准化波动率、标准化交易数量和标准化交易量来正确估计一天的市场活动影响,如下所示:V(d,t)=V′(d,t)hV′(d,t)idhV′(d,t)hV′(d,t)idit,(2)N(d,t)=N′(d,t)hN d′(d,t)idhN d′(d,t)idit,(3)VOL(d,t)=VOL′(d,t)hV ol′(d,t)idhV ol′(d,t)hV o l′(d,t)idit,(4)其中N′(d,t)和VOL′(d,t)是d日t时的交易数量及其数量。

使用道具

9
能者818 在职认证  发表于 2022-5-8 15:08:47 |只看作者 |坛友微信交流群
由于h··Ide表示d日的平均值,因此每日季节性通过方程式中的第一项从市场活动中移除。h···italso表示所有采样周期内时间t的平均值。第二项去除了市场活动的日内周期。接下来,我们调查了RTRS电子交易平台上显示的新闻的日内市场反应。我们当时观察了通用汽车inNYSE股票的三种不同市场活动t(即V(t) ,N(t) ,V ol(t) ),知道当时有警报或标题是“GM.N”t=0。图1显示了市场活动的平均值:hV(t) 我,嗯(t) 我,我(t) i.在警报情况下,平均值当时上升了约60%t=0,在指数函数中缓慢衰减(=0.45 exp(-0.073t) +1)。另一方面,当头条新闻出现时,平均值几乎没有变化。我们还调查了表一中64只纽约证券交易所股票和14只纳斯达克股票的日内市场反应。对于每只股票,警报和头条新闻的数量超过500篇,在整个样本期内,它们的总数超过3000篇。图2显示了在新闻发布后三分钟内每只股票市场活动的条件均值:hV(t) |0≤ t<3i,hN(t) |0≤t<3i,hV-ol(t) |0≤ t<3i。在警报情况下,我们观察到几乎所有股票的市场活动都出现了跳跃。这些跳跃的平均值为36.5%。另一方面,没有一只股票对标题做出很大反应。这些结果表明,在评估市场对此类新闻的反应时,我们需要区分吸引大量注意力的新闻和很少受到关注的新闻,并关注吸引大量注意力的新闻。

使用道具

10
大多数88 在职认证  发表于 2022-5-8 15:08:50 |只看作者 |坛友微信交流群
在接下来的章节中,我们将研究关于新闻文章语言相似性的统计规律,并提出衡量新闻文章新颖性和文章主题性的方法。四、 新闻文章之间的相似性我们使用反向文档频率(IDF)和协同相似性来衡量新闻文章之间的相似性。与“雪佛兰”、“反垄断”和“破产”等不太常见的词不同,诸如“and”、“with”和“the”等停止词并不是衡量相似性的好关键词IDF是衡量自然语言处理中所有文章中一个术语是常见还是罕见的常用指标,定义为新闻数据集中文章总数与本文中包含给定单词的文章数之比的对数。设A={A,···,an}是一组冠词,W={W,···,wm}是A中出现的一组不同的词。冠词表示为m维向量~wa。如前所述,我们使用idf值作为单词权重,并将向量描述如下:~wa=(δ(a,w)idf(w),··,δ(a,wm)idf(wm)),(δ(a,wk)=1(wk)∈ a) δ(a,wk)=0(wk/∈ a) 。(5) 当文章被表示为向量时,两篇文章的相似性对应于向量之间的相关性。这被量化为系数之间夹角的余弦:所谓的余弦相似性。给出了两篇文章,aia和aj,它们的余弦相似性是im(ai,aj)=~wai~waj | ~wai | | ~waj |。(6) 因此,余弦相似性在[0,1]之间有界。我们还研究了新闻文章在时间方向上的相似性。函数Sa(t) 表示文章在不同时间和t+的余弦相似性的平均值t、 在本文中,我们称之为Sa(t) 为方便起见,使用了自动正弦相似函数。无花果

使用道具

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
加JingGuanBbs
拉您进交流群

京ICP备16021002-2号 京B2-20170662号 京公网安备 11010802022788号 论坛法律顾问:王进律师 知识产权保护声明   免责及隐私声明

GMT+8, 2024-11-9 08:03