楼主: 能者818
1183 42

[量化金融] 利用人工智能重新获取规范#我改变了吗 [推广有奖]

21
可人4 在职认证  发表于 2022-6-14 05:58:06
年龄分布是倾斜的:定义和调查了最高层的一代,对男性略有偏见。7.2研究设计用于评估的精确模型版本是神经网络模型的屏蔽版本,其中精度为ollowNormsi=1如果P预测i=T rueGenderi0如果P预测i6=T rueGenderi(2)举例说明,#teknisktfel,#tystnadtagning和#medvilkenr"att(#technicalerror,#silencetake,#bywhichright)。预印本——2019年3月5日——推特样本的平均遵循标准相当于Geni的预测准确性。变量Follownorm变化以第一年获得的性别规范定义为基准。关于第二年(metoo事件发生地)包含metoo标签和其他相关标签的性别推文的讨论更加激烈,这让我们能够在事件发生前五个月调查可能的时间趋势。以下性别规范也可能存在季节性变化。我们可以使用第一年的推文(第一年的前一个推文起到比较组的作用,因为Geni没有接受这些推文的培训。它们更接近Geni的预测准确性,即在没有任何影响的情况下,人们期望在第二年达到的遵循标准的水平。图3:研究设计基线规格为:F ollowNormsitu=Y ear2t+AfterMetoot+vt+uitu(3)分别为观察是用户在日历日发布的推特。可变EAR2是一个二进制指示器,指示Metoo事件后的第2年。将第2年的推文与第1年测试集的推文进行比较,日历天数时间固定效应控制季节变化。这两个年份的时间索引都从2017年5月1日开始,每个日历日都有自己的截距(例如,2016年5月1日和2017年5月1日有一个截距)。设计使用多个时间点(大t)。

22
可人4 在职认证  发表于 2022-6-14 05:58:09
它也类似于时间上的回归不连续性(RDIT)。作为RDIT估算所用的正常SWindow大小。目前正在讨论如何对与当前设置相似的设置的标准误差进行聚类(Bertrand et al.,2004;Abadie et al.,2017)。本文采用的方法是在日历日上对presenteffects或time trends标准误差进行聚类。我选择在基准规范中显示每个日历日的标准误差集群,因为它提供了一个更容易扩展到用户固定效果的框架。(R)Ytg=Pi∈g组gYitug/Ig((R)Yt,g=Y ear2-\'\'Yt,g=Y ear1)=c+AfterMetoot+(ut,g=Y ear2- ut,g=Y ear1),由Newey-West标准误差估计,滞后长度为4(带宽为5)。由于数据是聚合的,因此在估计期间应用的权重等于两组观察值之和。在其他稳健性规范中,我扩展了基线规范(3),并具有用户固定的效果。这是Cameron等人(2011)提出的可行方差协方差矩阵估计量。我选择不包含用户固定影响的基线规格,因为我想调查推特中的变化。如果用户由于eventcontrols停止发布推文,则可能出现类似情况。在鲁棒性分析中,还采用了第二种控制策略。从理论上讲,Geni的表现应该比将样本量减少到原来的97-98%更差。预印本-2019年3月5日测试,预计不会因Metoo移动而更改。该系列主要控制瑞典语言的演变。

23
能者818 在职认证  发表于 2022-6-14 05:58:12
在分析中,Geni准确性的降低,即遵循规范变量,被解释为规范被较少用于过滤可能的语言进化影响。7.3结果原始基线截止值独立女性关注点(1)(2)(3)(4)Dep Var遵循规范遵循规范她在Metoo之后统计的性别语言-0.003***-0.015***0.013***0.022***(0.001)(0.005)(0.004)(0.007)时间FE否是是SUSER FE否否否否否NoSE:s鲁棒群集群集在day on上逐日推特989 028 1 192 719 1 192 719 1 192 719天(T)319 365 365用户(N)95 025114 040 114 040 114 040数据年份2年2/1年2/1年2/1注:**p<0.01,**p<0.05,*p<0.1。表6:无用户固定效应的Metoo结果稳定6显示了瑞典推特上Metoo事件是否会改变性别规范的主要结果。第一列给出了-0.003的原始估计,表明与五个月前相比,Metoo事件发生六个月后,推特上的性别规范平均遵守率较低。这一幅度很小,归因于五个月前遵循标准的平均水平下降了0.3%。虽然以下标准系列未显示出前期趋势(附录表B4),但估计可能存在偏差。性别规范的遵守可能会有季节性的变化,即使没有“我”运动,也会随之改变规范。通过允许同一日历日产生自己的影响来过滤季节性变化,并且仅在活动后的推文中较少反映平均值周围的变化。

24
nandehutu2022 在职认证  发表于 2022-6-14 05:58:16
估计的幅度相当大,18次移动后,1.9%的波形在移动前出现(基于50%的遵循标准的计算,asGeni在想要的和不想要的性别标准之间没有任何差异,比较也不规范。以概率作为因变量进行估计,其中包括较少的测量误差。该变量不涉及女性到更高的程度。量级相当大,3.0%的样本表示n、 如需有关详细信息,请参阅附录A。一张预印本——2019年3月5日,45年后,她会毫不犹豫地认为所有推特都是关于女性的。“更多女性化”的性别语言并不意味着推特是关于女性的,它同样可以很好地描述男性。表明遵守性别规范。有人可能会说,模型考虑到这一点是有益的。专栏(4)显示,梅托事件后,她发推的信息比之前多了2.2个百分点。这句话的意思是:谈论男人的数量正在减少。She He She He(1)(2)(3)(4)Dep Var Gendered Language Gendered Language Gendered Language Follow Norms Follow Norms Metoo 0.013***0.007*0.020***-0.005***(0.003)(0.004)(0.005)(0.001)Time FE Yes Yes Yes Yes Yes suser FE No No No No NoSE:s Clustered Clustered Clustered on day on day on day tweets 293 869 898 850 293 869 898 850Days(T)365 365 365数据年份2/1/1/1/1注:**p<0.01,**p<0.05,*p<0.1。表7:关于女性和男性的推特单独估计的Metoo结果7显示了分别针对she和he推特子集的基线规格。

25
何人来此 在职认证  发表于 2022-6-14 05:58:19
第(1)列和第(2)列表明,改变对性别的刻板印象,这意味着应该更多地描述女性,因为男性以前是相当合理的,先验地,没有理由认为规范的改变意味着性别之间的趋同。最终结果出炉了。目前的表格指出,根据过去的性别陈规定型观念,男性被描述的较少,因为这有助于基线效应。估计值-0.005仅表示事件前样本平均值的影响大小为0.5%。尽管他推特对平均基线效应的贡献更大,因为推特的贡献是平均基线效应的三倍左右,但推特仍然是典型的。目前的表格还指出,她推特的推特推动了基线效应,但方向“错误”。根据过去的性别规范,在我之后,男性的平均照片更多。性别规范的特定维度发生了变化,例如,推特可能会减少女性的性化。为了调查是否存在任何此类模式,表8列出了准确度变化最大的单词,即在接下来的第1年,以及在第2年的Metoo事件之后更不正确的单词。所采用的方法仅用于说明目的,未对单词进行正式测试。一个单词依赖于它周围的其他单词,因此,本文采用的主要方法是对推特建模并对其进行推理。在表8中,“Diff”列通过计算每个单词的平均预测准确度来显示准确度的变化。由于这一减少,并且由于GeniA预印本-2019年3月5日,通过分析底层推文来分析变化。例如,cutie(s"otis)一词标志着一种性别刻板印象,即男性在做特定事情时被称为cutie(略带贬义),而在第二年,女性也被称为cutie。

26
mingdashike22 在职认证  发表于 2022-6-14 05:58:22
男性和女性将“跳动的心”表情符号与其他词语结合使用,如“善良”或“能干”,主要用于描述自己的伴侣。在第二年,模式发生了变化:“跳动的心脏”表情符号与模型预测不正确的品质结合使用,例如男性表现很好(j"atteduktig)。关于单词views(asikterna),to have views(haasikter)被编码为表示男性性别刻板印象,在第一年大多数男性有观点,但在第二年,女性被描述为有更高程度的观点。表8:单词水平准确性的变化Diff英语Swedish0.78高度怀孕h"oggravid0.73灵感来源灵感sk"alla0.71 coco coco0.68囚犯fange0.63 cutie s"otis0.63 main 0.63怀孕孕妇0.63 handelbars styret0.61 N N0.60 univers\'universums0.60 nuv nuv0.58吓死skr"ackslagen0.57偏执狂症0.57=(=(0.57提出framst"alla0.55可爱<gulligegulliga>0.55流苏lugg0.55泰语thai0.54混音混音0.53 k-g k-g0.53马匹0.52 jemen jemen0.50 kreml kreml0.48关联relatera0.48给予joy gl"adjer0.47*带微笑的第八音符-表情符号**带微笑的第八音符-表情符号*0.46快速快速的快速的快速的快速混音0.46必要的n"odv ndig0.45绘制tecknar0.45带纹身的tatuerade0.45不同意osams0.45错误了解missf"orstand0.44 copy kopierar0.43 body guard livvakt0.43 nato nato0.43*跳动的心脏-表情**跳动的心脏-表情*0.42 mean taskiga0.42 svts svts0.42洗脑hj"arntv"attad0.42发言人talesperson0.42 06 060.41带前/包扎伤口f"orband继续下一页在线附录(瑞典语)中提供了该表的更长版本。

27
何人来此 在职认证  发表于 2022-6-14 05:58:25
据我所知,我无法根据Twitter API的条款和服务重新分发这些网页。该模式仍表示有变化。预印本-3月5日,2019年表8–续上一页Diff English Swedish0.37 loaded laddat0.37 foe ov"an0.37 viewsasikterna0.37作弊fuskar0.36 rinkeby rinkeby 0.36 melin melin 0.36 babe babe0.36晚餐Midagen0.35 claesson claesson 0.35财政部长0.34<姐夫>0.33性别歧视者0.31摔跤brottasNote:表格顶部显示单词包括在推特中,这些推特在metoo事件之前被正确预测,之后被错误预测。该表按以下方式生成:;所含数据为测试集的五个月(2016-10-18及以后),以及评估集的五个月(2017-10-18及以后)。对于每个周期,计算每个单词的平均准确度。该差异在表中命名为“Diff”,它是通过将评估集周期的平均精度与测试集的平均精度进行细分而形成的。将差异离散为20组,每组间隔为0.005步,并从测试集中为每组选择10个最频繁的单词,只要该单词在这两个时段至少包含在5条推文中。由于空间限制,该表仅显示差异分布的顶部。瑞典语的完整表格和基本推文包含在在线附录中。瑞典语的翻译是由作者完成的。7.4稳健性检查随时间变化。因此,附录表B5和B6复制了前两个表6和7,但显示每日聚合数据的估计值,因为Newey-West standarderrors考虑了残差的自相关。现在,基线估计仅在10%的水平上显著。一般来说,标准错误会增加。

28
mingdashike22 在职认证  发表于 2022-6-14 05:58:28
后者的p值为10.2%。系数和标准误差在Newey-West标准误差的两个大小上是等效的。生成他/她样本背后的选择过程可能会受到Metoo事件本身的影响,并影响到原始样本。中位数包括用户在第二年的8条推文,但一些用户的推文比其他用户的多,这使得平均值要高得多。对于基线规格,第1年的51000名用户被添加,无论他们的推文样本是否存在使其无法代表所有用户和推文的风险,但第(1)列和第(2)列分别在剪切样本上复制了RAW和基线估计值,并发现它们与各自的交易对手折扣率非常相似。在完整的推特样本中,无论是进入率还是退出率,都没有在事件前后表现出任何明显的趋势中断,请参见附录图B2。预印-2019年3月5日圣诞节之后,他们开始在推特上发布不太规范的信息,3月中旬,他们又回到了活动前4),这使得平均估计值具有代表性。与用户在第1年改变其水平的方式相比,平均个人用户在后期会降低其遵守标准的水平。估计值-0.012与基线规格相似,相当可观,为事件前样本平均值的1.6%。

29
何人来此 在职认证  发表于 2022-6-14 05:58:32
这一估计意味着用户改变了他们的行为。原始:样本切割基线:样本切割用户FE基线:用户FE(1)(2)(3)(4)Dep Var遵循规范遵循规范遵循规范Metoo-0.003***-0.016***-0.005***-0.012**(0.001)(0.005)(0.001)(0.005)时间FE否是否用户FE否是:s鲁棒群集群集群集在用户日的同一天&用户推特849 518 1 053 209 849 518 1 053 209(T)319 365 319 365用户(N) 35 338 65 165 35 338 65 165。。。第二年35 338 35 338 35 338 35 338 35 338。。。第1年51 352 51 352数据年2/1年2/1注:**p<0.01,**p<0.05,*p<0.1。表9:Metoo结果与用户固定效应另一个偏差来源可能是Geni的表现更差,因为用户引入了她不知道的新词和短语,这将导致遵循规范水平的准确性下降,即使没有MetooTogetherness系列作为对照组。我们不希望主要系列遵循规范,而Togetherness系列遵循相同的时间趋势,因此这些都包含在规范中。第(1)列显示了“团结”系列的安慰剂回归,并显示该系列随着时间的推移是稳定的。结果表明,随着语言的发展,准确度没有下降。表10的其余部分重新估计了主要规格,因为与稳定的聚会系列相比,主要系列中存在U型模式的预测精度,在聚会系列后面的其他用户与主要系列相同的基础上包括在内后,即通过在活动现场推特。该规范比较了用户在活动后平均改变推文模式的方式,而3月份的推文模式明显低于活动前的平均遵循规范水平(不影响主要结果),达到5%。

30
能者818 在职认证  发表于 2022-6-14 05:58:35
首选使用第一年的推特作为对照组,因为它们允许控制季节变化,表6第(2)列中的基线估计是首选。第一年推文的样本量要小得多,是原始推文的20%,因为我已经对其进行了二次抽样,以便进行modelin估计。换言之,可能的趋势不会对After Metoo的估计产生影响,其程度与第一年的推特相同,不会改变任何估计(未显示)。预印本-3月5日,2019年Togetherness Time Trends Time FE Time&User FE(安慰剂)(1)(2)(3)(4)Dep Var Follow Normals*100 Follow Normals*100 Follow Normals*100 Follow Normals*100 After Metoo 1.531 11.449**10.659*19.153***(1.237)(5.646)(5.763)(5.069)After Metoo*t-0.010-0.107**-0.103**-0.150***(0.010)(0.048)(0.049)(0.039)After Metoo*2 0.000 0.000**0.000*0.000 000***(0.000)(0.000)(0.000)(0.000)(0.000)次FE号否是是用户FE否否否否否否否群集群集群集群集群集群集在一天一天内群集和用户推文1 014 356 2 003 384 2 003 384 1 706 588天(T)319 319 319 319用户(N)116 376 211 401 211 401 77 863数据聚合年2/聚合年2/聚合年2/聚合度yit=1(b+bt+bt)+后etoo(b+bt)+uitYit=1(b+bt+bt+后etoo(b+bt)+HeShe(b+bt+bt)+其中HeShe变量是使用本文中主序列的二进制指标。规格(3):Yit=后梅托(b+bt+bt)+HeShe(b+bt+bt)+vt+uit。规格(4):Yit=AfterMetoo(b+bt+bt)+vt+mi+uit,在这两个系列中发推的用户被视为两个独立的用户。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-1-27 03:53