楼主: 能者818
1398 26

[量化金融] 基于深度回归的车牌拍卖价格预测 [推广有奖]

  • 0关注
  • 6粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
10 个
通用积分
39.6240
学术水平
0 点
热心指数
1 点
信用等级
0 点
经验
24699 点
帖子
4115
精华
0
在线时间
1 小时
注册时间
2022-2-24
最后登录
2024-12-24

楼主
能者818 在职认证  发表于 2022-5-31 02:53:51 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Predicting Auction Price of Vehicle License Plate with Deep Recurrent
  Neural Network》
---
作者:
Vinci Chow
---
最新提交年份:
2019
---
英文摘要:
  In Chinese societies, superstition is of paramount importance, and vehicle license plates with desirable numbers can fetch very high prices in auctions. Unlike other valuable items, license plates are not allocated an estimated price before auction. I propose that the task of predicting plate prices can be viewed as a natural language processing (NLP) task, as the value depends on the meaning of each individual character on the plate and its semantics. I construct a deep recurrent neural network (RNN) to predict the prices of vehicle license plates in Hong Kong, based on the characters on a plate. I demonstrate the importance of having a deep network and of retraining. Evaluated on 13 years of historical auction prices, the deep RNN\'s predictions can explain over 80 percent of price variations, outperforming previous models by a significant margin. I also demonstrate how the model can be extended to become a search engine for plates and to provide estimates of the expected price distribution.
---
中文摘要:
在中国社会,迷信是最重要的,数字合适的车牌在拍卖中可以卖到很高的价格。与其他贵重物品不同的是,车牌在拍卖前不分配估计价格。我认为预测车牌价格的任务可以看作是一项自然语言处理(NLP)任务,因为其值取决于车牌上每个字符的含义及其语义。我构建了一个深度递归神经网络(RNN)来预测香港车牌的价格,基于车牌上的字符。我证明了拥有深厚的人际网络和再培训的重要性。根据13年的历史拍卖价格进行评估,deep RNN的预测可以解释80%以上的价格变化,大大优于以前的模型。我还演示了如何将该模型扩展为车牌搜索引擎,并提供预期价格分布的估计。
---
分类信息:

一级分类:Computer Science        计算机科学
二级分类:Computation and Language        计算与语言
分类描述:Covers natural language processing. Roughly includes material in ACM Subject Class I.2.7. Note that work on artificial languages (programming languages, logics, formal systems) that does not explicitly address natural-language issues broadly construed (natural-language processing, computational linguistics, speech, text retrieval, etc.) is not appropriate for this area.
涵盖自然语言处理。大致包括ACM科目I.2.7类的材料。请注意,人工语言(编程语言、逻辑学、形式系统)的工作,如果没有明确地解决广义的自然语言问题(自然语言处理、计算语言学、语音、文本检索等),就不适合这个领域。
--
一级分类:Computer Science        计算机科学
二级分类:Machine Learning        机器学习
分类描述:Papers on all aspects of machine learning research (supervised, unsupervised, reinforcement learning, bandit problems, and so on) including also robustness, explanation, fairness, and methodology. cs.LG is also an appropriate primary category for applications of machine learning methods.
关于机器学习研究的所有方面的论文(有监督的,无监督的,强化学习,强盗问题,等等),包括健壮性,解释性,公平性和方法论。对于机器学习方法的应用,CS.LG也是一个合适的主要类别。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--
一级分类:Statistics        统计学
二级分类:Machine Learning        机器学习
分类描述:Covers machine learning papers (supervised, unsupervised, semi-supervised learning, graphical models, reinforcement learning, bandits, high dimensional inference, etc.) with a statistical or theoretical grounding
覆盖机器学习论文(监督,无监督,半监督学习,图形模型,强化学习,强盗,高维推理等)与统计或理论基础
--

---
PDF下载:
--> Predicting_Auction_Price_of_Vehicle_License_Plate_with_Deep_Recurrent_Neural_Network.pdf (930.36 KB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:价格预测 车牌拍卖 拍卖价 distribution Applications

沙发
大多数88 在职认证  发表于 2022-5-31 02:53:56
基于深度递归神经网络的车牌拍卖价格预测*香港沙田香港中文大学经济系在中国社会中,迷信是最重要的,数量合适的车牌在拍卖中可以卖到很高的价格。与其他贵重物品不同的是,车牌在拍卖前不会分配到估计价格。我建议将预测车牌价格的任务视为自然语言处理(NLP)任务,因为其值取决于车牌上每个单独字符的含义及其语义。我构建了一个深度递归神经网络(RNN)来预测香港车牌的价格,基于车牌上的字符。我证明了拥有深厚的人际网络和再培训的重要性。根据13年的历史拍卖价格进行评估,deepRNN的预测可以解释80%以上的价格变化,远远超过以前的模型。我还演示了如何将该模型扩展为车牌搜索引擎,并提供预期价格分布的估计。关键词:价格预测、专家系统、递归神经网络、深度学习、自然语言处理1。中国社会非常重视数字迷信。诸如8(代表繁荣)和9(长寿)这样的数字经常被使用,仅仅是因为它们所代表的理想品质。例如,北京奥运会开幕式于2008年8月8日晚上8点举行,中国银行(香港)于1988年8月8日开业,香港与美元挂钩,汇率约为7.8。车牌代表了人们可以拥有的数字的一种非常公开的显示,因此可以毫不奇怪地获得巨额资金。统治*通讯作者。

藤椅
nandehutu2022 在职认证  发表于 2022-5-31 02:53:59
利益声明:无电子邮件地址:vincichow@cuhk.edu.hk(Vinci Chow)提交给专家系统的预印本和2019年10月9日的申请并没有忽视这一点,价值的印版通常被拍卖以产生公共收入。然而,与其他贵重物品的拍卖不同,车牌通常没有价格估计,这是影响销售价格的一个重要因素(Ashenfelter,1989;Milgrom&Weber,1982)。由于每次拍卖都有大量的字符组合和图版,因此很难提供合理的估计。本研究提出,基于车牌特征预测车牌价格的任务可以看作是一项自然语言处理(NLP)任务。而在西方,数字本身可能出于各种原因而可取(如7)或不可取(如13),而在中国社会,数字的上层价值来自于它们与之押韵的字符。由于汉语是逻辑音节和分析性语言,数字的组合可以代表发音相似的短语。因此,与具有正符号的短语押韵的数字组合是可取的。例如,“168”是中国一家主要商业门户网站的URL,与中文“一路走向繁荣”相呼应(http://www.168.com)。从本研究中分析的历史数据来看,168号车牌的平均价格为10094美元,其中一个案例的价格高达113462美元。与具有负面含义的短语押韵的数字组合同样不可取。

板凳
大多数88 在职认证  发表于 2022-5-31 02:54:02
数字为888的车牌通常很受欢迎,在数据中平均售价为4105美元,但在前面加上5(与“否”押韵)会大幅降低平均售价至342美元(香港特别行政区运输署,2010年)。正如这些示例所示,特定字符组合的价值取决于每个字符的含义和广义语义。因此,手头的任务与情感分析和机器翻译密切相关,这两项工作近年来都取得了显著进展。使用深度递归神经网络(RNN),我证明了一个很好的估计车牌的价格可以得到。这项研究的DEEP RNN预测比之前的车牌价格建模要准确得多,并且能够解释80%以上的价格变化。本文中的发现有两个直接的应用:第一,准确的预测模型有助于套利,使我们能够检测到定价过低的板块,这些板块可能在活跃的二手市场中以更高的价格出售。其次,从模型的最后一个递归层提取的特征向量可用于构建类似板材的搜索引擎,该搜索引擎可为任何给定板材的预测价格提供高度信息的公正性。从更普遍的意义上讲,本研究做出了以下两项贡献:首先,它证明了深度网络和NLP在做出准确的价格预测方面的价值,这在许多行业中都具有实际重要性。虽然在许多领域中,为了自然语言处理的目的使用深度网络是很普遍的,但在价格预测中的应用仍处于初级阶段。

报纸
何人来此 在职认证  发表于 2022-5-31 02:54:06
车牌拍卖提供了一个理想的试验场,因为它避免了类似应用程序面临的两个主要问题,例如股票价格或产品价格预测:车牌的价值直接取决于车牌上的字符,因此文本数据不能代表其他潜在因素。也不存在激励问题,即买方与文本数据发起人之间的战略互动可能导致文本数据对价格的影响不明确(Morgan&Stocken,2003)。其次,它强调了随机拆分数据与按顺序拆分数据的影响。一方面,对于本研究中训练的所有模型,由于训练数据更具代表性,当数据被随机分割时,性能更高。另一方面,这两种分割数据的方法对性能最佳的超参数集的影响有限。特别是,递归神经网络的最佳层数和每层神经元数保持不变。主要区别在于最佳嵌入维度,当训练数据变化较大时,需要更大的嵌入维度。因此,研究结果表明,在两种分割数据的方式下效果最好的超参数集似乎以可预测的方式有所不同。本文的结构如下:第2节介绍了香港车牌拍卖,然后在第3节回顾了相关研究。第4节详细介绍了模型,该模型在第5节中进行了测试。第6节探讨了使用最后一个重现层的特征向量构建类似车牌搜索引擎的可能性。第7节总结全文。2、香港牌照拍卖自1973年以来,牌照一直通过香港政府拍卖出售,并对牌照的转售加以限制。

地板
可人4 在职认证  发表于 2022-5-31 02:54:09
从1997年到2009年,平均每年拍卖3812块车牌。2006年9月之前唯一可用的传统车牌由两个字母的前缀或无前缀组成,后跟最多四位数字(例如AB 1、LZ 3360或168)。传统板块可分为特殊板块和普通板块相互排斥的类别。特殊车牌由一系列法律规则定义,包括最理想的车牌。普通牌照是政府在新车登记时发放的。如果车主不想要指定的车牌,他或她可以退还车牌并在拍卖中再次出价。车主还可以保留任何未分配的车牌进行拍卖。只能转售普通钢板。除了传统车牌外,个性化车牌还允许车主在政府官方拍卖网站上详细描述规则。建议使用的字符串。这些车牌必须从拍卖会上购买。本研究中使用的数据不包括这种类型的钢板。拍卖会对公众开放,由运输部每月两次在周末举行。要拍卖的车牌数量从早期的每天90张到后来的每天280张不等,可供出售的车牌名单早就向公众公布了。采用英语口语升序拍卖格式,通过借记卡或支票当场结算(香港特别行政区运输署,2019年)。3.

7
能者818 在职认证  发表于 2022-5-31 02:54:12
相关研究与当前研究最相关的是关于车牌建模价格的有限文献,它使用了具有大量手工特征的特征回归(Woo&Kwok,1994;Woo et al.,2008;Ng et al.,2010)。这些高度特殊的模型依赖于手工制作的功能,因此它们对新数据的适应能力很差,尤其是当它们包含以前看不到的字符组合时。相比之下,本研究中考虑的深层RNN从拍卖价格中学习每个角色组合的价值,而不涉及任何手工特征。关于使用神经网络进行价格预测的文献非常广泛,涵盖的领域包括股票价格(Baba&Kozaki,1992;Olson&Mossman,2003;Guresen et al.,2011;de Oliveira et al.,2013)、商品价格(Kohzadi et al.,1996;Kristjanpoller&Minutolo,2015,2016)、房地产价格(Do&Grudnitski,1992;Evans et al.,1992;Worzola et al.,1995),电气价格(Weron,2014;Dudek,2016)、电影收入(Sharda&Delen,2006;Yuet al.,2008;Zhang et al.,2009;Ghiasi et al.,2015)、汽车价格(Iseri&Karlik,2009)和食品价格(Haofei et al.,2007)。大多数研究集中于数字数据,并使用小型、浅层网络,通常使用一个由20多个神经元组成的隐藏层。这项研究的重点非常不同:通过字母数字字符组合预测价格。由于此任务的复杂性,使用的网络要大得多(每层多达1024个隐藏单元)和更深(多达9层)。该方法与情绪分析密切相关(Maas et al.,2011;Socheret al.,2013),其中主要关注情绪的离散度量,但人们可能想知道,为什么自2010年以来没有发表新的研究。

8
何人来此 在职认证  发表于 2022-5-31 02:54:15
我认为,这背后的原因是,对这一主题感兴趣的研究人员不知道新技术的可用性。对车牌定价的研究主要发生在经济学领域。在这个领域,使用的主要统计技术一直是线性回归。虽然该领域不断创新,但重点主要是更好的识别,在提高预测准确性方面几乎没有什么作用。大多数经济学家也没有受过机器学习或统计学习中常用的非回归技术的培训。价格可以被视为衡量买家情绪的持续指标。一个特别相关的研究领域是使用推特提要预测股票价格变动(Bollen等人,2011;Bing等人,2014;Pagolu等人,2016),尽管目前的研究存在显著差异。本研究使用单一模型从字符组合中生成预测,而不是将情绪分析和价格预测视为两个不同的任务,并且实际价格水平的预测不只是价格运动的方向。这种端到端的方法是可行的,因为情绪和价格之间的因果关系对于车牌来说要比股票强得多。最后,(秋田等人,2016年)利用长-短期记忆(LSTM)网络研究了10只日本股票的集体价格变动。该研究中的神经网络仅用作时间序列模型,从两个更简单的非神经网络模型中获取向量化文本信息。

9
mingdashike22 在职认证  发表于 2022-5-31 02:54:18
相反,本研究直接在文本信息上使用神经网络。深度RNN在涉及序列数据的任务中表现良好,如机器翻译(Cho等人,2014;Sutskever等人,2014;Zaremba等人,2014;Amodei等人,2016)和基于文本描述的分类(Ha等人,2016),因此在本研究中使用。预测车牌价格相对简单:该模型只需要基于最多六个字符的字符串预测单个值。与深层RNN训练中更常用的数据集相比,这种简单性使得在研究中使用的车牌拍卖数据量相对较小的情况下进行训练成为可能。4、用深度递归神经网络建模车牌价格第4.1节概述了批量归一化双向递归神经网络的工作原理。熟悉该模型的读者可能希望直接跳到第4.2.4.1节中的实施细节。神经网络是由神经元组成的。每个神经元都可以看作是一个回归,从输入向量中生成一个输出。最早的网络软化使用逻辑回归,而最近的网络通常在线性回归上应用几种常见的非线性变换之一。本文中使用的非线性变换是直接线性单位,其中f(x)=max{0,x}。最简单的网络只有一个隐藏层。在隐藏层中有多个神经元,每个神经元将数据作为输入并输出一个值。神经元的线性回归权重取决于学科,这些权重通常是封闭系数或参数。

10
nandehutu2022 在职认证  发表于 2022-5-31 02:54:21
这些权重在训练过程中通过反向传播预测误差进行随机初始化和调整。最终的神经元从隐藏层获取所有输出并输出一个数字,在我们的例子中,这是预测价格。这个最终的神经元?s权重也会进行初始化和训练。在本文中,矩阵WL表示l层中所有神经元的权重。深度网络有多个隐藏层。在这种情况下,隐藏层中的每个神经元都将前一个隐藏层的所有输出作为输入。这种类型的层称为完全连接层。在本文中,l层的输出表示为~hl,这是一个包含与该层中的神经元数量相同的元素的向量。当对文本数据使用神经网络时,每个字符按顺序输入网络。输入字符的顺序称为时间步。由于神经网络需要数字输入,时间步长t中的字符由一个向量ht表示~HTS只取决于角色,而不取决于时间步长,其值是从训练中学到的。循环层不同于完全连接层,因为每个神经元不仅接受前一层的输出,还接受前一时间步中同一层的输出。双向递归层中的神经元在下一个时间步中传统地接收同一层的输出(Schuster&Paliwal,1997)。双向性允许网络访问上一个和下一个时间步骤中的隐藏状态,从而提高其在上下文中理解每个字符的能力。在本文中,l层上一个时间步长的输出表示为ht-1l,而下一时间步的输出指示为ht+1l。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
扫码
拉您进交流群
GMT+8, 2026-2-2 06:45