楼主: kedemingshi
801 36

[量化金融] 基于半监督学习的投标泄漏检测 [推广有奖]

  • 0关注
  • 4粉丝

会员

学术权威

78%

还不是VIP/贵宾

-

威望
10
论坛币
15 个
通用积分
89.2735
学术水平
0 点
热心指数
8 点
信用等级
0 点
经验
24665 点
帖子
4127
精华
0
在线时间
0 小时
注册时间
2022-2-24
最后登录
2022-4-15

楼主
kedemingshi 在职认证  发表于 2022-6-14 05:46:55 |AI写论文

+2 论坛币
k人 参与回答

经管之家送您一份

应届毕业生专属福利!

求职就业群
赵安豆老师微信:zhaoandou666

经管之家联合CDA

送您一个全额奖学金名额~ !

感谢您参与论坛问题回答

经管之家送您两个论坛币!

+2 论坛币
英文标题:
《Stealed-bid Auctions: Detecting Bid Leakage via Semi-Supervised Learning》
---
作者:
Dmitry I. Ivanov and Alexander S. Nesterov
---
最新提交年份:
2020
---
英文摘要:
  Bid leakage is a corrupt scheme in a first-price sealed-bid auction in which the procurer leaks the opponents\' bids to a favoured participant. The rational behaviour of such participant is to bid close to the deadline in order to receive all bids, which allows him to ensure his win at the best price possible. While such behaviour does leave detectable traces in the data, the absence of bid leakage labels makes supervised classification impossible. Instead, we reduce the problem of the bid leakage detection to a positive-unlabeled classification. The key idea is to regard the losing participants as fair and the winners as possibly corrupted. This allows us to estimate the prior probability of bid leakage in the sample, as well as the posterior probability of bid leakage for each specific auction.   We extract and analyze the data on 600,000 Russian procurement auctions between 2014 and 2018. We find that around 9% of the auctions are exposed to bid leakage, which results in an overall 1.5% price increase. The predicted probability of bid leakage is higher for auctions with a higher reserve price, with too low or too high number of participants, and if the winner has met the auctioneer in earlier auctions.
---
中文摘要:
在第一次价格密封投标拍卖中,出价泄露是一种腐败的方案,在这种拍卖中,购电方将对手的出价泄露给受青睐的参与者。这种参与者的理性行为是在接近截止日期的时候出价,以便收到所有出价,这使他能够确保以尽可能最好的价格获胜。虽然这种行为确实会在数据中留下可检测的痕迹,但由于没有投标泄漏标签,无法进行监督分类。相反,我们将投标泄漏检测问题简化为正的未标记分类。关键的想法是,把输家视为公平的,把赢家视为腐败的。这使我们能够估计样本中出价泄露的先验概率,以及每个特定拍卖的出价泄露的后验概率。我们提取并分析了2014年至2018年间60万次俄罗斯采购拍卖的数据。我们发现,大约9%的拍卖会面临投标泄露,这导致整体价格上涨1.5%。对于底价较高、参与者人数过低或过高、且获胜者在早期拍卖中见过拍卖师的拍卖,预测的投标泄漏概率较高。
---
分类信息:

一级分类:Economics        经济学
二级分类:General Economics        一般经济学
分类描述:General methodological, applied, and empirical contributions to economics.
对经济学的一般方法、应用和经验贡献。
--
一级分类:Quantitative Finance        数量金融学
二级分类:Economics        经济学
分类描述:q-fin.EC is an alias for econ.GN. Economics, including micro and macro economics, international economics, theory of the firm, labor economics, and other economic topics outside finance
q-fin.ec是econ.gn的别名。经济学,包括微观和宏观经济学、国际经济学、企业理论、劳动经济学和其他金融以外的经济专题
--

---
PDF下载:
--> Stealed-bid_Auctions:_Detecting_Bid_Leakage_via_Semi-Supervised_Learning.pdf (1.83 MB)
二维码

扫码加我 拉你入群

请注明:姓名-公司-职位

以便审核进群资格,未注明则拒绝

关键词:学习的 Participants Quantitative Contribution Probability

沙发
大多数88 在职认证  发表于 2022-6-14 05:47:01
偷标拍卖:通过半监督LEARNINGDMITRY I.IVANOV和ALEXANDER S.NESTEROVAbstract检测投标泄漏。投标泄漏是一种腐败的方案,在第一次价格密封的投标拍卖中,购电方将对手的投标泄漏给受青睐的参与者。这类参与者的理性行为是在接近截止日期的时候出价,以便收到所有出价,这使他能够确保以尽可能最好的价格获胜。虽然这种行为确实会在数据中留下可检测的痕迹,但由于没有BidLeak标签,无法进行监督分类。相反,我们将投标泄漏检测问题归结为一个积极的未标记分类。关键的想法是,把失败的参与者视为公平的,把胜利者视为可能的腐败者。这使我们能够估计样本中投标泄漏的先验概率,以及每个特定拍卖的投标泄漏的后验概率。我们提取并分析了2014年至2018年间60万次俄罗斯采购拍卖的数据。我们发现,约有9%的拍卖存在投标漏报风险,导致整体价格上涨1.5%。对于底价较高、参与者人数过低或过高、且获胜者在早期拍卖中遇到拍卖师的拍卖,预测的投标泄漏概率较高。在每个国家,公共采购都是一个重要而复杂的经济部门。2017年,俄罗斯的年度公共采购总量为36.5万亿卢布,约占年度GDP的三分之一。俄罗斯采购中的大多数合同都是通过拍卖授予的,从理论上讲,拍卖会将合同以尽可能最低的价格授予效率最高的公司。

藤椅
kedemingshi 在职认证  发表于 2022-6-14 05:47:04
然而,在实践中,某些隐性操纵可能会破坏分配效率和合同价格的结果。感谢国立研究型大学高等经济学院基础研究项目的支持。我们要感谢Fedor Sandomirskiy、Nikita Kalinand和整个圣彼得堡博弈论实验室的有益评论,感谢Sergei Izmalkov和AlexeyDrutsa的建设性批评,感谢Mikhail Akimov的开放访问脚本,该脚本为Dedus提供了如何解析ftp服务器的初步见解。这篇论文之前的标题是“识别采购拍卖中的投标泄漏:机器学习方法”。采购拍卖中的投标泄漏2在本文中,我们研究了“报价请求”,即小型且频繁的首价密封投标采购拍卖。这些拍卖可以防止出价泄露——即腐败计划,即购电方非法向其青睐的参与者提供其他参与者的出价信息,以便他能够做出最佳响应。我们的目标是估计投标漏报的普遍程度,并确定每个特定拍卖受投标漏报影响的可能性。我们分析了包含600000多个俄罗斯报价请求的数据集。该数据集涵盖了2014年1月至2018年3月期间发生的所有拍卖,并从在线数据库中提取。图1:。典型的投标报价邀请函泄露示例:拍卖持续7天以上。由于中标人在每一次出价之后,都会在最后期限前出价,而且只略低于亚军,因此此次拍卖可能会出现出价泄露。我们的工作受到Andreyanov等人的启发。

板凳
何人来此 在职认证  发表于 2022-6-14 05:47:07
(2016年)观察到可能反映收到漏标的受惠参与者理性行为的模式(见图1):这些参与者(1)最后一次投标,(2)接近截止日期投标,以及(3)以微弱优势获胜。在有出价泄露的拍卖中,这三种模式背后的直觉是直截了当的。首先,对于不公平的参与者来说,了解其他出价并确保其获胜的唯一方法是最后一次出价,因此是模式(1)。同样,她尽可能推迟投标,以降低不是最后一个的风险,因此是模式(2)。由于她的目标是获得最高的利润,她略微低于目前的最佳出价,hencepattern(3)。我们使用这三种模式来确定某一特定拍卖是否因出价泄露而遭到破坏。为此,我们制定了两阶段识别策略。ftp://ftp.zakupki.gov.ru/BID采购拍卖中的漏洞3在第一阶段,我们通过使用与模式(1)、(2)和(3)相关的特征,建立了一个分类工具,以区分赢家和经营者。对于给定的赢家,预测的赢家概率越高,拍卖就越可疑。在一个没有投标漏报的世界中,假设这些特征与实际投标无关,则此类分类将失败,如果没有失败,则必须归因于投标漏报。

报纸
可人4 在职认证  发表于 2022-6-14 05:47:10
然而,在实践中,即使在没有出价泄露的拍卖中,分类师可能仍然能够很好地预测获胜者,这会导致有偏差的估计。为了纠正我们的估计,我们构建了一个公平拍卖的合成安慰剂数据集,并估计了偏差的符号和大小。在第二阶段中,我们使用分类者的预测和性能来估计数据集中随机拍卖被破坏的先验概率,以及特定拍卖被破坏的后验概率,这取决于分类者分配给其获胜者的获胜概率。我们估计投标泄漏的先验概率为9%。我们还发现,在底价较高的拍卖中,当投标人数量低于4人或高于7人时,更有可能出现投标泄漏。论文的其余部分组织如下。在第2节中,我们介绍了报价请求和相关文献的背景,并概述了我们的识别策略。在第3节中,我们描述了数据集并给出了初步分析。在第4节中,我们介绍了投标泄漏估计的两个阶段:分类和投标泄漏前、后概率的估计。在第5节中,我们介绍了估算结果及其经济影响。在第6节中,我们通过几个间接测试验证了该方法。第7节结束。问题设置和识别策略2.1。报价要求和投标泄漏检测背景。在俄罗斯,询价单用于分发小型合同,如工厂屋顶维修或将产品交付给学校厨房。在每次拍卖开始之前,购电方将发布一份公告,说明合同和拍卖的相关信息。

地板
mingdashike22 在职认证  发表于 2022-6-14 05:47:13
该公告包括底价——合同可转让的最高价格,底价为500000卢布(约8000美元)。拍卖会至少持续一周。在此期间,潜在参与者可以提交标书。在采购拍卖中,每个参与者只能提交一份漏标4bid,投标是密封的。拍卖结束后,将显示所有出价,最低价中标,最终价格等于中标价格(一价拍卖)。关于拍卖中操纵的文献很冗长,但主要涉及串通方案,如串通投标(Porter and Zona 1993,Imhof et al.2018)和投标轮换(Aoyagi 2003);有关共谋检测的文献综述,请参见(Harrington 2005)。对我们的研究问题至关重要的是投标的时间安排,而俄罗斯采购数据是唯一包含此信息的。此前,在易趣(eBay)等重复的互联网拍卖中,人们研究了竞价的时机,每个竞价者都有一组及时提交竞价的时机(Song 2004)。但是,据我们所知,之前没有使用投标时间来检测腐败(下文讨论的Andreyanov et al.(2016)除外)。其他利用俄罗斯数据研究投标泄露或其他形式腐败的论文在特定时间段内,在特定市场的地方规模上,或利用投标人的国家所有权进行研究(Yakovlev等人,2016年,Mironov和Zhuravskaya,2014年,Balsevich和Podkolzina,2017年,Tkachenko等人)。关于拍卖的实证文献非常丰富(例如,参见Athey andHaile(2007)和Krasnokutskaya(2011)的开创性著作),但在拍卖腐败检测中使用监督机器学习(分类)的研究很少。通常,他们利用数百个标记拍卖的小数据集(Ferwerda et al.2017,Huber et al.2018)。2.2.

7
可人4 在职认证  发表于 2022-6-14 05:47:16
识别策略和安慰剂。与我们密切相关的论文只有(Andreyanov et al.2016)及其最新版本(Korovkin et al.2018):使用相同的数据研究相同的对象。然而,我们的识别和评估策略在三个关键方面有所不同:我们使用较弱的假设、更先进的方法和更大的特征集(即特征),这还使我们能够确定每个规范的投标泄漏后验概率。(Andreyanov et al.2016,Korovkin et al.2018)中的确定依赖于一个关键假设,即在没有投标泄漏的拍卖中,投标和投标时间是独立的。如果独立性保持不变,那么最后一次投标比之前的投标更有可能获胜,这完全是由于投标泄漏造成的。独立性假设可能会因为一些原因而失败。厌恶风险的投标人研究该案例的时间越长,其出价就越低。禁止在采购拍卖中泄密5例如,在我们的数据中,我们观察到1.2%的参与者表现得像“狙击手”:他们在拍卖的第一天出价,出价略低于底价(高达5%)。另一个原因是诚实的投标人试图抵制投标泄露。一方面,标书提交得越晚,被腐败投标人泄露和削价的可能性就越低。另一方面,在更接近截止日期的情况下提交需要关注,并且可能需要昂贵的物流成本。因此,估价较高(即,执行成本较低)的投标人提交了较低的投标,同时,与估价较低的投标人相比,准备推迟提交。由于在估值过程中,投标和时机是混淆的,因此独立性假设不成立。

8
可人4 在职认证  发表于 2022-6-14 05:47:19
之后的投标更有可能中标,这不仅是因为存在投标泄漏,而且是因为预计会出现投标泄漏。我们在第2.3小节中正式提出了这一论点。我们不依赖独立性假设。相反,我们使用一个公平拍卖的合成安慰剂数据集来修正我们的估计。我们从所有拍卖中删除排名第一的投标人(真正的获胜者),并相应地重新计算特征。这样,我们获得了一个新的数据集,其中第二名被视为优胜者,第三名被视为亚军(图2)。我们估计了这些合成拍卖中的偏差,并假设该偏差等于原始数据集中公平拍卖中的偏差。我们验证了这一假设,并将其与第6.1节中的独立性进行了比较。图2:。安慰剂拍卖示例,由图1中的auctionat转换而来注:安慰剂拍卖是通过从拍卖中删除中标来生成的。在这个假设的拍卖中,出价1属于胜利者,出价2属于亚军。此次拍卖不再怀疑出价泄露。传闻证据表明,一些投标人不依赖邮政或快递服务,而是亲自递交标书,以确保在截止日期前提交。与简化的形式和结构统计模型相比,采购拍卖中的投标泄漏时间为6秒,我们使用机器学习技术。这使我们能够立即考虑有关投标泄漏模式的所有证据,而不必对其互连施加限制。当我们只包括相关特征的子集时,如中所述(Korovkin et al。

9
能者818 在职认证  发表于 2022-6-14 05:47:23
2018年),该方法确定的投标漏报明显较少。最后,我们从总体水平出发,开发了一种方法,能够将出价泄漏的后验概率分配给数据集中的每个拍卖。我们的方法提供了更精确和具体的投标泄漏估计,并可用于自动事后投标泄漏检测,这对监管和审计机构很有用。2.3. 投标漏报的博弈模型。在本节中,我们使用一个简单的博弈论模型来说明为什么即使没有投标泄漏,投标和时间之间的独立性也可能会失败。首先考虑一下没有投标泄漏的世界。拍卖商出售的采购合同的底价标准化为1,执行合同的最低可能成本标准化为零。每个投标人都是风险中性的,并从[0,1]的统一分布中提取其执行成本e,或者,同等地,每个投标人的iid估值v=1- e从[0,1]上的均匀分布得出;累积密度函数(cdf)为F(v)=v。让参与拍卖的预期投标人数量为n。对于每个出价为v的投标人i,其均衡出价为其亚军的预期出价,条件是i为获胜者,b*(v) =1-RvxdFn-1(x)RvdFn-1(x)=1- 越南- 1n。由于投标在估价上是单调的,为了中标,投标人需要有最高的估价。因此,获胜的概率为Fn-1=vn-1和预期收益isEπ(v,b*(v) )=vnn。现在,我们将时间维度添加到问题中。各投标人选择提交时间t∈ [0, 1]. 我们假设延迟提交是代价高昂的,提交时间t将花费投标人c(t),其中c是递增的和凸的,c>0,c>0,并且非常接近截止日期,c(1)=∞. 这些成本代表了压力,因为投标人是风险中性的,估值是i.i.d。

10
可人4 在职认证  发表于 2022-6-14 05:47:26
马修斯(1987)、麦卡菲(McAfee)和麦克米兰(McMillan)(1987)指出,投标人确切数量的不确定性并不起作用。采购拍卖中的投标泄漏7注意不错过最后期限的成本,以及更精确的投标交付的成本。在没有投标泄漏的世界中,投标的时间与中标无关,每个投标人在时间t=0时提交。现在让投标泄漏成为可能。我们假设每个投标人都有一个关于投标泄漏可能性的共同先验信念。在拍卖被破坏的条件下,特定出价被泄露和削价的可能性会在提交时间内减少:如果你稍后提交,那么你的出价被泄露的可能性会更低。我们假设,对于每个投标人来说,其在时间t提交的标书被泄露的感知概率和咬边是由某种函数β(t)在时间上递减,β(t)<0,在截止日期t=1时降到零,β(1)=0。因此,估价为v和b的投标人的预期利润*(v) 如下所示:Eπ(v,b*(v) ,t)=vnn(1- β(t))- c(t)。最佳提交时间t*(v) 由一阶条件c(t)给出*(v) )=-vnnβ(t*(v) )。观察两个b*(v) 正在减少且t*(v) 估价增加。因此,最优投标和投标提交时间受到估价的影响。估价越高,投标人就越愿意为获得合同而支付费用:无论是在提交较低的标书方面,还是在成本高昂的延迟提交方面。还要注意的是,时间和出价之间的相关性适用于每一次估价,因此不仅对胜利者如此,对亚军也是如此。我们在第4.2节中使用安慰剂数据集揭示了亚军的这种相关性,并用它来纠正我们对优胜者的偏差估计。2.4. 正未标记分类。

您需要登录后才可以回帖 登录 | 我要注册

本版微信群
jg-xs1
拉您进交流群
GMT+8, 2026-1-8 19:22