响应面排序的序贯设计 - 第5页 - 外文文献专区

41楼

发表于 2022-5-9 03:58:31

如前所述，顺序排序算法是在固定预算设置下进行的，增加了设计，直到达到预先规定的大小K。实际上，通常希望通过针对预先设定的置信水平来规定自适应、数据驱动的终止。良好的终止标准应同时考虑准确性和效率，确保bu`（x）的准确性，并预计进一步采样步骤的信息增益较低。一个建议的终止标准是跟踪经验损失EL（^C（k））的演变，并在EL（^C（k））终止时终止- EL（^C（k+1））足够小。这相当于最小化Lk:=EL（^C（k））+k、在哪里 > 0是模拟成本的参数；我们越是关心效率，效率就越高是当设计尺寸k较小时，第一项将占主导地位，因此LK预计将首先减少→ ∞, 损失函数的改善率会缩小，最终会增加。然而，我们发现EL（^C（k））非常嘈杂，尤其是如果克里格模型跨阶段重新训练。从这个意义上讲，终止标准需要足够稳健，以产生足够强大（临时）的保证，确保真正达到一定的容忍阈值。参考资料。[1] R Aid、L Campi、N Langren’e和H Pham。“最优多重切换问题的概率数值方法及其在发电投资中的应用”。摘自：《暹罗金融数学杂志》5.1（2014），第191-231页。[2] R.安德森和D.米卢蒂诺维奇。“目标跟踪Dubins反馈控制的随机方法”。2011年IEEE/RSJ智能机器人和系统国际会议。2011年，第3917-3922页。[3] B.安肯曼、B.L.纳尔逊和J.斯塔姆。“模拟元建模的随机克里金法”。《运筹学》58.2（2010），第371-382页。[4] P.奥尔、N.塞萨·比安奇和P.菲舍尔。

42楼

kedemingshi

发表于 2022-5-9 03:58:33

“多臂土匪问题的有限时间分析”。《机器学习》47.2-3（2002），第235-256页。[5] J·阿齐米、A·芬和X·Z·芬。“通过模拟匹配进行批量贝叶斯优化”。神经信息处理系统的进展23。由J.La Offerty、C.Williams、J.Shawe Taylor、R.Zemel和A.Culotta编著。柯兰联合公司，2010年，第109-117页。[6] J·贝特、D·金斯伯格、L·李、V·皮切尼和E·巴斯克斯。“用于估计失效概率的计算机实验的顺序设计”。《统计与计算》第22.3页（2012年），第773-793页。[7] S.布贝克、R.穆诺斯和G.斯托尔茨。“全副武装和持枪强盗的纯粹探索”。《理论计算机科学》412.19（2011），第1832-1852页。[8] S.Bubeck、R.Munos、G.Stoltz和C.Szepesvari。“X-武装匪徒”。摘自：《机器学习研究杂志》第12期（2011年），第1655-1695页。[9] A.Carpentier、A.Lazaric、M.Ghavamzadeh、R.Munos和P.Auer。“多武装匪徒主动学习的上限算法”。内容：算法学习理论。斯普林格。2011年，第189-203页。[10] C.Chevalier、J.Bect、D.Ginsbourger、E.Vazquez、V.Picheny和Y.Richet。“基于快速并行克里格法的逐步不确定性降低，并应用于异常集的识别”。摘自：Technometrics 56.4（2014），第455-465页。[11] C.骑士、D.金斯伯格和X.埃默里。“批量连续数据同化的修正克里格更新公式”。主题：地球数学。斯普林格，2014年，第119-122页。[12] H.A.奇普曼、E.I.乔治和R.E.麦卡洛赫。“BART：贝叶斯加性回归树”。《应用统计年鉴》4.1（2010），第266-298页。[13] T.Choi和M.J.Schervish。“关于非参数回归问题的后验一致性”。摘自：《多元分析杂志》98.10（2007），1969-1987页。[14] D.A.科恩。

43楼

大多数88

发表于 2022-5-9 03:58:36

利用神经网络探索优化实验设计。《神经网络》9.6（1996），第1071-1083页。[15] D.埃格罗夫。“最佳停止和统计学习的蒙特卡罗算法”。安。阿普尔。Probab。15.2（2005），第1396-1432页。参考文献25[16]J.A.Fuemmeler和V.V.Veeravalli。“传感器网络能效跟踪的智能睡眠策略”。地址：IEEE Trans。信号处理。56.5（2008），第2091-2101页。[17] V.加比隆、M.加瓦姆扎德、A.拉扎里克和S.布贝克。“多强盗最佳武器识别”。简介：神经信息处理系统的进展。2011年，第2222-2230页。[18] S·E·加诺、J·E·雷诺、J·D·马丁和T·W·辛普森。“变量优化中使用的克里金模型的更新策略”。《结构与多学科优化》32.4（2006），第287-298页。[19] D.T.吉莱斯皮。“耦合化学反应的精确随机模拟”。摘自：《物理化学杂志》81.25（1977），第2340-2361页。[20] R.B.Gramacy和D.W.Apley。“大型计算机实验的局部高斯过程近似”。摘自：《计算与图形统计杂志》24.2（2015），第561-578页。[21]R·B·格拉梅西和H·K·H·李。“超级计算机实验的自适应设计与分析”。摘自：Technometrics 51.2（2009），第130-145页。[22]R.B.格拉梅西和M.卢德科夫斯基。“最优停车问题的顺序设计”。摘自：《暹罗金融数学杂志》6.1（2015），第748-775页。[23]R·B·格拉梅西和N·波尔森。“用于顺序设计和优化的高斯过程模型的粒子学习”。摘自：《计算与图形统计杂志》20.1（2011），第102-118页。[24]R.B.格拉梅西和M.塔迪。“tgp，一个用于树型高斯过程模型的R包”。摘自：《统计软件杂志》第33期（2012年），第1-48页。[25]R.B.格拉梅西、M.塔迪和N.波尔森。“学习和设计的动态树”。

44楼

大多数88

发表于 2022-5-9 03:58:39

摘自：《美国统计协会杂志》106.493（2011），第109-123页。[26]S.Gr–unew–alder、J.-Y.Audibert、M.Opper和J.Shawe Taylor。“高斯过程强盗问题的遗憾边界”。年：国际艺术情报与统计会议。2010年，第273-280页。[27]J.赫斯帕尼亚、M.卢德科夫斯基和S.昆特罗。“基于回归的动态规划用于目标跟踪的小型无人机随机最优协调”。摘自：《智能与机器人系统杂志》82（2016年1月），第135-162页。[28]M.W.Ho Off man、B.Shahriari和N.de Freitas。在贝叶斯多臂土匪优化中利用相关性和预算约束。技术代表arXiv预印本arXiv:1303.67462013。[29]D.琼斯、M.肖洛和W.韦尔奇。“高效地对昂贵的黑盒函数进行全局优化”。摘自：《全球优化杂志》13.4（1998），第455-492页。[30]A.Joshi、F.Porikli和N.Papanikolopoulos。“图像分类的多课堂主动学习”。摘自：《计算机视觉与模式识别》，2009年。CVPR 2009。IEEE会议。IEEE。2009年，第2372-2379页。[31]赖昌星、王文星、S·凯克雷、A·舍勒·沃尔夫和N·塞科曼迪。“液化天然气终端储存的评估”。摘自：运筹学59.3（2011），第602-616页。[32]林俊杰和卢德科夫斯基。“隐马尔可夫随机运动模型中的序贯贝叶斯推断及其在季节性流行病检测和响应中的应用”。《统计与计算24.6》（2014），第1047-1062页。[33]F.朗斯塔夫和E.施瓦茨。“通过模拟评估美式期权：一种简单的租赁方方法”。参考文献[34]M.Ludkovski和J.Niemi。“流动管理的最佳动态政策”。《传染病统计通讯》第2（1）（2010）条，第5条（电子版）。[35]M.卢德科夫斯基和J.尼米。

45楼

mingdashike22

发表于 2022-5-9 03:58:42

“使用随机模拟的最优疾病暴发决策”。参加：模拟会议（WSC），2011年冬季会议记录。IEEE。2011年，第3844-3853页。[36]D.麦凯。“基于信息的主动数据选择目标函数”。《神经计算4.4》（1992），第590-604页。[37]M.McKay、R.Beckman和W.Conover。“计算机代码输出分析中选择输入变量值的三种方法的比较”。摘自：Technometrics 21（1979），第239-245页。[38]N.Meinshausen和B.Hambly。“多重行使期权估值的蒙特卡罗方法”。《数学金融》第14.4页（2004年），第557-583页。[39]D.梅尔、R.约翰逊、R.格拉梅西和M.曼格尔。“流行病学干预措施适应性管理的统计框架”。《公共科学图书馆综合》第4（6）（2009）号，第5087页。[40]V.皮切尼和D.金斯伯格。“用于部分收敛模拟的非平稳时空高斯过程模型”。摘自：SIAM/ASA《不确定性量化杂志》1.1（2013），第57-78页。[41]V.皮切尼、D.金斯伯格、Y.里奇特和G.卡普林。“基于分位数的可调精度噪声计算机实验优化”。摘自：Technometrics 55.1（2013），第2-13页。[42]V.皮切尼、D.金斯伯格、O.罗斯坦、R.T.哈夫特卡和N.-H.金。“精确逼近目标区域的自适应实验设计”。摘自：机械设计杂志132（2010），第071008页。[43]P.兰扬、D.宾厄姆和G.米切利迪斯。“复杂计算机代码轮廓估计的序贯实验设计”。摘自：Technometrics 50.4（2008），第527-541页。[44]B.里普利。黄土{stats}：局部多项式回归拟合。R软件包verion 3.0.1。[45]O.Roustant、D.Ginsbourger和Y.Deville。“DiceKriging，DiceOptim：通过基于kriging的元建模和优化分析计算机实验的两个R包”。摘自：《统计软件杂志》51.1（2012），pp。

46楼

nandehutu2022

发表于 2022-5-9 03:58:45

1–51.[46]N.斯里尼瓦斯、A.克劳斯、S.卡卡德和M.西格。“bandit环境下高斯过程优化的信息论方法”。摘自：IEEE信息论学报58.5（2012），第3250-3265页。[47]C·K·威廉姆斯和C·E·拉斯穆森。机器学习的高斯过程。麻省理工学院出版社，2006年。[48]M.泽沃斯、T.C.约翰逊和F.阿拉泽米。“低买高卖”的投资策略。《数学金融23.3》（2013），第560-578页。

[量化金融] 响应面排序的序贯设计 [推广有奖]

浏览过的帖子

浏览过的版块

本版微信群