|
当学习参数为零或总市场规模与初始产量相比非常小时,我们恢复了经典的投资组合设置。除了我们的一般动机(能量系统)和我们模型的两个主要组成部分(经验曲线和均值-方差投资组合理论),我们的设置还与处理随机过程最优控制的大量文献有关,这与经济学和运筹学很好。更直接的兴趣是技术、研发和创新问题的应用,其中收益递增和锁定问题更为突出。当投资期权使其变得越来越好时,历史很重要。Atkinson&Stiglitz(1969)已经指出,本地化技术进步的一个重要来源是边做边学,这将证明投资于一种还不是最便宜的技术是合理的。在技术选择文献中,众所周知,收益和不确定性的增加可能会导致技术选择不足占主导地位的情况(David 1985)。Arthur(1989)在一个网络外部性下运行的两个竞争标准的模型中表明,如果机会在早期偏向一个本质上更差的选项,则该选项积累的经验为其获得边际消费者提供了有利条件。随着这一优势的积累,它可能永远超过切换到本质上更好的选项所带来的好处。在这种情况下,apolicy maker对一项政策感兴趣,该政策能够在做出最终选择之前,对不同选择的优点进行最佳探索。Cowan(1991)在双臂bandit框架中描述了社会规划师的最优决策,其中每个时期都有两种技术中的一种选择。
|