乐虎平台

多臂老虎机研究现状(wiki词条翻译)+个人调研补充

在概率论中,多臂老虎机问题是学习者必须在竞争性(alternative)选择之间分配固定的有限资源集,以最大化预期收益的问题。在此问题中,学习者仅部分了解每个选择的属性,随着“试验/游戏”轮次的增加及资源的逐步分配,他们对每个选择的了解越来越多乐虎平台。这是经典的强化学习问题,它例证了勘探与开发之间的权衡困境。 想象在一排老虎机(有时称为“单臂匪徒”)前的赌徒,他们必须决定要玩哪些机器,每

乐虎平台 | 乐虎国际平台 | 乐虎老虎机游戏平台 | 乐虎国际官网
Add your widget here