第七章-动态规划.pptx
上传人:王子****青蛙 上传时间:2024-09-10 格式:PPTX 页数:69 大小:1.5MB 金币:10 举报 版权申诉
预览加载中,请您耐心等待几秒...

第七章-动态规划.pptx

第七章-动态规划.pptx

预览

免费试读已结束,剩余 59 页请下载文档后查看

10 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

动态规划(D.P.–DynamicProgram)是解决多阶段决策过程最优化问题的一种方法。广泛应用于工业技术、生产管理、企业管理、经济、军事等领域。可用于解决最优路径问题、资源分配问题、生产计划与库存、投资、装载、排序等问题及生产过程的最优控制等。动态的含义:动态规划方法与“时间”关系很密切,随着时间过程的发展而决定各时段的决策,产生一个决策序列,这就是“动态”的意思。动态规划的起源:1951年,(美)数学家R.Bellman等人,根据多阶段序贯决策问题的特点,提出了著名的“最优性原理”。将多阶段决策问题转变为一系列的互相联系的单阶段决策问题,然后,逐个阶段予以解决,最后再形成总体解决。从而创建了求解优化问题的新方法——动态规划。1957年,他的名著《动态规划》出版。最优性原理:作为整个过程的最优策略具有这样的性质:即无论过去的状态和决策如何,对前面的决策所形成的状态而言,余下的诸决策必须构成最优子策略。简言之,最优策略的子策略总是最优的。动态决策问题:决策过程具有阶段性和时序性(与时间有关)的决策问题。即决策过程可划分为明显的阶段。动态决策问题分类:1、按数据给出的形式分为:离散型动态决策问题。连续型动态决策问题。2、按决策过程演变的性质分为:确定型动态决策问题。随机型动态决策问题。例1生产与存贮问题要求确定一个逐月的生产计划,在满足需求条件下,使一年的生产与存贮费用之和最小?例2投资决策问题某公司现有资金Q万元,在今后5年内考虑给A,B,C,D4个项目投资?例3设备更新问题现企业要决定一台设备未来8年的更新计划,问应在哪些年更新设备可使总费用最小?例4基建投资问题一家公司有三个工厂,每个厂都需要进行扩建。公司用于扩建的资金总共为7万元。各个厂的投资方案及扩建后预期可获得的利润如表所示(单位:万元)。例5货船装运问题有四种货物准备装到一艘货船上。第i(i=1.2,3,4)种货物的每一箱重量是wi(单位:吨),其价值是vi(单位:干元),如表所示。例6最短路程问题假定从A地到E地要铺设一条管道,其中要经过若干个中间点(如图)。二、基本概念和基本原理2、状态:各阶段开始时的客观条件叫做状态。状态变量:描述各阶段状态的变量,用sk表示第k阶段的状态变量。状态集合:状态变量的取值集合,用Sk表示。3、决策:当各段的状态取定以后,就可以作出不同的决定(或选择),从而确定下一阶段的状态,这种决定称为决策。决策变量:表示决策的变量,称为决策变量,常用uk(sk)表示第k阶段当状态为sk时的决策变量。允许决策集合:决策变量的取值往往限制在一定范围内,我们称此范围为允许决策集合,用Dk(sk)表示第k阶段从状态sk出发的允许决策集合。策略:各段决策确定后,整个问题的决策序列就构成一个策略,用p1,n{u1(s1),u2(s2),...un(sn)}表示。允许策略集合:对每个实际问题,可供选择的策略有一定范围,称为允许策略集合,记作P1,n,使整个问题达到最优效果的策略就是最优策略。4、状态转移方程:动态规划中本阶段的状态往往是上一阶段状态和上一阶段的决策结果。第k段的状态sk,本阶段决策为uk(sk),则第k+1段的状态sk+1也就完全确定,它们的关系可用公式表示:sk+1=Tk(sk,uk)5、指标函数:用于衡量所选定策略优劣的数量指标。它分为阶段指标函数和过程指标函数。阶段指标函数是指第k段,从状态sk出发,采取决策uk时的效益,用d(sk,uk)表示。d(B1,C2)一个n段决策过程,从1到n叫作问题的原过程,对于任意一个给定的k(1≤k≤n),从第k段到第n段的过程称为原过程的一个后部子过程。V1,n(s1,p1,n)表示初始状态为s1采用策略p1,n时原过程的指标函数值;Vk,n(sk,pk,n)表示在第k段,状态为sk采用策略pk,n时,后部子过程的指标函数值。最优指标函数记为fk(sk):表示从第k段状态sk采用最优策略到过程终止时的最佳效益值。最简单的方法--穷举法。共有多少条路径,依次计算并比较。动态规划方法--本方法是从过程的最后一段开始,用逆序递推方法求解,逐步求出各段各点到终点的最短路线,最后求得起始点到终点的最短路线。可以看出,在求解的各阶段,都利用了第k段和第k+1段的如下关系:动态规划标号法较之穷举法的优点:第一,容易算出;其次,动态规划的计算结果不仅得到了从起始点到最终点的最短路线,而且得到了中间段任一点到最终点的最短路线。动态规划方法的基本思想:(1)将多阶段决策过程划分阶段,恰当地选取状态变量、决策变量及定义最优指标函数.从而把问题化成一族同类型的子问题,然后逐个求解。(2)求解时从边界条件开始,逆(或顺)过程行进方向,