动态规划通常用来解决最优化问题,通过做出一组选择来达到最优解。在做出每个选择的同时,通常会生成与原问题形式相同的子问题。当多于一个选择子集都生成相同的子问题时,动态规划技术通常就会很有效,其关键技术就是对每个这样的子问题都保存其解,当其重复出现时即可避免重复求解。
动态规划(dynamic PRogramming)与分治方法相似,都是通过组合子问题的解来求解原问题。分治方法将问题划分为互不相交的子问题,递归的求解子问题,再将他们的解组合起来,求出原问题的解。与之相反,动态规划应用于子问题重叠的情况,不同的子问题具有公共的子子问题。在这种情况下,分治算法会做许多不必要的工作,它会反复地求解那些公共子问题,而动态规划算法对每个子子问题只求解一次,将其解保存在一个表格中,从而无需每次求解一个子子问题时都重新计算,避免了这种 不必要的计算工作。 动态规划常用来求解最优化问题(optimization problem),这类问题可以有很多可行解,每个解都有一个值,寻找最优值(最大值或最小值)的解,称这样的解为问题的一个最优解(an optimal solution),而不是最优解(the optimal solution),因为有可能有多个解都达到最优值。 通常用4个步骤来设计一个动态规划算法: 1. 刻画一个最优解的结构特征; 2. 递归的定义最优解的值; 3. 计算最优解的值,通常采用自底向上的方法; 4. 利用计算出的信息构造一个最优解 。
钢条切割问题:给定一段长度为n英寸的钢条和一个价格表pi(i=1,2,•••,n),求切割钢条方案,使得销售收益rn最大,钢条可以0切割。
长度为n英寸的钢条共有2^(n-1)中不同的切割方案,因为在距离钢条左端i(i=1,2,•••,10)英寸出,我们总是可以选择切割或不切割。一个最优解就是将钢条切割为k段(1<=k<=n),那么最优切割方案为 n=i1+i2+•••+ik 将钢条切割为长度分别为i1,i2,•••,ik的小段,得到最大收益 rn=pi1+pi2+•••+pik 更一般的,对于rn,可以用更短的钢条的最优切割收益来描述它 rn=max(pn,r1+r(n-1),r2+r(n-2),•••,r(n-1)+r1)
根据上面得到的式子,采用递归的方法,伪代码如下:
CUT_ROD(p, n)if n == 0 return 0q = -1for i = 1 to n q = max (q, p[i] + CUT_ROD(p, n - i)return q从上面的递归中可以看出,每个n值,都会反复的计算前面已经计算过的值,当n比较大时,递归调用的工作量会爆炸性的增长,所以应该采用动态规划的方法求解。
动态规划有两种等价的实现方法。 第一种方法称为带备忘的自顶向下法(top-down with memorization)。此方法仍按照自然的递归形式编写过程,但过程会保存每个子问题的解(通常保存在一个数组或哈希表中),我们称这个递归过程是带备忘的(memoized)。 第二种方法称为自底向上法(bottom-up method)。这种方法一般需要恰当定义子问题“规模”的概念,使得任何自问的求解都只依赖于“更小的”子问题的求解,因而可以将子问题按规模排序,按由小至大的顺序进行求解。 两种方法得到的算法具有相同的渐进运行时间,仅有的差异是在某些特殊情况下,自顶向下方法并未真正递归地考察所有可能的子问题,由于没有频繁的递归函数调用的开销,自底向上方法的时间复杂性函数通常具有更小的系数。 这里采用第二种方法的伪代码如下:
BOTTOM_UP_CUT_ROD(p, n)let r[n] be a new arrayr[0] = 0for j = 1 to n q = -1 for i = 1 to j q = max(q, p[i] + r[j – i]) r[j] = qreturn r[n]上面的伪代码已经计算出最优解的值,但缺少最优解的方案,可以稍加修改,添加数组s记录n英寸钢条最优切割方案的第一段切割长度:
EXTENDED-BOTTOM-UP-CUT-ROD(p, n)let r[n] and s[n] be new arraysr[0] = 0for j = 1 to n q = -1 for i = 1 to j if q < p[i] + r[j – i] q = p[i] + r[j – i] s[j] = i r[j] = qreturn r and s通过下面的伪代码来输出完整的最优切割方案:
PRINT_CUT_ROD_SOLUTION(p, n)(r, s) = EXTENDED-BOTTOM-UP-CUT-ROD(p, n)while n > 0 print s[n] n = n – s[n]给定n个矩阵的链[A1,A2,•••,An],矩阵Ai的规模为p(i-1)*pi(1<=i<=n),求完全括号化方案,使得计算乘积A1A2•••An所需标量乘法次数最少。
和钢条切割问题相似,A1A2•••An其实就可以写成A1•••AkA(k+1)•••An,其中A1•••Ak和A(k+1)•••An就成为了两条子链,同理,子链亦可往下分解,原来的问题就变成了求解这些子链的的问题。
令m[i, j]表示计算矩阵链所需标量乘法次数的最小值,原问题的最优解的值为m[1, n],很容易,我们得到 m[i, j] = m[i, k] + m[k+1, j] + p(i-1)pkpj,当i=j时,m[i , j]=0.
根据上面的递归公式,假设矩阵Ai的规模为p(i-1)*pi,它的出入序列是p=[p0,p1,•••,pn],过程中用辅助表m保存代价m[i, j],用辅助表s记录最优值m[i, j]对应的分割点k。伪代码如下:
MATRIX_CHAIN_ORDER(p)n = p.length – 1let m[n+1][n+1] and s[n][n+1] be new tablesfor i = 1 to n m[i, i] = 0 for i =2 to n for i = 1 to n-l+1 j = i + l – 1 m[i , j] = -1 for k = i to j-1 q = m[i, k] + m[k+1, j] + p(i-1)pkpj if m[i, j] < 0 or q < m[i, j] m[i, j] = q s[i, j] = kreturn m and s利用递归求解的思路递归的输出最优括号方案,伪代码如下:
PRINT_OPTIMAL_PARENS(s, i, j)if i == j return “A”ielse print “(“ PRINT_OPTIMAL_PARENS(s, i, s[i, j]) PRINT_OPTIMAL_PARENS(s, s[i, j] + 1, j) print “)”新闻热点
疑难解答