上次讲到了用dib方法来获取图像的像素。从这次开始将如果运用已经得到的像素来处理图像。
图像插值放大的方法有很多,最主要的有二次线性插值和三次线性插值这两种。
这次我把自己的程序中所用的二次线性插值的算法公布给大家,希望对各位要使用vb写类似程序的朋友有所帮助。
程序中用到的api、数据类型、全局变量的定义请参考上一篇:
《vb图像处理,(一)像素的获取和输出 》
public sub zoomimage(byval outputwidth as long, byval outputheight as long)
dim i as long
dim l as long
dim x as long
dim y as long
dim xb as long
dim yb as long
dim xe as long
dim ye as long
dim m as integer
dim n as integer
dim curr as long
dim curg as long
dim curb as long
dim nxtr as integer
dim nxtg as integer
dim nxtb as integer
dim dr as single
dim dg as single
dim db as single
dim drt as single
dim dgt as single
dim dbt as single
dim xratio as single
dim yratio as single
dim curstep as single
dim nxtstep as single
dim negn as single
on error goto errline
if not canzoom then exit sub
done = false
outputwid = outputwidth - 1
outputhei = outputheight - 1
i = (bits / 8) - 1
redim coltmp(i, inputwid, outputhei) '先从y方向进行缩放处理,结果保存在此中间数组内
redim colout(i, outputwid, outputhei)
xratio = outputwid / inputwid
yratio = outputhei / inputhei
timezoom = timegettime
negn = 1 / int(yratio + 1)
for x = 0 to inputwid
curr = colval(0, x, 0)
curg = colval(1, x, 0)
curb = colval(2, x, 0)
curstep = 0
nxtstep = 0
for y = 0 to inputhei - 1
nxtstep = curstep + yratio
yb = curstep
ye = nxtstep
n = ye - yb
coltmp(0, x, yb) = curr
coltmp(1, x, yb) = curg
coltmp(2, x, yb) = curb
m = y + 1
nxtr = colval(0, x, m)
nxtg = colval(1, x, m)
nxtb = colval(2, x, m)
if n > 1 then
drt = (nxtr - curr) * negn
dgt = (nxtg - curg) * negn
dbt = (nxtb - curb) * negn
dr = 0
dg = 0
db = 0
for l = yb + 1 to ye - 1
dr = dr + drt
dg = dg + dgt
db = db + dbt
coltmp(0, x, l) = curr + dr
coltmp(1, x, l) = curg + dg
coltmp(2, x, l) = curb + db
next
end if
curstep = nxtstep
curr = nxtr
curg = nxtg
curb = nxtb
next
coltmp(0, x, outputhei) = nxtr
coltmp(1, x, outputhei) = nxtg
coltmp(2, x, outputhei) = nxtb
next
negn = 1 / int(xratio + 1)
for y = 0 to outputhei
curr = coltmp(0, 0, y)
curg = coltmp(1, 0, y)
curb = coltmp(2, 0, y)
curstep = 0
nxtstep = 0
for x = 0 to inputwid - 1
nxtstep = curstep + xratio
xb = curstep
xe = nxtstep
n = xe - xb
colout(0, xb, y) = curr
colout(1, xb, y) = curg
colout(2, xb, y) = curb
m = x + 1
nxtr = coltmp(0, m, y)
nxtg = coltmp(1, m, y)
nxtb = coltmp(2, m, y)
if n > 1 then
drt = (nxtr - curr) * negn
dgt = (nxtg - curg) * negn
dbt = (nxtb - curb) * negn
dr = 0
dg = 0
db = 0
for l = xb + 1 to xe - 1
dr = dr + drt
dg = dg + dgt
db = db + dbt
colout(0, l, y) = curr + dr
colout(1, l, y) = curg + dg
colout(2, l, y) = curb + db
next
end if
curstep = nxtstep
curr = nxtr
curg = nxtg
curb = nxtb
next
colout(0, outputwid, y) = nxtr
colout(1, outputwid, y) = nxtg
colout(2, outputwid, y) = nxtb
next
done = true
timezoom = timegettime - timezoom
canput = true
exit sub
errline:
msgbox err.description
end sub
全局变量定义:
dim coltmp() as byte '用于保存插值中间变量
dim outputhei as long '要插值的目标高度
dim outputwid as long '要插值的目标宽度
public timezoom as long '插值运算使用的时间
简单解释一下关于二次线性插值算法。
(为了说明算法本身,我们只计算这个图片的红色分量,因为红绿蓝三种颜色的计算方法完全相同)
假设我们有一个很简单的图片,图片只有4个像素(2*2)
a b
c d
现在我们要把这个图片插值到9个像素:3*3
a ab b
ac abcd bd
c cd d
其中大写的字母代表原来的像素,小写字母代表插值得到的新像素。
想必看到这个图,大家心里已经有了这个算法了。
ab=(a+b) / 2
cd=(c+d) / 2
ac=(a+c) / 2
bd=(b+d) / 2
abcd=(ab+cd) / 2=(a+b+c+d) / 4
推导:ab= a + (b-a) / 2
cd=c +(d-c) / 2
...
很简单,对吧,先从一个方向把只涉及两个原始像素的新像素算出来。我们这里假定先计算水平方向。
而在算垂直方向的插值的时候,因为ab和cd已经在前面算好了,所以abcd的计算也和计算ac和bd没有任何区别了。
有可能为有朋友已经想到把原来的图像插值到4*4或5*5的方法了。
a ab1 ab2 b
ac1 ab1cd11 ab2cd21 bd1
ac2 ab1cd12 ab2cd22 bd2
c cd1 cd2 d
推导:ab1 = a + (b-a) * 1 / 3
ab2 = a + (b-a) * 2 / 3 =ab1+(b-a) / 3
cd1 = c + (d-c) * 1 / 3
cd1 = c + (d-c) * 2 / 3 =cd1+(d-c) / 3
...
以a和b为例,先求出原始像素的差(a-b)再算出每一步的递增量(a-b) / 3
然后每一个新的点就是在前面那个点的值加上这个递增量就是了。
这里我们假设a=100, b=255 放大倍率为3,水平方向插值
先计算出原始像素的差:(b-a) = 255-100 =155
再计算出水平方向每一步的递增量:(a-b) / 3=155 / 3 = 51.7
这里我们用一个变量drt来记录这个递增量(这里只用红色来做例子)
ab1 = a + drt = 100+51.7 =151
ab2 = ab1 + drt = 151+51.7 = 202
好了,其实二次线性算法就是这么一个东西,并不复杂。
或许有写朋友会对于我给出的代码产生疑问。很简单的一个算法为什么要写这么多代码。
其实答案很简单:为了提高速度。
在vb中“+”和“-”永远是最快的,“*”要比“/”和“/”快。不论是什么类型的变量都是这样的。
下面再来分析一下我的程序。
在我的程序中把两个方向的插值分解成了两个单独的部分。
先把
a b
c d
变成:
a ab1...abn b
c cd1...cdn d
再变成
a ab1...abn b
ac1 ............. db1
... ............ ...
acn .............. bdn
c cd1...cdn d
这两个方向的插值算法完全相同
而xratio 和yratio 这两个变量则用来记录水平方向和垂直方向的放大倍率。
所以这个过程也能够让图像缩放不按照原始的纵横比进行。
好了,将这个模块和全局变量添加到上次建立的工程模块中。
把按钮中的代码改成:
sub command1_click()
with picture1
.scalemode=3
.borderstyle=0
dibget .hdc ,0 , 0 , .scalewidth , .scaleheight
zoomimage , .scalewidth * 2 , .scaleheight * 2
end with
picture2.autoredraw=true
dibput picture2.hdc
picture2.refresh
end sub
图像是否已经放大到原来的两倍了呢?速度不算很慢吧?
什么?很慢?先编译成exe再运行吧。
关于二次线性插值就说到这里了,下一次将说一些基本的滤镜效果:锐化、柔化、扩散、雕刻
请大家继续关注
(这里只是说了我自己在写程序的时候用到的方法,存在很多的不足。并且因为在贴上来的时候作了部分修改,可能会存在部分错误,请各位高手不吝赐教,将您用到的更好的方法提供一下,我将不胜感激。)