构造.NET环境下的网页下载器 (1)
2024-07-10 13:00:29
供稿:网友
一.前言:
微软的.net框架为我们进行网络编程提供了以下两个名字空间:system.net以及system.net.sockets。通过合理运用其中的类和方法,我们可以很容易地编写出各种网络应用程序。这种网络应用程序既可以是基于流套接字的,也可以是基于数据报套接字的。而基于流套接字的通讯中采用最广泛的协议就是tcp协议,基于数据报套接字的通讯中采用最广泛的自然就是udp协议了。下面我将重点向大家介绍.net网络编程中的一些类:dns类、iphostentry类、ipendpoint类以及socket类,并会在最后给出一个网页下载器的实例以加深读者对.net网络编程的理解。
二.网络编程类介绍:
dns 类:
向使用 tcp/ip internet 服务的应用程序提供域名服务。其resolve()方法查询dns服务器以将用户友好的域名(如"www.google.com")映射到数字形式的 internet 地址(如 192.168.1.1)。resolve()方法返回一个iphostenty实例,该实例包含所请求名称的地址和别名的列表。大多数情况下,可以使用 addresslist 数组中返回的第一个地址。
resolve()方法的函数原型如下:
public static iphostentry resolve(string hostname);
下面的代码获取一个 ipaddress 实例,该实例包含服务器 www.google.com 的ip地址:
iphostentry iphostinfo = dns.resolve("www.google.com");
ipaddress ipaddress = iphostinfo.addresslist[0];
不过在dns类中,除了通过resolve()方法,你还可以通过gethostbyaddress()方法以及gethostbyname()方法来得到相应的iphostentry实例,函数原型如下:
public static iphostentry gethostbyaddress(string ipaddress);
public static iphostentry gethostbyname(string hostname);
下面的代码显示了如何分别运用以上两种方法获得包含服务器www.google.com的相关信息的iphostentry实例:
iphostentry hostinfo=dns.gethostbyaddress("192.168.1.1");
iphostentry hostinfo=dns.gethostbyname("www.google.com");
在使用以上方法时,你将可能需要处理以下几种异常:
socketexception异常:访问socket时操作系统发生错误引发
argumentnullexception异常:参数为空引用引发
objectdisposedexception异常:socket已经关闭引发
以上,我向大家简要地介绍了dns类中一些方法以及其用法,并列举出了可能出现的异常,下面就让我们转到和dns类密切相关的iphostentry类。
iphostentry类:
该类的实例对象中包含了internet主机的地址相关信息。此类型的所有公共静态成员对多线程操作而言都是安全的,但不保证任何实例成员是线程安全的。其中主要的一些属性有:addresslist属性、aliases属性以及hostname属性。
addresslist属性和aliases属性的作用分别是获取或设置与主机关联的ip地址列表以及获取或设置与主机关联的别名列表。其中addresslist属性值是一个ipaddress类型的数组,包含解析为aliases属性中包含的主机名的ip地址;aliases属性值是一组字符串,包含解析为addresslist 属性中的ip地址的dns名。而hostname属性比较好理解,它包含了服务器的主要主机名,这光从名称上就可以知道了。如果服务器的dns项定义了附加别名,则可在aliases属性中使用这些别名。
下面的代码列出了服务器www.google.com的相关别名列表以及ip地址列表的长度并将所有的ip地址列出:
iphostentry iphost = dns.resolve("www.google.com/");
string[] aliases = iphost.aliases;
console.writeline(aliases.length);
ipaddress[] addr = iphost.addresslist;
console.writeline(addr.length);
for(int i= 0; i < addr.length ; i++)
{
console.writeline(addr[i]);
}
介绍完iphostentry类,我们能获得了所要连接的主机的相关ip地址以及别名列表,但是真正要和主机取得连接还需要一个很重要的类-ipendpoint类。
ipendpoint类:
在internet中,tcp/ip使用一个网络地址和一个服务端口号来唯一标识设备。网络地址标识网络上的特定设备;端口号标识要连接到的该设备上的特定服务。网络地址和服务端口的组合称为终结点,在.net框架中正是由endpoint类表示这个终结点,它提供表示网络资源或服务的抽象,用以标志网络地址等信息。.net同时也为每个受支持的地址族定义了 endpoint的子代;对于ip地址族,该类为ipendpoint。ipendpoint类包含应用程序连接到主机上的服务所需的主机和端口信息,通过组合服务的主机ip地址和端口号,ipendpoint类形成到服务的连接点。
在ipendpoint类中有两个很有用的构造函数:
public ipendpoint(long, int);
public ipendpoint(ipaddress, int);
它们的作用就是用指定的地址和端口号初始化 ipendpoint 类的新实例。该类中的属性有:address属性、addressfamily属性以及port属性,这些属性相对比较容易理解,这里就不作多介绍。下面的代码显示了如何取得服务器www.google.com的终结点:
iphostentry iphost = dns.resolve("www.google.com");
ipaddress[] addr = iphost.addresslist;
ipendpoint ep = new ipendpoint(addr[0],80);
这样,我们已经了解了和主机取得连接的一些必要的基本类,有了这些知识,我们就可以运用下面的socket类真正地和主机取得连接并进行通讯了。
socket类:
socket类是包含在system.net.sockets名字空间中的一个非常重要的类。一个socket实例包含了一个本地以及一个远程的终结点,就像上面介绍的那样,该终结点包含了该socket实例的一些相关信息。
需要知道的是socket 类支持两种基本模式:同步和异步。其区别在于:在同步模式中,对执行网络操作的函数(如send和receive)的调用一直等到操作完成后才将控制返回给调用程序。在异步模式中,这些调用立即返回。
下面我们重点讨论同步模式的socket编程。首先,同步模式的socket编程的基本过程如下:
1.创建一个socket实例对象。
2.将上述实例对象连接到一个具体的终结点(endpoint)。
3.连接完毕,就可以和服务器进行通讯:接收并发送信息。
4.通讯完毕,用shutdown()方法来禁用socket。
5.最后用close()方法来关闭socket。
知道了以上基本过程,我们就开始进一步实现连接并通讯了。在使用之前,你需要首先创建socket对象的实例,这可以通过socket类的构造方法来实现:
public socket(addressfamily addressfamily,sockettype
sockettype,protocoltype protocoltype);
其中,addressfamily 参数指定socket使用的寻址方案,比如addressfamily.internetwork表明为ip版本4的地址;sockettype参数指定socket的类型,比如sockettype.stream表明连接是基于流套接字的,而sockettype.dgram表示连接是基于数据报套接字的。protocoltype参数指定socket使用的协议,比如protocoltype.tcp表明连接协议是运用tcp协议的,而protocol.udp则表明连接协议是运用udp协议的。
在创建了socket实例后,我们就可以通过一个远程主机的终结点和它取得连接,运用的方法就是connect()方法:
public connect (endpoint ep);
该方法只可以被运用在客户端。进行连接后,我们可以运用套接字的connected属性来验证连接是否成功。如果返回的值为true,则表示连接成功,否则就是失败。下面的代码就显示了如何创建socket实例并通过终结点与之取得连接的过程:
iphostentry iphost = dns.resolve("http://www.google.com/");
string []aliases = iphost.aliases;
ipaddress[] addr = iphost.addresslist;
endpoint ep = new ipendpoint(addr[0],80);
socket sock = newsocket(addressfamily.internetwork,
sockettype.stream,protocoltype.tcp);
sock.connect(ep);
if(sock.connected)
console.writeline("ok");
一旦连接成功,我们就可以运用send()和receive()方法来进行通讯。
send()方法的函数原型如下:
public int send (byte[] buffer, int size, socketflags flags);
其中,参数buffer包含了要发送的数据,参数size表示要发送数据的大小,而参数flags则可以是以下一些值:socketflags.none、socketflags.dontroute、socketflags.outofbnd。
该方法返回的是一个system.int32类型的值,它表明了已发送数据的大小。同时,该方法还有以下几种已被重载了的函数实现:
public int send (byte[] buffer);
public int send (byte[] buffer, socketflags flags);
public int send (byte[] buffer,int offset, int size,
socketflags flags);
介绍完send()方法,下面是receive()方法,其函数原型如下:
public int receive(byte[] buffer, int size, socketflags flags);
其中的参数和send()方法的参数类似,在这里就不再赘述。
同样,该方法还有以下一些已被重载了的函数实现:
public int receive (byte[] buffer);
public int receive (byte[] buffer, socketflags flags);
public int receive (byte[] buffer,int offset, int size,
socketflags flags);
在通讯完成后,我们就通过shutdown()方法来禁用socket,函数原型如下:
public void shutdown(socketshutdown how);
其中的参数how表明了禁用的类型,soketshutdown.send表明关闭用于发送的套接字;soketshutdown.receive表明关闭用于接收的套接字;而soketshutdown.both则表明发送和接收的套接字同时被关闭。
应该注意的是在调用close()方法以前必须调用shutdown()方法以确保在socket关闭之前已发送或接收所有挂起的数据。一旦shutdown()调用完毕,就调用close()方法来关闭socket,其函数原型如下:
public void close();
该方法强制关闭一个socket连接并释放所有托管资源和非托管资源。该方法在内部其实是调用了方法dispose(),该函数是受保护类型的,其函数原型如下:
protected virtual void dispose(bool disposing);
其中,参数disposing为true或是false,如果为true,则同时释放托管资源和非托管资源;如果为false,则仅释放非托管资源。因为close()方法调用dispose()方法时的参数是true,所以它释放了所有托管资源和非托管资源。
这样,一个socket从创建到连接到通讯最后的关闭的过程就完成了。虽然整个过程比较复杂,但相对以前在sdk或是其他环境下进行socket编程,这个过程就显得相当轻松了。