构造.NET环境下的网页下载器（1）

2024-07-10 13:00:29

字体：大中小

来源：转载

供稿：网友

一．前言：

　　微软的.net框架为我们进行网络编程提供了以下两个名字空间：system.net以及system.net.sockets。通过合理运用其中的类和方法，我们可以很容易地编写出各种网络应用程序。这种网络应用程序既可以是基于流套接字的，也可以是基于数据报套接字的。而基于流套接字的通讯中采用最广泛的协议就是tcp协议，基于数据报套接字的通讯中采用最广泛的自然就是udp协议了。下面我将重点向大家介绍.net网络编程中的一些类：dns类、iphostentry类、ipendpoint类以及socket类，并会在最后给出一个网页下载器的实例以加深读者对.net网络编程的理解。

　　二．网络编程类介绍：

　　dns 类：

　　向使用 tcp/ip internet 服务的应用程序提供域名服务。其resolve（）方法查询dns服务器以将用户友好的域名（如"www.google.com"）映射到数字形式的 internet 地址（如 192.168.1.1）。resolve（）方法返回一个iphostenty实例，该实例包含所请求名称的地址和别名的列表。大多数情况下，可以使用 addresslist 数组中返回的第一个地址。

　　resolve（）方法的函数原型如下：

public static iphostentry resolve(string hostname);

　　下面的代码获取一个 ipaddress 实例，该实例包含服务器 www.google.com 的ip地址：

iphostentry iphostinfo = dns.resolve("www.google.com");
ipaddress ipaddress = iphostinfo.addresslist[0];

　　不过在dns类中，除了通过resolve（）方法，你还可以通过gethostbyaddress（）方法以及gethostbyname（）方法来得到相应的iphostentry实例，函数原型如下：

public static iphostentry gethostbyaddress(string ipaddress);
public static iphostentry gethostbyname(string hostname);

　　下面的代码显示了如何分别运用以上两种方法获得包含服务器www.google.com的相关信息的iphostentry实例：

iphostentry hostinfo=dns.gethostbyaddress("192.168.1.1");
iphostentry hostinfo=dns.gethostbyname("www.google.com");

　　在使用以上方法时，你将可能需要处理以下几种异常：

socketexception异常：访问socket时操作系统发生错误引发

argumentnullexception异常：参数为空引用引发

objectdisposedexception异常：socket已经关闭引发

以上，我向大家简要地介绍了dns类中一些方法以及其用法，并列举出了可能出现的异常，下面就让我们转到和dns类密切相关的iphostentry类。

　　iphostentry类：

　　该类的实例对象中包含了internet主机的地址相关信息。此类型的所有公共静态成员对多线程操作而言都是安全的，但不保证任何实例成员是线程安全的。其中主要的一些属性有：addresslist属性、aliases属性以及hostname属性。

　　addresslist属性和aliases属性的作用分别是获取或设置与主机关联的ip地址列表以及获取或设置与主机关联的别名列表。其中addresslist属性值是一个ipaddress类型的数组，包含解析为aliases属性中包含的主机名的ip地址；aliases属性值是一组字符串，包含解析为addresslist 属性中的ip地址的dns名。而hostname属性比较好理解，它包含了服务器的主要主机名，这光从名称上就可以知道了。如果服务器的dns项定义了附加别名，则可在aliases属性中使用这些别名。

　　下面的代码列出了服务器www.google.com的相关别名列表以及ip地址列表的长度并将所有的ip地址列出：

iphostentry iphost = dns.resolve("www.google.com/");
string[] aliases = iphost.aliases;
console.writeline(aliases.length);

ipaddress[] addr = iphost.addresslist;
console.writeline(addr.length);
for(int i= 0; i < addr.length ; i++)
{
console.writeline(addr[i]);
}

介绍完iphostentry类，我们能获得了所要连接的主机的相关ip地址以及别名列表，但是真正要和主机取得连接还需要一个很重要的类－ipendpoint类。

　　ipendpoint类：

　　在internet中，tcp/ip使用一个网络地址和一个服务端口号来唯一标识设备。网络地址标识网络上的特定设备；端口号标识要连接到的该设备上的特定服务。网络地址和服务端口的组合称为终结点，在.net框架中正是由endpoint类表示这个终结点，它提供表示网络资源或服务的抽象，用以标志网络地址等信息。.net同时也为每个受支持的地址族定义了 endpoint的子代；对于ip地址族，该类为ipendpoint。ipendpoint类包含应用程序连接到主机上的服务所需的主机和端口信息，通过组合服务的主机ip地址和端口号，ipendpoint类形成到服务的连接点。

　　在ipendpoint类中有两个很有用的构造函数：

public ipendpoint(long, int);
public ipendpoint(ipaddress, int);

　　它们的作用就是用指定的地址和端口号初始化 ipendpoint 类的新实例。该类中的属性有：address属性、addressfamily属性以及port属性，这些属性相对比较容易理解，这里就不作多介绍。下面的代码显示了如何取得服务器www.google.com的终结点：

iphostentry iphost = dns.resolve("www.google.com");
ipaddress[] addr = iphost.addresslist;
ipendpoint ep = new ipendpoint(addr[0],80);

　　这样，我们已经了解了和主机取得连接的一些必要的基本类，有了这些知识，我们就可以运用下面的socket类真正地和主机取得连接并进行通讯了。

　　socket类：

　　socket类是包含在system.net.sockets名字空间中的一个非常重要的类。一个socket实例包含了一个本地以及一个远程的终结点，就像上面介绍的那样，该终结点包含了该socket实例的一些相关信息。

　　需要知道的是socket 类支持两种基本模式：同步和异步。其区别在于：在同步模式中，对执行网络操作的函数（如send和receive）的调用一直等到操作完成后才将控制返回给调用程序。在异步模式中，这些调用立即返回。

　　下面我们重点讨论同步模式的socket编程。首先，同步模式的socket编程的基本过程如下：

1．创建一个socket实例对象。

2．将上述实例对象连接到一个具体的终结点（endpoint）。

3．连接完毕，就可以和服务器进行通讯：接收并发送信息。

4．通讯完毕，用shutdown（）方法来禁用socket。

5．最后用close（）方法来关闭socket。

知道了以上基本过程，我们就开始进一步实现连接并通讯了。在使用之前，你需要首先创建socket对象的实例，这可以通过socket类的构造方法来实现：

public socket(addressfamily addressfamily,sockettype
sockettype,protocoltype protocoltype);

其中，addressfamily 参数指定socket使用的寻址方案，比如addressfamily.internetwork表明为ip版本4的地址；sockettype参数指定socket的类型，比如sockettype.stream表明连接是基于流套接字的，而sockettype.dgram表示连接是基于数据报套接字的。protocoltype参数指定socket使用的协议，比如protocoltype.tcp表明连接协议是运用tcp协议的，而protocol.udp则表明连接协议是运用udp协议的。

在创建了socket实例后，我们就可以通过一个远程主机的终结点和它取得连接，运用的方法就是connect（）方法：

public connect (endpoint ep);

该方法只可以被运用在客户端。进行连接后，我们可以运用套接字的connected属性来验证连接是否成功。如果返回的值为true，则表示连接成功，否则就是失败。下面的代码就显示了如何创建socket实例并通过终结点与之取得连接的过程：

iphostentry iphost = dns.resolve("http://www.google.com/");
string []aliases = iphost.aliases;
ipaddress[] addr = iphost.addresslist;
endpoint ep = new ipendpoint(addr[0],80);

socket sock = newsocket(addressfamily.internetwork,
sockettype.stream,protocoltype.tcp);
sock.connect(ep);
if(sock.connected)
console.writeline("ok");

一旦连接成功，我们就可以运用send（）和receive（）方法来进行通讯。

send（）方法的函数原型如下：

public int send (byte[] buffer, int size, socketflags flags);

其中，参数buffer包含了要发送的数据，参数size表示要发送数据的大小，而参数flags则可以是以下一些值：socketflags.none、socketflags.dontroute、socketflags.outofbnd。

该方法返回的是一个system.int32类型的值，它表明了已发送数据的大小。同时，该方法还有以下几种已被重载了的函数实现：

public int send (byte[] buffer);
public int send (byte[] buffer, socketflags flags);
public int send (byte[] buffer,int offset, int size,
socketflags flags);

介绍完send（）方法，下面是receive（）方法，其函数原型如下：

public int receive(byte[] buffer, int size, socketflags flags);

其中的参数和send（）方法的参数类似，在这里就不再赘述。

同样，该方法还有以下一些已被重载了的函数实现：

public int receive (byte[] buffer);
public int receive (byte[] buffer, socketflags flags);
public int receive (byte[] buffer,int offset, int size,
socketflags flags);

在通讯完成后，我们就通过shutdown（）方法来禁用socket，函数原型如下：

public void shutdown(socketshutdown how);

其中的参数how表明了禁用的类型，soketshutdown.send表明关闭用于发送的套接字；soketshutdown.receive表明关闭用于接收的套接字；而soketshutdown.both则表明发送和接收的套接字同时被关闭。

应该注意的是在调用close（）方法以前必须调用shutdown（）方法以确保在socket关闭之前已发送或接收所有挂起的数据。一旦shutdown（）调用完毕，就调用close（）方法来关闭socket，其函数原型如下：

public void close();

该方法强制关闭一个socket连接并释放所有托管资源和非托管资源。该方法在内部其实是调用了方法dispose（），该函数是受保护类型的，其函数原型如下：

protected virtual void dispose(bool disposing);

其中，参数disposing为true或是false，如果为true，则同时释放托管资源和非托管资源；如果为false，则仅释放非托管资源。因为close（）方法调用dispose（）方法时的参数是true，所以它释放了所有托管资源和非托管资源。

这样，一个socket从创建到连接到通讯最后的关闭的过程就完成了。虽然整个过程比较复杂，但相对以前在sdk或是其他环境下进行socket编程，这个过程就显得相当轻松了。

上一篇：WebGain and HP Collaborate to Bridge Java and .NET

下一篇：如何在.NET中访问MySQL数据库