在 WinForm 中完整支持在多级目录中保存的 ASP.NET
2024-07-10 12:56:58
供稿:网友
大概半年前曾写过一个在 winform 程序中嵌入 asp.net 的简单例子,《在winform程序中嵌入asp.net》。因为是试验性质的工作,所以当时偷懒直接使用系统自带的 simpleworkerrequest 完成 asp.net 页面请求的处理工作。使用自带工具类在实现上虽然简单,但受到系统的诸多功能限制,如后面有朋友提到无法直接处理多级子目录的问题等等。(如虚拟目录为 "/" 时无法处理 "/help/about.aspx" 类型的页面请求)
对于此类需求,一个最好的实现实例就是 www.asp.net 提供的 cassini。这个例子完整地演示了如何实现一个支持 asp.net 的简单 web 服务器功能,并被 borland 的 delphi.net 等许多开源项目,当作调试用 web 服务器。虽然只有几十 k 的源代码,但麻雀虽小五脏俱全,还是非常值得一看的。但因为 cassini 是为处理 web 服务而设计,因此需要在了解其结构的基础上,做一些定制来满足我们的需求。
首先来看看 cassini 的程序结构。
与我前文例子中采用的结构类似,cassini 包括界面(cassiniform)、服务器(server)、宿主(host)和请求处理器(request)等几个主要部分,并通过 connection 等几个工具类,完成 web 请求的解析与应答功能。
总体工作流程图如下:
以下内容为程序代码:
+-------+ [1] +-------------+ [2] +--------+
| admin |---->| cassiniform |---->| server |
+-------+ +-------------+ +--------+
| [3]
v
+--------+ [4] +------+
| client |---->| host |
+--------+ +------+
^ | [5]
| v
| +------------+ [6] +---------+
[7]| | connection |---->| request |--+
| +------------+ +---------+ | [7]
+----------------------------------------+
[1] cassini 的管理者(admin)首先通过 cassiniform 的界面,设定 web 服务器端口、页面物理目录和虚拟目录等配置信息;
[2] 然后以配置信息构造 server 对象,并调用 server.start 方法启动 web 服务器;
以下内容为程序代码:
public class cassiniform : form
{
private void start()
{
// ...
try {
_server = new cassini.server(portnumber, _virtroot, _apppath);
_server.start();
}
catch {
// 显示错误信息
}
// ...
}
}
[3] server 对象在建立时,将获取或自动初始化 asp.net 的注册表配置。这个工作是通过 server.getinstallpathandconfigureaspnetifneeded 方法完成的。工作原理是通过 httpruntime 所在 assembly (system.web.dll) 的版本获得合适的 asp.net 版本;然后从注册表中查询 hkey_local_machinesoftwaremicrosoftasp.net 下是否有正确的 asp.net 的安装路径;如果有则返回之;否则会根据 system.web.dll 的版本,以及 hkey_local_machinesoftwaremicrosoft.netframework 下 .net framework 按照目录等信息,动态构造一个合适的 asp.net 注册表配置。进行这个工作的原因是 asp.net 可以在按照 .net framework 后,使用 aspnet_regiis.exe 手工注销掉,而运行支持 asp.net 的 web 服务器,又必须有合适的设置。
在完成配置和 asp.net 安装路径后,server 将建立并配置 host 对象作为 asp.net 的宿主。
以下内容为程序代码:
public class server : marshalbyrefobject
{
private void createhost() {
_host = (host)applicationhost.createapplicationhost(typeof(host), _virtualpath, _physicalpath);
_host.configure(this, _port, _virtualpath, _physicalpath, _installpath);
}
public void start() {
if (_host != null)
_host.start();
}
}
[4] host 类作为 asp.net 的宿主类,主要完成三部分工作:配置 asp.net 的运行时环境、响应客户端(client)发起的 web 页面请求、以及判断客户端请求的有效性。
配置 asp.net 的运行时环境主要工作是,为 asp.net 的执行和后面请求有效性的判断获取足够的配置信息。例如 server 能够提供的 web 服务端口、页面虚拟路径、页面物理路径以及 asp.net 程序安装路径等等,以及 host 根据这些信息计算出的 asp.net 客户端脚本的虚拟和物理路径等等。此外还会接管线程所在 appdomain 的卸载事件 appdomain.domainunload,在 web 服务器停止的时候自动终止 web 服务。
响应客户端(client)发起的 web 页面请求功能,是通过建立 socket 监听 server 对象指定的 web 服务 tcp 端口来完成的。host.start 方法建立 socket,并通过线程池异步调用 host.onstart 方法在后台监听请求;host.onstart 方法则在 接收到 web 请求后,通过线程池异步调用 host.onsocketaccept 方法完成请求的响应工作;host.onsocketaccept 则负责在处理 web 请求的时候,建立 connection 对象,并进一步调用 connection.processonerequest 方法处理 web 请求。虽然 host 没有使用复杂的请求分配算法,但因为线程池的灵活使用,使得其性能完全不受处理瓶颈的限制,也是线程池使用的良好范例。
以下内容为程序代码:
internal class host : marshalbyrefobject
{
public void start() {
if (_started)
throw new invalidoperationexception();
// 建立 socket 监听 web 服务端口
_socket = new socket(addressfamily.internetwork, sockettype.stream, protocoltype.tcp);
_socket.bind(new ipendpoint(ipaddress.any, _port));
_socket.listen((int)socketoptionname.maxconnections);
_started = true;
threadpool.queueuserworkitem(_onstart); // 通过线程池异步调用
}
private void onstart(object unused) {
while (_started) {
try {
socket socket = _socket.accept(); // 响应客户端请求
threadpool.queueuserworkitem(_onsocketaccept, socket); // 通过线程池异步调用
}
catch {
thread.sleep(100);
}
}
_stopped = true;
}
private void onsocketaccept(object acceptedsocket) {
connection conn = new connection(this, (socket)acceptedsocket);
conn.processonerequest(); // 处理客户端请求
}
}
最后,判断客户端请求的有效性的功能,是通过三个重载的 host.isvirtualpathinapp 方法,提供给 connection 在具体处理客户端请求时调用,来判断请求的有效性,下面讨论 connection 时再详细解释。
[5] host 在建立 connection 对象并调用其 processonerequest 方法处理用户请求时,connection 对象会首先等待客户端请求数据(waitforrequestbytes),然后创建 request 对象,并调用 request.process 方法处理请求。而其自身,则通过一堆 waitxxx 函数,为 request 类提供支持。
以下内容为程序代码:
internal class connection {
public void processonerequest() {
// wait for at least some input
if (waitforrequestbytes() == 0) { // 等待客户端请求数据
writeerrorandclose(400); // 发送 http 400 错误给客户端
return;
}
request request = new request(_host, this);
request.process();
}
private int waitforrequestbytes() {
int availbytes = 0;
try {
if (_socket.available == 0) {
// poll until there is data
_socket.poll(100000 /* 100ms */, selectmode.selectread); // 等待客户端数据 100ms 时间
if (_socket.available == 0 && _socket.connected)
_socket.poll(10000000 /* 10sec */, selectmode.selectread);
}
availbytes = _socket.available;
}
catch {
}
return availbytes;
}
[6] request 在接收到 connection 的请求后,将从客户端读取请求内容,并按照 http 协议进行分析。因为本文不是做 http 协议的分析工作,所以这部分代码就不详细讨论了。
在 request.parserequestline 函数分析 http 请求获得请求页面路径后,会调用前面提到过的 host.isvirtualpathinapp 函数判断此路径是否在 web 服务器提供的虚拟路径下级,并且返回此虚拟路径是否指向 asp.net 的客户端脚本。如果 web 请求的虚拟路径以 "/" 结尾,则调用 request.processdirectorylistingrequest 方法返回列目录的响应;否则调用 httpruntime.processrequest 方法完成实际的 asp.net 请求处理工作。
httpruntime 通过 request 的基类 httpworkerrequest 提供的统一接口,采用 ioc 的策略获取最终页面的所在。与我前面文章中使用的 simpleworkerrequest 实现最大不同在于 request.mappath 完成了一个较为完整的虚拟目录到物理目录映射机制。
simpleworkerrequest.mappath 实现相对简陋:
以下内容为程序代码:
public override string simpleworkerrequest.mappath(string path)
{
if (!this._hasruntimeinfo)
{
return null;
}
string physpath = null;
string appphyspath = this._appphyspath.substring(0, (this._appphyspath.length - 1)); // 去掉末尾斜杠
if (((path == null) || (path.length == 0)) || path.equals("/"))
{
physpath = appphyspath;
}
if (path.startswith(this._appvirtpath))
{
physpath = appphyspath + path.substring(this._appvirtpath.length).replace('/', '/');
}
internalsecuritypermissions.pathdiscovery(physpath).demand();
return physpath;
}
request.mappath 的实现则相对要完善许多,考虑了很多 simpleworkerrequest 无法处理的情况,使得 request 的适应性更强。
以下内容为程序代码:
public override string request.mappath(string path) {
string mappedpath = string.empty;
if (path == null || path.length == 0 || path.equals("/")) {
// asking for the site root
if (_host.virtualpath == "/") {
// app at the site root
mappedpath = _host.physicalpath;
}
else {
// unknown site root - don't point to app root to avoid double config inclusion
mappedpath = environment.systemdirectory;
}
}
else if (_host.isvirtualpathapppath(path)) {
// application path
mappedpath = _host.physicalpath;
}
else if (_host.isvirtualpathinapp(path)) {
// inside app but not the app path itself
mappedpath = _host.physicalpath + path.substring(_host.normalizedvirtualpath.length);
}
else {
// outside of app -- make relative to app path
if (path.startswith("/"))
mappedpath = _host.physicalpath + path.substring(1);
else
mappedpath = _host.physicalpath + path;
}
mappedpath = mappedpath.replace('/', '/');
if (mappedpath.endswith("/") && !mappedpath.endswith(":/"))
mappedpath = mappedpath.substring(0, mappedpath.length-1);
return mappedpath;
}
关于 cassini 的进一步讨论,可以参考 www.asp.net 上的讨论专版。
[7] 在 httruntime 完成具体的 asp.net 页面处理工作后,会通过 request.sendresponsefromxxx 系列函数,将页面结果返回给客户端。
虽然 simpleworkerrequest.mappath 方法实现简单,但理论上完全可以处理多级目录的情况。之所以在使用 simpleworkerrequest 时,无法处理嵌套目录,是因为 simpleworkerrequest 在构造函数中错误地分解了请求的页面所在虚拟目录等信息。
simpleworkerrequest 的两个构造函数,在将请求页面虚拟路径(如"/help/about.aspx")保存后,都调用了 extractpagepathinfo 方法对页面路径做进一步的分解工作。
以下内容为程序代码:
private void simpleworkerrequest.extractpagepathinfo()
{
int idx = this._page.indexof('/');
if (idx >= 0)
{
this._pathinfo = this._page.substring(idx);
this._page = this._page.substring(0, idx);
}
}
this._pathinfo 是为实现 httpworkerrequest.getpathinfo 提供的存储字段。而 getpathinfo 将返回 url 中在页面后的路径信息,例如对 "path/virdir/page.html/tail" 将返回 "/tail"。早期的许多 http 客户端程序,如 delphi 中 webaction 的分发,都利用了这个路径信息的特性,在 web 页面或 isapi 一级之后,再次进行请求分发。但因为 simpleworkerrequest 实现上或者设计上的限制,导致在处理 pathinfo 时会将 "/help/about.aspx" 类似的多级 url 错误切断。最终返回给 httpruntime 的 this._path 将变成空字符串,而 this._pathinfo 被设置为 "/help/about.aspx",而单级路径如 "about.aspx" 不受影响。
知道了这个原理后,就可以对 simpleworkerrequest 稍作修改,重载受到 extractpagepathinfo 影响的几个方法,即可完成对多级目录结构下页面的支持。如果需要进一步的映射支持,如同时支持多个虚拟子目录,可以参照 cassini 的 request 实现 mappath 等方法。
以下内容为程序代码:
public class request : simpleworkerrequest
{
private string _appphyspath;
private string _appvirtpath;
private string _page;
private string _pathinfo;
public request(string page, string query, textwriter output) : base(page, query, output)
{
this._appphyspath = thread.getdomain().getdata(".apppath").tostring();
this._appvirtpath = thread.getdomain().getdata(".hostingvirtualpath").tostring();
this._page = page;
// todo: 从 page 中进一步解析 path info
}
public override string getpathinfo()
{
if (this._pathinfo == null)
{
return string.empty;
}
return this._pathinfo;
}
private string getpathinternal(bool includepathinfo)
{
string path = (_appvirtpath.equals("/") ? _page : _appvirtpath + _page);
if (includepathinfo && (_pathinfo != null))
{
return path + this._pathinfo;
}
else
{
return path;
}
}
public override string geturipath()
{
return getpathinternal(true);
}
public override string getfilepath()
{
return getpathinternal(false);
}
public override string getrawurl()
{
string query = this.getquerystring();
if ((query != null) && (query.length > 0))
{
return getpathinternal(true) + "?" + query;
}
else
{
return getpathinternal(true);
}
}
public override string getfilepathtranslated()
{
return _appphyspath + _page.replace('/', '/');
}
public override string mappath(string path)
{
string physpath = null;
if (((path == null) || (path.length == 0)) || path.equals("/"))
{
physpath = this._appphyspath;
}
if (path.startswith(this._appvirtpath))
{
physpath = this._appphyspath + path.substring(this._appvirtpath.length).replace('/', '/');
}
return physpath;
}
}