首页 > 编程 > .NET > 正文

《.net编程先锋C#》第二章 理论基础-公用语言 运行环境

2024-07-10 13:00:25
字体:
来源:转载
供稿:网友
第二章 理论基础-公用语言 运行环境
既然你已经具有了c#全面的印象,我也想让你了解ngws runtime的全貌。c#依靠由ngws提供的运行时;因此,有必要知道运行时如何工作,以及它背后所蕴含的概念。
所以,这一章分为两部分——它们是所有的概念和使用的基础。两部分的内容虽然有些重叠,但它有助于加深理解正在学习的概念。

2.1 ngws runtime
ngws和ngws runtime为你提供了一种运行时环境。该运行时管理执行代码,并提供了使编程更容易的服务。只要你的编译器支持这种运行时,你就会从这种受管理的执行环境中得益。
你猜测c#编译器支持ngws runtime很正确,但是不仅它支持ngws runtime,vb和c++也支持。这些为支持运行时所创建的代码称作"受管代码"(managed code)。以下是你的应用程序从ngws runtime那里所得到的利益:

交叉语言集成(通过通用语言规范)
自动内存管理(垃圾收集)
交叉语言异常处理(统一展开)
增强安全(包括类型安全)
版本支持("dll地狱"终结者)
组件交互简化模式

因ngws runtime 要提供了所有的这些好处,编译器必须把元文件和受管代码一起发出。元文件描述代码中的类型,它和你的代码存在一起(与pe类似---pe为可变位执行文件)
正如你从很多种交叉语言功能所看到的,ngws runtime主要是关于高度集成交叉多异编程语言(tight integration across multiple different programming languages)。这种支持可达到允许你从一个vb对象派生出一个c#类的程度(我后面会给出要讨论的文章)。
c#程序员将会喜欢的一个功能是,他们不必担心内存管理—也就是说不必担心臭名昭著的内存泄漏。ngws runtime提供了内存管理,当对象和变量的生命期结束(不再被引用)时,垃圾收集器释放它们。我真的喜欢这个功能,因为在com中的内存管理一直是我的一块心病。
应该鼓励配置一个管理应用程序或者组件。因为管理应用程序含有元数据文件,ngws runtime可以利用这些信息,以确保你的应用程序具有它所需的各种规定版本。所产生的明显效果为,由于你的代码没有相互之间的依赖,很少可能出现中断。
这章余下来的将分为两部分,每一部分讨论ngws runtime的各个方面,直到你的c#应用程序能执行为止。
1、中间语言(intermediate language,缩写il)和元数据
2、即时编译器(just-in-time compliers,简称jiters)

2.1.1 中间语言和元数据
由c#编译器生成的受管代码并不是原始代码,但它是中间语言(il)代码。这种il代码自身变成了ngws runtime的受管执行进程的入口。il代码明显的优势在于它是cpu无关的,这也意味着,你要用目标机器上的一个编译器才能把il代码转换成原始代码。
尽管il代码由编译器产生,但它并不是编译器提供给运行时仅有的东西。编译器同样产生有关你代码的元数据,它告诉运行时有关你代码的更多的东西,例如各种类型的定义、各种类型成员的签名以及其它数据。基本上,元数据是类型库、注册表内容和其它用于com的信息。尽管如此,元数据还是直接和执行代码合并在一起,并不处在隔离的位置。
il和元数据存放于扩展了pe格式的文件中(pe格式用于.exe和.dll文件)。当这样的一个pe文件被装载时,运行时从文件中定位和分离出元数据和il。
在进一步说明之前,我想给你已有的il指令的简短目录。尽管它不是一个完整的清单,也不需要你熟记和理解,但是它列出了你所必需的、c#程序所基于的知识基础。

算术和逻辑操作符
控制流
直接内存访问
堆栈操作
参数和局部变量
堆栈分配
对象模式
实例类型值
临界区
数组
分型位置
即时编译器(jitters)

2.1.2 即时编译器(jitters)
由c#或其它能产生受管代码的编译器所生成的受管代码就是il码。虽然il代码被包装在一个有效的pe文件中,但是你还是不能执行它,除非它被转换成为受管原始代码。这就是ngws runtime 即时编译器(也称作jitters)大显身手的时候。
为什么你会对即时编译代码感到厌繁, 为什么不把整个il pe文件编译成原始代码? 答案是时间——需要把il代码编译成cpu规格的代码的时间。这种编译将更加有效率,因为一些程序段从来就没有被执行过。例如,在我的字处理器中,邮件合并功能从来就没有被编译。
从技术上说,全部的处理过程如下:当一个类型被装载时,装载器创建一个存根(stub),并使它连接每一个类型的方法。当一个方法第一次被调用时,存根把控制交给jit。jit把il编译为原始代码,且把存根指针指向缓冲了的原始代码。接着的调用将执行原始码。在某些位置上(at some point),所有的il都被转换成为原始代码,而jitter处于空闲状态。
正如我在前面提到的,jit编译器有很多,不止一个。在windows平台上,ngws runtime装有3个不同的jit编译器。
jit——这是ngws runtime默认使用的jit编译器。它是一个后台(back end)优化的编译器 ,在前台(up front)实行数据流分析,并创建了高度优化的受管原始代码做为输出结果。jit可以使用不严格的il指令集编码,但是所需资源将十分可观。主要的限制在于内存足迹(footprint)、结果工作集,以及实行优化所消耗的时间。
econojit—— 和主jit相比,econjit的目标是把il高速地转换成受管原始代码。它允许缓冲所产生的原始代码,但是输出码并不象主jit生成的代码那样优化(代码小)。当内存紧张时,快速代码生成方案的优势将荡然无存。通过永久地抛弃无用的已jit过的代码,你可以把更大的il程序装入代码缓冲区。因为jit编译快,执行速度也仍然很快。
prejit—尽管它是基于主jit的,但操作起来更象是一个传 统的编译器。你安装了ngws组件,它才能运行,才可以把il代码编译成受管原始代码。当然最终的结果为,更快的装载时间和更快的应用程序启动时间(不需要更多的jit编译)。
在所列出的jitters中,有两个是运行时的jitters。可是你怎么决定要使用哪一个jit,它如何使用内存? 有一个称做"jit编译管理器"的小应用程序(jitman.exe),它存放于ngws sdk安装目录下的bin目录中。当执行该程序时,它把一个图标加到系统任务条上,双击该图标打开程序对话框(见图2.1)。

图2.1 jit编译管理器允许你设置各种相关性能的选项

尽管它是一个小小的对话框,可是你所选择的选项功能是相当强大的。每一个选项将在以下描述。
use econojit only 选项——当该复选框没有选上时,ngws runtime使用默认的正常的jit编译器。前面就曾经解释过两种jitter的区别。
max code pitch overhead(%)选项——该设置仅保留给econojit。它控制了jit编译时间和执行代码时间的百分比。如果超过了设定的域值,代码缓冲区得到扩充,以缩短jit编译所消耗的时间。
limit size of code cache选项——该项默认为非选。没有选择该项意味着缓冲区将使用它所能得到的内存。如果你想限制缓冲区大小,复选该选项,这将允许你使用max size of cache(bytes)选项。
max size of cache(bytes)选项—控制容纳jit代码的缓冲区的最大值。虽然你可以非常严格地限制这个值,但你还是应该小心,不能超过这个缓冲区所适合的最大值。否则该方法的jit编译将会失败。
optimize for size选项——告诉jit 编译器,优化的目的是为了使代码更小而不是能执行得更快。这个设置默认是关掉的。
enable concurrent gc[garbage collection]选 项——垃圾收集(gc)默认地运行在用户代码的线程中。意味gc发生时,可能会注意到回应有轻微的延迟。为防止出现该现象,打开当前gc。注意,当前gc比标准gc更慢,它仅在windows 2000上写时(the time of writing)有效。
当用c#创建项目时,你可能使用不同的设置试验过。当创建 ui-intensive应用程序时,你将会看到允许当前gc的最大差别。

2.2 虚拟对象系统(vos)
到目前为止,你仅看到了ngws runtime如何工作,但是并不了解它工作的技术背景以及为什么它要这样工作。这节都是关于 ngws 虚拟对象系统的(vos)。
以下为在vos中形成声明、使用和管理类型模型时,ngws runtime的规则。在vos背后的思想是建立一个框架,在执行代码时不能牺牲性能,允许交叉语言集成和类型安全。
我提到的框架是运行时架构的基础。为了帮助你更好地了解它,我将它勾出四个区域。当开发c#应用程序和组件时,理解它们很重要。
vos类型系统——提供丰富的类型系统,它打算支持全面编程语言的完全实施。
元数据——描述和引用vos类型系统所定义的类型。元数据的永久格式与编程语言无关,但是,元数据拿自己当作一种互换机制(nterchange mechanism)来使用,这种互换是在在工具和ngws的虚拟执行系统之间。
通用语言规范(cls)——cls定义了vos中类型的子集,也定义了常规的用法。如果一个类库遵守cls的规则,它确保类库可以在其它所有能实现cls的编程语言上使用。
虚拟执行系统(ves)——这是vos实时的实现。ves负责装入和执行为ngws运得时编写的程序。
这四个部分一起组成了ngws runtime架构。每一部分在下面小节中描述。

2.2.1 vos类型系统
vos类型系统提供丰富的类型系统,它打算支持多种编程语言的完全实施。所以,vos必须都支持面向对象的语言和过程编程语言。
现在,存在着很多种近似但有点不兼容的类型。就拿整型当例子,在vb中,它是16位长,而在c++中,它是32位。还有更多的例子,特别是用在日期和时间以及数据库方面的数据类型。这种不兼容使应用程序的创建和维护不必要地复杂化,尤其当程序使用了多种编程语言时。
另一个问题是,因为编程语言之间存在着一些差别,你不能在一种语言中重用另一种语言创建的类型。(com用二进制标准接口部分地解决了这个问题)。 当今代码重用肯定是有限的。
发布应用程序的最大障碍是各种编程语言的对象模型不统一。几乎每一方面都存在着差异:事件、属性、永久保存(persistence)等等。
vos这里将改变 这种现象 。vos定义了描述值的类型,并规定了类型的所有值所必须支持的一条合约。由于前面提到的支持面向对象和过程编程语言,就存在着两种值和对象。

对于值,类型存储于表述(representation)中,同样操作也在其中实行。对象更强大因为它显式地存于表述中。每一个对象都有一个区别于其它对象的识别号。支持不同的vos类型在第四章 "c#类型"中提出。


2.2.2元数据
尽管元数据用于描述和引用由vos类型系统定义的类型,但它还不能锁定到这个单个目标。当你写一个程序时,通过利用类型声明,你所声明的类型(假定它们是数值类型或引用类型)被介绍给ngws runtime类型系统。类型声明在存于pe可执行文件内部的元数据中得到描述。
基本上,元数据用于各项任务:用于表示ngws runtime用途的信息,如定位和装载类、 内存中这些类的事例、解决调用 、翻译il为原始码、加强安全并设置运行时上下文边界。
你不必关心元数据的生成。元数据是由c#的"代码转il编译器"(code-to-il compiler,不是jit编译器)生成的。代码转il编译器发送二进制元数据信息给pe文件,是以标准的方式发送的,不象c++编译器那样,为出口函数创建它们自己的修饰名字。
你从元数据和可执行代码并存所获得的主要优势为,有关类型的信息同类型自身固定在一起,不会遍布很多地方。同样有助于解决存在于com中的版本问题。进一步地,你可以在相同的上下文中使用不同的版本库,因为库不仅被注册表引用,也被包含在可执行代码中的元数据引用。


2.2.3通用语言规范
通用语言规范(cls)并不是虚拟对象系统(vos)真正的一部分,它是特殊的。cls定义了vos中的一个类型子集,也定义了必须符合cls的常规用法。
那么,对此有什么迷惑呢?如果一个类库遵守cls规则,其它编程语言同样也遵守cls规则,那么其它编程语言的客户也可以使用类库。cls是关于语言的交互可操作性(interoperability)。因此,常规用法必须仅遵循外部可访问项目 (externally visible items)如方法、属性和事件等等。
我所描述的优点是你可以做以下工作。用c#写一个组件,在vb中派生它,因加在vb中的功能是如此之强大,在c#中再次从vb类派生它。只要所有的外部可访问项遵守cls规则,这样是可行的。
我在这本书中出示的代码不关心cls协定。但在构建你的类库时要注意到cls协定。我提供了表2.1,用以给类型和外部可访问项定义协定规则。
这个清单不完整。它仅包含一些很重要的项目。我不指出出现在本书中每一种类型的cls协定,所以有个好主意:当你寻找cls协定时,至少应该用浏览该表,以了解哪种功能有效。不要担心你不熟悉这章表中的每一个含义,在这本书中你会学到它们。

表2.1 通能语言规范中的类型和功能

bool
char
byte
short
int
long
float
double
string
object(所有对象之母)

arrays(数组)
数组的维数必须是已知的(>=1),而且最小下标数必须为0。
要素类型必须是一个cls类型。

类型(types)
可以被抽象或隐藏。
零或更多的接口可以被实现。不同的接口允许拥有具有相同名字和签名的方法。
一个类型可以准确地从一个类型派生。允许成员被覆盖和被隐藏。
可以有零或更多的成员,它们是字段(fields)、方法、事件或者类型。
类型可以拥有零或更多个构造函数。
一种类型的可访问性可以是公共的或者对ngws组件来说是局部的;但是,仅公共成员可以认为是类型接口的一部分。
所有的值型必须从系统值型继承。异常是一个枚举——它必须从系统枚举(system enum)继承。

类型成员
类型成员允许隐藏或者覆盖另一种类型中的其它成员。
参数和返回值的类型都必须是 cls 协定 类型。
构造函数、方法和属性可以被重载。
一个类型可以有抽象成员,但仅当类型不被封装时。

方法
一种方法可以是静态、虚拟或者实例。
虚拟和实例方法可以是抽象的,或者是一个实现。静态方法必须总拥有一个实现。
虚拟方法可能是最后的(或者不是)。

字段(fields)
可以是静态或者是非静态。
静态字段可以被描述或只初始化。

属性
当获取和设置方法而不是使用属性语法时,属性可以公开。
获取的返回类型和设置方法的第一个参数必须是相同的cls类型——属性的类型。
属性名字必须不同,不同的属性类型用于区分是不充分的。
由于使用方法实现属性访问,如果 propertyname 是同一个类中定义的一个属性,你不能实现命名为 get_propertyname 和 set_propertyname 的方法。
属性可以被索引。
属性访问必须遵循这种命名格式:get_proname,set_propname。

枚举(enumerations)
强调类型必须是byte、short、int 或long。
每一个成员是一个枚举类型的静态描述字段。
一个枚举不能实现任何接口。
你允许给多字段设定相同的值。
一个枚举必须继承系统枚举(隐含在c#中)

异常
可以被引发和被捕获。
自定义异常必须继承系统异常。

接口
可需要实现其它接口。
一个接口可以定义属性、事件和虚拟方法。实现取决于派生类。

事件
增加和取消方法必须是都提供或者都没有 ,每一种方法采用一个参数,它是一个从系统代表元(system delegate)派生下来的类。

自定义属性
可以仅使用下更类型:type(类型),char, char, bool, byte, short, int, long, float, double, enum (一种cls 类型), and object.

代表元(delegates)
可以被创建和被激活

标识符(identifiers)
一个标识符的第一个字母必须来自一限制集。
通过大小写在单一范围内,不可能唯一地区别两个或更多个标识符(大小写不敏感)。

2.2.4虚拟执行系统(ves)
虚拟执行系统实现了虚拟对象系统。通过实现一个负责ngws runtime的执行引擎(execution engine,缩写ee)创建ves。这个执行引擎执行你用c#编写和编译的应用程序。
下列组件为ves的一部分。
1、中间语言(il)——被设计为很容易受各种各样的编译器所兼容 。在该框架之外,c++、vb和c#编译器都能够生成il。
2、装入受管代码——这包括解决内存中的名字、 表层类(laying out classes ),并且创建jit编译所必需的存根。通过执行经常性校验,包括加强一些访问规则,类装载器同样也增强了安全性。
3、用jit转换il成原始代码——il代码并不是设计成为一种传统的解释字节代码或树型代码,il转换是真正的编译。
4、装入元数据、校验类型安全和方法的完整性
5、垃圾收集(gc)和异常处理——两者都是基于堆栈格式的服务。受管代码允许你动态地跟踪堆栈。要动态地识别各个堆栈框架,jitter或其它编译器必须提供一个代码管理器。
6、描绘和查错服务——两者都取决于由源语言编译器所生成的信息。必须发出两个映射:一个映射从源语言结构发到指令流中的地址,一个映射从地址发到堆栈框架中的位置。当执行从il到原始代码的转换时,这些映射被重新计算。
7、管理线程和上下文,还有远程管理——ves为受管代码提供这些服务。
虽然这个清单并不完整,但它足以让你理解运行时基于的由ves提供的低层架构。肯定将会有专门讨论运行时的书,而这本书将稍为深入地挖掘各种话题。

2.3 小结
这一章,我带你逛了一回运行时的世界。我描述了当创建、编译和配置c#程序时它是如何工作的。你学会了中间语言(il),还有元数据是如何用于描述被编译为il的类型。元数据和il都用于jitter检测和执行你的代码。你甚至可以选择用哪一种jitter来执行应用程序。
在这一章的第二部分,涉及到了运行时为何按这种方式工作的理论。你学了虚拟对象系统(vos)和组成它的那部分。对于类库设计者最为感兴趣的就是通用语言规范(cls),它为基于vos的语言交互操作设定规则。最后,你看到了虚拟执行系统(ves)如何通过ngws runtime实现vos。


发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表