多数人使用 html 4 和 xhtml 1 编写网页。相对较少的 html 狂热者了解语义 html 的概念、验证 html 结构和改进文档的可访问性。高质量的 html 文档是反复权衡、设计优选和讨论酝酿的结果。尽管受到诸多批评,还没有任何语言的普及性能与 html 比肩。多数用户满足于标准的现状,仿佛生来就该如此一样。
但是和其他很多标准一样,html 也有后继者。即便现在,专家仍然在考虑 html 的下一版本,解决当前版本中已知的所有问题。和任何人多的地方一样,这些专家也对此项工作的未来方向持有不同意见。
关于新 html 版本的第一个提议来自 w3c 组织的一个工作组。这个工作组想法围绕着 xhtml 2— 这个标准延续了原来进一步净化 xhtml、回归第一版 html 设计理念的开发方向。
w3c 之外的一些重要的 html 专家 — 浏览器厂商、web 开发人员、作者和其他有关人员 — 不同意 xhtml 2 的方向。2004 年,他们成立了一个独立的工作组,为新的 html 版本提出了一种新的设计方向。在 whatwg(web 超文本应用程序技术工作组,web hypertext application technology working group)的名义下,他们推出了 html 5 和 web forms 2。
数年之后,通过工作草案清楚地描述了 html 的另一种发展方向。2007 年 4 月,w3c 针对是否接纳 html 5 进入标准审核程序的提议进行了投票,(还)没有承认它是正式标准。多数人赞同。于是出现了一种有意思的情形:w3c 同时研究两种互相竞争的 html 和 xhtml 后继技术。从理论上说,两者都有充分的理由。从实践上说,让所有的主流浏览器支持这两种标准还要克服很多障碍。
这就是导致目前这种情况的基本事实。更有意义的是讨论两种提议之间的真正分歧。本文概括介绍了两种提议的基本要点,然后剖析两者的设计理念。
css:级联样式表
html:超文本标记语言
w3c:万维网联盟
xhtml:可扩展超文本标记语言
理解 xhtml 2 背后隐藏的设计理念需要了解一点历史。20 世纪 90 年代初,第一个 html 版本是基于标准通用标记语言(sgml)的。主要的区别在于超链接特性 — 万维网的关键基础和成功因素。和 sgml 一样,html 允许作者描述文档的结构,把头部和段落、有序列表、无序列表分开。在屏幕上的显示结果和浏览器有关。
随着 web 日渐普及,html 用户要求控制页面的观感。浏览器厂商在 html 2 和 3 中推出了新的特性。网页变得难以理解,复杂的嵌套表结构成为控制页面布局的主要手段。文档的其余部分则充斥着 font 标记和 color 声明。原来的文档结构已经难以理清。
html 4 的出现就是为了结束这种混乱,它将表示逻辑推给了 css,为高级的内容定位引入了层(div)。和 html 3 相比这意味着代码编写模式上的变化。为了简化迁移的过程,通过 html 4 的 transitional 版本来支持旧的 html 3 结构。适用于高级用户的 strict 版本则要求将内容和表示彻底分开。
第一个 html 4 网站把 div 当作新的圣杯一样使用,页面中几乎每个需要略加修饰的元素都用上,包括(但不限于)头部。html style 属性是常见的描述表示细节的地方。最终从网页中消灭了泛滥成灾的表格。但内容和表示逻辑仍然混在一起。必不可少的 css 文件只有寥寥数行。
最近,一些知名的 web 开发人员为 html 4 样式表提出了一种更巧妙的办法。在现代浏览器中,css 属性并没有局限于 div 元素。只要愿意可以为任何 html 元素指定样式。很多 weblog 开始谈论语义 html。没有完全禁止 div 元素,但是网页编写者开始使用最适合描述其内容的 html 元素。比方说,多数网站的导航菜单最好用无序列表来描述。再比如,不对段落元素使用 bigheader 这样的类名,而改为 h1 元素,然后用 css 根据要求修改表示形式。
同时,w3c 提出 xhtml 1 作为符合结构良好而有效的 html 4 的 xml 版本。对于 xml 用户来说,这样做简化了将 xml 内容转化成网页并用已有验证程序检查转换结果的工作。xhtml 1.1 尝试将不同的问题隔离到不同的模块中。模块化方法便于针对不同的需要重用标准的不同部分,也有利于用新的功能扩展标准。
和 html 4 相比,xhtml 1.1 的用户甚至更多,把内容和表示分离开。但是和过去一样,一些实际问题只能使用 css 中技巧来解决。比如,无序列表表示的菜单结构通常包括漂亮的图片。但是,图像不大容易通过文本-语音设施读给有视觉障碍的人听。而且 lynx 这样的文本浏览器也不能显示图像。一个复杂的 css 技巧可以在浏览器中隐藏文本显示图像。但是如果不同页面上的菜单不同,就很难用 css 指定这部分内容了。
xhtml 2 背后最重要的设计理念是进一步分离内容和表示,改进 html 4 和 xhtml 1 残留的瑕疵。比如,为无序列表中的每项指定图像的原生支持。原来的 img src 标记换成了可用于任何元素的可选属性 src。修改后的 css 完全脱离了内容,不支持图像的设备很容易转而表示文本。
但 css 不是 web 开发人员的惟一挑战。大量的时间用于服务器和 html 表单的交互以及存在大量 javascript™ 代码。表单仅限于一维的键值对。开发 javascript 代码工作量很大,但是在文本-语音转换设备这样的接口上毫无用处。
基于模块化的方法,xhtml 2 用 xforms 模块替换了 html forms,使用适当的应用程序模型增加了对常见问题的支持。xforms 不需要一行脚本就能指定交互逻辑、验证规则和计算方法。此外,这种技术采用了丰富的 xml 结构而不是键值对,允许出现嵌套的子表单和重复的元素。除了提供一个强大的引擎外,文本-语音设备更适合改变应用程序的丰富性。
除了 xforms,还有其他一些 xhtml 有关的问题抽取为独立的规范满足其他需要 — 比如 xml events、xframes 和 ruby(亚洲语言)。
随着表示的分离,编程也从标准中分离出来。onclick 之类的交互属性被 xml events 模块代替。由于 xml events 规范本身就是为此而设计的,它提供了一组更强大的工具来处理用户接口。
对于 xhtml 2 的创新,总结而言其基本理念就是分解不同的问题。问题不再是 html 的次要特性,而成为新规范的主要目的。因此,新规范最适合优化面临的问题。不过,区别对待不同的问题是出于理念而不是实践的需要。熟悉使用这套工具的聪明的开发人员可以得到需要的结果。但是当前 html 版本的一般用户能否创建高质量的 xhtml 文档并不好说。
xhtml 2 的目标很可能不是一般 html 用户。但是在好的开发人员手中,可以作为增强可访问性的不错的方法。
whatwg 在设计 html 5 的时候采用了一种更符合实际的方法。没有考虑问题分解之类的抽象理念,这个工作组从当前主流浏览器的行为出发制定文档,和 w3c 规范完全不同。在上述分析的基础上,这个工作组调查了 html 的实际运用。
根据这些信息,工作组提出了旨在简化一般 web 开发人员工作的方案。虽然 html 5 宣称源于上一 html 版本,但其主要目标不是纯粹性。比如,模块化文档的主要目标是方便用优化的 web 应用程序替换。
基于此目的的模块化语言大大简化了 web 应用程序的开发。比如,html 5 支持数据表格、菜单和工具栏这类交互组件。使用默认行为的描述性 html 元素可以避免用大量代码模拟通用 div 的行为。
html 5 规范不限于 html 元素和属性。它定义了编辑文档和拖放式交互这类专用的 javascript api。这种方法和分解问题的办法截然不同。它简化了 web 开发人员 api 但增加了规范的大小。
html 5 和 html 4 的相似性远远超过 xhtml 2 和 xhtml 1 的相似性。迁移路径更平坦了,有经验的 html 4 开发人员熟悉新版本也更方便。新特性遵循相似的逻辑。特定元素的专门事件属性允许 html 编辑人员提供更适当的文本完成功能。
当前的 web 应用程序和服务器的交互依赖于异步 javascript + xml (ajax)。html 5 认识到了和服务器交互的重要性,定义了多种和网络交互、分发收到的服务器事件和从其他域向文档发送消息而不会造成安全问题的方式。
html 5 的基本设计理念是利用 web 开发人员需要的特性扩展 html 4。html 5 在继承 html 4 基本技术的同时进行了简化。为了解决 html v4 的不足,html v5 选择最简单直接的办法重新设计。
xhtml v2 和相关模块得到了 w3c 的官方支持,相关模块成为 w3c 支持的其他 xml 规范的重要因素。不幸的是,w3c 的官方认可不能保证主流 web 浏览器的支持。支持一般的 xhtml v2 不是问题:现代浏览器已经支持很多功能。正确地使用 xhtml v2 依赖于相关模块的可用性。在撰写本文的时候,microsoft 是否要扩展 windows® internet explorer® 以支持 xml events 和 xforms 这些特性还不清楚。一种 mozilla xforms 插件,包括 xml events,已经开发了数年。该插件提高了这种技术的功能,降低了实现的难度。
html v5 规范的编写保持了和浏览器厂商的深入沟通,始终考虑到实现的问题。尽管该团队对 w3c 官方认可表示怀疑。faq 甚至没有正式回答什么时候通过正式批准的问题。不论 w3c 的态度如何,浏览器厂商似乎决定实现非正式的 html 5 标准。浏览器厂商赶在官方标准出炉之前已不是第一次了。
到目前为止,html 5 和 xhtml 2 都还不是正式的推荐标准。将来一些细微的地方还可能变化。但它们的发展方向不会变,两者都解决了现行标准存在的一些不足。未来的浏览器如何增加对这两种新标准的支持还有待观察。当前浏览器同时支持 html 4 和 xhtml 1。类似地,将来的浏览器可能同时支持 html 5 和 xhtml 2。这两种标准都有各自的支持者。
如果对 xhtml 1.1 比 html 4 更关心,希望创建的文档能够支持不同的设备,可能更偏爱 xhtml 2。如果使用 xhtml 1 仅仅是因为它符合 xml 标准,而更喜欢 html 5 的新特性,xhtml 5(用 xml 改写的 html 5)也许是您的最佳选择。
html 5 颇受使用 html 4 开发交互式 web 应用程序的开发人员的欢迎。对于使用所见即所得 文档编辑器的站点这种方法更可行。但是要具体情况具体分析,html 4 和 xhtml 1 很可能要并存很长时间。
新闻热点
疑难解答