入门基础知识,架构简介

不必对术语“架构”望而生畏。架构只不过是一种包含某些规则的 XML
文件,这些规则用来定义 XML
数据文件中能包含哪些内容,不能包含哪些内容。架构文件通常使用 .xsd
文件扩展名,而 XML 数据文件使用 .xml 扩展名。

您可能听 IT 部门的人员说过“标准格式”的 XML。标准格式的 XML
文件遵循一组管理 XML 的、非常严格的规则。如果文件不遵循这些规则,XML
就会停止运行。例如,在上面的代码示例中,每一个开始标记都有对应的结束标记,因此该示例遵循一种标准格式的规则。如果您删除一个标记,然后尝试在一个
Office
程序中打开该文件,您将会看到一条错误消息,并且该程序会阻止您使用该文件。

最近接触到了TVML,平时也会使用过XML。在这里也整理XML简易语法规则以便回顾查阅。文章主要介绍
XML 文档的基础结构,以及创建构造良好的 XML
需要遵循的规则,包括命名约定、正确的标记嵌套、属性规则、声明和实体。

程序可以使用架构来验证数据。架构为数据提供了结构框架,可以帮助创建者和任何其他用户理解数据。例如,如果用户输入无效数据,程序就会提示用户输入正确的数据。只要
XML 文件中的数据遵循给定架构中的规则,任何支持 XML
的程序都可以使用该架构读取、解释和处理这些数据。例如,如下图所示,Excel
和 Word 都可以根据 CAT 架构来验证 数据。

您不必了解创建标准格式 XML 的规则,但确实需要记住:只有在 XML
数据采用了标准格式的情况下,才可以在程序和系统之间共享该数据。如果某个
XML 文件无法打开,则该文件很可能不是标准格式的。


图片 1

XML 还不受平台的限制,这意味着,无论硬件或操作系统是什么,为使用 XML
而构建的任何程序都可以读取和处理 XML 数据。例如,利用正确的 XML
标记,就可以使用桌面程序打开和处理大型机中的数据。另外,无论是谁创建了
XML 数据体,您都可以通过若干 Microsoft Office 2003 和 Microsoft Office
专业版 2007 程序(包括 Microsoft Office Access 2007、Microsoft Office
Word 2007、Microsoft Office InfoPath 2007 和 Microsoft Office Excel
2007)处理相同的数据。由于 XML
具有可移植性,它已成为用于在数据库和用户桌面之间交换数据的最受欢迎的技术之一。

XMLHTML

标记语言从早期的私有公司和政府制定形式逐渐演变成标准通用标记语言(Standard
Generalized Markup Language,SGML)、超文本标记语言(Hypertext Markup
Language,HTML),并且最终演变成 XML。SGML
比较复杂,HTML(实际上仅是一组元素集)在识别信息方面不够强大。XML
则是一种易于使用和易于扩展的标记语言。

总之,我们可以使用 XML 创建自己的元素,从而能够更精确地表示自己的信息。


架构可能非常复杂,教您怎样创建架构并不属于本文的范畴。(另外,IT
部门人员应该知道如何创建架构。)不过,了解架构的外观还是有用的。下面的架构定义了
… 标记集的规则。

图片 2

构建 XML

XML 文件由 内容标记 组成。通常,标记包围内容。


如果不理解上面示例中的内容,不必担心。只需要记住以下事项:

除了使用标准格式的标记数据之外,XML
系统通常还使用其他两种组件:架构和转换。以下部分将介绍这两种组件的工作方式。

创建 XML 文件

XML 文档的第一行通常是一个 XML 声明。
形式:<?xml version="1.0" encoding="utf-8"?>
作用:将文件识别为 XML 文件,有助于工具和人类识别 XML(不会误认为是 SGML
或其他标记)。
PS:什么情况下通常忽略这个可选信息?打算将多个小的 XML 文件合并为一个大
XML 文件。

-示例架构中的行项目被称为“声明”。如果需要有关宠物的其他信息,IT
部门可能需要向架构中添加声明。您可以根据业务需求的变化来更改 XML 系统。
-声明对数据结构具有较强的控制能力。例如, 声明表示 和
等标记必须按照上面列出的顺序显示。声明也可以控制用户输入的数据类型。例如,上面的架构要求猫的年龄必须为正数,而对于
ALTERED 和 DECLAWED 标记则必须为布尔值。 -当 XML
文件中的数据遵循架构所提供的规则时,数据就是有效数据。根据架构检查 XML
数据文件的过程称为“验证”。架构的突出优点是可以帮助防止数据损坏。使用架构也可以很容易地发现损坏的数据,因为
XML 遇到问题时将会停止运行。

创建根元素

一个文件只能有一个根元素,并且需要使用 “包装器”
包含它。一个文件只能有一个根元素,并且需要使用 “包装器”
包含它。内容和其他标记必须放在 根元素 中间。

命名元素

命名时需要注意的地方:
· 元素名中不能出现空格。
· 名称只能以英文字母开始,不能是数字或符号。
· 对大小写没有限制,但前后要保持一致,以免造成混乱。