您的位置: 首页 > 技术文档 > 网络编程 > Thinking XML #1
Asp常见问题(新手) 回到列表 DW+ASP 玩转动态二级菜单
 Thinking XML #1

作者:Uche Ogbuji 时间: 2003-11-27 文档类型:转载 来自:

原文出处:http://www-900.ibm.com/developerWorks/cn/xml/rdf/part1/index.shtml

编者按:实际上这是一篇很老的文章了,不过Thinking XML这一系列的文章仍然在IBM : 中国网站更新着。Uche Ogbuji 是 4Suite,它是一个用于 XML、RDF 和知识管理应用程序的开放源码平台。Ogbuji 先生是一位出生于尼日利亚的计算机工程师和作家,他现在美国科罗拉多州博耳德(Boulder)生活和工作。可以通过 uche.ogbuji@fourthought.com 与 Ogbuji 先生联系。

这篇对 XML 和语义的讨论揭开了这个由 Uche Ogbuji 撰写的专栏的序幕,本专栏讨论了 XML 知识管理方面的问题,包括元数据、语义、资源描述结构 (RDF)、主题映射和自主主体。本专栏从实践的角度来剖析这个主题,因此它针对的读者是程序员,而不是针对理论家。

“XML 编程思想”这个新专栏将讨论 XML 和知识体系结构 (KA) 的交汇处。知识体系结构听起来象是一句行话,但它其实只是一个涵盖面很广的术语,是指当今 XML 逐步走向成熟时出现的一些非常有用的技术。元数据管理、语义透明性和自主主体都是 XML 独有的概念,但 XML 对统一结构化语法和半结构化语法的承诺有助于将几乎不可能的事变成切实可行的。

区分本专栏和许多此类主题讨论的主要特征是我将针对程序员展开讨论,而不是针对理论家。我将讨论一些开发工具和技术,它们可以让开发人员使用 XML 更好地收集和浏览隐藏在数据中的知识,无论这些数据是在公司的数据库中还是在 Web 上。这听上去象是在夸夸其谈,但本专栏的各篇文章其实是一个循序渐进的过程,决不会脱离常识。

本专栏的前两篇文章介绍了预备知识,因此它们可能会稍微偏离我的基本规则“重代码,轻理论”。前两篇专栏文章将讨论 XML 的语义和相关词汇。我只用现有产品来讨论其创始过程,以供开发人员了解,但现在还不会展示许多实用代码。

究竟什么是语义?
那么,什么是语义?因为语义这个单词的特殊性,每个人对语义定义的观点都各有不同。一般来说,语义是构建在公用语法上的系统中 XML 数据的一层规范。这就引出了许多标记了 XML 语义的概念。

它们包括:

  • 元素类型名称、属性名称和某些情况下内容术语的解释
  • 用于用有效文档引导事务的处理规则(也称作商业规则)
  • 一个文档中的结构化元素与另一个文档中的结构化元素之间的关系

当然,在这三概念之间有一些重叠。

反观语义
两年前,我写了一篇文章在 Sunworld(现在称作 Unix Insider:请参阅参考资料)上发表,这篇文章研究了新的 XML 如何适应电子数据交换 (EDI) 的世界。促使 EDI 回到 70 年代的事件之一就是对统一商业事务词汇的承诺,以便改进不同公司的信息系统之间的电子通信自动化。

EDI 为特定业界定义了一种特殊语法和一套特殊语义 -- 一些是普通语义,而另一些是非常特殊的语义。XML 目前有明确的语法和结构,但它没有提语义透明性。语义透明性可以使 XML 机器建立元素(比如,PurchaseOrderPO)和根据该元素执行专门操作的高阶处理之间的关系。总而言之,它意味着数据中的表达式如实地表示了相应概念的含义。语义透明性的最终测试是如果某个人使用适用于 XML 处理软件的机制,他能否正确理解 XML 数据的含义。

显然,单靠 XML 根本无法实现语义透明性,这正是那么多 XML 技术专家关注语义透明性的原因。如果 XML 系统不能实现语义透明性,那么这些系统可能就不符合有三十几年历史的 EDI,就不能成为一种自动电子交易的方式。

关于 XML 实现语义透明性的必要性还有一些争论。在完成 XML 1.0 规范之前,各种团体都期望开发语义透明性的机制。实际上,某些创意没有考虑到 XML;它们期望(至今仍是这样)成为集 SGML、XML、EDI、表格式报表和其它机器格式的术语于一身的通用权威。

关于 ISO BSR
机器可读语义的业界元老自有其 EDI 基础:自 1998 年开始开发的 ISO 基本语义字典 (BSR),其主旨是“充当参考中心,辅助跨商业、工业和管理的数据的通用、多语言理解”。这个宏伟的目标似乎只有 ISO 才能承担,然而 BSR 却迟迟不能完成。

目前已经建立了基本规则(出版物 ISO 16668:2000),ISO 已经收集了一个试用集合,有几千项,例如 AccountsPayablesContactParty.CustomerAssigned.IdentifierContract。一旦完成,BSR 可以让程序员使用合成 XML 模式,如以下 DTD 片段:
<!ELEMENT AccountsPayables.Contact (ContactParty.CustomerAssigned.Identifier)>
<!ELEMENT ContactParty.CustomerAssigned.Identifier (#PCDATA)>

假设那些元素是由制造公司使用的报表格式,该公司将其会计工作外包给另一家公司。那么,XML 词汇的开发人员将从以下方式中得到语义透明性的好处:

  • 开发人员确保所使用的元素类型名称符合 BSR 中的等价概念,以最小化元素含义的多义性。制造商可以与会计人员讨论数据,并确保双方都认同所表达的内容。
  • 由于术语的含义非常清楚,因此将此格式映射成会计学的标准格式比完成此类任务的常规做法更简单,它甚至可以自动完成。即使制造商使用 EDI,而会计人员使用 XML,这种简单映射仍是可行的。
  • BSR 中的含义指出了元素之间的关系,例如 ContactParty.CustomerAssigned.Identifier 元素和报表中别处或另一个文档中的 Contract 元素。

即便在这个初级阶段,也可以使用 BSR 进行实验,因为全球信息定位服务 (GILS) 已经创造了试用 BSR 项的 RDF 模式和 XML 模式编译。GILS 是美国政府的倡议,它涵盖了用于寻找结构化信息的技术和资源。GILS BSR 编译是一个有价值的资源,它已经涵盖了在常规政府与私人交流中使用的常用术语。

但是,请注意这个初始集合是实验性的。不仅描述非常粗略,而且 XSchema 和RDFS 表示中还有语法错误。

我建议查看 BSR,因为它影响着重要组织,如 UN/CEFACT(全球范围)、CEN/ISSS(欧洲)和 DISA(美国)。

统一欧洲和美国的术语
CEN/ISSS 值得一提,这个组织在 XML/EDI 的领域中做了大量工作。CEN/ISSS 是负责促进欧盟中信息系统标准化的委员会。虽然据官方声称,它的 XML/EDI 工作仍处于试行阶段,但 CEN/ISSS 已经创建了一个综合结构,用于将 EDI 的 UN/EDIFACT 风格转换成 XML。这个转换结构包括 DTD 生成规则和熟悉 EDI 的开发人员可以试用的样本。其结果的确很复杂,但 EDI 的悠长历史确保了这两个字段和 XML/EDI 中使用的消息流都是非常明确的。

显然,开发 EDI 的组织在处理 XML 语义方面跳跃了一大步。其中不带 EDI 标记的主要代表是 Microsoft。在 1999 年,Microsoft 推出了 BizTalk 结构。BizTalk 是 Microsoft、其伙伴和业界组织用于注册模式、进程描述和样本 XML 文件的库。其旨在充当 XML 格式和相关进程的交换所,这是它成为实现语义透明性的重要力量。

部分是因为它是由一家公司开发的,部分是因为常用行业政策,BizTalk 已经成为激烈争论的主题。某些人将它看作是 Microsoft 通过在语义问题上建立霸权以达到掠夺 XML 的目的。不管政策如何,现在已经出现了在 BizTalk 结构中工作的工具。许多工具都是类似于 XML 解决方案的映射软件,它们提供了 GUI 以便将一个词汇映射成词汇。同样,开发人员可以开始使用基于 SOAP 的 BizTalk XML 消息格式的公开规范。遗憾的是,如果要执行重要的 BizTalk 消息传递,需要使用 Microsoft 的商业 BizTalk 服务器产品。

该领域中的新生事物
我没有涵盖部分相关的工作,如 OMG 的 XML 元数据交换 (XMI),或 Unisys 的通用库 (UREP),因为它们的主要目的是交换应用程序开发模型(虽然 XMI 和 UREP 与 XML 有一些关系)。

在这篇文章中,我讨论了 XML 语义这个舞台上的一些重要演员。然而,现在该领域中的许多活动来自于新生代,如 ebXML、UDDI 和 eCo,以及纵向联合行业组织的工作。在下一篇文章中,我将讨论这些新加入者更实际的方面。

参考资料

  • Uche Ogbuji 撰写的 XML: The future of EDI? 讨论了即将问世的 XML 可能会替代 EDI;这篇文章接触了有关语义的问题。
  • Robin Cover 在 1998 年研讨会上发表的论文 XML 和语义透明性权威地总结了这些问题。
  • 国际标准组织 (ISO) 基本语义字典 (BSR) 是构建关于跨行业、国家和语言的数据元素含义的主要权威的创始人。
  • 全球信息定位服务 (GILS) 创造了 RDF 模式XML 模式格式的 ISO BSR 的早期编译。
  • CEN/ISSS 是负责信息系统标准化的欧洲委员会,它已经产生了 XML/EDI 试行项目的中期报告,这是该领域中最先进的成果之一。
  • 口号是“库、模板、代理”的 XML/EDI 小组从事于以 XML 格式促进 EDI 实践,通常是自动处理公司之间的事务。
  • Microsoft 的 Biztalk 是表示商业事务的模式库和 XML 消息的结构。BizTalk 文档和消息规范已经公开。

出处:
责任编辑:handmade

◎进入论坛网络编程版块参加讨论

相关文章 更多相关链接
建立XSLT页可视化操作XML数据
重构、标准、布局
网站设计的标准时代
跟我学XSL(二)
跟我学XSL(一)
关键字搜索 常规搜索 推荐文档
热门搜索:CSS Fireworks 设计比赛 网页制作 web标准 用户体验 UE photoshop Dreamweaver Studio8 Flash 手绘 CG
站点最新 站点最新列表
周大福“敬•自然”设计大赛开启
国际体验设计大会7月将在京举行
中国国防科技信息中心标志征集
云计算如何让安全问题可控
云计算是多数企业唯一拥抱互联网的机会
阿里行云
云手机年终巨献,送礼标配299起
阿里巴巴CTO王坚的"云和互联网观"
1499元买真八核 云OS双蛋大促
首届COCO桌面手机主题设计大赛
栏目最新 栏目最新列表
浅谈JavaScript编程语言的编码规范
如何在illustrator中绘制台历
Ps简单绘制一个可爱的铅笔图标
数据同步算法研究
用ps作简单的作品展示页面
CSS定位机制之一:普通流
25个最佳最闪亮的Eclipse开发项目
Illustrator中制作针线缝制文字效果
Photoshop制作印刷凹凸字体
VS2010中创建自定义SQL Rule

蓝色理想版权申明:除部分特别声明不要转载,或者授权我站独家播发的文章外,大家可以自由转载我站点的原创文章,但原作者和来自我站的链接必须保留(非我站原创的,按照原来自一节,自行链接)。文章版权归我站和作者共有。

转载要求:转载之图片、文件,链接请不要盗链到本站,且不准打上各自站点的水印,亦不能抹去我站点水印。

特别注意:本站所提供的摄影照片,插画,设计作品,如需使用,请与原作者联系,版权归原作者所有,文章若有侵犯作者版权,请与我们联系,我们将立即删除修改。

您的评论
用户名:  口令:
说明:输入正确的用户名和密码才能参与评论。如果您不是本站会员,你可以注册 为本站会员。
注意:文章中的链接、内容等需要修改的错误,请用报告错误,以利文档及时修改。
不评分 1 2 3 4 5
注意:请不要在评论中含与内容无关的广告链接,违者封ID
请您注意:
·不良评论请用报告管理员,以利管理员及时删除。
·尊重网上道德,遵守中华人民共和国的各项有关法律法规
·承担一切因您的行为而直接或间接导致的民事或刑事法律责任
·本站评论管理人员有权保留或删除其管辖评论中的任意内容
·您在本站发表的作品,本站有权在网站内转载或引用
·参与本评论即表明您已经阅读并接受上述条款
推荐文档 | 打印文档 | 评论文档 | 报告错误  
专业书推荐 更多内容
网站可用性测试及优化指南
《写给大家看的色彩书1》
《跟我去香港》
众妙之门—网站UI 设计之道
《Flex 4.0 RIA开发宝典》
《赢在设计》
犀利开发—jQuery内核详解与实践
作品集 更多内容

杂⑦杂⑧ Gold NORMANA V2