XML 国际化和本地化开发
[绝版]基本信息
- 原书名: XML:Internationalization and Localization
- 原出版社: SAMS
- 作者: (法)Yves Savourel [作译者介绍]
- 译者: 李二勇 等
- 丛书名: Internet新技术丛书
- 出版社:机械工业出版社
- ISBN:7111095014
- 上架时间:2002-2-22
- 出版日期:2002 年1月
- 页码:384
- 版次:1-1
- 所属分类:
计算机 > 软件与程序设计 > 网络编程 > XML
内容简介回到顶部↑
本书通过大量完整的示例,全面深人地探讨了XML在国际化和本地化领域里的应用,是广大全球化工作者的必备资料。主要内容包括:XML在国际化和本地化领域里的基本特征,使用XML进行全球化之前应做的准备工作,应用XML进行本地化的技术、工具和规范。附录包括大量参考信息。
本书内容深入浅出,适合从事于国际化和本地化的人员参考,也适合于对这个领域感兴趣的读者。
本书内容深入浅出,适合从事于国际化和本地化的人员参考,也适合于对这个领域感兴趣的读者。
作译者回到顶部↑
本书提供作译者介绍
Yves Savourel从事国际化与本地化工作已逾十年:最初在 International Laflgunge Eflgineering(ILE),后来在Sykes公司,目前在RWS集团任职。他的第一个本地化项目是使用6种语言和 IBM汇编器本地化 Wordstar 7版。由于疲于处理手工调整字符串的枯燥工作,因此 Yves编写了一个工具程序执行这项任务。这引起了更多工具程序的出现,并最终导致ILE研发组的创建。
在开设软件国际化课程和提供咨询的同时,Yves主要一直关注着用于本地化处理的工具和解决方案的进展。SGML和XML就是这些进展.. << 查看详细
在开设软件国际化课程和提供咨询的同时,Yves主要一直关注着用于本地化处理的工具和解决方案的进展。SGML和XML就是这些进展.. << 查看详细
目录回到顶部↑
第1章 使用xml进行全球化
1.1 标记语言
1.2 开发周期的关键组成部分
1.3 国际化
1.3.1 启用
1.3.2 准备本地化
1.4 本地化
1.4.1 分析
1.4.2 准备
1.4.3 翻译与编辑
1.4.4 后处理
1.4.5 校对与qa
1.5 xml难题
1.5.1 数据的类型
1.5.2 修补文档
1.5.3 随选文档
1.5.4 单源文档
1.6 语言难题
1.6.1 字符集
1.6.2 标点和符号
1.1 标记语言
1.2 开发周期的关键组成部分
1.3 国际化
1.3.1 启用
1.3.2 准备本地化
1.4 本地化
1.4.1 分析
1.4.2 准备
1.4.3 翻译与编辑
1.4.4 后处理
1.4.5 校对与qa
1.5 xml难题
1.5.1 数据的类型
1.5.2 修补文档
1.5.3 随选文档
1.5.4 单源文档
1.6 语言难题
1.6.1 字符集
1.6.2 标点和符号
前言回到顶部↑
太阳高高地挂在天空,空中飘着朵朵白云,空气潮湿又闷热。Borneo是热带的一个大岛,位于巴布亚新几内亚的北部。这里远离西方文明,远离计算机和屏幕,我渴望真正地度假。没有自来水和空调,只有天空、树木、泥泞和荒原。我们的小艇在Sukau河的latte色的河水中缓慢而稳稳地行驶,河的两岸布满了茂密的植被。引擎的低声轰鸣几乎被森林的噪声所掩盖。
我们行驶到一个地方,有一段半沉在水中的树干堵住了航道,不得不减慢速度。船家抓着他的长杆,引导着小船慢慢地通过了障碍。
突然,一声怪异的尖叫刺破了丛林的低吟。当我正在猜想是什么乌发出这种令人讨厌的声音时,只见船家走到他脚边堆着的衣服旁,拿出一个小黑匣子凑近耳朵,开始用马来语讲话。太离奇了!他将蜂窝电话夹在肩膀和耳朵之间,继续引导小船通过水流,正如硅谷的穿行者驾驶着汽车在交通拥挤的车流中迂回前进一般。
我听不懂他说些什么,但他看上去很激动,对着我们微笑。我忘记了蜂窝电话的闯入,甚至喜欢上了它,因为可能是营地的某些人在返回途中发现了一些有趣的鸟或动物,并且及时提醒我们,我们将在适当的时间在适当的地方见到它们。我更加专注地听着,突然我听到一个词:“Internet”。不,这不可能。我的脑子混乱了几秒钟,我坚守着不可能的信念,即由于某种奇怪的巧合,这个词其实就是长鼻猴或白冠犀鸟的亚种的本地名字,但事情并不幸运,在听到了“server”和“ISP”后,我必须面对事实,即我们友好的船家 Ahmed还有神秘的一面——他还是位Web站点管理员。
许多个月后,我在亚马逊森林中徒步旅行。在高高的树冠的遮蔽下,我走在一条通往OX一bow湖的泥泞小路上去观察Piranhas鱼。途中我们稍作停留以指明狼蛛的洞穴和稀有鸟类的巢穴,而在行进期问,我们的秘鲁向导 Hernando热情地谈论着他在学校上的 HTML课程以及最新的万维网技术。
不久前在 Radjasthan,我走在 JahiPur拥挤而五颜六色的大街上,不禁观察起许多因特网广告牌子。Kriss是我们的印度向导,总是面带微笑,他注意到这些牌子后,开始非常热情地谈起他的另一份工作:他正在开办一家因特同企业。
毫无疑问,因特网无处不在,它带来了变化并开阔了人们的视野。即使在世界上最偏远的地方,因特网也很流行。它触及每种文化并在许多城市和村庄中扎根。无论在哪里,它都带来变化。有些变化我们已经注意到,而有些变化我们尚未彻底了解。
这个全球体系的核心就是数据:传输、显示、翻译、解析、存储、搜索、编制索引。数据总是在改变和扩展。
当技术适应新的领域时,XML用得越来越多,而当内容扩展到新的领域时,英语用得越来越少。
明天甚至可能在你阅读本书时,Ahmed、Hernando和Kriss将以他们自已的语言(马来语、西班牙语以及北印度语)创建数据,并将其存储在XML文档中。许多人将和他们一道创建资料库和基于XML的系统,试图进入最新可获得的市场。在基于XML的系统里,内容必须适应不同的语言和文化。
本书旨在帮助读者理解要创建这些启用XML的系统都需要什么,并提供适当的方法以更有效地本地化数据。
本书读者范围
本书针对处理多语言XML内容的计算机专业人员,以及任何想要了解如何创建可无缝本地化的XML的人员。
其他人如本地化专业人员也应该阅读本书。本书可以提高XML的国际化方面的知识水平,以及简化翻译XML内容的过程。另外,无论项目是否拥有XML组成部分,在本地化过程中越来越多地应用到XML。
处理XML的数据库体系结构设计者也可用到本书的许多章节,多语言网站开发人员以及涉及内容管理的人员都可用到本书。
本书结构
本书分为20章。你不必依次阅读,可以挑拣适合你目前的兴趣的主题,但是,深刻理解第2章“字符表示法”将有助于阅读本书的其他部分。
第1章从标记语言的观点开始论述国际化和本地化。该章还提出了由XML或语言带来的主要难题。第一部分启用XML材料
第2章解释XML文档中如何处理字符以及与编码有关的问题。
第3章提出了特殊文本属性的选集,这些属性可在任何文档中使用,而且XML为其提供了特殊结构。
我们行驶到一个地方,有一段半沉在水中的树干堵住了航道,不得不减慢速度。船家抓着他的长杆,引导着小船慢慢地通过了障碍。
突然,一声怪异的尖叫刺破了丛林的低吟。当我正在猜想是什么乌发出这种令人讨厌的声音时,只见船家走到他脚边堆着的衣服旁,拿出一个小黑匣子凑近耳朵,开始用马来语讲话。太离奇了!他将蜂窝电话夹在肩膀和耳朵之间,继续引导小船通过水流,正如硅谷的穿行者驾驶着汽车在交通拥挤的车流中迂回前进一般。
我听不懂他说些什么,但他看上去很激动,对着我们微笑。我忘记了蜂窝电话的闯入,甚至喜欢上了它,因为可能是营地的某些人在返回途中发现了一些有趣的鸟或动物,并且及时提醒我们,我们将在适当的时间在适当的地方见到它们。我更加专注地听着,突然我听到一个词:“Internet”。不,这不可能。我的脑子混乱了几秒钟,我坚守着不可能的信念,即由于某种奇怪的巧合,这个词其实就是长鼻猴或白冠犀鸟的亚种的本地名字,但事情并不幸运,在听到了“server”和“ISP”后,我必须面对事实,即我们友好的船家 Ahmed还有神秘的一面——他还是位Web站点管理员。
许多个月后,我在亚马逊森林中徒步旅行。在高高的树冠的遮蔽下,我走在一条通往OX一bow湖的泥泞小路上去观察Piranhas鱼。途中我们稍作停留以指明狼蛛的洞穴和稀有鸟类的巢穴,而在行进期问,我们的秘鲁向导 Hernando热情地谈论着他在学校上的 HTML课程以及最新的万维网技术。
不久前在 Radjasthan,我走在 JahiPur拥挤而五颜六色的大街上,不禁观察起许多因特网广告牌子。Kriss是我们的印度向导,总是面带微笑,他注意到这些牌子后,开始非常热情地谈起他的另一份工作:他正在开办一家因特同企业。
毫无疑问,因特网无处不在,它带来了变化并开阔了人们的视野。即使在世界上最偏远的地方,因特网也很流行。它触及每种文化并在许多城市和村庄中扎根。无论在哪里,它都带来变化。有些变化我们已经注意到,而有些变化我们尚未彻底了解。
这个全球体系的核心就是数据:传输、显示、翻译、解析、存储、搜索、编制索引。数据总是在改变和扩展。
当技术适应新的领域时,XML用得越来越多,而当内容扩展到新的领域时,英语用得越来越少。
明天甚至可能在你阅读本书时,Ahmed、Hernando和Kriss将以他们自已的语言(马来语、西班牙语以及北印度语)创建数据,并将其存储在XML文档中。许多人将和他们一道创建资料库和基于XML的系统,试图进入最新可获得的市场。在基于XML的系统里,内容必须适应不同的语言和文化。
本书旨在帮助读者理解要创建这些启用XML的系统都需要什么,并提供适当的方法以更有效地本地化数据。
本书读者范围
本书针对处理多语言XML内容的计算机专业人员,以及任何想要了解如何创建可无缝本地化的XML的人员。
其他人如本地化专业人员也应该阅读本书。本书可以提高XML的国际化方面的知识水平,以及简化翻译XML内容的过程。另外,无论项目是否拥有XML组成部分,在本地化过程中越来越多地应用到XML。
处理XML的数据库体系结构设计者也可用到本书的许多章节,多语言网站开发人员以及涉及内容管理的人员都可用到本书。
本书结构
本书分为20章。你不必依次阅读,可以挑拣适合你目前的兴趣的主题,但是,深刻理解第2章“字符表示法”将有助于阅读本书的其他部分。
第1章从标记语言的观点开始论述国际化和本地化。该章还提出了由XML或语言带来的主要难题。第一部分启用XML材料
第2章解释XML文档中如何处理字符以及与编码有关的问题。
第3章提出了特殊文本属性的选集,这些属性可在任何文档中使用,而且XML为其提供了特殊结构。
序言回到顶部↑
本书出版之际恰逢北京申奥成功,而且正值中国加入WTO之时。这些都预示着中国将越来越多地参与全球经济技术的合作与竞争。中国产品,尤其是软件产品,如何在世界范围内赢得尊重,如何在市场上获得足够的份额?这对于我们的大多数软件企业而言都是必须面对的课题。而本书正是从软件产品全球化的特点切入,并以XML这一最新的智能语言为基石,深入地介绍了标记语言在软件国际化和本地化领域内的有力应用,弥补了国内同类技术的空白。
由于本书主要说明XML标记语言在国际化领域内的应用,所以不得不首先介绍XML。XML是eXtensible Markup Languape(可扩展标记语言)的英文首字母缩写,是SGML(标准通用标记语言)的子集。它是为国际互联网上日益增长的专用格式的数据而设计的。例如,化学家想要在Web上传输和交换新合成的有机高分子的结构数据,那么他们就可以定义和使用自己的XML标记,包括C原子数标记、H原子数标记和空间构型标记等等,这样人们就能直观地看到数据本身所表示的含义。当然,XML中的通用标记在任何行业内都可使用,即使这
些行业在未来获得了巨大发展,从而发明了新的名词和概念,它们也无须修改早已制订好的文档类型定义(DTD),就可以使用现有标记来表示新的数据成员。此外,XML文档中数据与格式是截然分开的。就是说,对于同一个表示碳氢化合物的分子组成和结构的XML文档而言,它既可以在屏幕上以三维虚拟现实的方式显示,也可以通过打印机输出为文本和图形格式的混合文件。用于修饰XML数据的样式文件称为XSL(可扩展样式语言)文件。在本书中,读者将看到XML文档如何与XSL文件完美地结合,从而实现高效的翻译过程。
国际化和本地化具有一个共同的性质,即都需要将使用源语言的文档翻译为目标语言的文档。例如将欧美市场上使用的英语文本汉化,这就需要将文本编码转换为GB2312、从单字节转换为双字节、从字母文字转换为会意文字,甚至将普通话南方音与北方音区分开来。这些要用到的基本元素和技术将在本书第一部分中说明。全球化过程可分为三个步骤:开发编写、翻译和测试。产品文档从编写开始,就需要考虑到XML的要求,然后在前处理、翻译和后处理中进行行业化的转换,而最后对译文进行校对和验证,以满足使用XML发布的要求。本书第二部分将重点介绍XML的一些关键技术在全球化过程中的应用。而这期间文档编写和翻译人员不可避免地要使用到一些工具软件和辅助技术,这些内容在书中第三部分以产品测试的形式提供给读者。
总之,充分利用XML的可扩展和智能特性,企业可以更快及更好地对产品文档进行更新,从而能够更迅捷地应对全球市场的风云变幻,并能削减由产品的国际化和本地化而带来的额外成本。希望本书的出版可以推动国内全球化领域的技术进展,并为软件业提供最新的竞争手段。
参与本书翻译工作的人员有李二勇、刘莹、洪涛、于京生、钟鸣、蒋唯沧、康仑、白致铭、邹田春、曹华、李德志、周健、王景茹、张新园、左磊等。本书由前导工作室统稿。前导工作室全体工作人员共同完成了本书的翻译、录排、校对等工作。由于时间仓促,而且水平有限,书中难免有不当之处,恳请读者批评指正。如果你对本书有疑问或意见,可以向前导工作室发电子邮件: qiandao@263.net。我们会尽力解决你的问题。
2001年8月
由于本书主要说明XML标记语言在国际化领域内的应用,所以不得不首先介绍XML。XML是eXtensible Markup Languape(可扩展标记语言)的英文首字母缩写,是SGML(标准通用标记语言)的子集。它是为国际互联网上日益增长的专用格式的数据而设计的。例如,化学家想要在Web上传输和交换新合成的有机高分子的结构数据,那么他们就可以定义和使用自己的XML标记,包括C原子数标记、H原子数标记和空间构型标记等等,这样人们就能直观地看到数据本身所表示的含义。当然,XML中的通用标记在任何行业内都可使用,即使这
些行业在未来获得了巨大发展,从而发明了新的名词和概念,它们也无须修改早已制订好的文档类型定义(DTD),就可以使用现有标记来表示新的数据成员。此外,XML文档中数据与格式是截然分开的。就是说,对于同一个表示碳氢化合物的分子组成和结构的XML文档而言,它既可以在屏幕上以三维虚拟现实的方式显示,也可以通过打印机输出为文本和图形格式的混合文件。用于修饰XML数据的样式文件称为XSL(可扩展样式语言)文件。在本书中,读者将看到XML文档如何与XSL文件完美地结合,从而实现高效的翻译过程。
国际化和本地化具有一个共同的性质,即都需要将使用源语言的文档翻译为目标语言的文档。例如将欧美市场上使用的英语文本汉化,这就需要将文本编码转换为GB2312、从单字节转换为双字节、从字母文字转换为会意文字,甚至将普通话南方音与北方音区分开来。这些要用到的基本元素和技术将在本书第一部分中说明。全球化过程可分为三个步骤:开发编写、翻译和测试。产品文档从编写开始,就需要考虑到XML的要求,然后在前处理、翻译和后处理中进行行业化的转换,而最后对译文进行校对和验证,以满足使用XML发布的要求。本书第二部分将重点介绍XML的一些关键技术在全球化过程中的应用。而这期间文档编写和翻译人员不可避免地要使用到一些工具软件和辅助技术,这些内容在书中第三部分以产品测试的形式提供给读者。
总之,充分利用XML的可扩展和智能特性,企业可以更快及更好地对产品文档进行更新,从而能够更迅捷地应对全球市场的风云变幻,并能削减由产品的国际化和本地化而带来的额外成本。希望本书的出版可以推动国内全球化领域的技术进展,并为软件业提供最新的竞争手段。
参与本书翻译工作的人员有李二勇、刘莹、洪涛、于京生、钟鸣、蒋唯沧、康仑、白致铭、邹田春、曹华、李德志、周健、王景茹、张新园、左磊等。本书由前导工作室统稿。前导工作室全体工作人员共同完成了本书的翻译、录排、校对等工作。由于时间仓促,而且水平有限,书中难免有不当之处,恳请读者批评指正。如果你对本书有疑问或意见,可以向前导工作室发电子邮件: qiandao@263.net。我们会尽力解决你的问题。
2001年8月







点击看大图

加载中...

