JS不完全国际化&本地化手册之理论篇

2019-11-20 08:52:06

字体：大中小

来源：转载

供稿：网友

前言

最近加入到新项目组负责前端技术预研和选型，其中涉及到一个熟悉又陌生的需求――国际化＆本地化。熟悉的是之前的项目也玩过，陌生的是之前的实现仅仅停留在"有"的阶段而已。趁着这个机会好好学习整理一下，为后面的技术选型做准备。
本篇将阐述国际化和本地化的概念，以及其中一个很重要的概念――Language tag(也叫Language code 或 Culture)。

何为国际化？

国际化我认为就是应用支持多语言和文化习俗(数字、货币、日期和字符比较算法等)，而本地化则是应用能识别用户所属文化习俗自动适配至相应的语言文化版本。
过去常常以为国际化就是字符串的替换――如"你好!"替换为"What's up, man!"，其实具体是分为以下5方面:

字符串替换
如"你好!"替换为"What's up, man!".
数字表示方式
如1200.01，英语表示方式为1,200.01，而法语则为1 200,01，德语则为1.200,01.
货币表示方式
如人民币￥1,200.01，美元表示方式为$1,200.01，而英语的欧元则为,200.01，德语的欧元则为1.200,01 /code>. 注意: 这里没有还没算上汇率呢.

  日期表示方式
   如2016年9月15日，英语表示方式为9/15/2016, 而法语为15/9/2016, 德语为15.9.2016.
    字符比较算法
   如ä和z比较时，英语、德语中均是ä排在z前面，而在瑞典语中则是z排在ä前面.
  本地化的关键 ―― Language Tag
   既然要自动适配至用户所属的语言文化版本，那么总得有个根据才能识别吧？我想大家应该对zh-CN和en等不陌生吧，而它们正是我们所需的根据了！在我们使用已有i18n库实现国际化/本地化时，必定会写下以下文档
  { "en": { "name": "Enter Name" }, "zh-CN": { "name": "输入姓名" }}
   但除了en和zh-CN还有其他键吗？它们的组成规则又是如何的呢？下面我们来稍微深入的了解这些Language Tag吧！

`语法规则`

注意以下采用ABNF语言描述(ABNF的语法请参考语法规范：BNF与ABNF)

Language-Tag = langtag    / privateuse    / grandfatheredlangtag = language   ["-" script]   ["-" region]   *("-" variant)   *("-" extension)   ["-" privateuse]

可以看到Language-Tag分为langtag，privateuse 和 grandfatherd三个子类,下面我们先了解一般情况用不上的两个吧！ privateuse 标签的意思不由subtag registry定义，而是由使用的团队间私自定义、维护和使用。格式:

privateuse = "x" 1*("-" (1*8alphanum))

示例:x-zh-CN是privateuse，其意思不一定与languagezh-CN一致。注意: 只作为小集团内部用可以，决不能大范围适用。

grandfathered 用于向后兼容。由于RFC 4646前的标签无法完全匹配当前registry的标签语法和意思，因此通过grandfathered来提供向后兼容的特性。语法:

grandfathered = irregular    / regualrirregular = "en-GB-oed"   ; irregular tags do not match   / "i-ami"    ; the 'langtag' production and   / "i-bnn"    ; would not otherwise be   / "i-default"   ; considered 'well-formed'   / "i-enochian"  ; These tags are all valid,   / "i-hak"    ; but most are deprecated   / "i-klingon"   ; in favor of more modern   / "i-lux"    ; subtags or subtag   / "i-mingo"    / "i-navajo"   / "i-pwn"   / "i-tao"   / "i-tay"   / "i-tsu"   / "sgn-BE-FR"   / "sgn-BE-NL"   / "sgn-CH-DE"regular = "art-lojban"  ; these tags match the 'langtag'  / "cel-gaulish"  ; production, but their subtags  / "no-bok"   ; are not extended language  / "no-nyn"   ; or variant subtags: their meaning  / "zh-guoyu"   ; is defined by their registration  / "zh-hakka"   ; and all of these are deprecated  / "zh-min"   ; in favor of a more modern  / "zh-min-nan"  ; subtag or sequence of subtags  / "zh-xiang"

注意: 几乎所有grandfarthered标签均可被当前registry的标签及其组合作替代(像i-tao可以被tao代替)，因此如无意外请使用现行的标签吧。

下面就到了我们的重头戏langtag了,首先我们看看langtag下的第一个subtag――language.

`Primary language subtag`

像en这种就是Primary language subtag，用于标识资源所对应的语言。语法:

language = 2*3ALPAH   ["-" extlang]   / 4ALPHA   / 5*8ALPHAextlang = 3ALPHA   *2("-" 3ALPHA)

看到language有三种形式，其中让我比较好奇的是第一种2*3ALPHA ["-" extlang]。这种形式中前面的2*3ALPHA称为macrolanguage，用于标明资源对应一种语言的汇总，而具体的某一种语言/方言则通过extlang指定。而包含extlang部分的language也被称为encompassed language. 如zh-cmn和zh-yue就是encompassed language，其中zh是macrolanguage，而cmn和yue则是extlang。这里有个很有趣的事情是，我们认为普通话和广东话等都是汉语的方言，但西方却认为普通话、广东话根本就不属于一种语言，因此像zh-cmn和zh-yue在规范中被设置为redundant，建议直接使用cmn和yue等。不过由于历史原因，我们还是使用zh-CN代表cmn-CN。另外现在可以作为macrolanguage的就只有7个标签(ar,kok,ms,sw,uz,zh和sgn) 另外几个和cmn类似的subtags如下

cmn 普通话（官话、国语）wuu 吴语（江浙话、上海话）czh 徽语（徽州话、严州话、吴语-徽严片）hak 客家语yue 粤语（广东话）nan 闽南语（福建话、台语）cpx 莆仙话（莆田话、兴化语）cdo 闽东语mnp 闽北语zco 闽中语gan 赣语（江西话）hsn 湘语（湖南话）cjy 晋语（山西话、陕北话）

注意: 一般采用全小写

`Script subtag`

用于指定字迹或文字系统资源所属的语言和方言等。语法:

script = 4ALPHA

注意: 一般采用首字母大写，后续字母全小写

`Region subtag`

指定与国家、地域对应的语言/方言文化。语法:

region = 2ALPHA  / 3DIGIT

注意: 一般采用全大写

`Variant subtag`

指定其他subtag又无法提供的额外信息语法:

variant = 5*8alphanum  / (DIGIT 3alphanum)

示例:de-CH-1996其中1996是variant subtag，整体意思是在Switzerland使用的自1996改良过的德语。

`Extension subtag`

提供一种机制让我们去扩展langtag 语法:

extension = singleton 1*("-" (2*8alphanum))singleton = DIGIT   / %x41-57   / %x59-5A   / %x61-77   / %x79-7A

现在仅支持u作为sigleton的值。示例:de-DE-u-co-phonebk表示采用电话本核对的方式对内容进行排序等操作。

更多关于language-tag的信息请参考BCP 47

`如何选择Language Tag`

硬着头皮啃下这么多规范的内容，但我还不知道如何组合合适的language-tag呢:(其实选择和组合的原则就只有一条在足以区别当前上下文中其他language-tag的前提下，保持language-tag足够地短小精干示例1:下文普通话、粤语并存

<p lang="cmn">小陈说:"老大爷，东方广场怎么走啊？"老大爷回答道:"<span lang="yue">你讲咩也啊？我听唔明喔。</span>"</p>

示例2:下文含大陆人讲英语、香港人讲普通话和美国人说英语

<p lang="cmn">小陈说:"<span lang="en-CN">Hi, where are you come from?</span>"李先生说:"<span lang="cmn-HK">你的英文跟我的普通话一样普通啊，哈哈！</span>"Simon说:"<span lang="en">Hey, what's up!</span>"</p>

那现在引出另一个问题，那就是我们怎么知道各个subtag具体定义了哪些值呢？具体都定义在IANA Language Subtag Registry中了。假如觉得查找起来还是不方便，那么就使用Language Subtag Lookup tool吧！另外若不清楚各国各地区所使用的语言或方言时，可通过Ethnologue查看，直接点击地图上的区域即可获取相应的subtag信息。

`总结`

现在我们已经对国际化和本地化有了更全面的理解，也对Language tag有了更深入的认识，现在是不是迫不及待想挽起袖子撸代码呢？敬请期待下篇《JS魔法堂:不完全国际化&本地化手册之实战篇》

`感谢`

网页头部的声明应该是用 lang="zh" 还是 lang="zh-cn"？ Language Subtag Registry BCP 47 Language on the Web Choosing a Language Tag Language tags in HTML and XML








上一篇：微信小程序（十二）text组件详细介绍


下一篇：Javascript json object 与string 相互转换的简单实现














发表评论
共有条评论






用户名:

密码:



验证码:

 

匿名发表


















学习交流
更多





索泰发布一款GTX 1070 Mini迷


AMD新旗舰显卡轻松干翻NVIDIA 






索泰发布一款GTX 1070 Mini迷你版本:小机
索泰发布一款GTX 1070 Mini迷你版本:小机箱大爱...






usb无线网卡怎么用,小编告诉你安装教程09-10

usb调试在哪,小编告诉你usb调试在哪09-10

优盘不显示,小编告诉你优盘不显示怎么办09-10

低级格式化,小编告诉你硬盘怎么低级格式化09-10




帝国cms分类信息的所在地在的修改09-08

将网站地图和友情链接table样式改为div+css09-08

用帝国cms实现不规则新闻或信息调用（应大站09-08

帝国调用DZ论坛精华帖09-08

用灵动标签调用discuz和phpwind的最新贴子09-08







热门图片
更多




芭蕾舞蹈表演，真实美到极致


下午茶时间，悠然自得的休憩




充斥这繁华奢靡气息的城市迪拜风景图片


从山间到田野再到大海美丽的自然风景图片




肉食主义者的最爱美食烤肉图片


夏日甜心草莓美食图片




人逢知己千杯少，喝酒搞笑图集


搞笑试卷，学生恶搞答题







猜你喜欢的新闻


荣耀总裁赵明乌镇演讲：荣耀首款5G手机V30下

搜狐张朝阳：回归媒体是搜狐重新崛起的关键

华为轮值董事长郭平：虚拟技术创造现实价值

第六届世界互联网大会开幕“to B”端成热门

滴滴英文服务上线两周年 用户已超200万

华为推出全球至快AI训练集群Atlas900

马斯克：特斯拉正组建中国技术团队

10年后6G将问世 速度有望比5G快100倍

WeworkCEO称已开始考虑未来职位 不排除放弃

谷歌软件商店模式变革：推出5美元会员 可用数





猜你喜欢的关注


新闻内页-JS分页

鼠标划过时整行变色

网页里控制图片大小的相关代码

用 或 || 来兼容FireFox

JS代码的格式化和压缩

动态加载iframe

Javascript 小技巧全集第1/4页

html下载本地

强制设为首页代码

可输入的下拉框











新闻热点





荣耀总裁赵明乌镇演讲：荣耀首款5G手机V30下月发布
2019-10-23 09:17:05






搜狐张朝阳：回归媒体是搜狐重新崛起的关键
2019-10-21 09:20:02






华为轮值董事长郭平：虚拟技术创造现实价值
2019-10-21 09:00:12






滴滴英文服务上线两周年 用户已超200万
2019-09-26 08:57:12






华为推出全球至快AI训练集群Atlas900
2019-09-25 08:46:36






马斯克：特斯拉正组建中国技术团队
2019-09-25 08:15:43











疑难解答




索泰发布一款GTX 1070 Mini迷你版本:小机箱

AMD新旗舰显卡轻松干翻NVIDIA 有几个点我们

i5 6500配什么显卡最佳？i5 6500配1060显卡可

AMD新一批显卡曝光:更便宜的14nm北极星

A卡自修改BIOS安装16.12.1 ReLive驱动教程 

2016笔记本显卡性能哪个好？笔记本显卡天梯图

2016显卡性能怎么看好坏 显卡天梯图2016年1

PS4 Pro显卡解析:显存带宽相当于标准版PS4

iGame 1050烈焰战神U-2GD5版图赏版:最美非

EVGA FTW GTX 1080/1070显卡存在严重问题:







图片精选




document 和 document.all 分别什



获取对象



一个很Cool的JS菜单效果



怎样调用动态获取的自定义对象的方











网友关注




u盘无法识别怎么办,小编告诉你U盘无法识别怎

usb无线网卡怎么用,小编告诉你安装教程

usb调试在哪,小编告诉你usb调试在哪

优盘不显示,小编告诉你优盘不显示怎么办

低级格式化,小编告诉你硬盘怎么低级格式化

分区表丢失,小编告诉你分区表丢失如何修复

进入bios,小编告诉你戴尔笔记本进入bios设置u

怎么刷bios,小编告诉你华硕怎么刷bios

读卡器怎么用,小编告诉你如何使用读卡器

bios升级,小编告诉你华硕主板bios怎么升级

JS不完全国际化&本地化手册 之 理论篇

前言

何为国际化？

本地化的关键 ―― Language Tag

语法规则

Primary language subtag

Script subtag

Region subtag

Variant subtag

Extension subtag

如何选择Language Tag

总结

感谢