世界各地的人名有何不同,这些差异对web的表单、数据库、本体等设计有什么影响?
创建web表单、数据库或本体的人通常不知道在其他国家和地区的人名可能有多么不同,因为他们建立自己的表单或数据库时对外国用户可能有过多的假设。本文将首先向你介绍一些用于人名的不同形式,然后介绍在web上处理人名时要考虑的一些内容。
本文并未提供所有答案,最佳答案将根据应用的需要而有所不同,而且在大多数情况下,可能很难找到“完美”的解决方案。本文试图通过介绍的方式让你了解一些关键问题。本文中的示例和建议主要与web表单和数据库相关。不过许多概念对于本体设计也是有用的,尽管我们不会在本文中举出具体的例子。
有几种关键场景需要考虑:
你正在用一种语言(比如英语)设计一个表单,来自世界各地的人们将填写该表单。
你正在用一种语言设计表单,当网站被翻译成其他语言时,表单将被调整以适应特定语言环境的文化差异。
在现实情况下,你可能无法针对每种不同的文化进行本地化,因此即使你使用第二种方法,有些人仍会使用并非专门针对其文化的表单。
首先,让我们看一看世界各地的人名如何不同的例子。
这里的信息只是描述了对人的命名习惯中有许多重大差异的简单案例。在现实情况下,即使是在单一文化中,通常也更加复杂。
Björk是Björk Guðmundsdóttir这个冰岛语的人名中的名(given name)。人名的第二部分表示父亲(有时是母亲)的名字,后面会有‑son代表男性和‑dóttir代表女性。这更多的是一种描述,而不是西方意义上的姓氏。Björk的父亲Guðmundur是Gunnar的儿子,所以被称为Guðmundur Gunnarsson。
冰岛人通常使用他们的名(Björk)或全名(Björk Guðmundsdóttir)来称呼彼此。Björk通常不会期望被人叫做Guðmundsdóttir女士。冰岛的电话簿按名排序。
在印度南部、马来西亚和印度尼西亚的部分地区,一个人的名字中包含一个名和一个父名(patronymic)。
在马来语人名Isa bin Osman中,“bin”一词的意思是“某人的儿子”(“binti”用于女性)。在称呼这个人时,你可能会说Isa先生,或者如果你和他熟识,也可以称他为Encik Isa(Encik 是一个马来语词汇,意思类似于“先生”)。
在中文姓名毛泽东中,姓(family name)是毛,也就是从左到右阅读时的第一个字。名(given name)是东。中间的字泽是字辈(generational name),毛泽东的兄弟姐妹(例如毛泽民、毛泽覃和毛泽红)都有这个字作为名字的一部分。
不太熟悉毛泽东的人可以称呼他为毛泽东先生或者毛先生(“先生”相当于英语的“Mr.”)。尽管现在(尤其在中国大陆)并非每个人都有字辈,但那些有字辈的人可能会希望你连同名一起使用。因此,如果你与名叫毛泽东的人关系熟悉,可以称呼他泽东,而不是只有东。
需要注意的是,中文姓名之间没有空格分隔。
其他一些文化,例如日本、朝鲜和匈牙利,也采用姓在前、名在后的姓名排列方式。
与外国人打交道的中国人,常常会采用一个更容易让西方人使用的外语名。例如,姚明(姓姚,名明)可能会在写给外国人时将自己的名字写成Fred Yao Ming或Fred Ming Yao。
说西班牙语的人通常会有两个姓。比如,María José Carreño Quiñones(José 是她名的一部分)可能是Antonio Carreño Rodríguez和María Quiñones Marqués的女儿。
你可以称她为Carreño小姐(Señorita Carreño),但不能称她为Quiñones小姐(Señorita Quiñones)。然而,近年来人们越来越倾向于避免使用反映女性婚姻状况的称谓(尤其是在男性称谓中没有类似区分的情况下),因此Señorita可能被Señora取代。
巴西人也有类似的习俗,他们甚至可能有三个或四个姓氏,借用其他祖先的名字,比如José Eduardo Santos Tavares Melo Silva。
通常情况下,西班牙语国家的两个姓氏的顺序是父姓+母姓,而巴西的葡萄牙语姓氏通常是母姓+父姓。不过,这种顺序有时也可能改变。
此外,有些名字中还会加上短小的词语,例如de或e,用来连接姓,如Carreño de Quiñones或Tavares e Silva。
我们已经了解到,在冰岛,父名的后缀根据孩子的性别不同,分别以‑son(表示儿子)或‑dóttir(表示女儿)结尾。而在俄罗斯,父名用作中间名,并且还会使用姓,也就是说,名字顺序为:名-父名-姓。父名和姓氏的结尾通常会表示出这个人是男性还是女性。比如,Борис Николаевич Ельцин(Boris Nikolayevich Yeltsin,鲍里斯·尼古拉耶维奇·叶利钦)的妻子是Наина Иосифовна Ельцина(Naina Iosifovna Yeltsina,奈娜·约瑟福芙娜·叶利钦娜)——可以注意到,丈夫的名字(包括父名)以辅音结尾,而妻子的名字(还有从父亲继承的父名)都以‑а结尾。
顺便提一下,稍微不那么正式的俄语名字书写方式是姓-名-父名的顺序,比如:Ельцина Наина Иосифовна。
美国人通常会在名字中使用中间名首字母缩写,比如John Q. Public。在美国设计的表格中,这种写法往往被认为是理所当然的。然而,即使是在英国,尽管人们可能也有一个或多个中间名,这种做法通常被认为是一种非常美国化的方式。在其他国家,拥有两个以上名字且通常不使用首字母缩写的人可能会对如何填写这些表格感到困惑。此外,还需注意,有些使用名字首字母缩写的人可能会将缩写放在姓名的开头。
菲律宾人也会在名字中使用中间名首字母缩写,但它代表的是母亲婚前的姓氏,而不是名。例如,在Maria J. Go中,“J”代表的是 Jimenez,这是Maria母亲的婚前姓氏。(实际上,一个首字母缩写可能代表多个名字:“D”在全名书写时可能表示“Dela Cruz”。)
不要以为同一个家庭的成员一定共享相同的姓,这种假设是错误的。在西方,越来越多的女性在婚后保留自己的姓。在其他文化中,比如中国,这种做法本身就是常态。在某些国家,妻子可能选择使用丈夫的姓氏,也可能选择保留自己的姓氏。例如,如果马来女孩Zaiton嫁给了Isa,她可能仍然叫Mrs. Zaiton,也可能选择成为Zaiton Isa,在后面的情况下,她可能会被称为Mrs. Isa。
一些西班牙语国家的姓名处理方式稍有不同。1996年,Manuel A. Pérez Quiñones描述了他家庭的命名方式。如上所述,他的姓氏(在西班牙语中称为apellidos)为Pérez Quiñones,因为他的父亲姓Pérez Rodríguez,而他的母亲姓Quiñones Alamo。后来,他和一个姓Padilla Falto的女孩结婚。婚后,女孩的姓氏变成了Padilla de Pérez。他们的孩子叫做Pérez Padilla,以此类推。关键之处在于,只有孩子们才会拥有相同的姓氏(apellidos)。
此外,不要简单地假设姓只能从丈夫传递给妻子。有时,男性会在结婚后改为妻子的姓。在这种情况下,表格上的“原姓”(Previous name)可能比“女子婚前姓”(Maiden name)或“娘家姓”(née)这样的表述更为恰当。
许多文化会将姓名的不同特点加以混合,并融入自己的新创意。
例如,Velikkakathu Sankaran Achuthanandan是来自印度南部喀拉拉邦的名字,通常写作V. S. Achuthanandan,其命名顺序为“姓-父亲的名-名”。
在许多地方,名字的某些部分来源于头衔、地名、家族信息、种姓、宗教等。以下是一些例子:
印度姓名Kogaddu Birappa Timappa Nair的命名顺序为“村名-父亲的名-名-姓”。
在印度的另一个地区,Madurai Mani Iyer的命名顺序是“城镇名-名-种姓名”。
阿拉伯人名Abu Karim Muhammad al-Jamil ibn Nidal ibn Abdulaziz al-Filistini翻译为:“Karim的父亲,穆罕默德(名),美丽的,Nidal之子,Abdulaziz之子,巴勒斯坦人”。其中“Karim”是穆罕默德的长子。(有关这种丰富的命名传统的更多细节,可参考维基百科。)
在泰国,人们有一个通常与正式名字无关的昵称,并且在非正式场合通常使用这个名字互相称呼。(与西方人打交道时,他们也倾向于用这个昵称自我介绍,因为昵称一般只有一个或两个音节,更容易发音。)前总理他信·西那瓦的昵称是“Maew(แม้ว)”。泰国人通常对家庭和朋友使用不同的昵称。
在越南,像Nguyễn Tấn Dũng(阮晋勇)这样的名字的命名顺序是“姓-中间名-名”。尽管这种命名方式看起来和中国类似,但即使在正式场合,这位越南总理也会被称为“勇先生”,而不是“阮先生”。
在日文姓名中,表意字符通常可以有多种读音。这种情况有时会使人难以准确地知道姓名的正确读音,同时也会对基于姓名读音的自动排序和检索造成问题。例如, 東海林賢蔵中的姓氏(東海林)可能会被转写或读作Tōkairin或Shōji。
此外,不同的汉字可能具有相同的读音,因此罗马字(也就是拉丁字母转写)往往会丢失与姓名相关的重要区分信息。比如,庄司、庄子、東海林和小路都可以被转写为Shōji。
一些日文姓名还会使用现代日语中已经不再使用的字,这些字可能很难被读出来。
由于这些问题,日本人通常会在姓名的普通书写形式旁附上一个用非表意文字(假名)的读音版本,以明确姓名的发音。
维基百科上有大量关于世界各地不同文化中人名的有趣文章,建议你通过以下链接阅读更详细的信息。
阿肯人 • 阿拉伯人 • 巴厘人 • 保加利亚人 • 捷克人 • 中国人 • 荷兰人 • 斐济人 • 法国人 • 德国人 • 夏威夷人 • 希伯来人 • 匈牙利人 • 冰岛人 • 印度人 • 印度尼西亚人 • 爱尔兰人 • 意大利人 • 日本人 • 爪哇人 • 朝鲜民族 • 立陶宛人 • 马来西亚人 • 蒙古人 • 波斯人 • 菲律宾人 • 波兰人 • 葡萄牙人 • 俄罗斯族 • 西班牙人 • 台湾原住民族 • 泰国人 • 越南人
如上所述,一种可能的处理方法是针对特定文化去做本地化的表单。理论上,这可以让你根据受众的需求量身定制表单。不过,这种方法可能仍存在一些缺点:
接下来我们提出一些可能有用的一般指导原则。不过这是一个复杂的话题,这里的建议适用于比较普遍的情况,并不能解决所有问题。
如果你在设计一个表单或数据库来,接受来自不同背景的人的姓名,你应该问问自己,是否真的需要为名和姓设置单独的字段。
这取决于你要对数据执行什么操作,但显然,在可能的情况下,仅使用用户提供的全名会更简单。
你的个人资料
请记住,某些文化中的名字可能比你自己的名字长很多。确保输入字段足够长,以便输入长名称,并确保如果名称稍后显示在网页上,有足够的空间。另外,避免限制数据库中名字的字段大小。特别是,不要假设你只需要4个字节就可以容纳UTF-8中四个字符的日文名——你可能需要12个字节。
如果你仍然觉得需要单独询问姓名的组成部分,尽量避免使用非本地化形式的标签,如“first name”和“last name”,因为对于先写姓再写名的人来说,这可能会造成混淆。
你的个人资料
对于某些文化来说,这仍然是有问题的(比如冰岛人,他们没有姓氏),但是,除了非常本地化的定制之外,这可能是我们可以做的最佳通用表单。
在某些情况下,你想要识别姓名的各个部分,以便可以按字母顺序对姓名列表进行排序、联系他们等。考虑一下除了全名字段之外,是否还需要一个或多个额外字段,在这些字段中,你可以要求用户输入你需要用于特定目的的姓名部分。
有时,你可能选择使用单独的字段,因为你希望能够使用姓名的一部分来直接称呼或提及该人。例如,当Google+提到“Richard的联系人”时。或者可能是因为你想向他们发邮件,并在顶部显示他们的名字。请注意,你不仅可能会遇到姓名语法问题,还必须考虑到世界各地对称呼正式程度的期望不同(并非所有人都愿意让陌生人直呼其名)。最好在设置个人资料时单独询问用户希望你如何称呼他们。
你的个人资料
这个额外的字段对于从长列表中找到合适的名字以及处理泰国昵称也很有用。
顺便说一句,为了对日语姓名进行排序,你需要一个额外的字段,让他们输入姓名的发音,因为很多时候你从汉字中推断发音。此类发音信息用于对日语姓名进行排序。
另外,如果你为某人姓名的各个部分设置了单独的字段,请确保清楚地标记出你想要的各个部分的位置。例如,不要假设他们提供的姓在名的后面。
另外,要小心算法中自动提取姓名的各个部分的假设。例如,隐含“n”优化的v-card和h-card方法可能会遇到困难,比如在遇到中文名时。你应该尽可能清楚地告诉人们如何给出他们的名字,这样你就可以捕获到需要的数据。
不要假设单个字母的名字就是首字母。有时,人们的名字确实只有一个字母长。如果表单验证拒绝接受他们的名字并要求他们提供全名,这些人可能会遇到问题。如果你想鼓励人们不要使用首字母缩写,也许你应该将其作为警告消息,而不是阻止表单提交。
相似地,不强制人们提供姓。在印度南部、马来西亚和印度尼西亚等部分地区的文化中,许多人的名字只包含名,没有父名。如果你要求填写姓氏,则可能会在这些文化中造成严重问题,因为用户会在姓氏字段中输入“.”或“先生”之类的垃圾数据,只是为了提交表单。
允许人们在名字中使用连字符、撇号等标点符号。 不要求姓名全部大写——在移动设备上这可能比较困难。 允许用户输入带空格的名字,例如支持前缀和后缀(如法语中的de、德语中的von以及美国名字中的Jnr/Jr),也因为有些人认为以空格分隔的字符序列是一个整体,例如Rose Marie。
不要规范名字的大小写。有些名字(例如“McNamara”)包含非首字母的大写字母;其他名字(例如“van der Waals”)包含非大写的单词。表单应保留用户输入的大小写,而不是强制要求此类名字始终且仅在每个单词的开头使用大写字母。
不要假设同一个家庭的成员会使用同一个姓氏。
问问自己是否有必要要求人们提供称谓。有些人根本不希望使用称谓。在这种情况下,他们应该能够将这一字段留空。如果你要求人们提供诸如先生/太太/女士之类的称谓来表明他们的性别,为什么不直接询问呢?这也避免了这样一个问题:你可能会无意中要求女性决定是否透露他们的婚姻状况,而不要求男性决定。当然,还要记住,世界各地的称谓差异很大(见下文)。
正如前面提到的,因为改变姓氏的不仅仅是女性,表单上最好要求填写“以前的姓名”,而不是“女子婚前姓”(Maiden name)或“娘家姓”(née)。
如果你正在设计根据每个文化进行本地化的表单,请不要忘记,原子化的人名组成部分可能仍需要存储在中央数据库中,因此,该数据库需要能够表示你通过将表单设计委托给本地化工作来处理的各种复杂性。
英语使用者必须记住的第一件事是,大多数人的名字都不使用拉丁字母,而使用拉丁字母的人中,大多数人使用英语中没有的重音符号和字符。这一点说出来似乎很明显,但它对设计者有一些重要的影响,而这些影响往往被忽视。
如果你正在设计英文表单,你需要决定是否希望人们以自己的文种输入姓名(例如小林康宏)还是用拉丁字母输入姓名(例如Yasuhiro Kobayashi),或者两者兼而有之。
请记住,即使是英文名字也可能涉及非ASCII字符(例如Zoë)。
在某些情况下,比如在仅支持ASCII的系统上的登录名,你不能允许使用非ASCII字符。
人们在表单中输入的内容通常取决于表单及其页面是否使用他们的语言。如果页面使用他们的语言,那么返回非拉丁字符或带重音符的拉丁字符也不足为奇。
如果你希望只接受拉丁字母或ASCII,你需要告知用户。
你的个人资料
关于哪种方法最合适,在某种程度上取决于你收集人们的姓名的目的以及你打算如何使用它们。
Your profile
请注意,日本用户可能需要提供日语音节文字的转写,而不只是表意文字形式。这可能导致添加一个新的(第三个)字段。
如果你接受非ASCII的名字,则应在页面、后端数据库以及其间的所有软件代码中使用Unicode字符编码(如UTF-8)。这将大大简化你的工作。
世界各地的姓名列表并不总是按姓排序。比如,泰国人和冰岛人希望列表按名排序。
作为另一个例子,在西班牙语世界的不同地区,排序顺序也可能不同。例如,一个地方的María José Carreño Quiñones会希望通过查找Carreño Quiñones在列表中找到她的名字。然而,另一个地方的María José Carreño Quiñones会希望她的名字按Quiñones排序。
处理诸如“von”、“de”和“van”等小词会给排序带来额外的复杂性。有时前缀很重要,有时则不重要。
不同文化中有不同的正式程度。称呼某人时,你需要考虑到这一点。虽然名字在西方和科技界正成为一种流行的称呼方式,但它绝不是普遍适用的。在英国,第一次联系某人时使用名字有时可能意味着你之前曾见过他们。
另一方面,使用称谓和名字(例如“爱德华先生”)或仅用姓氏(如“温莎!”)来称呼某人在世界某些地方是可以接受的,但在其他地方则不可以(例如英国)。
在德国,称谓很重要,你可能不仅需要称呼某人为“Herr Schmidt”,还需要称其为“Herr Professor Doktor Schmidt”。
在日本文化中,在你联系的人的名字后面加上称谓或职称是很正常的。例如,人们通常称某人为Tanaka-san或Tanaka-sama(取决于你与他们的关系)。姓田中的部长通常被称为田中部长。虽然你可以在名字后面加上 -san,但在工作环境中这样做是不常见的。