从滴血认亲到str分析:亲子鉴定的前世今生 | 商周专栏
实际上,大多数人可能对“亲子鉴定”一词并不陌生,影视剧作品里也常有 “滴血认亲” 和dna医学检验的场景,而此次的社会事件,更是让大家关注起了“利用亲子鉴定用来确认被拐卖人口身份”的话题。
亲子鉴定怎么做?经历了哪些发展历程?“滴血”是否真的能“认亲”?本文作者商周为从事过遗传学研究的学者,黄巧娘则曾从事过亲子鉴定工作,从古代滴血认亲的历史讲起,他们为大家介绍了亲子鉴定的前世今生。
撰文 | 商周 黄巧娘
责编 | 王雨丹
● ● ●
在描述血缘关系的时候,我们通常会用 “血亲” “骨肉” “骨血” 等词汇,在西方也大抵如此。英语中的consanguinity(血缘关系)和德语里的blutsverwandtschaft(血亲)都来源于拉丁语的cognatio一词,指的是通过出生而建立的关系。
亲子关系不仅事关感情,还涉及财产和地位的继承,所以这种关系的不明确会带来许多冲突和问题。为了解决或避免这种矛盾,人类历史上发明过诸多不同鉴定亲子关系的方法。比如,中国古代就有滴血认亲一说,通过观察 “两人的血是否相凝(合血法)” 或检测 “一个人的血是否可以渗入另一个人的骨头中(滴骨法)” 来判断亲子关系。虽然这种做法历史悠久,而且看上去融入了 “骨血” 的概念,但实际上它十分荒谬,毫无道理。
没有道理的认亲方法不仅出现在古代的中国。在中世纪的欧洲,判断一名男子是否是一个孩子父亲的方法之一,就是让他在医生、官员和牧师面前证明自己阴茎的勃起能力 [1]。即使到了科学日益昌明的18、19世纪的欧美,鉴别当事人是否为生父的方法也只停留在观察男子的精子是否有活力的水平之上 [1]。
人类之所以在鉴定亲子关系上束手无策,是因为对遗传学一无所知,不知道决定性状的基因,也不知道人的基因一半来自父亲、另一半来自母亲。等到之后,亲子鉴定也就摆脱了蒙昧,迎来了新的纪元。
豌豆的黄绿圆皱和人类亲子鉴定,这两个事物看上去似乎毫不相关,但这恰恰是基础研究如何指导技术应用的一个典型例子。
有趣的是,第一个科学的亲子鉴定方法还是和 “血” 有关,即血型分析。1900年奥地利科学家卡尔·兰德施泰纳(karl landsteiner ,1868-1943)发现了abo血型系统(注:因为发现了a、b、o、ab四种血型中的前三种,兰德施泰纳在1930年获得了诺贝尔生理学或医学奖)[2]。二十多年后,德国科学家费利克斯·伯恩斯坦(felix bernstein,1878-1956)发现血型的遗传也遵循孟德尔法则,由一个包括ia、ib、i三个等位基因的位点所决定,其中ia和ib都是显性 [3]。
如上图所示,人类的abo血型的基因型有六种:iaia、iai、ibib、ibi,iaib和ii,它们分别对应的血型是a、a、b、b、ab、o。知道了血型和基因型的关系,就可以通过血型来推导可能的基因型,并对父母和子女的基因关系做出判断。上世纪二十年代,这项技术就开始被用到了亲子鉴定里。
我们还是用实际情况来举例说明。
在没有代孕技术的年代,生母就是孩子的生物学母亲,所以亲子鉴定主要是检测父亲的身份。要鉴定一个男子是否为孩子生父,首先要做的是测定孩子和生母的血型,当这两个指标确定后,就可以去推断生父血型的可能性。
假设孩子的血型是a, 生母的血型也是a,那么生父的血型则可能是a、b、ab和o里的任何一种。在这种情况下,不仅无法确定一名男子是孩子的生父,也无法认定他不是孩子的生父(非父)。
但假设孩子血型是a,而生母的血型是b,那么生父的血型则只可能是a和ab,而不可能是b和o。如果一名男子的血型是b或o的话,他就肯定不是孩子的生父。在这种情况下,虽然同样不能确定一名男子就是孩子的生父,但在某些情况下可以将非父排除。
上面的表格里列出了孩子和生母血型的所有可能性组合,以及被鉴定男子可能是孩子生父(绿色)以及不可能是孩子生父(红色)两种情况下的血型分布。从上面这个总结表里可以看出,利用血型来进行亲子鉴定无法确定谁是孩子的生父,但有大约29%的概率能将非父排除。
这显然不是一个理想的结果。但作为亲子鉴定科学方法的先驱,它为后来的方法提供了借鉴。因为,血型分析之所以在亲子鉴定上表现不佳,主要是由于血型只取决于一个基因位点,而且这个位点只有三种等位基因,所以在多态性上非常有限。而要在方法上有所提高,就要提高所检测指标所代表的基因的多态性。
在之后发展起来的血清学分析和hla(human leukocyte antigen,人类白细胞抗原)分型就是在这样的思路下发展起来的。尤其是上世纪七十年代开发出来的hla分型法,更是让亲子鉴定的准确性有了较大的提高。hla是决定免疫反应的一类分子,主要功能是将抗原呈递给淋巴细胞。为了对付难以计数的外来病原体,hla分子进化出了极高的多态性:不仅由多个基因编码,而且每个基因都有多个等位基因。利用hla分型(注:指hla抗原分型,而不是现在的hla基因分型)虽然仍不能确定孩子的生父,但将排除非父的概率提高到了80%以上 [4]。
对具有高度多态性的hla进行分型,却依然无法确定孩子的生父,主要原因是这样检测的依然是多态性有限的表型,而不是具有更高多态性的基因型。而当分子生物学有了长足的进展之后,基因水平的亲子鉴定方法也就被开发了出来。
首先使用的基因分析方法是上世纪八十年代出现的rflp(restriction fragment length polymorphism,限制性内切酶片段长度多态性)[5],其原理是用限制性内切酶对被检测的dna进行剪切,再根据剪切后的结果进行判断。限制性内切酶本来是细菌进化出来切割噬菌体(感染细菌的病毒)dna的武器,比如最常见的ecori内切酶就来自大肠杆菌。当这些限制性内切酶被科学家发现后,它们就被用来作为剪切dna的分子生物学工具。
如果把人的dna比作一根长长的绳子,限制性内切酶就好比一把剪刀,它能够识别这根绳子上一些特异性的位点,并在这些地方把绳子剪成大小不一的片段。如果dna这根绳子在某个识别位点上发生了变异,让限制性内切酶无法识别,那么它们在这里就剪不开。因为这种识别位点上的多态性,不同人的dna在被同一种限制性内切酶剪切后,出现的片段数量和大小会有所不同。将多个限制性内切酶的剪切结果综合起来,就可以构成高精度的个人dna图谱。正是因为这个dna图谱的高度精确性,rflp分析法不仅可以将非父排除,而且可以准确地认定谁是孩子的生父。
虽然rflp分析法效力足够强大,但操作起来却很不方便。于是,出现后不到十年它便被另一种更具优势的基因分析方法代替:str分析(short tandem repeat,短串联重复序列)。str分析方法出现于上世纪八十年代末,它的科学基础来自八十年代的两个分子生物学进展:pcr扩增技术和dna上str序列的发现 [6,7]。这种方便快捷的方法一经出现便迅速被应用到亲子鉴定领域中,并且一直沿用至今。
进入二十一世纪后,分子生物学进入了快速发展的车道,亲子鉴定在方法学上也有了更多的可能:比如单核苷酸多态性(single nucleotide polymorphism,snp)芯片分型和二代测序等更加现代的方法都先后被开发了出来。虽然这些更现代的方法功能非常强大,但并没有撼动str分析法在这一领域的统治地位(主要是成本原因),只是偶尔在一些str分析不适用的场合使用(比如胎儿无创亲子鉴定里,需要通过检测母体血液中游离的胎儿dna来对胎儿进行基因分析)。
那么,在亲子鉴定领域一统江湖的str分析法是如何工作的呢?
str分析在亲子鉴定中的工作原理
str指的是基因组上的一些短的dna碱基序列(长度为1到6个或更多碱基)的简单连续重复,不同的重复次数导致了这一区域dna碱基长度上的不同。这种重复的次数从几次到几十次不等,如果把控制血型的基因位点的三个等位基因a、b、o比喻成红黄绿三色的话,那str位点的多态性就像一个有着诸多色彩的斑斓世界。单一位点上的高度多态性,再加上这样的位点在人类基因组上数以千计的存在,让str分析成为了绘制高精度的dna个性图谱的天然资源。在实际操作中(比如亲子鉴定),只需将含有str位点的基因片段用pcr的方法进行扩增,然后通过检测所扩增出来的dna片段的长度,就可以绘制一个人的个性dna图谱。
正是因为其高精度、低成本和易操作的特性,str分析便一直 “统治” 着亲子鉴定这一领域。
下面举个例子,来说明str分析法是如何进行亲子鉴定的。
如上图所示,假设孩子在某个str位点上的基因型是(9重 6重)(1重指的是一个str基本序列的一个重复), 生母的基因型是(9重 8重)。所以孩子的生父在这个str位点上必须带有6重才行,比如带有(11重 6重)基因型的可能是生父,而带有(11重 2重)基因型的则为非父。
写到这里,有读者应该能看出来,单个的str位点也无法认定谁是孩子的生父,同样只能把部分人鉴定为非父。举个例子,d3s1358是一个常用来做亲子鉴定的str位点,这个位点的17重的等位基因在福建汉族人群中的概率是20%左右。假设被鉴定人必须携带d3s1358的17重才可能是孩子的生父的话,那么这一个位点的检测就可以把人群中60-70%左右的汉族男子作为非父排除掉。
虽然单个位点无法满足亲子鉴定的要求,但str位点在基因组上数以千计,采用多个位点组合的办法就可以准确地完成亲子鉴定的任务。为了达到利用尽量少的str位点就完成亲子鉴定的目的,被选来做分析的位点应该遵循三个基本原则:一是在当地的人群中有较高的多态性,方便提高分辨能力;二是多态性稳定(突变率小于0.2%),防止因为位点突变而带来的结果混淆;三是被选用的str位点在整个基因组上相对均匀地分布,避免两个str位点在同一染色体上靠得太近。
在实际应用中,一般采用的是20个左右的具有高度多态性的str位点组合,这种组合可以确定累计非父排除概率(cumulative probability of exclusion, cpe),达到亲权鉴定技术规范的国家标准(gb∕t 37223-2018)。这里说的内容都是认定非父(母)的可能性,那么如何认定被检测人就是孩子的生父(母)呢?
要做到这一点,需要在上述基础上进一步评估被检者与孩子有亲生关系的可能性大小(亲权机会)。这里需要再引入一个概念:亲权指数( paternity index,pi),即亲权关系鉴定中判断遗传证据强度的指标,它表达的是被检测人是孩子生父(母)的概率与随机人是孩子生父(母)概率的比值。
假设被检测个体是孩子生父(母)的概率为 x, 随机个体是孩子生父(母)的概率为 y,仍以上面提到的d3s1358位点为例,假设生父(母)必须携带的等位基因是d3s1358-17重,而被检测人的基因型是(17重 17重),他提供生父基因 d3s1358-17重的概率为1(即x=1)。随机男人提供生父基因 d3s1358-17的概率为该基因的频率(即y=0.208)。因此,这里的亲权指数(pi)值为 1/0.208=4.808。如果被检人的确是孩子的生父,则不论检测多少位点,他都不会被认定为非父。所以当多个str位点用于亲子鉴定时,假设每个位点的亲权指数分别为pi1,pi2,pi3,pi4……pin,n个str位点的亲权指数相乘则为累计亲权指数(combined paternity index,cpi),即:
cpi=pi1×pi2×pi3×…×pin
根据gb∕t 37223-2018亲权鉴定技术规范规定,鉴定使用的遗传标记累计非父排除效率≥99.99%,且累计亲权指数大于10000时,就可以支持被检测人是孩子生父(母)的判断。
从以上原理可以看出,如果检测样本有子女、母亲和父亲三方,那么达到亲子鉴定目的所需要的str位点就会少一些,一般20个左右的str位点检测就可以达到目的。而当检测样本只有子女和父母一方的时候(如子女-父亲、子女-母亲),需要的str位点就会多一些,有时会出现20个位点检测后依然不能达到规范标准的情况,这时候就需要增加检测str位点的数量。
但无论如何,利用str位点的检测可以准确地判断子女和生父(母)的亲子关系。
亲子鉴定的实际应用和现实问题
作为一项精确的技术,亲子鉴定已经在我们的生活中得到了广泛的应用。由于亲子鉴定的结果有时可能会带来一些负面的社会问题,因此不少国家为亲子鉴定的应用范围制定了相应的法规,而且不同国家的规定也有所不同。
◆ 认亲、移民
◆ 继承财产、办理户口
◆ 被拐卖人口的身份确认
◆ 丈夫怀疑孩子不是亲生
◆ 怀疑在产房抱错婴儿
◆ 遇难者辨识:残骸身份确定
最近,因为 “徐州丰县生育八孩女子” 事件,亲子鉴定用来确认被拐卖人口身份的话题受到了人们的关注。根据@徐州发布2月10日发布的通报,相关部门对被锁女子(即“八孩母亲”)、光某英(小花梅同母异父妹妹)与普某玛(已去世,小花梅母亲)生前遗物进行dna检验比对,结果为普某玛与被锁女子、光某英符合母女关系,结合调查走访、组织辨认,认定被锁女子即是小花梅 [8]。
可能是因为在这一事件上相关部门发出的通报有前后矛盾之处(比如之前的通报否定人口拐卖,但最近的通报却承认了这一事实),@徐州发布2月10日的这份通报甫一发布便遭到了一些网友的质疑。需要指出的是,部分网友质疑的并不是亲子鉴定技术本身,而是普某玛的生前遗物是否依然可以提取到用来做鉴定的dna。
的确,只要普某玛的dna顺利获得,那么她是不是被锁女子的生母肯定会有一个确定的答案。一般来说,用来进行身份鉴定的dna样本来源可以多样,主要包括血液、毛囊、口腔黏膜、精液等。如果以上样本无法获得,那么其他一些和被检测人相关的间接样本也可以用来检测,比如穿过的衣物、嚼过的口香糖等,但关键是需要其中带有被检测人的细胞,而且不能存在他人细胞的污染。
那么,去世几年的人的遗物是否能提取到dna并用来进行身份鉴定呢?这需要看具体情况,比如遗物上留有被检测人的血液,那应该就可行。但如果这些遗物上没有被检测人的细胞,或者这些遗物被他人使用过并留下了他人的细胞,那应该就不行。所以,在这件事情上,官方通报如果能给出一些细节,或者委托独立的第三方来进行检测,将会对事件的澄清有所帮助。
从被锁女子被拐卖的这一事件,还可以引申出另一个有关认亲鉴定的问题。因为被拐卖的人口(尤其是妇女)大多发生在上世纪,她们的父母已经部分离开了人世。所以,关于被拐卖人身份的认定,有时候会遇到这样一个问题:没有父母的dna,是否还可以帮助他们找到自己的家?
要回答这个问题,我们需要回到亲子鉴定原理的核心部分:子女从父母双方各继承了一半基因。也就是说,子女的基因多态性肯定是从父母那里得到的,而且父母双方各一半。正是因为这种确定性,让判断子女与父母的关系成为了可能。
而当父母已经不在或无法准确获得其dna的时候,兄弟姐妹的dna可以用来做认亲的同胞关系鉴定吗?
从理论层面来看,就像当事人一样,他(她)的兄弟姐妹也都从父母那里各继承了一半的基因。但需要指出的是,每个人继承的那一半并不相同,这也是为什么兄弟姐妹间在外貌上可能相似但不会相同(单卵双生子除外)。所以,如果用亲子鉴定的方法去分析当事人和兄弟姐妹的dna时,他们之间可能会在很多位点上有一致之处,但却无法百分之百确定二者就是来自同一父母,只能得出一个倾向性的结论。
在实践层面上,根据根据2021发布的《生物学全同胞关系鉴定技术规范》sf/t 0117-2021(下称 “规范”),全同胞鉴定可以进行。根据这个规范,19个str位点是必检位点,还可以根据需要去补充更多的检测位点(注:检测位点越多,检测的效能越高)。被检测的二人在所检测位点的等位基因的一致性,或者是根据这个指标计算出来的同胞关系指数,就是评估他们是否为全同胞的指标。
我们可以用更容易理解的 “等位基因的一致性” 这个指标来做进一步说明。假如使用的是规范里规定的19个必检str位点,它的效能是0.5655。19个位点一共有38个等位基因, 通过比较被检测两人在这38个等位基因的状态,可以得出累计状态一致(combined identity by state,cibs)的数值。当这个数值大于22的时候,可以做出 “倾向于认为两名被鉴定人为全同胞” 的判断。假设检测的str位点高达39个,检测的效能就可以提高到0.9782,cibs大于40,也可以做出 “倾向于认为两名被鉴定人为全同胞” 的判断(如下表)。
所以,无论是理论层面还是实践层面,全同胞的鉴定能给出的都是一个倾向性的结论。如果被用来鉴定的是同父异母或者同母异父的姐妹关系(或是更远一些的堂兄妹或表兄妹的关系),这种不确定性就会更大一些。
虽然无法100%肯定同胞关系,但这不妨碍帮助被拐卖人找回他们的亲人。还有一个办法就是增加被检的人数和检测的str位点。在被检测人的选择上,最好包括所有的兄弟姐妹。如果兄弟姐妹也没有,那来自父母上方血缘关系最近的亲属也会有所帮助。当检测位点和人数足够多的情况下,凭借极高概率的倾向性结论,结合社会学因素,同样可以帮助被拐卖人找回自己的家庭。
正是因为str分析技术的先进性和确定性,它已经成为了帮助被拐卖人口认亲的强大工具。目前,我国相关部门已经利用str分析技术为部分因人口拐卖而失去骨肉的家庭建立了dna库,以便和那些失散的儿童及妇女进行对比认亲。希望这一技术能帮助尽量多的失散者找回自己的父母家人,重新享受家庭的幸福。
当然,最好,这样的 “失散” 不再发生。
制版编辑 | 姜丝鸭