从拼图游戏到人类基因组计划.doc
上传人:qw****27 上传时间:2024-09-10 格式:DOC 页数:5 大小:137KB 金币:15 举报 版权申诉
预览加载中,请您耐心等待几秒...

从拼图游戏到人类基因组计划.doc

从拼图游戏到人类基因组计划.doc

预览

在线预览结束,喜欢就下载吧,查找使用更方便

15 金币

下载此文档

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

从拼图游戏到人类基因组计划——浅探碎片拼接中有趣的数学规律H同学的日本笔友送了他一幅20×15的拼图。虽然在人们印象中,拼图似乎是小孩子玩的幼稚游戏(至少在商场里,它总是出现在儿童玩具专柜,与毛绒玩具、变形金刚为伍),但事实证明,有时拼图比电脑游戏更有吸引力:班里几乎每个同学都花费将近3个小时,各自把它拼了一遍。我自己拼图时可以明显感到进展速度并不均匀。有时缺少一块起关键连接作用的碎片就会导致其它的无法拼上.而剩下的最后几块却很容易就位。彼此切磋技艺时,大家说也有同感。于是我想,整个拼图过程会不会有什么潜在的数学规律呢?以下要探索的就是这个问题。同学A拼图初步统计数据:时间块数时间块数时间块数时间块数时间块数时间块数2335173110511292153134372741106213121542423847511072132315535340876210811332156266441771110113421574714728311111135115829449684211211362159211250287411411372162113551189311621381163214556390211721391164216157391811821411166817358292311911422168219259193612011433169120263139631211144217112276549921221146417532616761005124114751763284682101212531481177231169310211264150117853227131033127215141792341723104212811521结束【引申】可以看出,②式存在4个参数。我们以上讨论的是已知x1,x2和C而求g。因此如果已知波峰所在,就可以利用“波峰系数”,通过x1、x2、g这3个参数预测总过程的耗用时间C。例如以下试对“人类基因组计划”的完成时间进行预测。人类基因组计划(HumanGenomeProject)是一项研究人类DNA序列奥秘的工程。它由美国科学家最先提出,于1990年开始运作,先后有5个国家加入共同完成。我国是其中唯一的发展中国家。众所周知,DNA(Deoxyribonucleicacid,脱氧核糖核酸)是遗传信息的载体,DNA的不同导致了生物种群、个体的不同。它的组成单位是4种不同的核苷酸。核苷酸之间由化学键连接经线性排列形成DNA链。碱基是核苷酸的重要成分之一。4种不同的碱基:腺嘌呤,鸟嘌呤,胞嘧叮和胸腺嘧叮,决定了这4种不同的核苷酸。生物体的DNA都是由这4种核苷酸组成的,它们不同的排列顺序代表了不同的信息。也就是说,不同的碱基排列顺序,决定了生物的形态和种类。这项计划的主要目的是要获得人类DNA链上30亿个碱基对(basepair,以下简称bp)的排列顺序,绘制成一幅比较标准的人类基因组图谱。中国则承担其中位于第3号染色体短臂上3000万bp的测序工作(简称为1%工程)。结合笔者亲自参与测序的实践经验,我认为可以用②式对1%工程的完成时间进行预测,原因如下:·测序过程中需要把一条较长的DNA链多次随机分割成大约500~800bp的短链,分别测序再按原来顺序拼接起来,我认为和拼图有异曲同工之妙;·拼接过程可以通过多次分割的重叠部分或是一些特殊标记识别相邻片断。这和拼图碎片具有颜色、形状等特征也很相似。·可以说整个计划的过程就是分割-测序-拼接的循环体。理论上分割与测序两个步骤制约着拼接工作进展的速度,但实际上分割与测序速度大大超过拼接速度:重要的“瓶颈”其实在于拼接。因此,拼接的完成就意味着整个任务的完成。以下是从第1天拼接到第107天的数据表:时间-碱基数量表时间(天)被拼接上的碱基数量(bp)时间(天)被拼接上的碱基数量(bp)1254,81555830,9722598,786561,200,47931,049,449571,037,9624943,37658656,9035857,17859799,3246683,46060775,4937621,85361921,3288679,84962708,0899940,926631,172,28510915,559641,117,46011636,52765685,80412382,785661,091,24013936,66167923,66014471,73068674,40715641,11769627,61116900,33470802,86517492,87771821,79618470,29172993,15219715,004731,319,48320448,79874881,678211,096,222