[音乐]
我们再往下看一些例子,非编码的RNA基因
这个是现在特别热的一个领域 什么叫非编码的RNA的基因?大家都知道你这个基因有编码
蛋白质的,还有编码比如说tRNA、rRNA这些都叫这个 编码的基因。还有一些它
能够这些DNA能够转录出RNA来 这些RNA就在那,你也不知道它是什么功能
当然现在知道了很多这个非编码RNA的一些功能了,比如说小RNA这些 做很多工作了。他做的是一件什么事呢?
他就去看在这个人和黑猩猩的基因组去比
他去,因为人和黑猩猩不是基因组的差异很小嘛
他视图从非编码的RNA的角度去看,他去找那些在
人基因组里面演化速度特别快的这些编码的RNA
结果他还就真找到了一个,找到了一个什么样的非编码RNA呢?
他是在人脑里头表达的
他找到了这样一个,而且演化速率很快。什么样叫很快,我们来看一下
这是这个序列 你们看不清,没关系,我就把这个有变化的地方用红框框打出来
一共是10个位点 在这个位点上,这个是,第一个是人的啊
下面这个是,比如说黑猩猩、大猩猩,什么这个猴子、小鼠、狗
牛、鸡什么的,就整个这个 鸭嘴兽之类的,就是有,有很多其他的这个物种
你去比,我画出来的这个 位点只有人这个基因
发生了改变,有10个位点在人的里头是发生改变,而在其他所有的
这个脊椎动物里头都没有改变,都一模一样的
所以这就表面这个编码、非编码RNA的这个基因
它在人里头演化的速率特别地块
对吧?它跟其他的这个脊椎动物都不一样,其他的脊椎动物在这个位点都非常保守
他又去做了一个结构的预测 这是在人的里头
这是在这个黑猩猩的里头,你可以看到 确实它,黑猩猩很长的这个柄到它这地方就变短了
黑猩猩很短的这个柄到它这个就变长了 所以这个工作呢其实他就发现了这么样一个
非编码RNA的基因,发现了它表达的部位
发现了它在不同的生物里头演化速率的差异
他就得出来一个这样的结论,他说哎呀这样这个
这个基因演化这么快,又在人脑里头,是不是它跟人的 这种演化有关呢?它跟人和黑猩猩的区别的有关呢?
所以你看,很多演化的文章它可以把它拓宽地很大,尽管他没有很充分的证据
这是一篇发在《Nature》的文章 当然比较早了,2006年,也不算特别地早
就所以在演,我一,一再跟同学们说,你这个演化 学习演化也好,做演化也好,其实很多时候需要你去想
你真的要会想,要敢想 当然你做实验还是要很严谨,这个没得说,这个是
你放到哪都必须很严谨,但是你要真的是要充分地 发挥你的这个想象力,这是,这一点非常重要
还有就是基因组里面,比如说人的基因组,你才大概1%
是编码这个蛋白质,编码RNA、tRNA、rRNA的这些,mRNA的 你很多其他东西DNA你都不知道它干嘛
所以有的,有一段时间人们把那些没编码的叫junk DNA
就是说垃圾,就是说它没有用,但会不会是这样的 情况呢?有人就来做了这样一个研究,就是把这个基因组的序列拿来
看那些没有编码的部分它到底保守不保守
从演化的角度来说,如果这一段序列在很多生物里面
都一直都没变,很保守的话,那它暗,暗示我们是什么?
这一段序列很可能有功能,对不对?他就是拿这种 从这个观点出发他去做这样一件事
他到哺乳动物里面去找那些非编码区域的 保守的片段,真给他找着了
他对13个哺乳动物的基因组里面去 非编码的区域,啥都不是的区域,他去看,看它的这个
突变的这个速率,或者看它的这个碱基的替代的情况 这个这个表,这个
横坐标是不同的物种,有13个,纵坐标就是它序列的差异 你看,这个
紫色的部分是它的编码蛋白质的基因
所以你看它这个里面的bar还是比较高的,对不对?
这个bar越高,就说明它的差异越大。再来看另一类 我们刚才说了非编码的RNA,是吧?它也是由基因
编码的嘛?它有DN,DNA编码的嘛,这个是什么颜色呢?是黄色的
那么黄色的你也看到它这个高高低低的,有的比这个编码的
基因要高,有的比编码的基因要低。但是还有一个
蓝色的这一部分就是它啥都不是
它也不编码RNA,也不编码蛋白质,但是它非常保守
看到吧?看到这个bar吧?它是最矮的 这样的这个序列在基因组里面
有0.3%,人的基因组31个碱基对,你乘一下,还是不小的一个数。
但是这个到底在那干嘛呢?不知道
但是你可以推测一下这么保守的,你像在这个13个哺乳动物里面同样的规律
同样的式样,它很可能代表着
它有很好的功能在那,它有很重要的功能在那 是什么?你不知道,需要人们继续去
研究,人们的猜测呢,就是说它很可能跟基因调控有关 是调控你基因表达的强弱、时间这些,空间、时间
这是推测。这也是一篇《Science》Paper
刚才讲了都是这个 动物里面的例子比较多。下面我来讲讲这个基因组学在
研究农作物的这个起源和演化方面的这个作用 这个是今年来非常热的,以前记得我这个记得跟你们说过
以前农作物大家都不屑去做的,现在你发现太有意思了 你拿农作物和它以前的祖先去比,能够发现很多有意思的现象
一些现象是可以来指导你以后的生产实践活动的,所以这些大家都很感兴趣
这个工作呢我是介绍的这个水稻的起源,水稻大家都知道,天天吃米对吧?
水稻呢它是分成两个亚种,一个叫
籼稻,一个叫粳稻,粳稻也有人叫geng稻。这个问题是什么呢?
第一个问题就是说,这两个亚种是不是独立起源的?
如果独立起源的话,从哪儿起源的? 哪个更古老一点?以前大家都觉得那个籼稻古老
indica是古老的,比japonica要古老,这个其实你是可以用基因组的方法去做的
这个是我们这个韩斌老师做出来的 他就重测序,测了多少呢?野生稻测了446份
然后各地的栽培品种测了1083份,所以1500多份东西在那 做出来他就去找
找那些基因组里面受到人工选择的痕迹的地方 也就是说野生稻里面这个地方是另外一个变化的式样
而在所有栽培稻里面都非常保守的,被人工选择固定下来了
所以就把所有,就拿这55处去跟所有的这个
材料去比,结果挺有意思
这是中国南方的野生稻
好,这是一个他觉得比较古老的 梗稻的,粳稻的这个品种japonica
所以他就是觉得最早起源是在中国南方,大概在珠江流域一带
然后最先人们把它驯化成
粳稻,不是籼稻,然后呢这个粳稻呢再跟 野生的一些稻,就是野稻
来杂交,形成了这个籼稻,所以就把这个很复杂的网络呢给它搞清楚了
结论就是水稻是单起源的,祖先来自于珠江流域 最先产生的是粳稻,
籼稻是再反复跟这个 粳稻杂交啊这么形成的,是后来形成的。
所以这个证据非常有说服力,它用了1500多份材料,重测序啊。就把基因组重测一遍
这么来找到的,所以这篇文章是发在《nature》上, 是前年发表的,所以你看这个基因组确实能够
很精细地,它的这个分辨率很高的
来解决一些大家长期争论不下的问题
这个起源有的人说在印度,有的人说在中国,有的人说在日本,这种争议来争议去争议好久了-
。这篇文章基本上 给这个提供了一个很有利的证据,做出了这样一个结论
人类基因组研究能够给我们提供什么信息呢? 这个是我们最关心的,人总是自我中心,很关心自己。
刚才说了,有个千人基因组计划 甚至我们还可以把古人类的基因组给测了,这个很有意思
就说我就精细地去测,家庭,比如说爸爸妈妈和他的女儿
这样测了两个家庭,发现家庭成员之间的 差异。你看,爸爸妈妈这个女儿之间差异
也不少呢,有差不多600万个SNP。600万个位点的碱基是有替代的
也有一些indel,这有65万
然后还有比较大的结构的差异,这SNP是最多的,indel第二
大的结构差异最少的。还有关心的就说你到底 上一辈,上一代遗传给下一代的遗传变异
到底有多少?所以这个呢它也算了一下
差不多就是可以遗传下去的,这个基因突变的率差不都是 每个,每一代每个碱基对10的负8次方
血红蛋白那个我们讲了,那个那个每一年
每个位点呢它是10的负9次方,当然那个是
从蛋白质的氨基酸水平做的,而这是碱基 这就是每一代之间的,这个你是可以给它看出来的
还有就是民族,他拿了四个不同的民族去做了一下,就包括我们汉族
他就对编码的基因进行了重测序,也就是测下来的结果呢也挺有意思的
他说每一个人,我们每一个人身体里头大概都携带有
250个到300个失去功能的基因 其中大概有50-100个是现在我们知道
这个基因坏了,如果你是纯合的话,就可能有这个病症,病状出来了
它是可以造成这个遗传性疾病的 近亲不能结婚啊,就是这个道理。
非洲人群当中遗传多样性是最高的,这个不管你拿什么去做
拿你线粒体,拿你的核基因都是这个结果。这个重测序结果也一样
非洲人群当中,这个遗传多样性最高 这是篇《Nature》的,后来又做了一个
对来自14个population的1092个人
又做了一遍,你这个怎么做都能发很好的paper。看看这个 就说每个人,
他有76个到190个,这反正这个数字 每个研究的分辨率不一样,它出来数字不一样
他说这个含有非同义突变的有害的基因,每个人,包括你我,都一样
其中有20个失去功能的,就是每一个人我们都含有大概20个失去功能的基因
你想想看,如果近亲结婚的,很容易这个基因就碰到一起了
这就是害处。那么更多的变异是在 保守性很强的非编码的区域
所以他们就推测,这很可能就跟你基因调控有关了 所以这个基因表达的调控是这种差异
广泛地存在于人群当中。这是一篇《Nature》的文章
前年的,所以看这些很有意思的进展 那么还有一个,就是我觉得也是非常exciting的这个领域
就是古人类的基因组的测序,这个我们专门有一讲,要讲到这个,我这地方就不详细说了
所以在刚才给你们看的这些基因组的研究里头
其实人们最关心的是些什么问题呢? 除了这个人的我们自身的健康什么以外
一个就是去找关键性状的起源,和新类群的起源
这个大家都知道,生物是从水生到陆生的 从水生的环境到陆生的环境,是一个非常大的环境的变化
你要演化出很多创新型性的性状,你才能适应。而这是现在人们关注的很大的一个问题
这都是很Fundamental scientific question
是这个非常根本性的一些生物学的问题 大家都知道达尔文说,这个
生命之树,就这么不断地分叉不断地分叉,不断有新物种出来 到底有没有一些基因跟物种形成相关
这也是人们现在非常关注的。这个现在很热的,家养的动植物
它的演化的趋势是什么?这是人们想知道
它一些驯化的关键基因有没有?要有的话,是什么?
地球上的生境非常多,有非常热有非常冷
有旱有盐有涝,这种环境里面都有生物
它一定是适应了这样的环境,那有没有一些遗传的基础啊?有没有一些分子机制啊?
这也是人们研究得非常热的,你都可以用基因组的手段来解决
所以我们小结一下,这个其实是我们做三节课的
整体的一个小结。中心演化理论主要适应于
分子水平。看啊,我都是这个用的主要
也不能把话说得特别的绝吧,主要适用于分子水平
中性或者近中性的 这样变异和随机的固定
这样一种理论其实是对达尔文演化理论的很重要的补充
补充了什么?补充了分子水平。分子水平上达尔文不知道,那时候他根本没有这种
手段,他根本得不到这样的信息对吧? 中性理论是个很重要的补充。那么分子演化的
速率呢,你是可以从蛋白质水平,从核酸水平来进行计算的 这一点希望大家记住,你进行分子演化研究的时候
你要用很多公式很多模型,你一定要了解那些公式和模型背后的生物学意义
不是说拿来我就用,也不管三七二十一,得一个结果说老师你给我解释吧
这样不行的,首先你要明确你的生物学问题是什么,然后要特别了解你所用的材料
然后要很了解你的方法,这个缺一不可。
基因组的研究现在真是 日新月异,用这个日新月异一点都不过,给我们提供了大量的数据
大量的信息,每拿到一期你都可以看到有一些从基因组水平做的研究工作。
基因组的这些研究对生物类群的起源,分化,完全是演化
领域的了是吧?对他们的研究的这个推动作用是很大
还有一个我要说的,就是生物对
逆境的适应,这方面的研究其实是跟我们人的活动密切相关的。
它对我们人的很多生产的这种实践啊,是有很重要的指导意义的。
最后我就想说一下,基因组学
将对生物演化领域产生更加深远的影响 现在我们得到了很多很有趣的研究的结果
我们觉得哎呀提供了很多很新的视角,你可以从不同的视角来看一些演化的问题
但是对演化理论的这个
推动呢,还没有到一个说,我可以提出一个新理论,就对理论方面的这个贡献
还没有看得出来,但是我觉得我们离这一天不远了 基因组,越来越多的生物的基因组被测序,被分析,
因为我们的生物的基因组里头是含有了你整个的演化的信息的,就看你怎么去
读,你怎么去解读。随着新的技术,分析的手段不断地更新
我觉得在演化理论方面新的突破,大概很快就会
产生的,这是我是比较乐观的,我觉得这个突破就有可能是
基因组学给我们带来的。这就是我这三节课的
总结,谢谢大家!