|
发表于 2023-2-9 08:49:27
分子生物学研究生来说一说,我做的方向是酶学,够典型的生物学方向吧?楼主应该知道蛋白质是由氨基酸组成,那现在我想通过定向进化改造它,比如说,提高选择性,假设这个蛋白有200个氨基酸(不算多啊),那么每个氨基酸有20个变化,如果随机突变的话,每种突变都出现,那这个文库规模是相当大的,这里就有一个问题,如何最快的在这个文库中搜索到选择性提高的突变体(你不可能每个都去做实验测一下!),这就涉及到算法问题了,或者说在这个蛋白质的氨基酸的序列空间里,如何构建出规模尽可能小又包含目的性状的突变文库,并且,更高端的来了。。。想提高选择性的同时要保证酶活,稳定性都尽量不变,这几个性状如何trade off即约束平衡?到底如何能在这个序列空间里最快找到这个突变体?我说,这就不仅是微积分的问题了,机器识别算法,nk模型什么的都来了。。。你想想,微积分只是基本的数学啊,牛顿搞出来的几个世纪的老玩意了。。。另外,现在的趋势就是跨学科和交叉,生物学迟早也要进化到能够精确控制的地步,怎么能少了数学的参与呢?
本人数学学渣,很遗憾读研才发现数学能用到哪。。。悲剧
用电脑来补充答案了:
借助数学工具的脱卤酶定向进化
2007 FoxNature
ProSAR驱动的定向进化借鉴了药物研发中小分子和多肽的结构-活性定量关系(quantitative structure-activityrelationship,QSAR)的工具和策略,是一种基于机器学习指导的蛋白质定向进化技术。
其原理如下:(1)选择10~50个突变位点构建突变体文库;(2)通过高通量筛选或表型选择获得ProSAR数据;(3)在Kauffman NK-landscape的基础上建立ProSAR线性/非线性模型,通过机器学习算法对ProSAR模型进行训练,根据回归分析数据将突变归类为有益突变、假定有益突变、中性突变和有害突变,被识别出的有益突变被固定下来作为亲本模板,与假定有益突变和其他待选突变通过半合成DNA混编(DNAshuffling)构建下一轮突变文库。上述步骤可反复迭代进行,直至需优化的蛋白质性质达到要求或不再增加为止。
Improving catalytic function by ProSAR-driven enzyme evolution : Abstract : Nature Biotechnology有兴趣的同学请自行下载。
最后有必要说明这个研究的意义------不只是提高了活性发篇文章而已,该文的主角卤醇脱卤酶在制备立普妥这个抗胆固醇药物的工艺上发挥重要作用,辉瑞的工艺就使用了这个酶。而这款药物年销售额过百亿美金,史上第一。对此我只能说:知识就是力量。 |
|