UFO中文网

 找回密码
 注册会员
查看: 193|回复: 5
收起左侧

想入生物信息学这个行业,python学习要达到什么程度???

[复制链接]
online_member 发表于 2023-2-20 11:30:39 | 显示全部楼层 |阅读模式
生物背景,想入生物信息这个行业,于是自学python?请问要学到什么程度?
还有R语言,要到什么程度可以入行???
千万别说越牛逼越好……
online_member 发表于 2023-2-20 11:31:22 | 显示全部楼层
学到你写任何数据分析的业务逻辑的时候(除了计算密集型任务),语言技能都不会阻碍你的程度。
online_member 发表于 2023-2-20 11:31:37 | 显示全部楼层
学生物学的学点python是很好的,因为python比较简单易学,可以做为工具使用,而且python方生面的生物学资源也比较多。 R不敌python,在淘汰中,能不学尽量不要学了。
推荐如下书籍 python 3.7极速入门教程 - 目录 看见面几章差不多可以上手了。研究生的功底摆在那里。
python工具书籍下载-持续更新
Python生物学Cookbook - Bioinformatics with Python Cookbook 2nd -2018.pdf
Python生物学 Python for Bioinformatics 2nd - 2018.pdf
online_member 发表于 2023-2-20 11:31:47 | 显示全部楼层
其实入门这个东西也看你要做什么样的工作。
生物信息学涵盖的范围也是很广的,我觉得目前而言做生信的主要有三类人:
1. 老本行是做实验的,做生信可能是为了辅助研究或者是为了发paper(有非常多的临床生选择趟生信这波水)
2. 主要是做生信的,主要涵盖高通量测序数据分析,组学数据分析等等,专门从事生物学数据分析的这群人,其大部分也是本科生物狗作为强大的生力军,以调包写R,python为主。那么这群人就要熟悉看各种包的tutorial以及如何进行常规的数据的处理和分析等等。那么其实这群人,我个人认为对python的编程要求不是很高,在coursera先上两门课程,然后照着参考书在项目中练练就熟络了。
3. 也是做生信的,但是主要以写包为主,什么意思?就是以开发算法供给第二类人用,做这部分工作的人需要具有良好的数理基础,所以一般大部分都是本科属于物理,数学等理工科的人在做这部分工作。当然对编程也提出较高要求,另外更倾向于C++.相关的实验室可以关注清华叉院以及自动化系那边,还有同济交大的实验室。其实国外这方面的气氛也很浓,我推荐一下普林斯顿的Han Liu,他主要是做probability graphic model,应用在biological network analysis很有意思。以及他开发的Stars算法选择正则化参数等等。
其实完全看题主以后做什么样的工作,我想也您也是第二类的方向,其实编程这种东西平时训练一下都能有收获,是真的投入和产出成正比的工作。那么更核心的问题,是在于你基本的统计思维和结合生物学背景思考问题的能力。
补充一下,做第三类人当然也有本科学生物的,我就不说Fisher对统计学的意义了,我遇见的两位老师,一位本科是农学的,phd在edinburgh读biostatistics,研究方向是群体遗传与进化,他的统计学基础十分了得,我看了他的草稿各种复杂的公式方程。另外还有一位是queensland的Jian Yang,他研究领域包括数量遗传,GWAS分析等等。也是从事software development的工作,他本科也是学生物的,题主有兴趣可以QU的官网上看看他发过的paper,已经不知道发过多少篇Ng...
对了,上面两位,没有修相关学位,全靠自学,所以题主,要加油呐。
online_member 发表于 2023-2-20 11:32:20 | 显示全部楼层
我以自己的3年的自学经历,给跟着我学习生物信息的小伙伴亲自出了13到题目,并邀请前辈录制了视频,分别是:
生信编程贴
01.生信编程很简单                                      |   02.人类基因组的外显子区域到底有多长
03.探索人类基因组序列                              |  04.探索人类基因组注释文件
05.多个同样的行列式文件合并                  |  06.根据GTF画基因的多个转录本结构
07.下载最新版的KEGG信息并且解析       |  08.写超几何分布检验!
09.根据指定染色体及坐标得到参考碱基  |  10.根据指定染色体及坐标得到位置信息
11.把文件内容按照染色体分开写出           |  12.json格式数据的格式化
生物信息Python从入门到精通
我觉得你能把这些题目独立完成,就说明在生物信息领域,你的编程能力大致是足够来工作了。
当然,去做科研算法还是不够的。
您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

UFO中文网

GMT+8, 2024-11-23 15:02

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表