找回密码
 注册会员
查看: 287|回复: 5

机器学习跨领域到生物信息学怎么样?

[复制链接]
online_member 发表于 2023-4-19 09:56:53 | 显示全部楼层 |阅读模式
我知道“生物信息学”是个很大的领域,不过一些分支,像“Genome annotation”,“Genetics of Disease”,有一些机器学习的应用,且存在一个研究方向叫“计算生物学”(Computational Biology)。不知道“生物信息学”领域的研究者欢迎机器学习跨领域吗?
(比如像数学专业基本上是一个计算机领域欢迎的跨专业行当~~那生物信息学领域里有比较强的“欲望”需要“机器学习”背景的研究者吗?)
online_member 发表于 2023-4-19 09:57:20 | 显示全部楼层
我是cs phd 做生信的
就我个人来看,生信分两种
一种主要是依靠牛逼的数据,高强度的跑包,成不成功都是玄学,但是技术要求特别低,cs转过去 3个月基本上全部掌握。 如果没有牛逼的数据,那对不起,撑死也就是个frontier级别的期刊。
一种就是做方法开发,可以看看bioinformatics bib nc一类的
你突然会发现,我靠,我还是老老实实做nlp把,做个时间序列啊,做交通啊,做cv都行
蛋白质也很卷,医学图像也挺难
关键没顶会,就业不给力
再补充一下,湿实验是容易出高分论文,但是考虑到湿实验庞大的人数,这个比例也就那样吧,并且还需要分出共同作者给生信等等
湿实验,靠设备,靠材料,靠劳动,三者缺最后一个说不定能成功,缺前面的一定不成功。
相同的实验,贵的材料和便宜的,结果就是不一样
所有做生物一定要去一个靠谱的组,去不了靠谱的组,科研寿命应该也没了
online_member 发表于 2023-4-19 09:57:44 | 显示全部楼层
科研领域发文章应该还不错,如果机器学习+生物信息投入临床使用,并得到行业认可还需要很长时间。
举个例子,

机器学习跨领域到生物信息学怎么样?478 / 作者:梦太晚616 / 帖子ID:116838
2017年的时候,谷歌团队发布了开源版本的DeepVariant,是一种将深度学习Convolutional neural networks (CNNs)和高通量测序NGS (Next generation sequencing technology)结合用于germline variant-calling的工具,当时可谓轰动一时。

机器学习跨领域到生物信息学怎么样?597 / 作者:梦太晚616 / 帖子ID:116838

主要技术原理

然后,和各种通用软件一顿比,
首先,出场的是GATK,在indels和snps方面,

机器学习跨领域到生物信息学怎么样?479 / 作者:梦太晚616 / 帖子ID:116838
然后,和gatk、strelka、greebayes等比较,DeepVariant获得更少的基因型错配(FP.gt)和等位基因错配(FP.al),多达50%

机器学习跨领域到生物信息学怎么样?331 / 作者:梦太晚616 / 帖子ID:116838
DeepVariant性能不受参考基因组版本影响,

机器学习跨领域到生物信息学怎么样?441 / 作者:梦太晚616 / 帖子ID:116838
跨物种

机器学习跨领域到生物信息学怎么样?270 / 作者:梦太晚616 / 帖子ID:116838
适用不同测序平台

机器学习跨领域到生物信息学怎么样?953 / 作者:梦太晚616 / 帖子ID:116838

机器学习跨领域到生物信息学怎么样?937 / 作者:梦太晚616 / 帖子ID:116838
几年之间github也被标星2.5k

机器学习跨领域到生物信息学怎么样?613 / 作者:梦太晚616 / 帖子ID:116838
而明星gatk也才1.2k

机器学习跨领域到生物信息学怎么样?556 / 作者:梦太晚616 / 帖子ID:116838
是不是很牛逼的样子~

机器学习跨领域到生物信息学怎么样?526 / 作者:梦太晚616 / 帖子ID:116838
<hr/>但是,除了在文献中看到有被使用,真正在检测流程中,有几家在用?(有使用的,欢迎点赞 )
个人感觉还是归功于CNN的黑盒、可解释性差吧~
推荐阅读

pythonic生物人:一图胜千言,超形象图解NumPy教程!
pythonic生物人:谁是Python/R中最强Dashboard APP开发工具?
pythonic生物人:pandas、spark、DataFrames.jl、polars、dask、data.table、datatable谁才是最快数据处理武器??
pythonic生物人:赞赞赞N个神经网络可视化工具
pythonic生物人:yellowbrick牛逼,机器学习“炼丹师”、“调参侠”们有福了
pythonic生物人:丰富的Python可视化“武器库”:从PyViz到Matplotlib
pythonic生物人:从哪些方面着手提高Python?Python社区“老司机们”的这本书讲清楚了!
pythonic生物人:13个高清图助快速上手Python: NumPy/Pandas/SciPy/Matplotlib?
更多好文,欢迎关注 @pythonic生物人
online_member 发表于 2023-4-19 09:58:24 | 显示全部楼层
我只见过反过来的,从生物信息跨到计算机搞机器学习,毕业以后去找工作去挣钱吃香的喝辣的,很少见到过愿意不要炙手可热的热点,愿意贡献自己的学识,青春给我们遗传学的。
真心给问主点个赞!
online_member 发表于 2023-4-19 09:58:36 | 显示全部楼层
我是CS PhD,focusing on computational biology,或者叫Bioinformatics,反正我们系里也没有各个分支的明确界限。
computational biology大部分情况下指的的computer Science的一个分支,Bioinformatics在美国大部分指的是生物学的一个分支。这里不细分了,统称生物信息。
生物信息本来就是用计算的手段来解决生物问题的,机器学习自然是现在来说,最最热门的计算上的手段了。生物信息和机器学习,分别是目的和手段,从纯学术来讲,是没有什么矛盾的。
从个人角度来看,因为和生物背景的人合作很多,大家的思路是不一样。生物系搞生物信息的,一般情况下,问题基本是定好的,比如我要预测某某某东西,我想分析A与B的相关性,问题定好了之后,在去找方法,统计分析,机器学习都试试,看看有什么结果。学计算机的搞这个生物信息,一般都是从方法出发,一般需要读文献的时候,从一个比较广的角度去看,看到某个方法很新颖很有效,就想想有没有什么问题可以用这个方法解决。
而经常遇到的困难,对从点了生物树技能的来说,就是经常因为编程或者方法上的问题,本来应该很快得到结论的,拖了很久才能有结果。对升了CS技能童鞋俩说,最常见的问题就是,解决的问题,没有生物学意义,属于屠龙之术。
从个人前途来讲,哪怕发了一样的paper,走CS路线的,不管找工业界工作,还是postdoc,包括教职,都好于从走生物路线的。从我们学校来看,排名100以后,CS PhD首先就被各大公司的校招general hire招走一大批,美国人很多留在本地,不想全国性搬家,剩下找postdoc的基本就是真的对学术感兴趣的,并且基本也都能找到大学霸的课题组
您需要登录后才可以回帖 登录 | 注册会员

本版积分规则

手机版|UFO中文网

GMT+8, 2024-12-23 17:50

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表