|
楼主 |
发表于 2015-10-22 21:37:57
|
显示全部楼层
卡尔安·维拉马沙纳尼(Kalyan Veeramachaneni)是坎特的论文导师及麻省理工学院计算机科学与人工智能实验室的一名研究科学家,他和坎特共同参与了这项研究。
在选择具有某种特征的数据进行分析时,往往要用到人类的直觉。而这两名研究人员的研究结果便是,让机器来做这个决定,即扮演起人类直觉的角色。“在为工业解决了大量数据科学问题之后,我们从自身经验中观察发现,这其中有着至关重要的一步,叫做特征工程。”
数据科学机运用多种指标,寻找数据库中、数据结构关系间的相关性,该机器可以利用这些指标在数据库中进行部署工作,并找到这些数字的平均数。在这一过程中,该机器还会寻找分类数据,即处在某一范围之内的数据,例如一周之中的某几天等。
通过与麻省理工学院计算机科学与人工智能实验室(CSAIL)的其他研究人员的合作,维拉马沙纳尼成功地将机器学习技术运用于解决实际问题之中,例如,预测有哪些学生会翘掉在线课程。
他表示,制造数据特征是该过程中极其重要的一步。“首先你得确定需要从数据库中提取出哪些变量,而为此你可能会有许多不同的想法。”
“数据科学机本身就是一项令人难以置信的伟大项目,因为它成功地将尖端研究成功运用到解决实际问题中去,提供了一种全新的看待该问题的方式。”哈佛大学的一名计算机科学教授马戈·塞尔策(Margo Seltzer)说道。
“我认为,他们所做的一切很快就会变成行业标准。” |
|