李玖一
2016年4月27日上午,北京大学生命科学学院生物信息中心高歌研究员受遗传发育所樊小龙教授的邀请,在116会议室作了题为“Rediscovery Human Genomes: what we learned from 675+ TB data”的学术报告。
高歌研究员的研究方向为生物信息学与计算基因组学,承担了包括“十一五”863国家生物信息网格(课题负责人),“十二五”国家大数据中心(子课题负责人)等在内的多项科技部、基金委重大课题,自主研发了9种生物信息学新算法软件及数据库,外部有效访问量逾亿次,其中半数以上来自国外,跻身国内自主开发的最有国际影响力的生物信息学技术行列;在此基础上,围绕基因表达调控网络的功能与演化开展了系列工作,作为第一及通讯/共同通讯作者在Genome Research、Molecular Biology and Evolution等生物信息学与基因组学权威杂志上发表论文19篇,并作为生物信息分析合作者在Cell, Cell Stem Cell, Developmental Cell 等杂志合作发表论文16篇,累计被引用两千五百余次。
高歌研究员首先与大家分享了当前生物大数据尤其是测序数据研究的概况。他指出尽管二代测序技术的发展为解读人类生命天书提供了无限的可能性,但这种可能性却极大的受制于生物信息学分析技术上的瓶颈。如何从海量数据中提取出真正有用的信息是当前急需解决的一大挑战。接着高歌研究员介绍了其课题组在这应对此挑战所做的尝试。高歌研究员发现,由于测序技术及比对算法的固有缺陷,“人类千人基因组计划”中有近50%序列无法比对到参考基因组上,许多关键信息可能被遗漏。所以,其课题组开发了一种不依赖于序列比对的数据库来对序列信息进行注释。对未比对注释结果表明,大量的未必对序列都发挥着重要的功能,有的与人类疾病,如糖尿病、肺癌有关;有的与基本感觉如嗅觉、味觉相关,这些都是以前没有发现的。高歌研究员的成果表明人类基因组虽已完成测序,但仍有大量的隐藏信息需要去解读。
报告结束后,与会的老师同学就报告的细节提出了一些重要而具有针对性的问题,高歌研究员都一一作了清楚的解答。随后,我院生物信息学专业的林魁、牛登科教授和高歌研究员进行了学术交流,并对在场的年轻人提出了殷切的希望。至此,报告圆满结束。