再过20天,2020人工智能大会即将在“云端”上线,上海市钦州路100号4楼里,一双无形的“AI慧眼”早已忙碌开启 。随着指尖跳动的搜索“关键词”,“AI慧眼”以最敏感的“视觉神经”启动了“在线科研”新模式——无需面对面,不必跑现场,就能捕捉到全球顶级人工智能大咖的“创新画像”,为世界人工智能大会的参与者挖掘AI产业新人才、指明AI研发的新方向。与此同时,“在线科研”集结号也在生物信息、病毒筛查、区块链等新领域悄然吹响,伴随着在线新经济的迅猛发展,上海科技创新踏出“云中漫步”新节拍。
图说:工作人员正在演示人工智能公共研发资源图谱的使用方法 记者 徐程 摄
在线科研为AI大咖“画像”
走进钦州路100号的上海科技创新资源数据中心,中央大厅的洁白墙壁可以瞬间“蓝屏”,“全球高层次科技专家信息平台”跃然眼前。你想了解国内外哪位人工智能专家的科研业绩,只要在搜索栏输入名字,各种有价值的科技信息随之而来。“吴恩达”,记者输入世界著名人工智能学家的名字,几秒钟后,一幅丰富又直观的学术谱系图,围绕在他本人的肖像,逐一展开。国籍、年龄、履历、荣誉,科学家本人的创新经历一应俱全;机器学习、人工智能、神经网络、大脑计算,他涉足过的研究热词,组成一张醒目的创新关键词矩阵。
作为首批建设的十五家功能型平台之一,上海科技创新资源数据中心功能型平台利用AI赋能,实现了可视化的“全球高层次科技专家信息平台”。去年,以人工智能及相关领域的重要数据资源为基础,平台发布了《上海人工智能公共研发资源图谱》,对海量数据进行挖掘和处理,通过深度学习和知识图谱的应用,产生与AI顶级大咖相关的“学术画像”,不必谋面,就可了解其创新全貌。
病毒库里 “大海捞针”
新冠疫情,让“核酸检测”为普通人所熟知。其实,它在生物医药领域十分常见。传统的核酸检测只能覆盖病原微生物全基因组的很小一部分,无法满足前瞻性科学研究和复杂临床检测的需求。在过去,测序技术受地域限制和分析周期的影响,分析结果的及时性较弱,尤其是对疾病的快速诊断十分不利。这对上海科技创新资源数据中心战略部科学数据产品经理左天宇来说,有诸多切身体会。他十分理解科研人员有多么渴望拥有一片“专属云”,实现在线研发和数据分析。
“读书的时候,很多医学专业的同学,就会拿着基因测序完的原始数据找人去分析。无奈,医学院里想找到计算机人才不容易;而懂复杂数据分析的人,又难以接触到生物医药团队。”所以,大家只能通过个人人脉去寻找,这种研发效率是比较低的。特别是此次疫情期间,“线上研发”需求更加迫切。例如,国家卫健委提出,“单从临床表现、胸部影像学难以鉴别,需依靠病原学检测来区分。”然而,精准的基因组测序以及数据分析和解读,又不是临床医生的必修课。
为此,上海科技创新资源数据中心联合中国科学院上海巴斯德研究所、中国科学院上海营养与健康研究所共同研发了基于二代测序数据的病毒基因组鉴定服务,在线面向全国医疗机构、医生和医学研究者免费开放。与核酸检查相比,病毒基因组鉴定优势就在于,“不仅可精准识别病毒基因特性,还能监测病毒变异趋势并及时做出更新判定。”左天宇形象地做了个类比,病毒核酸检查做的是判断题,而病毒基因组鉴定做的却是简答题。而且,这种“在线科研”是根据病患的呼吸道样本二代测序数据,通过分析流程将样本数据与病毒基因库进行快速比对,不仅1-3小时便可检测出结果,而且是在包括SARS、COVID-19等在内的所有人类已知一万多种病毒种类中,精准地实现“大海捞针”。
据后台数据显示,病毒基因组检测平台已向来自上海市公共卫生临床中心、复旦大学、复旦大学附属儿科医院、遵义医科大学等机构的用户提供了224次检测服务,检出了包括Covid-19、Hepatitis B virus、Influenza A virus在内的近10种病毒。遵义医科大学徐鹏副研究员说:“病毒检测平台让我和周边不太懂生物信息分析,但又有实际需要的研究人员眼前一亮。让我们在线就能享受到上海头部科研力量的研究成果,推动科学研究和临床诊断的发展。”
图说:上海科技创新资源数据中心的技术人员正在工作
科研大数据“在云端”
基于容器云平台的在线生物信息分析平台G-Xpert 已基本完成,预计于今年年底全面上线,真正实现了“科研大数据”。数据中心首席技术官张嘉锐告诉记者,鉴于测序数据分析的专业壁垒,基于云计算的生信分析平台对相关科研人员和临床工作者而言,有着极大的吸引力。创新链条上扮演不同角色的科研人员,可以通过“协同研发”,真正实现跨团队、跨专业、跨地区的科研协作。
“例如,一名从事细菌进化研究的科研工作者,可以在平台上完成测序数据质控、变异位点提取、进化树构建等常规分析步骤。同时,他也可以通过在平台上与领域内生信专家的协作,进一步分析细菌的进化过程,从而回溯细菌耐药性的产生过程和产生规律,为临床治疗提供指导。”
在张嘉锐看来,此次疫情给在线科研提出了新需求,也指明了新方向。围绕科研数据的专业存储、大数据分析处理、共享协作等,越来越成为各科研团队面临的共性问题。特别是在天文、地质、海洋、生命科学等以数据为驱动的科研领域,“协同科研”将是提高科研效率和寻找创新突破的新动力。“当然,协同科研并不仅仅是通过互联网沟通科学研究,而是将科学研究的全流程真正在线化、数据化,特别是让大学科、大团队的跨地区、跨领域科研协作,可以在云端如履平地。”
据介绍,在线生物信息分析平台的打造,就是希望通过实现各领域专家背书的云原生的数据处理、分析算法和流程,大大降低生物信息分析的门槛,提高科研人员和医务工作者的研究效率,实现科研大数据的创新和协同。“未来上海科技创新资源数据中心还将根据实际研发需求,除了在线分析外,将对于医院、疾控中心等涉及敏感数据的机构,协助完成本地化部署分析流程和云平台,提升实时分析的能力。”