作为中国工程生物学、合成生物学研发的中坚力量,由中国科学院和天津市人民政府共建的中国科学院天津工业生物技术研究所(简称:天津工业生物研究所)已经成为工业生物技术国家级创新科技平台。
得益于科研团队孜孜不倦的技术攻关,天津工业生物研究所牵头组织承担了多项合成生物学、绿色生物制造等重点研发计划任务。天津工业生物研究所拥有目前国内合成生物学、生物制造领域比较少见地,从基础研究端到产品端再到产业转化运营端完整的全产业链生态体系。
2019年,天津工业生物研究所成立了生物设计中心平台实验室,并围绕生物计算设计,开始与亚马逊云科技共同探索生物技术和信息技术相结合(BT+IT)技术体系,以进一步推动合成生物学发展,以期能够为在健康、能源、农业和环境等领域的重大突破提供技术支撑。
而近期,这一合作已经将升级至2.0阶段。双方在AI、大模型甚至量子计算等一系列前沿技术合作已箭在弦上。
构建BT+IT技术体系
天津工业生物研究所与亚马逊云科技的合作,始于2019年的上云浪潮。当时天津工业生物研究所负责IT技术的团队规模不大,开发人员数量不多。他们既要兼顾多个应用场景,开发不同的应用需求,同时需要开发好几个任务。
现实的需求让天津工业生物研究所开始尝试从基于服务器端的开发模式,转向于云原生的开发模式,借助云计算,很好的提升了科研业务的效率。从2019年开始在云上已经部署了超过20个云端应用。
天津工业生物研究所打通了一系列的不同的云上应用开发方式,包括纯分析类的、面向用户的工具/网站平台开发。几年来已经围绕着工业生物设计里面的不同子领域做了相当多的工作,比如说序列设计、图谱、各种分析平台开发、数据库开发等。
1.0技术合作三阶段层层递进
亚马逊云科技与天津工业生物研究所经过了四年多的合作,从最初的数字中心到现在的所有IT架构、开发理念、开发模式都以云原生的方式实现,合作分为三个阶段:
最初在2020年及之前,更多的是在学习云计算的一些技术,包括初步尝试在云上利用一些新的工具做构建。凭借天津工业生物研究所的行业经验和亚马逊云科技的提供的很好的云计算解决方案和思路,研发人员理解了云计算在解决具体场景需求方面的能力。
第二阶段,2021年进入快速发展期,天津工业生物研究所陆续有10多个软件应用实现了云上部署,并尝试构建云原生现代化应用,探索出了适合生物设计中心业务模式的最佳实践。
第三阶段,从2022年到现在,天津工业生物研究所使用托管服务和创新服务进行云原生创新,加大对云计算优势的利用,如按需交付、快速扩展、弹性等,大大提升了开发效率、业务敏捷性、可扩展性和可用性,同时实现成本节约。
生物计算设计成果频出
天津工业生物研究所与亚马逊云科技携手,通过突破传统开发模式提升科研效率,在核心数据库和专业应用工具设计两大研发方向上实现技术突破,有效推动了合成生物学发展。
天津工业生物所生物设计中心团队联合亚马逊云科技团队在计算生物学国际期刊《Nucleic Acids Research》(《核酸研究》)上发表文章,发布了首个基于图数据库Amazon Neptune的大肠杆菌调控代谢关系知识图谱ERMer,首次提供了全局的代谢调控图谱,并通过可视化框架实现了丰富的搜索功能,如多步查询、最短路径查询等。ERMer采用专门为高度关联的复杂数据集的高效存储和查询设计图数据库架构,这打破了传统的低效数据检索方式,有效增强用户和图谱的人机交互,大大降低了使用门槛。
为充分发挥知识图谱的价值,生物设计中心团队还进一步采用基于图神经网络技术进行推理,成功实现了转录因子预测和转录因子靶点预测等功能,这将有助于挖掘潜在的关键调控因子和调控靶点,构建新的调控代谢网络,能够为研究人员提供新的思路和方向。
另外,天津工业生物所生物设计中心团队开发得到了第一个能够在所有操作类型、任何基因组位点和跨物种上进行精确、自动化和高通量编辑序列设计的云平台AutoESD。AutoESD的开发采用了基于云端的无服务器架构,确保了高可靠性、稳健性和可扩展性,能够在几分钟内并行处理包含上千个编辑序列设计目标的数百个设计任务。
开发人员利用Amazon Lambda无服务计算将不同的引物设计、同源臂设计等编辑序列设计模块封装打包,满足了具体功能的模块化开发要求,并方便地对功能模块进行管理和共享;利用Amazon DynamoDB提供毫秒级的动态资源响应性能,并自动扩展所需资源以应对增加的业务需求;利用Amazon Step Functions实现可视化的工作流管理,实现了编辑序列设计工作流的串联,从而实现应用的快速构建和更新,同时快速查询处理异常任务。这些Serverless服务帮助天津工业生物所团队进一步简化运维,使得开发人员可以专注于业务代码和创新,与传统开发方式相比,开发时间缩短了75%,总体拥有成本降低50%。
战略合作升级到2.0 AI、大模型等是未来重点
中国科学院天津工业生物技术研究所副所长王钦宏介绍称,研究所正式成立十年来,产生了一系列的成果,尤其是最近几年随着积累的增加,成果产生的速度还在逐渐加快。从整个科技创新来说,研究所的创新首先要解决底层技术的创新,围绕着工业生物创制的体系的底层技术,做了很好的布局,也取得了不错的成绩。
王钦宏强调要借助亚马逊云科技强大的云计算能力、强大的数据处理能力、强大的计算平台,为天津工业生物研究所认识生命、设计生命以及合成生命来提供一个更好的支撑。
中国科学院天津工业生物技术研究所生物设计中心主任马红武认为,如同当下AI已经升级到2.0阶段,与亚马逊云科技的合作也准备进入到2.0模式。要把AI大模型、图数据库、知识图谱和工业生物大数据结合在一起,双方合作进一步深化并提升到新的高度。
中国科学院天津工业生物技术研究所生物设计中心副主任廖小平表示,天津工业生物研究所生物设计中心团队从去年开始布局做机器学习和推理的任务,今年上半年开始做大语言模型,希望用另外一种方式来推动研发方式的转变,从而撬动研发的新范式。此外,也期望通过亚马逊云科技的全球科研领域辐射能力,提升天津工业生物研究所生物计算设计方面的国际影响力,为世界各国的合成生物学科研工作者提供优质服务。
亚马逊云科技中国区商用与公共市场事业部总经理李晓芒表示:“亚马逊云科技为全球数千家生命科学领域客户提供云服务和行业解决方案,助力从实验室到真实世界,全面加速生命科学数字化创新。我们很高兴能够与天津工业生物所一道,通过云技术和深厚的行业实践推动合成生物学领域的技术进步,开拓生物制造产业的数字化创新路径。”