行业趋势
受疫情刺激,基因测序技术已获得广泛认可,其中20年H1基因企业融资同比增长287%,基因大数据的积累及其转化应用将出现井喷式发展,企业发展将面临”大而全“或”小而精“的战略选择,因此高性能、可扩展、经济的IT技术平台是生信技术高速发展的重要底座
从CPU算力,到异构计算加速
测序分析算法已逐渐稳定,行业除了使用传统的CPU为核心算力,通过容器、FGPA、GPU、大数据和分布式等技术缩短分析耗时,已逐渐成为趋势且部分软件也被广泛商用
从本地存储和硬盘邮寄,到网络交互
生物基因分析全过程的数据量巨大,依托5G和网络存储的高带宽、高可靠和海量资源进行数据的传输、分享、备份和归档,已逐步成为行业事实
从数据归档,到数据应用
基因数据量级剧增,归档存储的成本递增,随着大数据、人工智能和区块链技术在行业内的应用,“基因+”的跨界信息融合为企业提供商业创新模式,如基因体检、基因保险、基因创新药等
业务挑战
测序业务一般为项目型,有明显淡季和旺季之分,旺季业务量可能是淡季的10倍以上,本地资源不足以支撑峰值资源需求
协同办公,环境共用,需精细化管理成本
服务器运行多种业务,参数配置和分析耗时均不同(如30X的WGS耗时从6小时到40小时),无法准确统计单项目的资源利用率以及核算账单
软件繁多,配置繁琐,需简化环境部署
业务软件多达上千款,流程搭建和软件升级过程中的配置工作繁琐且软硬件强耦合,环境部署工作需几小时甚至几天才能完成,部署效率低下
参数调整,迭代升级,需优化历史流程
历史的分析流程缺少标准化管理工具和可视化分析工具,进行软件升级、参数调整和流程复现等工作,需耗费大量人力物力
应用场景
围绕基因数据的传输、存储和访问等阶段,提供全生命周期的高带宽、高性能、高安全和高可靠的网络/存储/安全服务,保证数据的可靠性、一致性和安全性
混合调度
无缝对接本地IDC,统一管理和调度本地IDC和云资源,按需使用高性能的多规格云计算资源如CPU算力、GPU算力、容器算力、鲲鹏算力和FPGA算力
流程管理
提供丰富的调度引擎如Cromwell、SGE、PBS、Slurm等,实现一站式的测序分析流程搭建、运行、管理和调优等能力
数据挖掘
基于大数据和AI服务,为基因组学、医疗影像和药物研发等领域构建基因数据湖、知识图谱、AI算法和预测模型等
华为云基因行业方案简介
华为云围绕基因数据的传输、分析、存储、访问、交付和数据挖掘等不同场景,提供数据管理、高性能计算集群、容器化工作流管理和基因数据AI使能等场景化解决方案,帮助基因客户快速实现业务云化,并享受云计算的技术红利数据云上管理架构
为基因数据的传输、存储、挖掘和共享等环节,提供全生命周期的高带宽、高性能、高安全和高可靠的网络/存储/安全等服务,简化数据管理并为用户创造新的商业模式
方案优势
低成本,高可靠
● OBS提供标准、低频、归档和深度归档四种类型,最低0.014元/GB/月,提供3AZ特性,可达4个9可用性、11个9持久性● SFS提供容量型、标准型和性能型等多款配置,可达99.95%的可用性和10个9持久性
一站式传输
● 提供OBS-Browser、obsutil和SDK等多种配套工具,适配Windows/Linux操作系统,可与本地业务流无缝对接● 基于公有云内网交付,可达XXGbps的传输带宽,下游客户获取数据后可直接开展测序分析
多级防护,访问隔离
● 可设置策略配置URL下载地址、有效时长和提取密码等,保障数据传输安全● 上传下载提供MD5一致性校验,保证数据一致性● 工具一键式完成子账户数据访问权限配置
高性能计算集群架构
提供一键式弹性伸缩的高性能计算集群,支持常用调度软件(例如SGE/PBS/Slurm等)的自动化部署,并可统一纳管云上/云下多种规格的计算节点
架构优势
高性能计算实例
● 多规格计算实例,按需使用,秒级发放● 全国独家提供96核2T裸金属服务器● 针对行业提供高性价比的C6、C6和P2v的计算实例,测序耗时降低30%
存储流程简化
● SFS支持一键挂载,在线容量调整,带宽可达10GB,IOPS可达10K● OBS提供POSIX接口,可直接用于数据读取,共享存储成本下降60%● 支持数据定期删除和自动归档
混合调度
● 统一管理和调度对本地机房计算资源和公有云计算资源● 集群支持X86和鲲鹏算力混合调度
容器化工作流管理架构
采用Serverless容器底座,提供基因数据分析领域各类场景下全容器化的基因容器服务,为工作流管理、流程加速和资源管控提供一站式解决方案
优势
易使用
● 多种主流第三方流程引擎,开箱即用● 图形化流程设计器,所见即所得● 全自动SGE集群管理,无缝迁移上云● 容器化Cromwell引擎、支持WDL语法
省成本
● 硬件卸载,确保资源100%投入业务生产● 按需按秒计费、急速弹性并发能力● 容器规格灵活配比,精细粒度话单管理
免运维
● 采用Serverless模式,无需关心集群资源管理● 全容器技术,解除软件和环境的依赖● 支持标准引擎+标准语法,任意环境可复现
基因数据AI使能架构
基于云计算、大数据和人工智能的技术优势,为基因测序、临床研究和药物研发分析提供多维一体化的医疗智能体解决方案
架构优势
一站式的平台
一站式集成化的测序分析平台● 丰富的项目权限和用户角色管理体系● 大规模混合集群的流程调度,兼容高性能集群和容器方案● 单集群同时支持CPU、GPU和NPU等异构框架● 完善、灵活的容器化流程编排● 支持EB级对象存储和万级条目数据库的构建和秒级查询● 内置应用市场,开箱即用,支持分享
智能化的平台
● 融合大数据、人工智能和知识图谱能力● 预置AutoGenome等高阶基因组和多组学自动建模工具
多种部署形态
● 支持各类硬件基础设施资源● 支持公有云、HCSO同架构部署
方案优势
多种规格的计算资源和存储资源按需使用,精准匹配不同流程的IT资源需求,相同流程的成本最高可节省30%
一图展示资源消耗,精准核算项目账单
提供资源热力消耗图、实时资源监控图和项目资源清单,辅助用户多维度分析、审计和优化资源使用现状,提升资源的有效利用率
一体管理流程版本,快速复现历史流程
提供版本管理、结果查询和过程日志等辅助功能,支持一键选择流程版本号和样本路径,秒级查看和运行历史流程
一体管理流程版本,快速复现历史流程
提供版本管理、结果查询和过程日志等辅助功能,支持一键选择流程版本号和样本路径,秒级查看和运行历史流程
相关方案
云容器实例(Cloud Container Instance)提供基于Kubernetes的Serverless容器服务,兼容K8s和Docker原生接口。用户无需关注集群和服务器,简单三步配置即可快速创建容器负载
高性能计算解决方案 HPC
高性能计算云解决方案(HPC Cloud)是一种高效、可靠、灵活、安全的计算服务,能够为工业设计仿真、数字建模模拟、海量数据处理等场景提供卓越的计算服务,帮助客户降低TCO,缩短产品上市周期, 提升企业产品竞争力
对象存储服务 OBS
对象存储服务 (Object Storage Service) 是一款稳定、安全、高效、易用的云存储服务,具备标准Restful API接口,可存储任意数量和形式的非结构化数据
医疗智能体
医疗智能体(EIHealth)基于华为云AI和大数据技术优势,为基因组、医疗影像、药物研发三个领域提供专业AI研发平台
武汉希望组
华为云提供裸金属服务器、大容量内存和大规模核心计算资源池,资源快速就绪,使基因测序原始数据处理速度得到快速提升;同时,通过运用Docker、ARM等多种技术,将部分应用性能提升5-10倍。华为云专业团队负责整体的运维管理,大大降低了希望组的IT运维压力,整体成本下降30%
华大基因
华为云利用基因容器技术,为华大基因提供云端基因测序解决方案,通过对常用的软件优化,更好的支撑DNA、RNA、液态活检等主流生物基因测序场景
贝瑞基因
华为云为贝瑞基因提供弹性的计算和存储服务,降低测序成本。同时,通过使用FPGA解决方案,为测序提升5倍以上的性能加速,同时满足客户对效率和精度的要求
上海科学院
VIC(Virus Identification Cloud)得到华为云容器平台强大计算能力的支持,可提供高通量多样本并行云端分析能力,助力临床诊断,还可监测病毒变异趋势
安智因
利用全容器技术,可做到对指定步骤资源做精确控制,使得全流程资源利用率大幅提升,更好的聚焦业务研发,降低基础设施管理成本
合作伙伴
专注于将生物信息学、基因组学和互联网前沿技术创新应用于基础生命科学研究和人类医学健康领域,致力于为全球科研及临床用户提供基因组学精准解决方案的产品和服务
上海生科院
中科院上海生科院拥有在生命健康和生物信息大数据领域长期积累的科研技术优势,结合双方优势,致力于实现生物医学跟人工智能、云计算高效有机结合,共同推动生物信息业务向大数据和AI转型及快速发展