第九届江苏省生物信息学学术会议暨生物医学大数据论坛
Bigtera(大兆)作为南京医科大学在生物信息大数据分析上的合作伙伴,有幸受邀参与了此次论坛, Bigtera(大兆)研发总监李铜舒先生围绕本次论坛的主题“生物医学大数据”作为演讲嘉宾进行了《面向对象的软件定义存储及并行分析系统》的主题汇报演讲,从Bigtera(大兆)自身产品平台出发,讲述了Bigtera和生物信息大数据的缘分故事。
4V时代,生物信息学对数据存储的需求和挑战
在本次学术论坛中,很多生物信息领域的专家都提及生物医学信息已经进入了大数据时代。数据、数据库可以帮助更多的学校、实验室、医院、专家、学者等进行专业病理的临床研究和学术研究等。在大数据时代,数据具有4V特性:Volume、Variety、Velocity、Value,但无论前三种特性如何变化,最终要服务于Value(科学价值),为了实现最大化的科学价值,生物医学大数据分析就对IT的架构提出了更多更高的要求,例如对工具和环境、存储性能、复合人才、数据安全和工作协同等方面的要求。
Bigtera(大兆)研发总监李铜舒
李铜舒介绍到除了要满足上述面临的要求,现阶段生物医学大数据分析发展中同时也面临着更多的实际挑战和问题,包括如何利用现有的硬件资源、在基因测序数据分析的复杂应用场景中如何节省人力资源、如何解决缺少有效管理和流程定义工具、如何在有限的科研资金下进行按需部署等。这些挑战和问题是我们企业应该协助整个生物信息大数据产业,从平台工具和存储技术基础架构方面进行思考和解决的。从而满足从大型科研院校、医院到中小型科研团队、实验室及专家学者个人使用的多种场景需求。
现在在生物信息大数据分析行业中普遍采用的计算分析模式是Job Queue,具有开发简单快速、工具算法支持简洁灵活、维护成本低、并行性强等特性,除了计算资源的管理和框架之外,软件定义存储系统可以更好的解决传统磁盘阵列的问题并满足对数据扩容、数据存储、故障处理、数据调度和管控等方面的需求,是比传统的存储方式更理想的、更适合于生物信息大数据分析研究的存储方式。
Bigtera(大兆)软件定义存储助力生物信息数据管理与分析
满足了硬件层面和IT调度层面的挑战需求是否就真正满足了生物信息大数据分析的需求?很显然这是远远不够的。生物信息大数据的分析是比其他行业的计算分析和存储应用更加复杂的技术研究。在行业的扩展中 Bigtera(大兆)和很多的实验室科研人员进行了沟通,从基层科研人员的角度了解了更多一线人员和机构面临的痛点。Bigtera(大兆)的软件定义存储系统架构平台可以从多方面解决现行业研究中面临的各种技术难点。
生物医学大数据分析面临的十大难点
1、利用纳管已有IT和存储,增加算力和存储节点,秒级上线;
2、通过各种工具、算法隔离用户保证节点独立运行快速构建环境分析能力;
3、硬件故障通知与定位快读自愈恢复,热冷温数据分层存储保障数据安全;
4、私有云pipeline管理系统,保证研究结果的一致性和稳定性;
5、设定角色账号自动配置网络存储资源;
6、资源配额管理灵活合理分配,节约经费,按需买单;
7、小型设备及高性能静音设备,可为用户提供放在手边的生物信息分析系统,无需专业机房;
目前针对生物信息大数据特别是基因测序场景对于IT基础环境的应用需求,Bigtera(大兆)与合作伙伴一起可以提供生信大数据分析领域的一站式解决方案。方案集高性能计算、海量存储以及先进、灵活的并行系统于一体,内嵌200多种分析工具,指令级环境动态加载能力,完美适配各类分析算法需求。实现IT与业务相剥离,大大降低IT使用门槛,使研究人员可以更加专注于自己的科研工作。
生物信息学领域是致力于研究人类生命健康发展的规模宏大的学术领域,是以计算机为工具对生物信息进行存储、检索和分析的科学同时也是是当今重要的科研领域之一。Bigtera(大兆)作为软件定义存储系统技术平台的创新者,从2015年起一直致力于生物信息行业的业务发展。目前已经和很多高校、实验室以及研究机构进行了合作,具有丰富的技术经验和业务模型。健康中国关系着每个个人、家庭,企业及全社会的发展,Bigtera(大兆)未来也将在生物信息行业中以稳定先进及不断创新的技术和服务,支持大健康产业的持续发展。