达梦分析型大规模数据处理集群软件(DMMPP)是基于达梦数据库管理系统研发的完全对等无共享式的并行集群组件,支持将多个DM8节点组织为一个并行计算网络,对外提供统一的数据库服务,最多可支持1024个节点,支持TB到PB级的数据存储与分析,并提供高可用性和动态扩展能力,是超大型数据应用的高性价比通用解决方案。DMMPP通过分布负载到多个数据库服务器主机,实现存储和处理大规模的数据。采用完全对等的无共享架构,每个数据库服务器称为一个EP,每个EP都是独立的数据库。该架构中各个EP节点的功能完全一样,用户可连接DMMPP系统内的任意一个EP节点进行数据操作。
核心特性
完全对等无共享体系架构
完全对等无共享体系架构结合了完全无共享体系的优点,各个节点完全对等,更进一步简化了体系的实现,也消除了系统可能存在的主节点瓶颈问题。
最大支持1024节点
支持在线扩展节点、在线动态数据重分布等特性,最大支持1024节点
提供数据分布和数据分区的组合支持
支持多种数据分布,包括HASH分布、范围分布和随机分布;支持表的水平分区、垂直分区和多级混合分区,并提供了数据分布和数据分区的组合支持,提供了极高的灵活性。
高性能
支持复杂查询
支持多级并行技术
并行高速数据加载
可提供数据镜像保护功能
DMMPP与DM8数据守护高级功能的结合使用,可为每个EP配置交叉数据守护,提供数据镜像保护功能。一旦主机出现故障,对应备机会自动切换为主机继续提供服务。
核心应用场景
大规模数据分析需求场景
大规模数据分析以复杂统计查询请求为主,并发相对较少,请求响应时间相对较长,通常为分钟级,部分场景甚至可达小时级,但该应用场景数据量非常大,达到TB级~PB级,在可靠性方面业务连续性要求相对较低,但数据必须确保副本/备份。