GalaxSphere数据智能引擎发布:为企业AI与HPC构建全新数据平面

来源:国芯科技 #国芯科技# #数据智能引擎# #紫山龙霖#
2843

紫山龙霖(国芯科技参股公司)正式发布面向企业AI与高性能计算(HPC)场景的全新产品——GalaxSphere数据智能引擎

作为承载GLFS数据操作系统的全闪数据智能引擎,GalaxSphere面向企业GPU集群、私有化大模型、RAG、Agent、多模态AI以及HPC/AI-HPC融合负载,提供全局命名空间、全局元数据索引与目录、智能数据编排和高性能热数据加速能力,帮助企业将分散、异构、难以调度的数据资源转化为可见、可达、可控、可加速的数据平面。

GalaxSphere并不是传统意义上的存储阵列。它以全闪硬件作为高可靠、高性能承载基础,以GLFS数据操作系统的数据平面能力为核心,面向AI时代开创企业数据基础设施新形态:让数据不只是被保存,而是能够被高效组织、快速发现、智能调度,并持续供给GPU、模型、智能体和高性能计算任务。


图:GalaxSphere数据智能引擎

AI进入深水区,数据平面称为新瓶颈

随着企业大模型、RAG、Agent、多模态 AI与HPC应用加速落地,AI基础设施的瓶颈正在从“算力不足”转向“数据供给不足”。

在真实业务环境中,企业数据往往分散在不同存储、业务系统、数据中心和计算集群中,数据规模持续增长,文件数量快速增加,访问模式也更加复杂。AI训练、推理、知识检索和HPC计算,都需要数据被快速发现、读取、调度和加速。

数据不可见,模型就难以获得高质量上下文;数据不可达,GPU和计算集群就会等待;数据不可控,企业就难以管理数据流转和访问边界;数据不可加速,AI与HPC的整体效率就会被I/O拖慢。

GalaxSphere数据智能引擎正是为解决这一问题而生:让分散数据变得可见、可达、可控、可加速,打通企业数据与算力之间的通路,持续释放AI与HPC的计算价值。


图:AI与HPC数据流动瓶颈

GalaxSphere开创AI数据基础设施新形态:四大核心能力

作为GLFS数据操作系统的关键承载产品,GalaxSphere当前重点落地其Data Plane数据平面能力。它以全闪存硬件为高性能、高可靠底座,在此基础上融合如下四大核心能力。

1.全局命名空间:让分散数据统一可见、统一访问

GalaxSphere通过GLFS全局命名空间,将分布在不同存储、不同目录、不同集群和不同业务系统中的数据整合到统一数据视图中。数据可根据性能、容量、热度、任务相关性和生命周期策略,在不同存储层级、存储系统和计算环境之间灵活移动,但对上层应用而言,文件路径保持不变,访问方式保持一致。

对于企业AI平台而言,这意味着训练任务、推理服务、RAG应用和Agent工作流无需关心数据原本存放在哪里,可以通过统一路径访问所需数据。

对于HPC和科研计算场景而言,全局命名空间可以帮助不同课题组、不同计算节点和不同数据源之间建立一致的数据访问视图,减少人工搬迁、重复拷贝和路径管理带来的复杂度。

全局命名空间让企业数据从“分散存放”走向“统一可达”,为后续数据编排、元数据索引和智能数据服务奠定基础。


图:GalaxSphere全局命名空间

2.全局元数据索引与目录:让海量数据快速可发现、可检索、可治理

AI与HPC场景中的数据规模通常不仅体现在容量上,更体现在文件数量、目录层级和元数据复杂度上。

大模型训练可能涉及海量文本、图像、音频、视频和样本文件;RAG应用需要从大量企业文档中快速发现和组织知识;自动驾驶、生命科学、工业仿真和科研计算则经常面对数以亿计的小文件、实验文件、日志文件和中间结果。

GalaxSphere全局元数据索引与目录能力,对文件系统元数据进行高效索引和查询,帮助用户快速发现数据、筛选数据集、定位目标文件,并支撑后续的数据治理、数据编排和数据服务。

通过全局元数据索引,企业可以从“遍历式找数据”转向“索引式用数据”,显著提升AI作业准备、RAG知识构建、HPC数据分析和科研数据管理效率。


图:GalaxSphere元数据加速对比

3.智能数据编排:让数据在合适的时间到达合适的位置

在AI与HPC场景中,企业真正面临的挑战,已经不只是“存储更多数据”,而是如何在海量、分散、异构的数据中,快速发现所需数据、精准定位数据价值,并将其自动组织到最适合的计算与应用环境中。

GalaxSphere数据智能引擎依托GLFS数据操作系统的数据平面能力,通过全局元数据索引、标签/标记能力,以及Change Data Capture(CDC)对数据变化的实时发现机制,为企业构建清晰、可控、可自动化的数据编排基础。无论数据发生新增、修改、删除、迁移,还是访问热度和业务属性发生变化,GLFS都能够持续感知,并形成不断更新的数据事件流。

基于这一事件流,GalaxSphere可以将传统“人工查找、手动复制、定期扫描”的数据管理方式,升级为事件驱动、策略驱动的数据工作流。企业可以围绕数据类型、业务标签、访问热度、任务优先级、生命周期和安全策略,自动触发数据识别、分类、索引、预热、加速、归档和治理动作。

这意味着,企业不再需要依赖人工搬迁数据,也不必等到周期性扫描后才发现数据变化。新的训练样本可以更快进入GPU数据通路,更新后的企业文档可以更快进入RAG知识流程,Agent所需的上下文数据可以更及时被组织和调用,HPC计算产生的中间结果与分析数据也可以被自动识别、复用和归档。


图:GalaxSphere数据编排界面

4.高性能热数据加速:让GPU、模型和计算任务更快获得数据

在AI和HPC场景中,性能并不只取决于底层介质速度,更取决于数据是否能够以适合工作负载的方式,被持续、就近、高效地供给计算资源。

GalaxSphere基于全闪架构构建高性能热数据层,并充分利用计算节点本地NVMe SSD形成更靠近GPU/CPU的Tier0超热数据层。通过GLFS统一命名空间与智能数据编排能力,热点数据、任务数据和高频访问数据可被自动调度到最合适的性能层级,在路径不变、应用无感知的前提下,面向AI训练、推理、RAG、多模态处理和HPC计算中的高并发、高吞吐、低时延访问需求进行优化。

它可以承载训练样本、模型检查点、向量化前后的中间数据、热点文档、多模态素材、仿真输入数据和计算结果数据,为上层GPU集群、模型平台和高性能计算平台提供稳定的数据加速能力。

通过高性能热数据层与Tier0超热数据层的协同,企业可以进一步降低热数据访问延迟,提升训练、检索、推理和计算任务的数据供给效率,让昂贵的GPU与HPC计算资源减少等待,加快计算效率,缩短业务时间。


图:GalaxSphere在训练场景下,3D U-Net工作负载的数据集加载时间对比

图:GalaxSphere在推理场景下的Tokens吞吐性能对比

部分数据来源:Scaling Multi-Turn LLM Inference with KV Cache Storage Offload and Dell RDMA-Accelerated Architecture | Dell Technologies Info Hub

GalaxSphere产品规格

面向多类场景,释放数据对AI与HPC的支撑能力

GalaxSphere数据智能引擎面向企业AI、私有化大模型、RAG、Agent、多模态AI以及 HPC场景,帮助客户打通分散数据与计算资源之间的通路,让数据更容易被发现、调用、管理和加速。

为Agent数据服务奠定基础

GalaxSphere作为GLFS数据操作系统的数据平面承载平台,将为后续更高阶的数据智能能力提供基础,包括Context上下文和Agent数据服务。

GalaxSphere将推动数据对象从被动文件走向具备语义、上下文和状态的数据单元;将帮助模型和智能体按任务需要获取高质量上下文;Agent数据服务则将进一步面向智能体工作流提供可调用、可组合、可治理的数据能力。

GalaxSphere当前落地的数据平面能力,正是这些上层能力的基础。

让数据成为AI生产力,而不是AI瓶颈

AI时代的竞争,不仅是算力的竞争,更是数据组织与供给能力的竞争。

GalaxSphere数据智能引擎的发布,标志着紫山龙霖正逐步构建连接企业数据、AI算力与智能应用的全新数据基础设施。作为承载GLFS数据操作系统的核心平台,GalaxSphere将全局命名空间、智能数据编排、全局元数据索引和热数据加速融为一体,让企业数据从“被存储”走向“被发现、被理解、被编排、被服务”,持续释放数据价值,支撑AI、Agent与HPC应用创新。

GalaxSphere数据智能引擎现已面向企业GPU集群、私有化大模型平台、智算中心、科研计算中心、HPC平台、RAG知识库、Agent应用和多模态AI场景开放咨询与测试。

责编: 爱集微
来源:国芯科技 #国芯科技# #数据智能引擎# #紫山龙霖#
THE END
关闭
加载

PDF 加载中...