Google Cloud 为 Spanner 数据库引入 HDD 层，将冷存储成本降低 80%

日期：2025-04-23 作者：zf3r8 移动：http://www.lekcy.cn/mobile/quote/1954.html

作者 | Renato Losio

译者 | 王强

策划 | Tina

谷歌最近为其在 Google Cloud 上的分布式 SQL 数据库 Spanner 引入了分层存储。这种分层存储架构包含一种新的 HDD 存储选项，比现有的 SSD 选项便宜 80%，可降低旧数据的存储成本，同时尽可能减少与传统数据迁移相关的开销。

该架构中，默认的 SSD 层是为需要高吞吐量和低延迟的数据而设计的，新的 HDD 层则是为不经常访问或对延迟不敏感的较大数据集而设计的。存储分层架构由策略驱动：作为维护任务的一部分，异步后台进程会根据用户定义的策略自动将数据从 SSD 移动到 HDD。无论数据在哪个存储层，SQL 查询都可以访问 SSD 和 HDD 层上的数据，并且备份策略在所有数据上一致应用。

谷歌团队强调，对于大多数数据库记录而言，数据的运营价值会随着时间的推移而降低，而其报告和合规性作用则会增强。这种转变意味着旧的“冷”数据不需要像当前的“热”事务数据那样具有高性能访问能力，从而鼓励公司寻求更具成本效益的历史信息存储解决方案。

来源：Google Cloud 博客

现在用户可以在各种 Spanner 级别（数据库、表、列或二级索引）实施存储分层策略，并可以灵活地将特定数据移动到速度较慢但成本较低的 HDD 存储。例如，很少访问的数据（如 JSON 产品属性）可以移动到 HDD，而无需重构表，并且可以将索引保留在更快的 SSD 上，同时将实际数据存储在 HDD 上。

要启用分层存储，必须创建一个定义存储选项 [SSD（默认）/HDD] 的位置组，并可以选择定义 ssd_to_hdd_spill_timespan 来指定在压缩周期将数据移动到 HDD 之前应在 SSD 上保留数据的时间。例如：

创建 SSD 到 HDD 溢出策略。在移动数据之前，数据必须在 SSD 中存储至少 1 小时。

Google Spanner 不是唯一提供分层存储的分布式云数据库。Amazon DynamoDB 隐藏了所使用的存储技术，提供具有不同存储和检索费用的标准和标准 IA 存储类别。

Spanner 的分层存储支持 GoogleSQL 和 PostgreSQL 方言，并且在所有提供 Spanner 的 Google Cloud 区域中都可用。可以从 System Insights 监控 HDD 使用情况。

Google Cloud Introduces HDD Tier for Spanner Database, Cutting Cold Storage Costs by 80%(https://www.infoq.com/news/2025/03/google-spanner-tiered-storage/)

特别提示：本信息由相关用户自行提供，真实性未证实，仅供参考。请谨慎采用，风险自负。

点赞 0举报收藏 0评论 0

0 条相关评论

相关最新动态

推荐最新动态

点击排行