真没想到!家用NAS的raid5竟然这么不安全?

加勒比考斯 2025-03-05 14:07:06

兄弟们,3 月 8 日晚 7 点,锁定淘宝synology群晖昊天专卖店直播间!

届时我将与大家畅聊NAS:

1、权限混乱、数据丢失、跨平台协作困难…… 公司 NAS 选不对,分分钟让你怀疑人生!NAS 型号全面分析,根据公司规模和业务需求,选出最适合的 NAS。

2、NAS 搭建全攻略,让你轻松搞定数据存储和管理!从硬件选购到系统安装,从 Raid 配置到域名设置,手把手教你如何在工作室搭建 NAS。

直播间还有群晖定制礼品等你抱回家,这场直播盛宴,绝对不容错过,咱们不见不散!

在 NAS 领域的新手群体中,大多会选择搭建 RAID 5 阵列,普遍觉得这是一套相当平衡的方案。毕竟它既能收获与 RAID 0 相近的数据读取速度,又能享有类似 RAID 1 那般凭借 1 块冗余盘来保障数据安全的特性,如此组建 RAID,可谓一举两得,自然备受青睐。

实际上,RAID 5 的运作机制是将数据以块为单位分散存储至各个硬盘。它并非对数据做直接备份,而是把数据以及对应的奇偶校验信息分别存储于 RAID 5 组成的多块磁盘上,且奇偶校验信息与对应数据分布在不同磁盘。当 RAID 5 中某一磁盘的数据出现损坏时,便可依靠剩余的数据和对应的奇偶校验信息来恢复受损数据。

这样子一听,感觉RAID 5也是十分靠谱的,只要不同时坏掉2块及以上的硬盘,那么我的数据就没事了。而且相比较于其他方案来说,这个方案存储成本较低,性能又很不错,所以被大众所普遍接受也是正常的事,但是它是否真的能保障数据安全呢?

讲到这里我要先提一个概念,叫做URE (Unrecoverable Read Error rate) “不可恢复性读取错误率”。现在有的厂商也叫做Non-recoverable Errors per bits read或者Nonrecoverable Read Error rate。

一般来说,SATA硬盘具有 1x10^-14 次方的不可恢复性读取错误率,意思是说每100,000,000,000,000 Bit(11.3687 TB),就会有1个Bit是硬盘用尽了所有的方法也读不出来的,这个Bit 是这块硬盘的黑洞。

我们来看一下市场上各个NAS硬盘的不可恢复性读取错误率,这个数据可以在各品牌官网上查询。

西部数据NAS红盘Plus的URE为小于1in10^14。

希捷IRONWOLF酷狼系列的URE根据硬盘容量不同也有不同,其中6~14 TB为最大1 per 10E15,6TB以下的为最大1 per 10E14。

希捷还有一个酷狼Pro系列,该系列的URE则全部为最大1 per 10E15。

西数红盘说的是小于1 in 10^14 ,希捷酷狼说的是最大是1 in 10^15,厂商都喜欢玩文字游戏,咱们不去咬文嚼字,直接按照1 in 10^14来计算概率,那么就是一百万亿分之一,咱们应该很多人会小看这个概率。

实则不然。

假设我们用4块4 TB的硬盘组建RAID 5阵列,突然抽掉一块磁盘,那么剩下的3块4 TB硬盘会从头到脚全部读一遍来重建冗余信息。

3 × 4 TB =12 TB

那么这三块硬盘一共读取的这12 TB的容量里面碰到一个URE的概率是多少呢?

1—(1—1in10^14)^ (12 × 8 × 1024× 1024× 1024× 1024) ≈0.652

通过计算得到概率为65.2%,这个概率真的不算小了。

而且这个这个错误并不是硬盘的坏道导致的,所以硬盘SMART根本无法感知出来,而且一般超过12TB的RAID 5阵列重建机制会强制对全盘数据进行CRC校验,校验的结果会因为这个URE黑洞的出现导致校验出错,RAID 5所以也必然重建失败。

但是在实际应用中,重建失败的概率并不如以上所讲的那么低,那是为什么呢?

以群晖DS1522+为例:

1、打开存储池可以看到一个功能,计划数据清理,通过定期执行数据清理可确保数据一致性,并降低在发生硬盘故障时数据丢失的风险。

2、目前大家很多人用的盘都是企业盘以及专业NAS盘,本身带有数据纠错服务。

3、最后是NAS所采用的文件系统会对该错误进行纠错修复,并不会造成数据丢失。群晖DS1522+就提供了2种文件系统供大家使用,强烈建议大家使用btrfs文件系统,因为它支持共享文件夹快照和复制、共享文件夹空间配额、高级数据完整性保护等高级功能,这些功能也能有效避免因为URE黑洞的出现导致RAID5重建校验出错。

0 阅读:195

加勒比考斯

简介:我是认真地,很认真在玩耍~