一场断电意外,令本不富裕的生活雪上加霜。
在外习惯于通过架在AC86U上面的VPN访问家里的设备,上周突然发现连着的VPN中断了数十秒,然后再连上后除了路由器外其他设备都显示不在线状态,当时没放在心上,以为就是普通的断电,回到家后才发现NAS点亮后还是不在线,难道这台矿渣区区半年就寿终正寝了,于是便开始考虑有哪些东西可以抢救一下。
# 0x00 问题推测
开始分析目前的状况
- 因为NAS空间使用率不高原本只插了一张数据盘作为存储池
- 点亮后默认引导可以正常启动系统并进入到 Happy hacking 界面
- 但是接着查看路由器后台发现设备始终不在线
- (重点)更换引导顺序启动会出现 Uncompression Error 导致 System halted
因为之前没有NAS挂掉的经验,所以简单推测可能有以下原因
- 网络问题
- 硬盘问题
- 引导问题
# 0x01 问题排查
> 网络问题排查
于是先是和PS4交换所插的LAN口,同时更换了一条备用的六类线,发现PS4正常联网,NAS依旧离线,所以先把网络问题放下。
> 存储设备问题排查
接着检查一下硬盘和数据是否完好,NAS里塞的这块被称为最强空气盘的HUS728T满打满算最多通电了5000小时,稳定性还是能保证的,再加上我的NAS主要用于挂PT和Jellyfin,重要数据有冷备,就偷懒没有组RAID直接用的Basic,文件系统是Btrfs,于是取出硬盘,塞入台式机上空闲的硬盘架,用备用的Manjaro准备挂载硬盘看看,按照网上的资料发现推荐用Ubuntu去读取,还有篇博客提及Manjaro会挂载失败,不信邪尝试了一下,发现参照教程都不用安装mdadm
,Manjaro在core repository 里已经预装了,硬盘一通电就挂载上了,直接parted
看一下
还好,看起来一切正常,数据目录完整,能够正常读写,排除硬盘问题。
> 引导问题排查
因为矿渣入手时内置的SSD已经壮烈了,所以相关的存储设备只有个引导用的U盘和证实完好的机械盘,于是取出U盘,用Disk Genius看了一下貌似没有问题,稍微检查了一下grub,没发现什么问题,加上能够正常引导进入系统,暂时排除了这个可能,但是我没想到这是一个伏笔,因为后来了解到群晖默认使用第一个分区的DSM系统,更换引导顺序后出错应该可以推断出是引导这边出了问题。
# Ox02 重装系统
现在陷入了僵局,各方面貌似都是正常的,那就只能想办法要不重装系统要不换台矿渣了。
于是搜一下发现这篇文章 暴风酷播云(华擎j3455)使用修改版1.04b引导安装黑群晖6.2.2,实现正常关机重启,硬解正常,硬解问题正好是J3455的痛点,之前Jellyfin里面一选择使用硬解矿渣就自动重启了,导致我后面很长一段时间的解决方案是NUC上的Manjaro通过NFS挂载NAS上的目录,然后在Manjaro里面容器化运行Jellyfin,步骤很是繁琐,最后都习惯直接挂载远程目录用本地客户端解码了,既然重装就换个新驱动吧,照着教程一步步来重装系统,重点来了,此时发现ChipEasy找不到U盘,格式化后Win32 Disk Imager也写不入数据,于是扫了一下坏道,发现整个U盘全红了,问题就出在这,看起来U盘可能因为读写时断电导致了颗粒损坏,既然定位到问题就好办了。
按照上面提到的文章用新U盘做完启动盘,然后插上播酷云,果不其然 SynologyAssistant 在局域网内可以搜索到NAS,状态是系统可恢复
直接选择恢复,恢复后系统自动重启,然后再看就显示已就绪状态,访问web界面发现回到之前正常的状态了,套件和数据什么的都还在,大功告成~
# 0x03 总结
- 同一机器黑群晖重装系统非常简单,只需要更换引导的U盘,然后修复系统即可
- 有条件还是尽量上UPS,对家里的服务器和NAS非常好的保护作用