你諗到gei, WD一早諗到
殘次品一樣可以賣入企業server
係可以完全避免直接流入edge消費性市場

你如果有 ...
pbodq 發表於 2026-2-23 14:04


唔講唔知道原來企業版都有分級
淨係知道企業版,入DC因為價錢平所以係冇保養
好似google,有問題都係直接報廢,用機打穿佢
(不過唔清楚,會唔會嘗試去救)

近排整緊mybook 12Tb
平均每三個月先至做cold backup,並且每半年 fullscan一次
結果四年後,500hr出C6
又過咗2年,一樣完全冇任何問題,已經完成抄file去新nas而冇任何問題
c6數值亦都冇增大,入Gsmart就話曾經寫緊嗰陣斷電,爛File
反正而家都決定搞backup321,,一共有3set data所以純粹試吓各樣方法

etc,插入918+入面es一次:睇吓會唔會del到c6
Low level 之後再nas run佢2個月,睇吓會唔會係自動修復返

TOP

本帖最後由 zoin0000 於 2026-2-23 16:07 編輯

回覆 110# madebyp90

香港區Sales以無得報HD價

連SSD都只可以1條

TOP

本帖最後由 pbodq 於 2026-2-23 19:45 編輯

回覆 111# madebyp90

c6其實不用太介意, 它表達的意義, 不算嚴重
01,05,c5,c6 這四項數值互相有很微妙的邏輯關係
其中01及c5係最關健性, 一般人覺得已死的05, 其實反而是好事

這關乎底層物理概念
唔好以為HD是絕對的discrete斷絕式數位化
磁粉粒其實是類比訊號, 唔會用一粒粉咁少去代表north或south
在顯微鏡下, 而係在一個區域空間, 用若干粒粉去反射1個bit訊號(many to one的原則, not one to one), 讀頭統計該區域是north(1)多還是south(0)多 (因為要容錯), 然後判斷該bit最終是1還是0。

這跟你在沙灘用筆刮幾條痕差不多, 若你隻手施加的力道大, 高矮坑道越明顯 ; 但如果d砂越乾越鬆散, 當你施加外力後, 少部份砂有機會sher返落坑, 高低不明顯。所以訊號的準確度及統計速度會受幾個因素影響, 不能立即就見到是0還是1, 不明確時就要re-read幾次(就是c5 pending, 準確譯名是不穩定/不確定磁區)。所以點解果d wiping 軟件要寫7次, 因為前兩次施加的磁場, 在bad sectors的角度, 因太頑固, 大機會不能被施加上磁改值, 該sector的數值不會被改變,  有機會是一個read only的sector 所以要write多幾次

這些又跟01,05,c5,c6有乜關係?
firmware個機制順序是
1.寫頭寫入512 Byte 0 or 1 (把磁粒上磁, 舉例每個bit 10粒, 512 x 8 x 10), 或4096 Byte(是但la, 視乎sector大小), 然後再搵額外空間寫入ECC Byte, 通常在該sector旁。到這一步為止, firmware係"唔會"覆檢data的成功或對錯

2.假如上唔到磁或其中幾bits的磁值出錯, 在這階段係無辦法得知。
這最少有兩種scenarios發生, a. 寫入的那刻已經出錯失敗; b.寫入時是對的, 但轉了兩年後, 磁值錯亂了
(其實還有第三第四種 conditions, 但太長, 唔想寫 )

3.來到firmware修正的步驟:
無論2a還是2b, 只有當讀頭再次讀取該pending sector時, 才能從ECC中察覺有error出現, 所以定期scan, scrub disks有一定需要,就像body check。但你要搞清ECC checksum只能detect errors, 它是而不能correct errors 那魔firmware要怎樣才correct到errors?
正正是上文, 從10粒1bit的統計中,不停 re-read re-try re-calculate, 睇下可唔可以從唔明顯的訊號值中, 撞返岩果ECC checksum一致
所以01個error修正rate就會升 ; 撞左一大輪都撞唔正的話, c6就有hit count

4.未完事: firmware會把太難修正, 過了timeout deadline都讀唔返出來的sector location記低
下次寫data入該sector時, 才會trigger LBA re-map, 即05上升
05上升就開心了, 一片碟一般有3%空閒多餘的健康sector作備用。14TB, 8片16面就正反每面約26GByte左右
呢d區通常在每片內圈, 所以特別健康, 亦特別慢。
這裡出現幾個conditional bugs, 假如未重新寫入(未remap), 卻幸運地能再次成功讀取pending sector (別忘了那個刮砂原理的模型), firmware就會它該sector從blacklist變whitelist。咁就玩死你了,你有排都remap唔到
所以點解我話, 見到05大升返而是好事, 因為雖然隻碟原本好唔健康, 但佢態度好極積努力地去康復緊, 進度容易
反而c5多, 未必係一件好件, 會浪費好多時間去retry; 這要跳到第五點, 詳講c5 pending
(出c6就立即撥備, 決斷可靠)

5.pending的程度分四類
a.顆粒每次上磁後, 統計磁值都不穩定
例如:我上1後: 第一次讀取是0, 第二次讀取變回1, 第三次讀又變返0
這種品質的碟片是最頭痛去處理

b.顆粒只是線性衰退不穩定
例如:我上1後: 一年後讀出來要估幾次才成功, re-write 一次後, 可以順利re-read幾次, 訊號keep到一年內不失真值

c.software cause wrong values
在開放的ATA標準指令集中, 容許Windows/Linux刻意寫入錯誤的sector ECC, 因為要讓廠方developers容易模疑bad sectors環境去debug。否則每次開發, 都要叫個developer拎個鎚去打隻碟?
這跟sector物理有無損毀完全無關係, 單純一次re-write, 寫入both正確的data field及ECC就解決了。這些黑方法我就不詳說, 否則HD廠鬧死我  lock更多API

6.最理想去重評健康度的方法是, 先全碟寫一次00, 再全碟寫一次FF(即full 11), 然後全碟寫一次random 01, 最後full read一次,覆檢checksum反應值
而在full read的過程中 (以一個512Byte sector的spec來說)
讀頭每次只讀512Byte跟每次讀block size :512 x 4或者8, 效果可以好唔同 (當然效率亦會差好遠, 但我這裡的焦點只在乎健康)
7200rpm, 就一秒512Byte x 4面積 x 7200次, 約16MByte per head每層


咁呢個行為關bad sector /  pending乜事?
殘酷現實是 : 若你每次謹以一個512Byte sector (即內地人所謂的慢掃, 其實好多人都講大話, 用快掃冒充慢掃)去掃一隻14TB, 可能要一星期(快掃, 四至八 sectors per block, 相對來說大概只需14-20小時), 你才能直正驗出每個sector原本的訊號反應時間
我猜是讀頭全面積的電動勢差, 產生的感應電流大好多, 彌補了個別弱弱的512Byte訊號
一般來說, 按返廠商製片時的physical sector size去定義block size已經足夠可靠

不過話說回來, spot唔出就spot唔出 la, 唔使追求咁完美, 原因係假如applications 用較大的面積進行scanning , 已經有滿意的訊號反映, 咁平時使用時, 大概不會出現卡卡卡的情況

P.S.
a. 如果你單純只做一次full read, 係排查唔到5d的那種pending status,
5d condition我上面無寫, 是一種不能重新上磁的status (舊值讀出來是無問題的 )

b. WD家用碟, firmware 的blacklist condition搵笨過enterprise好多, 有排都remap唔到

c. 相對sectors健康度來說, 你反而要諗諗點解會無故斷電, 這個現象更可怕

TOP

本帖最後由 madebyp90 於 2026-2-23 21:36 編輯

剛剛Low format(Fill 0)左
而家睇吓有冇工具Fill 1,有冇介紹?
之後打算用tools放滿file,再check sum5(上網見TeraCopy,copy完可以立即read去check sum5,強迫hdd檢查)

不過,本身諗住放入918+
s記係brfs上面已經可以人手強制data surb
之後再行smart,己好安全

隻mybook應該係太耐冇讀(etc半年),磁力弱(我每次cold backup都會做full scan)

nas os係這方面的確好過windows
windows太易發生bit role/讀嗰陣先知道係冷損毁
而平時用tools scan發現唔到,應該要搵軟件去每個file check sum
遲啲試吓chkdsk d: /r
睇吓可唔可以做到同樣效果

TOP

本帖最後由 pbodq 於 2026-2-24 00:42 編輯
剛剛Low format(Fill 0)左
而家睇吓有冇工具Fill 1,有冇介紹?
之後打算用tools放滿file,再check sum5(上 ...
madebyp90 發表於 2026-2-23 21:32


DiskGeneie介面較簡單易用
Free license好似已經有, 唔使買Professional



Victoria都有類似功能, 但無咁豐富, Victoria個custom pattern係要自己寫binary定義, 咁乾脆用random算鬼數



其實當你寫完一次00或FF或random乜都好la, sector的ECC field已經都寫左次checksum
下次scan read時, 在firmware的level已經強制核對一次有無出現bit rot, 唔好講到TeraCopy發出指令逼HD去計 即使是一個好普通的Windows stream read command, firmware背後都是強制計checksum, 這是firmware它天職。


這種sector layer計checksum的跟OS level Teracopy那類application在file system base layer計checksum有幾個分別
1.效能性
firmware去計係天經地義, filesystem係後補, 其實當filesystem去計時, 已經是第二次
咁既然係多餘地計多一次, 還有必要嗎? 這是因為透過file system, 你能對應出出錯的file checksum, file name等等
但如果只用firmware去計, firmware SMART只能話你知第幾個LBA checksum出錯, 但你不能知道這個LBA是對應著哪一個file(甚致可能無對應file ), 所以btrfs那種checksum feedback仍有價值, 而且兩隻碟可以實時修正LBA, 很自動化。

2.話事權干涉性

OS對HD進行read scan, 透過的ATA指令集分VERIFY 及普通READ
READ係全權由OS管理, 數據會經由SATA cable傳回, 慢好多 (當然, 如上文, firmware背後必定行先計checksum)
VERIFY是OS放權給firmware去scan read sectors, 計完checksum, 若有問題就feedback false及LBA, 無問題就feedback true繼續, SATA cable係唔會有實質data傳回, 除了效率快左之外, 由於判決權握在firmware手中, 所有規則遵從firmware, firmware覺得嚴重就是嚴重,要remap就要remap, OS無得干預
相反, 如果在normal read mode, OS覺得reading timeout, 發出interrupt 指令, firmware當然係會停止讀取, 不過由於這個判決係OS發出, 唔係由firmware自身規則判定, 所以firmware不會當bad sector。是否bad sector, 只有firmware自己講的才算數

3.唔係Windows容易發生bit rot, bit rot永遠係隻碟物理產生, 而係發生左bit rot後, Windows難察覺姐
其實Windows讀任何bit rot左的file, 都會有LBA error return, 只不過垃圾的M記唔好好report整理GUI出來姐
如果你努力去睇control panel個error log,會有寫的, 但睇到人都傻 chkdsk.exe介面又係衰,Microsoft樣樣野的介面都衰過人
而chkdsk.exe就係microsoft話你知這個LBA爛在哪一個file上面lor (command line)

Synology的btrfs scrub好快, 我唔知佢係咪用default block size(我估唔係), 甚致乎佢唔係揀READ command,可能係行VERIFY LBA。
因為BTRFS的checksum 已經當成data field的一部份, 寫在sector裡。只要firmware feedback ECC checksum正確, 這內裡已經包含埋BTRFS checksum正確。

4.
咁點解上文我話最好行一次00>>FF>>random
這裡磁粉進行了三次極性訊號轉換, 考驗緊活躍度
一般情況, 寫一次random就算
但有d碟太耐唔郁, 顆粒變質, 如果只做一次random (夾集01), 有d位真係太硬, 極化唔到, 就會read error
不過, 你可以話咁樣就可以嚴格filter出哪些sector仍然很健康, 連一次random都變唔到極性, 咁呢個sector仲要來把鬼?
對!硬碟廠re-certify就會咁樣做, 一來工夫時間快, 二來佢地唔可以得罪班客, 對於weak sectors好嚴格, 係有殺錯, 無放過。廠可以插線, 想點改LBA mapping都得, 成段600GB即管放心同我殺晒
但我呢d度縮user, 有時weak weak地都會照用, 重新上磁活化就算 (當然, 我係有後著 ), 而且最困難是, 我地無乜工具在手去改mapping(都唔係完全無, 但要花d成本, 麻煩去搞)  
如果我唔重新上磁00>>FF / FF>>00 我還有其他選擇去remap嗎? (接近無, 涉及到強制remap, c5變05的話題), 所以逼著做

而且WD家用碟, RED, Black, Blue這堆firmware, 把retry 門檻count, set到好高, 唔似得HC5XX這類enterprise。家用規則係難remap好多, 咁你就逼著要上磁refresh
附件: 您需要登錄才可以下載或查看附件。沒有帳號?註冊

TOP

成件事,其實係我自己誤解C5/C6生成del原理
400hr出c6之後
1)windows Low level format tools/wd官方 fill zero tools '全程有風扇,keep 36c
冇任何幫助,因為只係write一次

2)寫淨500GB空位,Gsmart scandisk一次,wd tool長test一次
冇任何幫助,可能只係write,冇完整read file

3)近排拆盒,有C6下 插入S記起儲存分區,順手掃描
冇任何幫助

4)s記行smart ,冇任何幫助
5)s記行Secure Erase ,冇任何幫助

以上嘅嘢,c6數值冇加多冇減少
所以嚟緊就應該嘗試teracopy,抄完file之後強制檢查,睇緊有冇方法就咁一個windows iso,複製滿成隻碟
由於copy之後強制檢查
等hdd即時知道邊一啲位有問題,邊一啲位原來係冇事,解除返mark
如果做到呢一步都唔得
就算數
反正s記係data sbr方面都做得好好,只係其中一份backup321,唔上心
純粹學嘢

TOP