deep-dives

23 posts

你有一半的 Cucumber Scenario 被跳過。這個狀態正在對你說謊。

Cucumber 的 'skipped' 狀態隱藏了三種完全不同的問題。這裡教你如何診斷是哪一種正在蠶食你的測試套件，以及如何阻止它。

你有一半的 Cucumber scenario 被跳過。不是失敗，是被跳過。那個黃色的狀態比紅色的 build 還危險。它讓你的測試套件看起來很健康，卻把三種完全不同的問題藏在同一個禮貌的標籤底下。一個被跳過的 scenario 可能是你的 tag filter 把它排除了、某個 step definition…

2026年6月9日

deep-dives gherkin bdd living-documentation

你的 Gherkin 規格正在對你說謊

一旦你指望人類手動更新，Gherkin 規格就會立刻脫節。以下是如何將檢查流程自動化，讓 feature 檔案始終保持誠實。

你的 Gherkin 規格正在對你說謊。不是故意的。它們起初是忠實的。但六個衝刺過後，有人重構了結帳流程，卻忘了更新這個 step。檔案仍然通過，因為 step definition 還在。它只是呼叫了一段不再符合 scenario 實際描述的程式碼。你拿到了綠燈測試和虛假的信心。這就是 BDD…

2026年6月8日

deep-dives architecture-testing clean-architecture ci-cd

編譯器檢查語法，測試應該檢查架構

大多數團隊把架構規則寫在 wiki 裡。這裡教你怎麼把它們變成可執行的測試，當依賴圖偏離設計時就讓 CI 失敗。

你的測試套件會驗證在給定正確輸入時回傳 42。但它不會驗證是否被允許 import 。編譯器對兩者都接受。你的單元測試對兩者也接受。但其中之一是架構違規，六個月後會讓你花上一整週重構。這就是盲點。我們為邏輯寫測試，卻假設結構會自動維持。它不會。…

2026年6月7日

deep-dives clean-architecture ci-cd dependency-rules

你的 domain layer 引用了 Postgres。你的 CI 完全沒意見。

Clean architecture 的圖在白板上畫起來很漂亮。這裡教你怎麼讓 build pipeline 自動執行 dependency direction，確保 domain code 絕對碰不到 infrastructure。

團隊裡有人剛剛在裡引用了。PR 可以編譯過。測試全綠。Code review 有三百行，沒人發現。三個月後，你想把 domain logic 抽成 shared package。你抽不出來。它依賴 Postgres 的型別、connection pooling 邏輯，還有一個只在 monolith 裡存在的…

2026年6月6日

deep-dives architecture documentation living-docs

你的架構圖早已是謊言

架構文件從你存檔的那一刻起就開始腐敗。以下說明如何透過程式碼產生的圖表、ADR 與自動化架構測試，讓文件保持誠實。

我在 wiki 裡看過的每一張架構圖都是錯的。不是明顯的錯，而是安靜地、漸進地錯。標示為「Auth」的服務在六個月前就被拆成三個微服務。標示為「sync call」的箭頭現在已經透過 queue 變成 async。標示為「PostgreSQL」的資料庫在某次火災演練中被遷移到別的東西，但沒人更新那個方框。…

2026年6月5日

deep-dives idempotency api-design resilience

你的重試迴路假設第一次請求失敗了。它大概沒有。

超時或當機不代表你的 API 請求遺失了。以下是 idempotency keys 如何讓重試變得安全，以及真正能防止重複的儲存模式。

你的服務在處理請求到一半時當機了。客戶端看到超時並重試。現在你有兩筆扣款。客戶很生氣。資料庫是一致的。你的商業邏輯不是。這不是邊緣案例。這是分散式系統的預設行為。網路會丟封包。container 會在請求處理到一半時被 OOM-killed。負載平衡器會對已經抵達後端的請求回傳 502。如果你的 API…

2026年6月4日

deep-dives distributed-locks leasing resilience

比你的进程更長命的 lock：分散式租約的實際運作原理

記憶體中的mutex會在伺服器重啟後消失。本文說明具有 fencing token 與 TTL 的分散式租約如何防止當機後的重複執行，以及它們仍然會失效的地方。

你的撐不過。它也撐不過 OOM、部署推出或節點重啟。程序結束的瞬間，lock 就消失了。如果那把 lock保護的是一個排程任務、資料遷移或領導者選舉，你現在會有兩個程序都認為自己是唯一在執行的那個。這不是你的mutex有 bug。這是類別錯誤。程序本地的lock無法保護叢集範圍的資源。…

2026年6月3日

deep-dives circuit-breaker performance resilience

沒有 goroutine、沒有 timer、也沒有背景開銷的斷路器

大多數斷路器函式庫會產生背景執行緒來探測恢復狀態。你並不需要它們。這裡介紹一種由請求驅動的設計，能在不犧牲正確性的前提下，消除所有背景開銷。

我審閱過的每一個 production 級斷路器，最終都會產生一個背景執行緒。它可能是 Go 的 goroutine、Java 的，或是 Rust 的 tokio task。工作內容永遠一樣：每隔幾秒醒來一次，檢查下游服務是否已恢復，然後從 OPEN 切換回 CLOSED。…

2026年6月2日

deep-dives crash-only-software resilience distributed-systems

你的 Web Service 有一條 Graceful Shutdown 路徑。那就是 Bug。

Crash-only software 把每一次失敗都當成 crash，把每一次啟動都當成 recovery。對 Web Service 來說，這意味著刪掉你的 shutdown 邏輯，並設計出能撐過 kill -9 的狀態。

你的 Web Service 有一個 shutdown handler。它會 flush buffer、關閉連線、寫入 checkpoint。你也許測試過一次。在生產環境，它大概一年只在計畫性部署時執行一次。其他時候，你的服務死於 OOM kill、node eviction、斷電，或是部署超時後被 SIGKILL。…

2026年6月1日

deep-dives mutation-testing test-writing debugging

當你不懂 mutant 改了什麼時，如何殺掉一個存活下來的 mutant

Mutation testing 發現了一個 survivor，但你完全不知道這個 mutation 到底做了什麼。這裡有一個逐步方法，讓你在還沒理解 mutant 之前就能寫出正確的 test。

你的 mutation testing 報告充滿了 survivors，其中至少有一個讓你完全摸不著頭緒。工具說它在第 47 行把翻成了，或是把整個 conditional block 替換成，或是 mutate 了一個你根本不知道正在被測試的 string literal。你把 diff…

2026年5月31日

deep-dives mutation-testing auth test-quality

Auth 程式碼需要 90% mutation coverage。你的 string utils 不需要。

為何在整個 codebase 強制套用單一 mutation score 是錯的，以及如何根據實際風險設定各模組的門檻。

在整個 codebase 強制套用單一的 mutation score，是讓團隊討厭寫測試的絕招。拿 PIT 或 Stryker 跑一個典型的 repo，你會看到同樣的模式：auth 模組只有 40%，string utilities 衝到 95%，ORM 層則卡在 60 幾趴。本能反應是設一個 70%…

2026年5月30日

deep-dives mutation-testing surviving-mutants test-quality

你的測試全過了，Mutation Score 卻只有 40%——Surviving Mutant 到底在跟你說什麼

Code coverage 告訴你很安全，Mutation testing 卻說你的測試大多是擺設。這篇文章告訴你 surviving mutants 如何戳破這個假象，以及你該怎麼補破洞。

你的測試全過了，coverage report 顯示 87%，但 mutation score 只有 40%，還有一半的 mutants 活得好好的。這個 40% 不代表你的程式壞了，它代表你的測試壞了。Coverage 衡量的是「測試執行時跑過哪些行」；Mutation testing…

2026年5月29日

deep-dives mutation-testing rust cargo-mutants test-quality

Rust 的 Mutation Testing 確實有效，但編譯時間會讓你痛苦

cargo-mutants 能找出那些只會假裝驗證程式碼的測試。以下是 mutation testing 在 Rust 中的運作原理、它能抓到什麼問題，以及編譯時間的成本是否值得。

你已經達到 100% 的行覆蓋率。每個分支都被執行過，每個函式都被呼叫過。然後有人把你的計價邏輯裡的改成，跑了一下測試，全部通過。這不是理論上的問題。這就是你的測試執行了程式碼，卻沒有真正驗證行為時會發生的事。Coverage 衡量的是哪些行被執行過，而不是哪些輸出被檢查過。Mutation testing…

2026年5月28日

deep-dives mutation-testing ci-cd test-quality

Mutation testing 跑四小時，團隊到底怎麼在 CI 裡用它？

大多數團隊不會在每次 commit 都跑完整的 mutation testing。這裡告訴你工程團隊如何實際把 mutation testing 整合進 CI，又不會搞爛 build pipeline。

如果你的 mutation testing suite 要跑四小時，恭喜你。你證實了大家早就猜到的事：你的測試有漏洞。你不會在每次 push 都跑這個。沒有團隊這樣做。問題不是你能不能負擔每次 commit 四小時，而是你能不能承受程式碼測試通過了，卻根本沒有驗證任何東西。 Code coverage…

2026年5月27日

deep-dives database testing persistence

單元測試全綠，資料卻憑空消失

模擬資料庫測試只能驗證 SQL 語法，無法確認資料列是否能撐過當機、並發寫入或 schema 不符。以下是真的測試資料持久化的方法。

如果你在測試中使用模擬資料庫，你其實只是在驗證 repository 層是否呼叫了正確的方法。你並沒有測試資料能否在當機後存活、唯一約束是否真的阻止重複資料，或者transaction 失敗時是否會回滾。這個差別很重要。模擬的只會回傳你預設的結果。真正的…

2026年5月26日

deep-dives redux testing state-management

不用淹沒在 mock action 裡也能測試 Redux

把每個 Redux action 都 mock 掉，只會讓你的測試變成變更日誌驗證器。以下介紹如何改用真實的狀態轉換來測試你的 store。

如果你曾經寫過一個測試，去驗證是否被以完全正確的 payload 形狀呼叫，那你其實寫了一個「只要有人重新命名常數就會壞掉」的測試。這不是測試你的狀態邏輯。這是在測試你的手指有沒有打對字串。 Redux 測試教學通常從 Jest mock 開始：監聽，斷言 action creator 被呼叫了，斷言 type…

2026年5月25日

deep-dives property-based-testing test-coverage shrinking

跑 100 次測試是騙人的：如何真正決定 Property-Based Test 的執行次數

Property-based testing 預設跑 100 個範例是一種社交妥協，而非統計策略。以下是根據你的信心需求與 CI 預算來選擇執行次數的方法。

如果你用預設的 100 個範例來跑 property-based tests，那你等於同時承受了兩種壞處。你的 CI 比實際需要還慢，而且那些真正重要的 bug 你還是抓不到。這個數字沒有什麼魔力。大多數函式庫，包括 Hypothesis 在內，預設設成 100…

2026年5月24日

deep-dives rust property-based-testing quickcheck proptest

Rust 的 Property-Based 測試：找出單元測試漏掉的 Bug

範例導向的測試只涵蓋你想得到的輸入。Property-based 測試會產生隨機資料、檢查不變條件，並將失敗縮減到最小的反例。

你寫了一個函式。你用和測試它。通過了。你發布出去。有個使用者傳入了一個單元素的 slice。你的函式把它遺漏了。他們開了一個 issue。你盯著測試檔案，納悶自己怎麼會漏掉這麼明顯的東西。你之所以漏掉，是因為範例導向的測試只能抓到你預期中的 bug。測試套件裡的每一個…

2026年5月23日

deep-dives unit-testing test-quality bug-prevention

你的單元測試過了。你的正式環境程式碼還是壞的。

程式碼覆蓋率指標製造了虛假的安全感。以下是單元測試為何總是漏掉那些讓你睡不著的 bug，以及你該改測什麼。

你有 90% 的程式碼覆蓋率，凌晨兩點還是被 on-call 警報吵醒。單元測試全過了。CI 也是綠燈。bug 還是進了正式環境。覆蓋率沒有說謊，但也沒有說出真相。它只衡量了哪些行被執行過，沒衡量哪些行為真的被驗證過。…

2026年5月22日

deep-dives rust runtime-contracts performance

Rust Runtime Contracts 在 Release Build 中可以零成本，但編譯器不會幫你做到

Rust 會自動剝除 debug assertions，但真正的 design-by-contract 需要的遠不止 debug_assert!。以下說明如何建立零成本的 runtime contracts，讓它們從你的 release binary 中完全消失。

Rust 可以在開發階段強制執行 runtime contracts，並在 release build 中將它們完全抹除。但書在於，這門語言並未將 contracts 視為 first-class concept。你拿到了積木，但得自己動手組裝。是最顯而易見的起點。它在 debug build 中執行，在…

2026年5月21日

deep-dives assertions production-code defensive-programming