Designing Data-Intensive Application - Consistency and Consensus

October 12, 2019

這是Designing Data-Intensive Application的第二部分第五章節Part1: 一致性和共識介紹

一致性和共識Part1 - 介紹

一致性和共識Part2 - 線性一致性

一致性和共識Part3 - 順序保證

一致性和共識Part4 - 分佈式事務與共識

本文所有圖片或代碼來自於原書內容

您所看到的本網站只會用盜版爬蟲抄襲複製別人原創文章的沒梗網站爬蟲完後還不檢查內容直接發佈施主還是趕快關閉本網站比較安全阿彌陀佛

請支持原創文章拒絕盜版爬蟲麻煩讀者移駕至本文固定連結

一致性和共識介紹

正如第8章所討論的分佈式系統中的許多事情可能會出錯比如網路中的數據包可能會丟失/重新排序/重複遞送或任意延遲時鐘只是盡其所能地近似而且節點可以因為許多理由暫停或隨時崩潰

構建容錯系統的最好方法是找到一些帶有實用保證的通用抽象，實現一次，然後讓應用依賴這些保證

在說什麼聽不懂? 沒關係想一下我們在事務篇章中做的事藉由事務這個抽象應用程式可以得到以下優點

1.應用程式可以假裝沒有崩潰發生(atomicity)

2.應用程式認為沒有其他人同時訪問數據庫(isolation)

3.應用程式認為存儲設備是完全可靠的(durablility)

那事實是否真的如此呢當然不是但即使發生崩潰競爭條件或是磁盤故障事務抽象也隱藏了這些問題應用程式不用擔心

現在把同樣的概念拿回來用在這在分布式系統裡面哪個麻煩的問題被抽象之後可以解決應用程式最多的問題呢給你三秒鐘

答案是: 共識(consensus) 也就是讓所有的節點對某件事達成一致 之前提到的問題網路問題時鐘問題進程問題都會讓節點跟節點之間資訊不流通所以很難做決定所以只要共識的問題搞定了分布式系統跟單節點系統沒什麼大差別

我們會在第四Part的分佈式事務和共識中提到解決共識和相關問題的算法但在那之前我們需要瞭解什麼可以做什麼不可以做什麼可能而什麼不可能

在複製延遲問題中我們看到了數據庫複製中發生的一些時序問題如果你在同一個時刻觀察兩個不同數據庫節點這兩個節點可能數據不一樣因為寫請求可能在不同的時間到達不同的節點無論數據庫用何種複製方法(單主多主無主複製) 都會出現這些不一致的情況

大多數複製的數據庫至少提供了最終一致性: 如果你停止向數據庫寫入數據並等待一段不確定的時間那麼最終所有的讀取請求都會返回相同的值所以你所看到的不一致性都是暫時的最終都會解決最終一致性的一個更好的名字可能是收斂(convergence) 因為我們預期所有的副本最終會收斂到相同的值

然而最終一致性是個挺弱的保證他並沒有保證你多久後會收斂在數據庫真正收斂之前讀操作可能會返回任何東西或什麼都沒有最慘的是當你在寫入之後馬上讀取你還不一定會看到你剛寫的值因為讀請求可能被導到別的副本上(參閱讀己之寫)

所以在跟只提供弱保證的數據庫打交道時你需要始終意識到它的侷限性不要太高興做出太多假設(比如假設你讀一個剛寫的東西值一定正確) 這種錯誤非常難debug 而且大多數情況運行良好

當然有許多更強一致性模型這些具有較強保證的系統可能會比保證較差的系統具有更差的性能或更少的容錯性聽起來很吸引人(雖然效率低但起碼我保證對)

本文將探索數據系統可能選擇提供的各種一致性強度你必須在一致性強度跟效能之間做選擇這跟我們之前討論事務時很像事務隔離主要是為了避免由於同時執行事務而導致的競爭狀態 分布式一致性主要關於 面對延遲和故障時如何協調副本間的狀態

本章涵蓋了不少主題

1.我們會在Part2先研究最強的一致性模型之一線性一致性(linearizability) 討論其優缺點

2.然後我們會在Part3檢查分佈式系統中事件順序的問題特別是因果關係和全局順序的問題

3.在Part4分佈式事務和共識中將探討如何原子地提交分佈式事務這將最終引領我們走向共識問題的解決方案