Concurrency - 並行

August 09, 2020

千呼萬喚終於等到Pragmatic Programmer 20週年紀念版如果沒聽過這本書你大概也聽過程序員修煉之道︰從小工到專家這本暢銷了20年的書終於等到了再版

在再版裡面刪掉了比較過時的內容和範例收集了20年來收到的feedback 在讓這本書的內容也可以適用於2020年的程序員但在我細細品嚐後發現其實很多人生的哲學並不是只適用於程序員各行各業看了都可以有所收穫

因為每個篇章的篇幅都不長所以筆記也用條列式紀錄

本篇的圖片以及程式碼來自於原書內容

您所看到的本網站只會用盜版爬蟲抄襲複製別人原創文章的沒梗網站爬蟲完後還不檢查內容直接發佈施主還是趕快關閉本網站比較安全阿彌陀佛

請支持原創文章拒絕盜版爬蟲麻煩讀者移駕至本文固定連結

第六章: 並行

開始這章之前我們來定義兩個容易搞混的詞

Concurrency: 並行指的是執行兩個或多個程式片段時就好像他們同時執行一樣

Parallelism: 平行指的是他們真的同時執行

如果要實作並行你必須在同一個環境中在程式碼的不同部分之間切換執行通常是使用thread或process的概念實作

如果要實作平行你需要同時能做兩件事的硬體也許是一個多核心的CPU 或是多個CPU的電腦或是很多台電腦連接在一起

本文會先說明為什麼打破時間耦合是高效並行化的必要步驟然後在不要共用狀態中說明為什麼共用狀態會讓並行窒礙難行最後再引入參與者模式介紹如何在不共用資料而是透過預定義的簡單語意通過channel進行通訊

打破時間耦合

什麼是時間耦合(temporal coupling)呢我們很常在寫程式的時候寫出類似這樣的邏輯

先做A -> 再做B 等等

B要等到A結束之後再做但其實這種方法不是很彈性也不太符合現實會這麼做的原因往往只是我們學寫程式的時候都是從sequential的程式語言開始學

如果做B這件事不依賴做A 那我們應該要讓並行發生 去掉時間或順序所產生的耦合 這樣我們可以獲的很多彈性並且減少時間上的依賴

尋找並行

我們要在專案中找出哪些操作可以同時發生哪些操作必須嚴格的照順序發生常見的方法是使用UML中的activity diagram

來看一下酒保怎麼做出飲料

Alt text

看了流程之後你發現其實步驟 1, 2, 4, 10, 11 可以在一開始就並行的去做做完1,2,4之後 3,5,6又可以並行的去做所以要是每個任務的單位時間一樣原本需要12個單位的時間如果可以成功並行那就只需要6個單位時間

並行的機會

雖然我們看到了並行的可能但並不表示這些地方真的可以如我們所願的並行剛剛說的6個單位時間的完成法酒保必須要有5雙手才可以達成

所以在程式碼中我們想要找出耗費時間的任務 但這任務卻又不是在執行程式碼比如說查詢資料庫存取外部服務等待使用者輸入等等這些事情會讓程式停滯這些停滯的時候就是處理並行的好時機

平行的機會

記住兩者的區別並行是個軟體機制平行是個硬體機制

如果我們有多個處理器我們就可以為他們分配可以平行拆分的工作然後再合併結果

要找出並行和平行的機會並不難

找出機會不難難的是如何安全地實現本文接下來的章節會討論安全實現的問題

不要共用狀態

假設你在一家餐廳你問服務生有沒有蘋果派服務生轉頭看了一下烤箱還有最後一個於是你就點了蘋果派

但在同一個時間有另一個客人也問一樣的問題也點了蘋果派那這家餐廳就出包了一定有一個客人吃不到

Shared State Is Incorrect State

非原子性的更新

簡單的來看一下程式碼

Alt text

雖然現實生活中這兩個服務員是平行工作因為這兩個服務員幾乎同時執行程式碼同時認為display_case.pie_count > 0 所以兩個都執行display_case.take_pie()

這裡的問題不是兩個人共用記憶體問題是出在兩個人無法保證他們對記憶體的看法一致因為當他們要看剩多少派的時候需要先把共享記憶體的資料複製到私人記憶體再來做判斷但在判斷的時候可能資料已經過時了

那要怎麼確保原子性呢

Semaphor

Semaphor就是個最簡單的鎖當服務生手上握著鎖的時候才可以幫忙點餐

case_semaphore.lock()
if display_case.pie_count > 0 
  promise_pie_to_customer() 
  display_case.take_pie() 
  give_pie_to_customer()
end
case_semaphore.unlock()

非交易型更新

共用記憶體身為並行性問題的根源自然受到了很多關注事實上只要是任何應用程式程式碼可共用可變資源都可能出現問題

Random Failures Are Often Concurrency Issues

除了semaphor 其他隊共用資源的獨佔存取包含mutex, monitor等等

這些需要外在的枷鎖才可以正確存取共用狀態的方法很複雜也很容易出錯有沒有簡單一點的方式來寫並行的程式呢??

參與者模型 Actor model

什麼是Actor呢就是一個獨立的虛擬處理器有著自己的狀態和郵箱當你的郵箱有了新的訊息而且參與者有空的話就會處理這個訊息一路處理到郵箱的所有訊息處理完後又進入空閒狀態

關於Actor 有幾個重要的特質

1.系統內沒有東西是可控的沒有人能安排接下來要發生什麼也沒有人可以安排從原始資料到最終輸出的資訊傳輸

2.系統的唯一狀態被保存在訊息之中還有每個參與者的本地狀態

3.除了接收端可以檢查訊息之外沒有人可以看到參與者收到的訊息除了參與者之外也沒有人可以存取參與者的本地狀態

4.所有的資訊都是單向的沒有回覆的概念如果你希望參與者回應你就要在訊息裡面寫好自己的郵箱地址然後參與者會再發另一條消息到指定的郵箱

5.參與者處理每條訊息直到完成並且一次只處理一條訊息

因此參與者的執行是並行非同步而且不共用任何內容的

使用參與者模型可以做到不共用狀態的並行工作

實作參與者模型的語言

Erlang/Elixir 有興趣的話可以看他們怎麼有效的使用參與者模型增加應用的可靠程度

jyt0532's Blog

Concurrency - 並行

第六章: 並行

打破時間耦合

尋找並行

並行的機會

平行的機會

要找出並行和平行的機會並不難

不要共用狀態

非原子性的更新

Semaphor

非交易型更新

參與者模型 Actor model

實作參與者模型的語言

相關文章

jyt0532's Blog

Concurrency - 並行

第六章: 並行

打破時間耦合

尋找並行

並行的機會

平行的機會

要找出並行和平行的機會並不難

不要共用狀態

非原子性的更新

Semaphor

非交易型更新

參與者模型 Actor model

實作參與者模型的語言

相關文章

Pragmatic Projects - 務實的專案 12 Sep 2020

Before Project - 專案啟動前 23 Aug 2020

While You Are Coding - 當您寫程式時 17 Aug 2020

Bend or Break - 彎曲或弄壞 25 Jul 2020