基于消息传递的并发模型

An object oriented language is a language with good support for objects.
A concurrency oriented language has good support for concurrency.

–Joe Armstrong

两类通用并发模型:参考七周七并发模型

  • 共享内存型Shared Memory
    • 线程Threads
    • 锁Locks
    • 互斥l量Mutexes
  • 消息传送型(CSP和Actor模型)
    • 进程Processes
    • 消息Messages
    • 不共享数据(状态)No shared data

重点介绍消息传送型的两种模型Actor和CSP(Communicating Sequential Process)的各项对比

主要目的:除了常用的Python、Java等用的并发模型之外,还存在这么个东西

先看两段代码

代码示例对比

使用Erlang代码和Go代码分别实现打印服务print_server,用来对比模型使用差异

Actor模型-Erlang代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
%%%-------------------------------------------------------------------
%%% @author Suncle
%%% @doc
%%% print_server
%%% @end
%%% Created : 2017/12/18 14:53
%%%-------------------------------------------------------------------
-module(print_server).
-author("Flowsnow").

%% API
-export([print_server/0, start_print_server/0, send_msg/2]).


print_server() ->
receive
Msg ->
io:format("print_server received msg: ~p~n", [Msg]),
print_server()
end.

start_print_server() ->
Pid = spawn(?MODULE, print_server, []),
Pid.

send_msg(Msg, Pid) ->
Pid ! Msg,
io:format("send_normal_msg: ~p~n", [Msg]).

Erlang shell输出结果如下:

1
2
3
4
5
6
7
8
1> c("print_server.erl").
{ok,print_server}
2> Pid = print_server:start_print_server().
<0.39.0>
3> print_server:send_msg("hello", Pid).
send_normal_msg: "hello"
print_server received msg: "hello"
ok

以上print_server使用的是最原始的Erlang语法实现的,也可以使用OTP gen_server原语实现更加清晰易懂

CSP模型-Go代码

print函数从channel读取消息并阻塞,直到主函数向channel写入hello消息

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
package main

import (
"fmt"
"time"
)

func main() {
c := make(chan string)
go print(c)
time.Sleep(1 * time.Second)
fmt.Println("main function: start writing msg")
c <- "hello"

var input string
fmt.Scanln(&input)
}

func print(c <-chan string) {
fmt.Println("print function: start reading")
fmt.Println("print function: reading: " + <-c)
time.Sleep(1 * time.Second)
}

输出结果如下:

1
2
3
4
D:\workspace\Go>go run print_server.go
print function: start reading
main function: start writing msg
print function: reading: hello

模型图对比

Actor

Actor1发送消息到Actor2的邮箱中,邮箱本质是队列,由Actor2消费

CSP

Process1在Channel的写入端添加消息,Process2在channel的读取端读取消息

基本特性对比

Actor

  1. 基于消息传递message-passing
  2. 消息和信箱机制:消息异步发送
  3. 保留可变状态但不共享
  4. 失败检测和任其崩溃
  5. 重点在于发送消息时的实体

CSP

  1. 基于消息传递message-passing
  2. 顺序进程Sequential processes
  3. 通过channel同步通信Synchronous communication through channels
  4. 频道交替复用Multiplexing of channels with alternation
  5. 重点在于发送消息时使用的通道channel

通信语义对比

Actor

Actor1等待消息并阻塞,直到Actor2发送消息给Actor1

Actor2发送消息给Actor3,暂存在Actor3的Mailbox中,直到Actor3接受并处理

CSP

Process1读取channel因没有消息阻塞,直到Process2向该channel添加消息

process2向channel添加消息并阻塞,直到Process3读取该channel消息

Erlang实现简易银行账户

使用Erlang原语,代码如下:

使用OTP的gen_server,代码如下:

Erlang小项目:IP数据库

使用Erlang/OTP实现的IP数据库,可以根据IP查询到具体的国家省份等,代码如下:

不一样的Erlang特性

  1. Let it crash思想:值得借鉴

比如:执行算术异常崩溃

  1. 变量是不可变的,变量一旦赋予值就无法再改变:带来的好处就是没有可变状态,就不需要内存共享,也就不需要有锁
  2. Erlang进程之间的唯一交互方式就是消息传递:Erlang中没有像C++那样,进程间拥有多种不同的交互方式(管道、消息队列、存储共享等等)。

FAQ

为什么没有容量自动增大的缓冲区?

即使现在有一个看上去永不枯竭的资源,总有一天这个资源还是会被用尽的。可能是因为时过境迁,当初的老程序现在需要解决更大规模的问题;也可能是存在一个bug,消息没有被及时处理,导致被堆积。如果没有思考缓冲区塞满时的对策,那么在未来的某个时间就有可能出现一个破坏性极强,隐蔽性极深且难以诊断的bug。最好的策略是在现在就思考如何处理缓存区被塞满的情况,将问题消灭在萌芽阶段。

因此常用的缓存区类型有三种:阻塞型(blocking),弃用新值型(dropping),移出旧值型(sliding)

Python有什么消息传递并发模型?

Actor模型pykka:https://github.com/jodal/pykka

CSP模型pycsp:https://github.com/runefriborg/pycsp/wiki/Getting_Started_With_PyCSP


图片均来源于here


参考:

捐赠:喜欢就请我喝一杯