Erlang初体验

jopen 9年前

我对 Erlang 编程理念的理解:以分布式架构师的角度写代码。

函数式编程

Erlang 里面的函数是数学里面的函数:必须有返回值。只要是函数必然有返回值,函数是一个过程,以英文的句号为函数结束符。函数结束之前的表达式就是该函数的返回值。所以这也是在 Erlang 里面的函数不会看到任何 return 语句的原因。 C++ 等其他语言的函数和函数之前可以通过共享变量来实现消息传递。 Erlang 里面的函数不可以,消息的传递通过函数的传入和传出。也只是为什么 Erlang 号称天生之处并行处理的原因,因为他们不共享变量,也就不需要加锁。

很多人听到函数式编程都会觉得高大上或者晦涩难懂。因为函数是编程没有 for 循环语句,但是在我看来,关键在于会使用【列表推倒】和【尾递归】来进行循环遍历。说到函数式编程就会拿快速排序说事,下面这个示例是 Erlang 版本的快速排序:

-module(sort).    -export([qsort/1]).    qsort([]) -> [];  qsort([Pivot | T]) ->      qsort([X || X <- T, X < Pivot]           ++ [Pivot] ++           qsort([X || X <- T, X >= Pivot]).

非常简洁,[Pivot | T] 就是拿列表的第一个元素当快排中的 Pivot 。

[X || X <- T, X < Pivot]

上式就是【列表推导】,含义就是找出列表 T 中所有元素小于 Pivot 中的元素组成一个新的列表。不过,这个例子显然性能不高,只是一个示例。

很多人一直在鼓吹函数式语言马上就要迎来朝阳,但是在我看来,函数式编程永远只能是小众语言,这就像当年的 lisp machine ,被鼓吹的天花乱坠还是夭折了。现在主流的计算机架构都是冯诺依曼体系的,并不是最适合函数式语言的生存土壤。

一切都是常量

没有变量,也就没有通过变量共享状态导致的资源竞争,也就不需要加锁。任何状态的变化都是通过函数的输入输出来进行改变,轻量级进程的状态变化也是靠消息传递(函数的输入输出)来实现。这也是为什么有人说函数式编程适合高并发的原因,因为他们没有变量,一切都是常量。

轻量进程

Erlang 里面有 spawn 函数,可以快速的创建一个 process ,这里的 process 不是操作系统的进程,而是 Erlang 自己的轻量进程。 Erlang 轻量到超乎你想象,构建 kv 数据库的时候,甚至可以对不同的 key 分配给不同的进程。而且进程的表示单位是 Pid ,只要知道进程的 Pid,哪怕该进程是在别的机器上面,都可以很轻易的发送给它。原因是 Erlang 的【天生自带RPC通信】和【自带端口映射】

天生自带RPC通信

ToPid ! Data

ToPid 是接受方进程的id , Data 可以是 Erlang 的任何类型,比如

Pid ! {name, "yanyiwu.com"}.

也就是可以直接把任何数据结构当成消息发送,天生自带 RPC 通信。(虽然本来 RPC 的含义是“远程过程调用”,不过其实反正就是帮你序列化了数据结构,Erlang 的 ! 操作符也是如此。)

进程端口映射

节点之间发消息在代码里面的表示也还是

ToPid ! Data

也就是在写代码的时候,根本不用考虑该进程是在哪台机器上面,无论是本 Erlang 进程(这里的进程是操作系统级别的进程,不是 Erlang 的轻量进程) 内,还是其他机器的进程,都不用管。这是因为有 epmd 的存在。

Epmd是Erlang Port Mapper Daemon的缩写,在Erlang集群中相当于dns的作用,供给节点名称到端口的查询办事,epmd绑定在总所周知的4369端口上。

有了 epmd ,写分布式程序就好像写单机程序一样简单。

严密的模块化管理

Erlang 的模块类似 C++ 中的 namespace(命名空间),但是比命名空间更利于高效的软件工程管理。

在 Erlang 项目源码中处处可见如下代码。

-module(my_app).  -export([start/2, stop/1]).

-module 指明模块名,-export 指明导出的函数。未被导出的函数都无法被外界调用。从软件工程上看的话,这样使得模块功能和使用方法更加清晰。使用者只需要关心如何 -export 里面的函数即可。相比较之下 C++ 对这方面特别不规范,而 Java 通过对类声明为 public class 指明可以被外界使用,Node.js 也是使用 export 来显示声明可以被外界使用的函数。

行为模式

-module(ecomet_app).    -behaviour(application).    %% comment: Application callbacks  -export([start/2, stop/1]).  -behavior(application).

Erlang/otp 里面的【行为模式】概念等价于 OOP 里面的接口概念。上面代码示例的意思就是该模块(ecomet_app)遵守的行为模式是(application)。刚行为模式需要实现的两个接口函数就是 -export([start/2, stop/1]).

另一个示例如下是遵守监督者(supervisor)行为模式,实现的一个接口函数是 -export([init/1]).

-module(ecomet_sup).    -behaviour(supervisor).    %% Supervisor callbacks  -export([init/1]).

监督者机制

Erlang/otp 的天生分布式特性在监督机制里面体现的很好,每一个 otp 应用启动的时候,都是启动监督者(supervisor)和工作者(worker)。他们的关系是树形结构,每个工作者的上级都会有监督者,每个监督者的上级也可能有监督者。当工作者异常退出的时候,监督者会根据相应的参数决定是否对工作者进行重启。如果重启失败的话监督者也会退出,而更加上层的监督者收到信号后会对他们进行重启等处理。这个监督者机制非常好理解,其实就是 OOP 编程里面的 try ... catch 异常处理机制。当出现异常的时候一层一层的往上抛出,直到有人重启。

otp平台

Erlang 最强大的地方也是最让我感觉难学的地方,就是它的 otp 平台。各种行为模式,让我感觉就像多年以前学习 MFC 的时候,感觉很强大,但是却总是感觉自己被按死在一条特定的轨道上面奔跑,有种不自由的疲惫感。

代码热切换

热切换也叫热升级,大部分情况下,如果需要对 C++/Java 程序进程版本升级,则需要重启进程。 Erlang 支持热切换的意思就是可以在运行的时候进行代码升级。升级过程不影响进程的运行,而且在过渡阶段新旧版本还可以共存。是不是碉堡了。这个功能对于那些需要 7x24 高可用的服务来说简直就是爽爆了。

Erlang 进程本身可以通过一个类似“后门”的控制台 erl 来实时的查看状态,甚至直接使用控制台来修改配置等,非常方便,这对于大部分其他语言来说,简直就是黑魔法般神奇的存在。

典型缺点

  • 文档太少,出现问题搜索出来的答案也少。
  • Erlang 人才稀缺,招聘不易。
  • 动态语言最典型的就是调试不易。
  • 上手门槛较高。

最后,我只是 Erlang 的入门初学者,因为工作中需要使用 ejabberd (Erlang 的开源项目),从而学习了 Erlang ,欠缺实战经验,所以这篇文章标题起为 【Erlang初体验】。

原文地址:http://yanyiwu.com/work/2014/11/26/erlang-otp-experience.html