Actor引用, 路径与地址

本章描述actor如何被确定,以及在一个可能是分布式的actor系统中如何定位。这与 Actor系统 的核心概念有关:固有的树形监管结构和跨多个网络节点的actor之间进行透明通讯。

上图展示了actor系统中最重要的实体关系,请继续阅读了解详情。

什么是Actor引用?

Actor引用是 ActorRef 的子类,其最重要的目的是支持向它所代表的actor发送消息。每个actor通过self字段来访问自己的标准(本地)引用;在给其它actor发送的消息中也缺省包含这个引用。反过来,在消息处理过程中,actor可以通过sender()方法来访问到当前消息的发送者的引用。

根据actor系统的配置,支持几种不同类型的actor引用:

  • 纯本地actor引用,在配置为不使用网络功能的actor系统中使用。这些actor引用如果通过网络连接传给远程的JVM,将不能正常工作。
  • 本地actor引用,在配置为使用远程功能的actor系统中使用,来代表同一个JVM的actor。为了能够在被发送到其它节点时仍然可达,这些引用包含了协议和远程地址信息。
  • 本地actor引用的一个子类,用在路由器中(routers,即混入 了 Router trait的actor)。它的逻辑结构与之前的本地引用是一样的,但是向它们发送的消息会被直接重定向到它的子actor。
  • 远程actor引用,代表可以通过远程通讯访问的actor,即向他们发送消息时会透明地对消息进行序列化,并发送到别的JVM。
  • 有几种特殊的actor引用类型,在实际用途中比较类似本地actor引用:
    • PromiseActorRef 表示一个Promise,其目的是通过一个actor返回的响应来完成。它是由 akka.pattern.ask 创建的。
    • DeadLetterActorRef是死信服务的缺省实现,所有接收方被关闭或不存在的消息都被重新路由在此。
    • EmptyLocalActorRef是当查找一个不存在的本地actor路径时Akka返回的:它相当于DeadLetterActorRef,但是它保有其路径因此可以在网络上发送,并与其它相同路径的存活的actor引用进行比较,其中一些存活的actor引用可能在该actor消失之前被得到。
  • 然后有一些内部实现,你应该永远不会用上:
    • 有一个actor引用并不表示任何actor,只是作为根actor的伪监管者存在,我们称它为“时空气泡穿梭者”。
    • 在actor创建设施启动之前运行的第一个日志服务,是一个伪actor引用,它接收日志事件并直接显示到标准输出上;它就是 Logging.StandardOutLogger

什么是Actor路径?

由于actor是以一种严格的树形结构样式来创建的,所以沿着子actor到父actor的监管链,一直到actor系统的根存在一条唯一的actor名字序列。这个序列可以被看做是文件系统中的文件路径,所以我们称之为“路径”。就像在一些真正的文件系统中一样,也存在所谓的“符号链接”,即一个actor也许能通过不同的路径被访问到,除了原始路径外,其它的路径都涉及到对actor实际监管祖先链的某部分路径进行转换的方法。这些特性将在下面的内容中介绍。

一个actor路径包含一个锚点,来标识actor系统的,之后是各路径元素的连接,从根监护者到指定的actor;路径元素是路径经过的actor的名字,以"/"分隔。

Actor引用和路径之间有什么区别?

Actor引用标明了一个actor,其生命周期和actor的生命周期保持匹配;actor路径表示一个名称,其背后可能有也可能没有真实的actor,而且路径本身不具有生命周期,它永远不会失效。你可以创建一个actor路径,而无需创建一个actor,但你不能在创建actor引用时不创建相应的actor。

注意

这个定义并不适用于actorFor,这是为什么废弃actorFor而选择actorSelection的原因之一。

你可以创建一个actor,终止它,然后创建一个具有相同路径的新actor。新创建的实例是actor的一个新的化身。它并不是一样的actor。一个指向老的化身的actor引用不适用于新的化身。发送给老的actor引用的消息不会被传递到新的化身,即使它们拥有相同的路径。

Actor路径锚点

每一条actor路径都有一个地址组件,描述访问这个actor所需要的协议和位置,之后是从根到actor所经过的树节点上actor的名字。例如:

"akka://my-sys/user/service-a/worker1"                   // 纯本地
"akka.tcp://[email protected]:5678/user/service-b" // 远程

在这里, akka.tcp 是Akka 2.2及以上版本默认的远程传输方式,其它的方式都是可以通过插件引入的。对使用UDP的远程主机可以使用akka.udp访问。对主机和端口部分的解析(即上例中的host.example.com:5678)决定于所使用的传输机制,但是必须遵循URI的结构标准。

Actor逻辑路径

顺着actor的父监管链一直到根的唯一路径被称为actor逻辑路径。这个路径与actor的创建祖先关系完全吻合,所以当actor系统的远程调用配置(和配置中路径的地址部分)设置好后它就是完全确定的了。

Actor物理路径

Actor逻辑路径描述它在一个actor系统内部的功能位置,而基于配置的远程部署意味着一个actor可能在另外一台网络主机上被创建,即另一个actor系统中。在这种情况下,从根守护者穿过actor路径来找到该actor肯定需要访问网络,这是一个很昂贵的操作。因此,每一个actor同时还有一条物理路径,从actor对象实际所在的actor系统的根开始。与其它actor通信时使用物理路径作为发送方引用,能够让接收方直接回复到这个actor上,将路由延迟降到最小。

物理路径的一个重要性质是它决不会跨多个actor系统或跨JVM虚拟机。这意味着如果一个actor有祖先被远程监管,则其逻辑路径(监管树)和物理路径(actor部署)可能会分叉。

如何获得Actor引用?

actor引用的获取方法分为两类:通过创建actor,或者通过查找actor。后一种功能又分两种:通过具体的actor路径来创建actor引用,和查询actor逻辑树。

创建Actor

一个actor系统通常是在根守护者上使用ActorSystem.actorOf创建actor来启动,然后在创建出的actor中使用ActorContext.actorOf来展开actor树。这些方法返回的是指向新创建的actor的引用。每个actor都拥有到它的父亲,它自己和它的子actor的引用(通过ActorContext访问)。这些引用可以与消息一起被发送给别的actor,以便接收方直接回复。

通过具体的路径来查找actor

另外,可以使用ActorSystem.actorSelection来查找actor引用。“选择”可在已有actor与被选择的actor进行通讯的时候用到,在投递每条消息的时候都会用到查找。

为了获得一个绑定到指定actor生命周期的ActorRef,你需要发送一个消息,如内置的Identify信息,向指定的actor,所获得的sender()即为所求。

注意

actorFor因被actorSelection替代而废弃,因为actorFor对本地和远程的actor表现有所不同。对一个本地actor引用,被查找的actor需要在查找之前就存在,否则获得的引用是一个EmptyLocalActorRef。即使后来与实际路径相符的actor被创建,所获得引用仍然是这样。对于actorFor行为获得的远程actor 引用则不同,每条消息的发送都会在远程系统中进行一次按路径的查找。

绝对路径 vs 相对路径

除了ActorSystem.actorSelection还有一个ActorContext.actorSelection,这是可以在任何一个actor实例中通过context.actorSelection访问的。它的actor查找与ActorSystem的返回值非常类似,不同在于它的路径查找是从当前actor开始的,而不是从actor树的根开始。可以用 ".." 路径来访问父actor. 例如,你可以向一个指定兄弟发送消息:

context.actorSelection("../brother") ! msg

当然绝对路径也可以在 context 中使用,即

context.actorSelection("/user/serviceA") ! msg

也能正确运行。

查询逻辑Actor树

由于actor系统是一个类似文件系统的树形结构,对actor路径的匹配与Unix shell中支持的一样:你可以将路径(中的一部分)用通配符(«*» 和 «?»)替换,来组成对0个或多个实际actor的选择。由于匹配的结果不是一个单一的actor引用,它拥有一个不同的类型ActorSelection,这个类型不完全支持ActorRef的所有操作。选择也可以用ActorSystem.actorSelectionActorContext.actorSelection两种方式来获得,并且支持发送消息:

context.actorSelection("../*") ! msg

会将msg发送给包括当前actor在内的所有兄弟。对于用 actorFor获取的actor引用,为了进行消息的发送,会对监管树进行遍历。由于在消息到达其接收者的过程中,与查询条件匹配的actor集合可能会发生变化,要监视查询的实时变化是不可能的。如果要做这件事情,通过发送一个请求,收集所有的响应来解决不确定性,提取所有的发送方引用,然后监视所有被发现的具体actor。这种处理actor选择的方式也许会在未来的版本中进行改进。

总结: actorOf vs. actorSelectionvs. actorFor

Note

以上部分所描述的细节可以简要地总结和记忆成:

  • actorOf 永远都只会创建一个新的actor,这个新的actor是actorOf所调用上下文(可以是任意一个actor或actor系统本身)的直接子actor
  • actorSelection只会在消息送达后查找已经存在的actor集合,即不会创建actor,也不会在创建选择集合时验证actor是否存在。
  • actorFor(废弃,已经被actorSelection取代) 永远都只是查找到一个已存在的actor,不会创建新的actor。

Actor引用和路径相等性

ActorRef的相等性与ActorRef的目的匹配,即一个ActorRef对应一个目标actor化身。两个actor引用进行比较时,如果它们有相同的路径且指向同一个actor化身,则两者相等。指向一个已终止的actor的引用,与指向具有相同路径但却是另一个(重新创建)actor的引用是不相等的。需要注意的是,由于失败造导致的actor重启,仍意味着它是同一个actor化身,即重新启动对ActorRef消费者是不可见的。

actorFor获得的远程actor引用不包括其身份的所有信息,因此,这种引用不能等于actorOfsendercontext.self的引用。正因如此actorForactorSelection替换废弃。

如果你需要跟踪一个集合中的actor引用,并不关心具体的actor化身,你可以使用ActorPath为键(key),因为目标actor的标识符在比较actor路径时没有被用到。

重用Actor路径

当一个actor被终止,其引用将指向一个死信邮箱,DeathWatch将发布其最终的转变,并且一般地它也不会起死回生(因为actor的生命周期不允许这样)。虽然以后可能创建一个具有相同路径的actor——如果无法保留actor系统开始以来创建的所有可用actor,则无法保证其反向成立——但是这不是一个好的实践:通过acterFor获取的已经‘死亡’的远程actor引用突然再次开始工作,但没有这种过渡和任何其他事件之间顺序的任何保证,因此,该路径的新居民可能收到本意是送给其以前住户的消息。

在某些非常特殊的情况下这可能是正确的事情,但一定要限制这种处理只能由其监管者操作,因为它是唯一可以可靠地检测名称正确注销的actor,在注销之前的新创建子actor的操作将失败。

它在测试中可能也是必要的,当测试对象取决于某个特定路径被实例化的时候。在这种情况下,最好mock其监管者,这样它会将终止消息转发至测试过程正确的点,使后者能够等待登记名字的正确注销。

与远程部署之间的互操作

当一个actor创建一个子actor,actor系统的部署者会决定新的actor是在同一个jvm中还是在其它节点上。如果是后者,actor的创建会通过网络连接引到另一个jvm中进行,因而在另一个actor系统中。远程系统会将新的actor放在一个专为这种场景所保留的特殊路径下,新的actor的监管者将会是一个远程actor引用(代表触发它创建动作的actor)。这时,context.parent(监管者引用)和context.path.parent(actor路径上的父actor)表示的actor是不同的。然而,在其监管者中查找这个actor的名称将会在远程节点上找到它,保持其逻辑结构,例如向另一个未确定(unresolved)的actor引用发送消息。

路径中的地址部分用来做什么?

在网络上传送actor引用时,是用它的路径来表示的。因此,它的路径必须包括能够用来向它所代表的actor发送消息的完整信息。这一点是通过将协议、主机名和端口编码在路径字符串的地址部分做到的。当actor系统从远程节点接收到一个actor路径,会检查它的地址部分是否与自己的地址相同,如果相同,那么会将这条路径解析为本地actor引用,否则解析为一个远程actor引用。

Actor路径的顶级作用域

在路径树的根上是根监管者,所有其他actor都可以从通过它找到;它的名字是"/"。在第二个层次上是以下这些:

  • "/user" 是所有由用户创建的顶级actor的监管者;用 ActorSystem.actorOf创建的actor在其下。
  • "/system" 是所有由系统创建的顶级actor的监管者,如日志监听器,或由配置指定在actor系统启动时自动部署的actor。
  • "/deadLetters" 是死信actor,所有发往已经终止或不存在的actor的消息会被重定向到这里(以尽最大努力为基础:即使在本地JVM,消息也可能丢失)
  • "/temp"是所有系统创建的短时actor的监管者,例如那些在ActorRef.ask的实现中用到的actor。
  • "/remote" 是一个人造虚拟路径,用来存放所有其监管者是远程actor引用的actor。

需要为actor构建这样的名称空间源于一个核心的非常简单的设计目标:在树形结构中的一切都是一个actor,以及所有的actor都以相同方式工作。因此,你不仅可以查找你所创建的actor,你也可以查找系统守护者并发送消息(在这种情况下它会忠实地丢弃之)。这个强大的原则意味着不需要记住额外的怪异模式,它使整个系统更加统一和一致。

如果您想了解更多关于actor系统的顶层结构,参考顶级监管者