English
邮箱
联系我们
网站地图
邮箱
旧版回顾



am8dc27-.com:重庆市人民政府关于印发…

文章来源:am8dc27-.com    发布时间:2018年07月20日 15:04  【字号:      】

am8dc27-.com
说着,便要上去抢夺。

小姐跟她说过,既有法宝,自然也有邪器。法器为了镇邪,邪器为的就是害人。

带有血煞的东西,必定是邪器!

可她身单力孤,哪里抢得过这几个身负武功的壮汉?其中一人伸手一推,她便跌倒在地,撞得手肘生疼。

“你们站住!那是邪器,不能乱动!”

两人琢磨来琢磨去,从半山腰转到另一条路上。

“来来来,我们到那边去,可以看到他们!”

两个小姑娘偷偷摸摸,借着山石的遮掩,盯着飞仙石的方向。

“你看,他们在说话!肯定是真的约好的。”安乡县主小声咬耳朵。

“也许只是碰到了,打个招呼而已。”明湘还是不愿意相信,七姐和杨公子有关系。

“你这丫头……”

黄莺没说完,明老夫人已开口:“黄莺,取衣裳来。”

“老夫人……”

二夫人那边,素节派了别的丫鬟。

听她这么说,二夫人愣了下,问:“现在?”

杨殊不高兴了:“你什么意思?本公子哪里不好了?”

“好好好,你很好。”她很敷衍地回了一句,说道,“我也没说天底下的男人都这样,你不用急着为自己辩解。”

她浪迹江湖多年,什么龌龊事没见过?世上有坏人自然也有好人。

她只是觉得,明三夫人太可怜了,别人遇到坏人也会遇到好人,偏她遇到的都是坏人。

被这一打岔,气氛变得轻松了一些。

GPLP君也见过很多LP转型GP成功的案例。

对此,GP请给LP一个投资的理由?

潮退了,才知道谁在裸泳。

或许,募资难还将持续更长时间。

明微也知道这一点,所以不常过来。

但今日,她不得不来。

昨夜杨殊又翻墙进了余芳园,丢给她一张舆图:“我知道翠是什么意思了。”

“什么?”

“翠幕峰。”他说,“就在秀丰山上。”

从博鳌论坛炒到数博会,区块链为何不见突破?

文/孟永辉

今年的区块链始终都是一个热点,走到哪里都会被一群人追捧和跟随。最近在数博会上,区块链再度成为人们口中热议的话题,就连马云都不可避免地谈及了区块链技术。看来,区块链技术还将会把当下这种火热的气势延续下去。尽管如此,当下人们对于区块链的讨论还是相当浅显,我们仅仅只是知道区块链是一个风口,但是真正介入其中后发现,区块链还是始终都逃不过它的母体——数字货币。

杨殊笑了笑,搁下匕首。

阿玄问:“我的血行不行?”

“活人的血,对妖邪都有克制作用。”明微说,“不过现在不必了,他的血最有用。”

“……”阿玄心说,既然有用,怎么不早说?他带来的人这么多,一人放一点,都能把飞仙石给淹了。

幸好他没说出口。他要是说了,明微就会回他,既然有更好用的,为什么要选次一等的?

本论文研究者认为解决该问题的关键在于通信,这可以增强策略间的协调。MARL 中有一些学习通信的方法,包括 DIAL [3]、CommNet [23]、BiCNet [18] 和 master-slave [7]。然而,现有方法所采用的智能体之间共享的信息或是预定义的通信架构是有问题的。当存在大量智能体时,智能体很难从全局共享的信息中区分出有助于协同决策的有价值的信息,因此通信几乎毫无帮助甚至可能危及协同学习。此外,在实际应用中,由于接收大量信息需要大量的带宽从而引起长时间的延迟和高计算复杂度,因此所有智能体之间彼此的通信是十分昂贵的。像 master-slave [7] 这样的预定义通信架构可能有所帮助,但是它们限定特定智能体之间的通信,因而限制了潜在的合作可能性。

学界|北京大学提出注意力通信模型ATOC,助力多智能体协作

为了解决这些困难,本论文提出了一种名为 ATOC 的注意力通信模型,使智能体在大型 MARL 的部分可观测分布式环境下学习高效的通信。受视觉注意力循环模型的启发,研究者设计了一种注意力单元,它可以接收编码局部观测结果和某个智能体的行动意图,并决定该智能体是否要与其他智能体进行通信并在可观测区域内合作。如果智能体选择合作,则称其为发起者,它会为了协调策略选择协作者来组成一个通信组。通信组进行动态变化,仅在必要时保持不变。研究者利用双向 LSTM 单元作为信道来连接通信组内的所有智能体。LSTM 单元将内部状态(即编码局部观测结果和行动意图)作为输入并返回指导智能体进行协调策略的指令。与 CommNet 和 BiCNet 分别计算内部状态的算术平均值和加权平均值不同,LSTM 单元有选择地输出用于协作决策的重要信息,这使得智能体能够在动态通信环境中学习协调策略。

研究者将 ATOC 实现为端到端训练的 actor-critic 模型的扩展。在测试阶段,所有智能体共享策略网络、注意力单元和信道,因此 ATOC 在大量智能体的情况下具备很好的扩展性。研究者在三个场景中通过实验展示了 ATOC 的成功,分别对应于局部奖励、共享全局奖励和竞争性奖励下的智能体协作。与现有的方法相比,ATOC 智能体被证明能够开发出更协调复杂的策略,并具备更好的可扩展性(即在测试阶段添加更多智能体)。据研究者所知,这是注意力通信首次成功地应用于 MARL。

图 1:ATOC 架构。

图 2:实验场景图示:协作导航(左)、协作推球(中)、捕食者-猎物(右)。

杀了上官,这可麻烦了。

若是没杀,还可以徐徐图之。既然杀了,说明对方没了退路,只有一条道走到黑了。

“大人。”雷鸿提议,“不如属下拼一拼,擒贼先擒王。”

蒋文峰摆手:“你武功虽高,但在弓弩之下,占不着便宜,何必浪费性命?”

“可是……”

“这是不是可以说,他死得毫无预兆?”

杨殊道:“定然是他没意识到自己会死,或许他觉得,这只是一项简单的任务,还不到需要留下线索的地步。”

两人目光相对,从对方的眼睛里看到了疑虑。

“我用金簪引得他派人来偷,这等于把事情摆到了明面上。”明微说。

杨殊点点头。




(责任编辑:邹悦成)

附件:

专题推荐

相关新闻


© 1996 - 2017 中国科学院 版权所有 京ICP备05002857号  京公网安备110402500047号 

网站地图    地址:北京市三里河路52号 邮编:100864