English
邮箱
联系我们
网站地图
邮箱
旧版回顾



hwx88环亚国际:柳岩哭诉北漂辛酸:为上镜不穿秋裤,感冒坚持不吃药

文章来源:hwx88环亚国际    发布时间:2018年07月22日 07:30  【字号:      】

hwx88环亚国际

当晚,有热心人将老人走失的信息转发到媒体微信群,全城媒体几乎都行动起来,南国都市报官方微博当即发布了寻人信息,广播、电视台等省内其他媒体也纷纷播报相关信息,帮忙寻人。与此同时,不少市民也在各自的微信群和朋友圈帮忙转发。

在大家的接力转发、寻找之下,3日下午3点半左右,终于传来了好消息。一位姓叶的热心市民发布朋友圈称:“一位阿公走路到店门口附近的草坪中暑晕倒了,说话含糊不清,手脚哆嗦,已送去滨海派出所,等待家人过来接走,认识的请帮忙转告哦!”有人发现这位阿公正是吴先生的父亲,立马给吴先生的家属打来了电话。

“谢谢大家的帮忙!我们已经把父亲接回家,他现在就是身体有些虚弱,其他一切还好。”吴先生说。

“像老D这样的高手,已经不多了。”飞鹰便衣大队统计的信息显示,多年前,以手指在杯里夹肥皂片方式训练,广收徒弟的老A出狱后已经不再收徒,徒弟们至今都关在了监狱里,老D是剩下为数不多难啃的硬骨头。

老D团伙成员大多是“多进宫”的中老年人,有技术,加上胆小谨慎,口风紧,谁被抓现行了,往往自己承揽所有。在便衣公交站前蹲守,甚至家里四周都被安插眼线的高压下,他们最近几乎“颗粒无收”,悄然间也改变了策略。

近期,老D他们通过社会上的各色朋友找到便衣队员,“有没有时间一起吃个饭?喝点小酒?”

清明时节念母恩

我深切怀念的妈妈:

您在天堂过的还好吗?天堂没有病魔也没有痛苦吧?

OMT

亚马逊Alexa再次抽风,莫名其妙把私人对话发给同事

目前家居使用Echo或谷歌Home等语音助手已经成为主流趋势。

据市场研究公司eMarketer统计,在美国,超过6千万的消费者每个月至少使用过一次智能语音助手,其中的4千万人用的亚马逊Alexa。

但这次事件之后,像Danielle一样担心自己隐私的人,再也不会给Alexa接上电源。

我不会再相信它了。

现在大家都说马斯克很了不起,我认为他最了不起之处在于用好了科学家,把科学家的观点转化成自己的观点。

马云:创新是逼出来的,不是资金和任务堆出来的

科学界和企业界,特别是科学界,我觉得要弥补的是未来的空白,而不是昨天的空白,也不是今天的空白。不是美国有,俄罗斯有,我们就必须有,而是因为未来需要,我们才去研发和探索,因为世界已经进入新的赛道,我们有机会换道超车。

今天很多东西,美国也没有,欧洲也没有,俄罗斯也没有,我们是有机会做出我们自己有的东西。

所以研究也不仅仅因为有兴趣,研究必须要有价值,当年在美国的很多研究院所提出研究for fun、研究 for profit,而今天则应是research for solving problems with profit and fun。

我们必须解决问题,同时又有快乐,又有价值和利润,只有这样的研究才能持久发展,人类没有未来的专家,我们对未来只是探索。我们要相信,所有的专家都是昨天的,不学习,谁也成不了专家,谁也当不了学者。

本论文研究者认为解决该问题的关键在于通信,这可以增强策略间的协调。MARL 中有一些学习通信的方法,包括 DIAL [3]、CommNet [23]、BiCNet [18] 和 master-slave [7]。然而,现有方法所采用的智能体之间共享的信息或是预定义的通信架构是有问题的。当存在大量智能体时,智能体很难从全局共享的信息中区分出有助于协同决策的有价值的信息,因此通信几乎毫无帮助甚至可能危及协同学习。此外,在实际应用中,由于接收大量信息需要大量的带宽从而引起长时间的延迟和高计算复杂度,因此所有智能体之间彼此的通信是十分昂贵的。像 master-slave [7] 这样的预定义通信架构可能有所帮助,但是它们限定特定智能体之间的通信,因而限制了潜在的合作可能性。

学界|北京大学提出注意力通信模型ATOC,助力多智能体协作

为了解决这些困难,本论文提出了一种名为 ATOC 的注意力通信模型,使智能体在大型 MARL 的部分可观测分布式环境下学习高效的通信。受视觉注意力循环模型的启发,研究者设计了一种注意力单元,它可以接收编码局部观测结果和某个智能体的行动意图,并决定该智能体是否要与其他智能体进行通信并在可观测区域内合作。如果智能体选择合作,则称其为发起者,它会为了协调策略选择协作者来组成一个通信组。通信组进行动态变化,仅在必要时保持不变。研究者利用双向 LSTM 单元作为信道来连接通信组内的所有智能体。LSTM 单元将内部状态(即编码局部观测结果和行动意图)作为输入并返回指导智能体进行协调策略的指令。与 CommNet 和 BiCNet 分别计算内部状态的算术平均值和加权平均值不同,LSTM 单元有选择地输出用于协作决策的重要信息,这使得智能体能够在动态通信环境中学习协调策略。

研究者将 ATOC 实现为端到端训练的 actor-critic 模型的扩展。在测试阶段,所有智能体共享策略网络、注意力单元和信道,因此 ATOC 在大量智能体的情况下具备很好的扩展性。研究者在三个场景中通过实验展示了 ATOC 的成功,分别对应于局部奖励、共享全局奖励和竞争性奖励下的智能体协作。与现有的方法相比,ATOC 智能体被证明能够开发出更协调复杂的策略,并具备更好的可扩展性(即在测试阶段添加更多智能体)。据研究者所知,这是注意力通信首次成功地应用于 MARL。

图 1:ATOC 架构。

图 2:实验场景图示:协作导航(左)、协作推球(中)、捕食者-猎物(右)。




(责任编辑:解彦融)

附件:

专题推荐

相关新闻


© 1996 - 2017 中国科学院 版权所有 京ICP备05002857号  京公网安备110402500047号 

网站地图    地址:北京市三里河路52号 邮编:100864