English
邮箱
联系我们
网站地图
邮箱
旧版回顾



尊龙人生就是就是博:初中生为图表扬 借老师手机给妈妈发微信称表现好

文章来源:尊龙人生就是就是博    发布时间:2018年09月24日 10:44  【字号:      】

尊龙人生就是就是博

上下班堵车多,城市路况买个SUV底子没什么用。

”嗯……正本认为说出这话的人心态应该很达观,成果谢俊彦回头就在另一个拜访里笑着跟记者说:“咱们都是鸡肋。以古修建为中心的园林式布局构成了共同的古代文明区,成为景德镇前史悠久的陶瓷前史文明的缩影。3个月新增1.84万亿 银行保本理财替代者出现

情报|宜人贷发布2018年Q1财报;警惕“保单分红”骗局

资管新规落地后,理财产品不再刚性兑付,银行亟需寻找保本型理财产品的继任者。而结构性存款被认为是为银行理财接盘的最合适之选。央行近日公布的数据显示,截至今年4月末,中资全国性银行结构性存款规模增至9.15万亿元,仅前3个月结构性存款就已新增1.84万亿元,超过2017年1.8万亿元的全年新增规模。(上海金融报)

警惕私募保壳乱象 包通过、内部关系催办为骗局

就近期市场上出现的一些私募登记、保壳乱象行为,5月24日,中国基金业协会发表严正声明表示,协会已发现部分违法中介机构和个人罔顾职业操守和法律底线,打着“登记备案包通过”、“有协会内部关系催办”、“保壳服务”、“专业移除异常公示”等幌子,招摇撞骗,混淆视听,诱导和欺骗相关申请机构以获取高额中介费或服务费,赚取不法利益。(北京商报)

@中国基金业协会:协会严格按照法律法规和相关自律规则的规定,公平、公正、有序开展登记备案工作,私募基金登记备案工作不收取任何费用,并接受社会公众监督。

到现在为止,被业界称为国内视觉辨认范畴的“四大草创公司”之中,阿里巴巴现已和其间的三家产生了或多或少的联络,只剩下云从科技一家尚未被归入阿里巴巴的“势力范围”。别人秀营销,联想秀工艺和测试,对于细节和品质的把控能力,是联想的杀手锏。

“ZUK重生”联想移动铸剑的底气何在?

联想创新基因

如果静下心回顾联想产品,你会发现,在联想过去的产品生态中,不乏亮眼的产品。比如,联想最早提出双模式平板概念,并推出了Mix和Yoga变形本,还有带有投影功能的联想平板,很多产品让使用者眼前一亮,有的甚至创造新的产品门类,比如联想旗下的Moto模块化手机,就颇受发烧友好评。

联想的ZUK系列手机,也一直有着不错的口碑:从Z1的不卡顿,Z2小屏旗舰,再到Z2 PRO九大参数领先,和Edge的以小见大的全面屏,每一代ZUK新品,留给使用者的印象是,满满的情怀和黑科技背后的极客精神。

渠道和线下优势

4、公司曾被处分整改17起经自查,到本回复出具日,公司具有控股体检中心230家,均已获得医疗组织执业许可证。更值得一提的是,该公司规划年产5万辆纯电动货车的新动力基地项目自上一年8月30日签定战略协作协议到正式投产,仅用了3个月时刻。本论文研究者认为解决该问题的关键在于通信,这可以增强策略间的协调。MARL 中有一些学习通信的方法,包括 DIAL [3]、CommNet [23]、BiCNet [18] 和 master-slave [7]。然而,现有方法所采用的智能体之间共享的信息或是预定义的通信架构是有问题的。当存在大量智能体时,智能体很难从全局共享的信息中区分出有助于协同决策的有价值的信息,因此通信几乎毫无帮助甚至可能危及协同学习。此外,在实际应用中,由于接收大量信息需要大量的带宽从而引起长时间的延迟和高计算复杂度,因此所有智能体之间彼此的通信是十分昂贵的。像 master-slave [7] 这样的预定义通信架构可能有所帮助,但是它们限定特定智能体之间的通信,因而限制了潜在的合作可能性。

学界|北京大学提出注意力通信模型ATOC,助力多智能体协作

为了解决这些困难,本论文提出了一种名为 ATOC 的注意力通信模型,使智能体在大型 MARL 的部分可观测分布式环境下学习高效的通信。受视觉注意力循环模型的启发,研究者设计了一种注意力单元,它可以接收编码局部观测结果和某个智能体的行动意图,并决定该智能体是否要与其他智能体进行通信并在可观测区域内合作。如果智能体选择合作,则称其为发起者,它会为了协调策略选择协作者来组成一个通信组。通信组进行动态变化,仅在必要时保持不变。研究者利用双向 LSTM 单元作为信道来连接通信组内的所有智能体。LSTM 单元将内部状态(即编码局部观测结果和行动意图)作为输入并返回指导智能体进行协调策略的指令。与 CommNet 和 BiCNet 分别计算内部状态的算术平均值和加权平均值不同,LSTM 单元有选择地输出用于协作决策的重要信息,这使得智能体能够在动态通信环境中学习协调策略。

研究者将 ATOC 实现为端到端训练的 actor-critic 模型的扩展。在测试阶段,所有智能体共享策略网络、注意力单元和信道,因此 ATOC 在大量智能体的情况下具备很好的扩展性。研究者在三个场景中通过实验展示了 ATOC 的成功,分别对应于局部奖励、共享全局奖励和竞争性奖励下的智能体协作。与现有的方法相比,ATOC 智能体被证明能够开发出更协调复杂的策略,并具备更好的可扩展性(即在测试阶段添加更多智能体)。据研究者所知,这是注意力通信首次成功地应用于 MARL。

图 1:ATOC 架构。

图 2:实验场景图示:协作导航(左)、协作推球(中)、捕食者-猎物(右)。

如果说在云效劳方面,阿里巴巴凭仗着先发优势现已超过了腾讯一截的话,那么在人工智能、深度学习这方面,两者现在难分凹凸。




(责任编辑:马路路)

附件:

专题推荐

相关新闻


© 1996 - 2017 中国科学院 版权所有 京ICP备05002857号  京公网安备110402500047号 

网站地图    地址:北京市三里河路52号 邮编:100864