English
邮箱
联系我们
网站地图
邮箱
旧版回顾



环亚快乐彩:再次举报安徽省临泉县牛勇侵吞亿

文章来源:环亚快乐彩    发布时间:2018年07月19日 19:32  【字号:      】

环亚快乐彩
南国都市报2月10日讯(记者 文盛)作为海南农垦改革后的第一个商业项目,海垦广场于2月10日举办试营业庆典,这标志着海口又一全新城市商圈已然兴起,将提升片区商业繁华和城市活力。

在海垦广场,星美国际影城、客润佳超市、彩虹盒子儿童剧场、实弹射击俱乐部、大型健身会馆等六大主力店领航,涵盖零售旗舰、主题餐厅、儿童乐园、休闲娱乐、体验式街区等多重主题业态主导的创业组合,能一站式满足吃货玩咖的需求。

此次试营业期间,海垦广场餐饮全场5折起,长桌盛宴上百个菜品免费吃;计价类黄金最高每克减50元;客润佳超市购物满额30000个红包不停送,同时,2000份脐橙、传统工艺糖画免费送,钢琴演奏会、油画拍卖也会将在此陆续上演。

南国都市报3月20日讯(记者 孙学新)20日下午,2018年三亚国际芒果产业大会传来好消息,三亚芒果协会加入中国果品流通协会龙头企业联盟(简称中果协龙头企业联盟)的申请获得通过。经过半年考察期后,三亚芒果协会将正式成为中果协龙头企业联盟一员,这也标志着三亚芒果产业发展将进入到新的历史阶段。

中果协龙头企业联盟是国内知名的果业销售平台之一,汇集了国内众多果业龙头企业。三亚芒果协会会长彭时顿透露,加入中果协龙头企业联盟,需要企业年产值销售额达到10亿元以上。

三亚芒果是三亚农产品供给中当仁不让的“龙头老大”。彭时顿表示,海南省委、省政府,三亚市委、市政府高度重视芒果产业发展,并出台了一系列政策予以支持。下一步,三亚芒果协会将团结会员单位与种植大户,推广种植基地标准化,打造芒果标准化生产示范园,探索芒果标准化种植,规范芒果种植、采摘与包装,使用“三亚芒果”区域公用品牌,借助中果协龙头企业联盟强大的销售渠道,将三亚芒果销往国内与海外的水果市场,推动三亚芒果向生态化、品牌化、标准化、国际化的目标迈进。

报名时间:即日起至3月18日

校总部咨询电话:65699668、66115373、13907615002(陈老师)

地方学院咨询电话:文昌学院63299166,琼海学院62819613,三亚学院88214928

孩子上学后 爸妈就开始坐立不安

她每周2天在手机上看女儿

去年,海口市民张女士的女儿进入国兴大道一家幼儿园,自此,张女士每周三、周五多了一项“任务”——监控女儿在幼儿园的情况。“幼儿园每周有2天开放监控视频,家长登录手机APP就可以看到孩子在幼儿园的情况,包括户外运动、室内上课的情况,都能看得一清二楚。”张女士说,每个月交几十块钱,花钱买到安心,感觉很值。

当然,在2013年立下赌约的时候,董明珠可以说是稳操胜券。因为在当时小米全年的营收只有265亿元,而格力则是1200亿,二者之间相差近四倍。但风水轮流转,小米经过近五年的发展,已经成为营收达到1146亿元的超级企业,同时已经提交IPO申请,将会在6月正式上市;而格力全年营收虽然还是比小米多300亿元,但二者的差距已经非常小。

为赢十亿赌局格力出奇招:强制要求代理商买格力手机?

也就是说,现在的格力已经不敢说能够稳赢小米了。按照小米近年来高速发展的势头,到年尾小米小超格力还是很有可能的。

此时,有网友爆料称,格力强制要求服务网点必须购买格力手机,而且限制其他手机登陆格力的派工系统。也就是说,如果你不买格力手机,你就无法正常开展工作。

我们建议重新审视知识蒸馏,但侧重点不同以往。我们的目的不再是压缩模型,而是将知识从教师模型迁移给具有相同能力的学生模型。在这样做的过程中,我们惊奇地发现,学生模型成了大师,明显超过教师模型。联想到明斯基的自我教学序列(Minsky』s Sequence of Teaching Selves)(明斯基,1991),我们开发了一个简单的再训练过程:在教师模型收敛之后,我们对一个新学生模型进行初始化,并且设定正确预测标签和匹配教师模型输出分布这个双重目标,进而对其进行训练。

ICML 2018|再生神经网络:利用知识蒸馏收敛到更优的模型

通过这种方式,预先训练的教师模型可以偏离从环境中求得的梯度,并有可能引导学生模型走向一个更好的局部极小值。我们称这些学生模型为「再生网络」(BAN),并表明当应用于 DenseNet、ResNet 和基于 LSTM 的序列模型时,再生网络的验证误差始终低于其教师模型。对于 DenseNet,我们的研究表明,尽管收益递减,这个过程仍可应用于多个步骤中。

我们观察到,由知识蒸馏引起的梯度可以分解为两项:含有错误输出信息的暗知识(DK)项和标注真值项,后者对应使用真实标签获得原始梯度的简单尺度缩放。我们将第二个术语解释为基于教师模型对重要样本的最大置信度,使用每个样本的重要性权重和对应的真实标签进行训练。这说明了 KD 如何在没有暗知识的情况下改进学生模型。

此外,我们还探讨了 Densenet 教师模型提出的目标函数能否用于改进 ResNet 这种更简单的架构,使其更接近最优准确度。我们构建了复杂性与教师模型相当的 Wide-ResNet(Zagoruyko & Komodakis,2016b)和 Bottleneck-ResNet(He 等,2016 b)两个学生模型,并证明了这些 BAN-ResNet 性能超过了其 DenseNet 教师模型。类似地,我们从 Wide-ResNet 教师模型中训练 DenseNet 学生模型,前者大大优于标准的 ResNet。因此,我们证明了较弱的教师模型仍然可以提升学生模型的性能,KD 无需与强大的教师模型一起使用。

图 1:BAN 训练过程的图形表示:第一步,从标签 Y 训练教师模型 T。然后,在每个连续的步骤中,从不同的随机种子初始化有相同架构的新模型,并且在前一学生模型的监督下训练这些模型。在该过程结束时,通过多代学生模型的集成可获得额外的性能提升。

南国都市报热线966123讯(记者 王康景)“合同中写的是2013年10月交房,并且交了40%首付,结果现在才交房并且要求签订新合同再交20%款额,且有不少不合理条款。”20日,市民刘先生向记者反映,他们一群购房者对开发商这种“不守承诺、擅自变更条款”的做法十分不认可,要求相关部门核查处理。当天,市住建、规划和消防等部门现场组织开发商和购房者开协调会,“摆问题讲道理”,协调双方房屋买卖矛盾。

开发商擅自变更合同

20日上午,包括市民刘先生等在内的约40位购房者来到海口城东市场附近幸福家园项目的售楼处,指责开发商没有信守承诺及时交房,如今又擅自变更合同内容要求购房者重新签订,导致一个项目楼盘售卖出现多个版本“合同”的乱象。

本论文研究者认为解决该问题的关键在于通信,这可以增强策略间的协调。MARL 中有一些学习通信的方法,包括 DIAL [3]、CommNet [23]、BiCNet [18] 和 master-slave [7]。然而,现有方法所采用的智能体之间共享的信息或是预定义的通信架构是有问题的。当存在大量智能体时,智能体很难从全局共享的信息中区分出有助于协同决策的有价值的信息,因此通信几乎毫无帮助甚至可能危及协同学习。此外,在实际应用中,由于接收大量信息需要大量的带宽从而引起长时间的延迟和高计算复杂度,因此所有智能体之间彼此的通信是十分昂贵的。像 master-slave [7] 这样的预定义通信架构可能有所帮助,但是它们限定特定智能体之间的通信,因而限制了潜在的合作可能性。

学界|北京大学提出注意力通信模型ATOC,助力多智能体协作

为了解决这些困难,本论文提出了一种名为 ATOC 的注意力通信模型,使智能体在大型 MARL 的部分可观测分布式环境下学习高效的通信。受视觉注意力循环模型的启发,研究者设计了一种注意力单元,它可以接收编码局部观测结果和某个智能体的行动意图,并决定该智能体是否要与其他智能体进行通信并在可观测区域内合作。如果智能体选择合作,则称其为发起者,它会为了协调策略选择协作者来组成一个通信组。通信组进行动态变化,仅在必要时保持不变。研究者利用双向 LSTM 单元作为信道来连接通信组内的所有智能体。LSTM 单元将内部状态(即编码局部观测结果和行动意图)作为输入并返回指导智能体进行协调策略的指令。与 CommNet 和 BiCNet 分别计算内部状态的算术平均值和加权平均值不同,LSTM 单元有选择地输出用于协作决策的重要信息,这使得智能体能够在动态通信环境中学习协调策略。

研究者将 ATOC 实现为端到端训练的 actor-critic 模型的扩展。在测试阶段,所有智能体共享策略网络、注意力单元和信道,因此 ATOC 在大量智能体的情况下具备很好的扩展性。研究者在三个场景中通过实验展示了 ATOC 的成功,分别对应于局部奖励、共享全局奖励和竞争性奖励下的智能体协作。与现有的方法相比,ATOC 智能体被证明能够开发出更协调复杂的策略,并具备更好的可扩展性(即在测试阶段添加更多智能体)。据研究者所知,这是注意力通信首次成功地应用于 MARL。

图 1:ATOC 架构。

图 2:实验场景图示:协作导航(左)、协作推球(中)、捕食者-猎物(右)。




(责任编辑:麹瞻)

附件:

专题推荐

相关新闻


© 1996 - 2017 中国科学院 版权所有 京ICP备05002857号  京公网安备110402500047号 

网站地图    地址:北京市三里河路52号 邮编:100864