English
邮箱
联系我们
网站地图
邮箱
旧版回顾



凯发真人娱乐网址:妹子“复活”画中的蒙娜丽莎

文章来源:凯发真人娱乐网址    发布时间:2018年07月17日 12:14  【字号:      】

凯发真人娱乐网址
南国都市报热线966123讯(记者 王洪旭)5月21日下午19时,从海口市美兰机场开往白沙门的21路公交车上,一名10岁的小学生上车后迷了路。该车司机和乘务人员将其带回调度室安顿好后,通过学校联系家长来认领。

当时,该小学生在海口美舍河路段上车,根据校服判断是海口琼山一小学生。“他就跟着别人上车,也不跟其他小孩子讲话,上车后就睡着了,一直坐车返回到场站。”21路公交车乘务人员李艳说,当时小孩就引起了她的注意,可能是迷路了。李艳询问孩子家庭住址等相关信息,可是男孩未作答。随后,21路公交车线长吴雄见此情景,随即通过114号码百事通平台查询到了琼山一小的联系电话,联系到了男孩母亲朱女士,21日晚23时许,朱女士赶到调度站见到自己的孩子时喜极而泣。

有的小哥吐槽快递效率降低 有的网购族吐槽快递电话没完没了 快件直放柜和联系你送上门 你站哪边?

南国都市报3月25日讯(记者何慧蓉)值夜班时睡着的网吧收银员王某醒来后发现前台少了200余元,查看监控后他到附近网吧寻找“小偷”。结果,在误认之下,他持钢管在另一网吧将无辜的魏某打得重伤,后不治身亡。省一中院以故意伤害罪判处王某无期徒刑,剥夺政治权利终身。

王某40来岁,在海口一乡镇的网吧做收银员。2016年11月14日,王某在网吧值夜班。犯困的王某在值班时睡着了,前来交接班的另一名收银员将他叫醒。早上8时10分,经过与同事核对,王某发现前台抽屉内少了现金人民币200余元,便调取网吧监控视频查看,其发现钱被一名男子偷走。

按照网吧的规矩,如果没找到小偷,王某将负责赔偿被偷的钱。王某在看了监控之后,决定到附近网吧查看寻找该偷钱男子。2016年11月14日8点55分,王某找到一根钢管。2016年11月14日10点8分,王某来到另一家网吧,其误认为正在上网的被害人魏某是偷钱男子,便一声不吭双手持钢管从上往下击打被害人魏某头部等部位。之后在被害人魏某表明其认错人后,其仍然连续击打被害人魏某,直至被害人魏某不能动弹。案发后,经查看监控录像,王某共双手持钢管从上往下用力连续击打被害人魏某头部等部位约25下。

关于油价,普京终于说话了!60美元完全适合俄罗斯,不希望太高!

沙特、俄罗斯同时宣布,国际油价大跌!为何国内油价却又上调?

每天增产100万,执行率降至100%!欧佩克突传消息,油价大跳水!

以前9点就能送完货 现在送到中午才算完

上午11点,负责海口秀英区美华路片区的某快递公司送件小哥小陈拖着沉重的步伐,将电动车停在一小区门口,随后他掏出手机,按照快件上的收件人电话挨个打了过去。

“您好,您有个快递,请问在家吗?”“您好,不在家的话,快递能放自提柜吗?”……6通电话打完后,小陈快速地将2个包裹放入了自提柜,随后挨个将快递送上楼。

图片来源:IGP官网

奶粉行业现“三国杀”?一家中国奶粉商向荷兰工厂索赔近900万

小食代了解到,由于“史上最严的奶粉新政”的全面实施,Arla目前已没有和该企业合作。不过,上述IGP公司有关负责人告诉小食代,虽然Arla目前没有名额可以给到IGP,“我们会重新找新工厂合作的”。

“我们还在等通过奶粉配方注册。一边消化库存,一边找工厂,两件事情是同步进行的。”上述人士表示。但他以“属于商业机密”为由,拒绝透露方牧健儿目前是否找到了新的代工厂。

本论文研究者认为解决该问题的关键在于通信,这可以增强策略间的协调。MARL 中有一些学习通信的方法,包括 DIAL [3]、CommNet [23]、BiCNet [18] 和 master-slave [7]。然而,现有方法所采用的智能体之间共享的信息或是预定义的通信架构是有问题的。当存在大量智能体时,智能体很难从全局共享的信息中区分出有助于协同决策的有价值的信息,因此通信几乎毫无帮助甚至可能危及协同学习。此外,在实际应用中,由于接收大量信息需要大量的带宽从而引起长时间的延迟和高计算复杂度,因此所有智能体之间彼此的通信是十分昂贵的。像 master-slave [7] 这样的预定义通信架构可能有所帮助,但是它们限定特定智能体之间的通信,因而限制了潜在的合作可能性。

学界|北京大学提出注意力通信模型ATOC,助力多智能体协作

为了解决这些困难,本论文提出了一种名为 ATOC 的注意力通信模型,使智能体在大型 MARL 的部分可观测分布式环境下学习高效的通信。受视觉注意力循环模型的启发,研究者设计了一种注意力单元,它可以接收编码局部观测结果和某个智能体的行动意图,并决定该智能体是否要与其他智能体进行通信并在可观测区域内合作。如果智能体选择合作,则称其为发起者,它会为了协调策略选择协作者来组成一个通信组。通信组进行动态变化,仅在必要时保持不变。研究者利用双向 LSTM 单元作为信道来连接通信组内的所有智能体。LSTM 单元将内部状态(即编码局部观测结果和行动意图)作为输入并返回指导智能体进行协调策略的指令。与 CommNet 和 BiCNet 分别计算内部状态的算术平均值和加权平均值不同,LSTM 单元有选择地输出用于协作决策的重要信息,这使得智能体能够在动态通信环境中学习协调策略。

研究者将 ATOC 实现为端到端训练的 actor-critic 模型的扩展。在测试阶段,所有智能体共享策略网络、注意力单元和信道,因此 ATOC 在大量智能体的情况下具备很好的扩展性。研究者在三个场景中通过实验展示了 ATOC 的成功,分别对应于局部奖励、共享全局奖励和竞争性奖励下的智能体协作。与现有的方法相比,ATOC 智能体被证明能够开发出更协调复杂的策略,并具备更好的可扩展性(即在测试阶段添加更多智能体)。据研究者所知,这是注意力通信首次成功地应用于 MARL。

图 1:ATOC 架构。

图 2:实验场景图示:协作导航(左)、协作推球(中)、捕食者-猎物(右)。

●湾岭白鹭湖度假区

●黎母山国家森林公园

●和平镇万泉河(乘坡河)石臼群

薪酬待遇

以上招聘岗位3000元/月起薪

入职即缴五险一金




(责任编辑:明神宗)

附件:

专题推荐

相关新闻


© 1996 - 2017 中国科学院 版权所有 京ICP备05002857号  京公网安备110402500047号 

网站地图    地址:北京市三里河路52号 邮编:100864