IT博客汇 | 「机器说」- 机器人领域一周关键词 (170531)

「机器说」- 机器人领域一周关键词 (170531)

Yunfei发表于 2017-05-31 01:36:48

版权信息：
● 本博客使用CC 3.0协议，转载请保留该信息。
● 原文作者: 戴晓天 @ 云飞机器人实验室
● 原文地址: 「机器说」- 机器人领域一周关键词 (170531)

# Alpha GO 2.0

上周最大的看点就是Alpha GO与柯杰的巅峰对战了。在经过一年的迭代之后，Alpha Go 2.0终于登上神坛，最终以三局全胜拿下了比赛。根据之前几个月Alpha GO在平台上对决的不败表现来看，柯杰本来就胜望不大，这次比赛的结果也就在预料之中了。然而这次Alpha GO的胜利却有标志性的意义：那就是人工智能已经可以挑战人类认为的“高级”活动了。随着这场胜利到来的是新的一波“人工智能威胁论”：如果机器不仅可以完成普通的体力劳动，还可以完成脑力甚至是创造力的活动，那么很多工作都会被机器人取代。每一次生产工具的革新都将带来社会分工的变革：从工业革命的历史中看，具有人工智慧的机器人势必会蚕食大量原本属于工人的工作；然而社会的进步就是以这种牺牲为代价的，通过工具改良提高的社会总体产值，会反过来影响这些因为新技术失业的人，迫使他们转向新的行业。我们不能还和18世纪一样，因为工具威胁到了自己的工作，就加入了反对的阵营。我们不能忽略这种革新是良性的。当然，想要机器与人和谐相处，我们需要对它们有足够多的认知和控制。但正如凯文凯利说的一样：我们为了达成目标所赋予机器的自由，最终会让我们失去对它们的控制，这是必然的、也是需要我们接受的。

# DJI Spark

“晓” (DJI Spark) 是大疆继Phantom和Mavic之后的新一代无人机。本次大疆瞄准了小型、自拍无人机市场，独特的人脸识别开机起飞与手势识别操控，彻底让Spark摆脱遥控器控制。“晓”的最终售价应该是在3000元左右，是Mavic的一半。当时Mavic出来的时候就心动的想买一个，这次Spark的定价总算是在一般用户的承受范围之内了。然而我还是对这款无人机的定位表示怀疑：

体积上的缩小势必降低了整体性能（最高航速、续航时间、成像清晰度4K降到了1080P，抗风性也会下降）；
和Mavic相比，Spark的价格虽然亲民，但是功能上越来越接近“玩具”级别。普通人可能不愿意花这个价格买一个不上不下的产品，可能更愿意买各方面都比较成熟的Mavic，尤其是便携性上Spark也没有太大优势。加上现在越发收紧的无人机管制，可能真正的用户需求量不会很大。

无论如何，这是大疆从专业级向业余级过渡的产品，也让大疆产品线的层次越发分明。

(信息来源 – 机器人Robotics China)

# FCIS

FCIS (Fully Convolutional Instance-aware Semantic Segmentation) 是在COCO-16上获奖的图像分割算法，该算法可以识别、标记图像中的物体种类，从而进行精细的图像分割：

该项目最近在Github上开源了，项目地址在：https://github.com/msracver/FCIS. 我并不太了解图像分割技术，所以没有去了解具体的技术细节，有需要的读者请自行解读。

# Deep Voice 2.0

百度研究院近日发布了一款基于神经网络构建的文本-语音转化 (Text-to-Speech) 系统Deep Voice 2.0，这是今年二月份发布的Deep Voice的第二版。但当时的系统只能转化20小时语音，而且只有一种声音。不到三个月的时间，这个系统得到大幅升级，能够生成数百个小时的语音，拥有数百种声音。我去Baidu Research的相关网页体验了一下，生成的合成语音真假难辨：http://research.baidu.com/deep-voice-2-multi-speaker-neural-text-speech/. 这项技术配合已经比较成熟的Voice Recognition，就可以完成语音信息的输入-输出闭环了。然而相比主流的语音生成模型技术，通过神经网络生成似乎缺乏灵活性，这个技术百度要如何完善和应用也还不明朗。

(信息来源 – 新智元)

「机器说」by 云飞机器人实验室：关注机器人技术的最新发展，三分钟为你解读每周机器人领域的核心关键词。每周一篇，在我的微博、知乎专栏和云飞机器人实验室网站同步更新。