周末想在Netflix看场电影?可能,你选择观看的电影正受到来自Netflix复杂的AI算法的影响。同理,由深度学习驱动的预测技术,将越来越便捷地决定你喜欢吃什么、穿什么。
而作为消费型科技公司,Netflix、Yelp、Yahoo、StitchFix这4家公司正在利用AI技术改变用户体验。
Netflix:动态个性化布局与视频缩略图
从观看传统上来讲,看电视是一个单向的通信方式——观众观看到的内容是制作者单向传递的,但观众不向内容制作者提供反馈。借助数字流媒体技术,观众的观看记录、鼠标(手指)点击,以及检索词,都可以让Netflix了解观众的偏好设置,并提供更多相关的内容。
2009年,Netflix在公开赛中为外部的编程团队授予了100万美元的Netflix奖,以改进公司的内部评级预测系统。该获胜队伍打败了原有的算法,效果提高超过10%。
从那时起,Netflix引入了更多先进的机器学习算法,让Netflix在排名、布局、目录、会员等各个方面,实现全新的预测,并提高个性化水平。今年年初,Netflix公司董事、哥伦比亚计算机科学系教授Tony Jebara在旧金山的RE?WORK深度学习峰会(RE?WORK Deep Learning Summit in San Francisco)上曾解释说,Netflix不仅可以给用户推荐更好的电影,而且为每个用户预测出更好的缩略图图像。
一般来说,优化网站上的图像需要在一段时间内测试A / B两种替代方案。这种方法的问题是,用户必须痛苦地等待系统收集数据,之后才能完成最佳决策。在此期间,网站的部分受众群体会经历测试过程的非最优变量。这种体验的丧失被称为“regret”。
图片作者:Tony Jebara
为了最大限度地减少regret,Netflix采用动态自适应测试法,比如多臂老虎机(multi-arm bandit)模型。这种模型能够在测试期间,动态地将流量转移为展示最好的广告素材,并在数学上减少regret。
什么算是“更好”呢?每个人不尽相同,所以Netflix也将用户的消费情况纳入,以执行个性化的探索/开发优化。如果你经常看喜剧,Netflix将使用罗宾·威廉姆斯的电影《心灵捕手》的封面。如果用户喜欢浪漫的言情片,Netflix则会把电影中马特·达蒙和明妮·德瑞弗接吻的照片推送给用户。
Yelp使所有地点展示最美丽的照片
一张图片胜过千言万语。为了帮助用户做出正确的餐厅选择,Yelp的Alex Miller和他的团队采用深度学习算法,用来展示最美的用户照片。
虽然指标(比如喜欢次数和点击次数)可用于评估照片,但它们也可能因偶然事件出错。更好的解决方案是,基于固有的内容和特征(例如景深,对比度和对准)来判断照片,但是每天有2500万MAU(每月活跃用户)给Yelp上传成千上万张照片,没有人能干得了这些工作。
2017年1月27日,在旧金山举行的Startup ML会议上,Miller介绍了他的工程团队如何使用CNN(卷积神经网络)建立一个图像评分模型。对于照片是不是好的标准可以是,这张照片是不是用单反拍的,这只需要检测EXIF元数据就行了。
Miller的团队利用它创建出可扩展的训练数据集,使用单反图像作为正例,而非单反图像作为负例。深度学习算法从训练数据集中学习了好的照片的质量,并且可以将这些学习应用于所有照片,无论是否是使用单反相机拍摄的。
除了照片质量得分,团队还添加了过滤器和多元化逻辑,这样,当你查看以某一菜或特色闻名的餐馆时,前10张照片不会都是同一主题。
事实胜于雄辩,我们来看看图片查看结果:
上图是旧版本,下图是最新版本
雅虎确保用户在任何情况 可以选择最好的表情符号
对于不爱打字的人来说,emoji是最简单的方法。但是,emoji目前有超过1800种表情符号可供选择,那么,用户怎么能确定选择最完美的那个呢?
雅虎的机器学习工程师Stacey Svetlichnaya就在解决这些问题。当用户撰写或回复消息时,自动填充建议中应显示哪些表情呢?理想情况下,用户希望可以给出前五个表情符号来选择。
使用表情符号是高度动态的。一些用于替换图像,还有的用于表达情感……
另一个挑战是emoji在不同平台的视觉风格迥然不同,容易造成误解。
不同平台的不同emoji表情
Svetlichnaya和雅虎视觉与机器学习团队(Yahoo Vision & Machine Learning Team)测试了三种不同的方法:
FastText算法,一种快速线性分类器;
LSTM算法,一种循环神经网络架构;
WordCNN算法,一种平衡性能与复杂性的卷积网络。
当然,三者之中,FastText不出意外地成为了速度的胜利者,但人们似乎更喜欢LSTM的结果。
雅虎不是唯一将机器学习应用于emoji的公司。2015年,InstagramEngineering刊发了一套由工程师Thomas Dimson撰写的系列——Emojineering:机器学习表情符号趋势。
StitchFix更快地找到最适合你的时尚
时尚是件很难的事,但StitchFix使造型这件事变得很轻松。这家个性化造型创业公司使用户可以个性化风格,并且每月将精选的服装和配件送上家门。
定义风格可能是模糊的。毕竟,用户怎么能知道一件衬衫是否复古,或者一件衣服是否“性感”但又不显得“太放荡”。
Moody是StitchFix的数据科学家,拥有统计学、天体物理学和计算机学的多学科学术背景。事实证明,“书呆子”的学术技能在时尚界是大有可为的。
许多深度学习模型是“黑匣子”,用户很难理解为什么算法得出特定的结论。Moody的研究集中于提高模型可解释性,使人类专家能够对算法的相对性能提供反馈。
一种方法是使用t-SNE(t分布的随机相邻嵌入),一种有助于降低可视化相似对象的维数的方法。许多深度学习模型使用人类不可能概念化的高维数据,维数减少方法将复杂的数据变成更易于理解的二维或三维散点图。
Moody也是k-SVD方法的狂热者。 k-SVD是k均值聚类方法的泛化。在高级非技术术语中,聚类分析指将具有类似属性的对象分组在一起。一旦已经识别出不同的集群,人类专家可以检查组合,以查看它们是否表现出任何统一的特征,并添加适当的标签,例如“背心”。
图片作者:Christopher Moody
Via 机器人圈