我爱机器学习(52ml.net)
发表于
2016-11-09 23:07:01

斯坦福CS231n—深度学习与计算机视觉(资料汇总)

官网链接：CS231n: Convolutional Neural Networks for Visual Recognition中文字幕视频 by 大数据文摘链接：http://study.163.com/course/courseMain.htm?courseId=1003223001课件中文翻译 by 杜克链接：https://www.52ml.net/tags/cs231课件英文视频及字幕等 by 爱可可-爱生活链接：https://pan.baidu.com/s/1pKsTivp#list ...继续阅读 (4)

我爱机器学习(52ml.net)
发表于
2016-11-09 23:07:01

斯坦福CS231n—深度学习与计算机视觉(资料汇总)

我爱机器学习(52ml.net)
发表于
2016-11-09 00:00:00

arXiv Paper Daily: Wed, 9 Nov 2016

Neural and Evolutionary ComputingAdversarial Ladder NetworksJuan Maroñas Molano,Alberto Albiol Colomer,Roberto Paredes PalaciosSubjects:Neural and Evolutionary Computing (cs.NE); Learning (cs.LG); Machine Learning (stat.ML)The use of unsupervised data in addition to supervised data in trainingdiscriminative neural networks has improved the performance of this clas-sification scheme. However, the best results were achieved with a trainingprocess that is divided in two parts: first an unsupervised pre-training stepis done for initializing the weights of the network and after these weights a ...继续阅读 (4)

我爱机器学习(52ml.net)
发表于
2016-11-09 00:00:00

arXiv Paper Daily: Wed, 9 Nov 2016

我爱机器学习(52ml.net)
发表于
2016-11-08 23:25:39

中国人工智能学会通讯

来源：云展网中国人工智能学会通讯电子书，“科技前沿”和“观点交锋”专栏干货满满。中国人工智能学会通讯第10期中国人工智能学会通讯第9期中国人工智能学会通讯第8期中国人工智能学会通讯第7期中国人工智能学会通讯弟6期中国人工智能学会通讯2016年第5期中国人工智能学会通讯2016年第4期中国人工智能学会通讯2016年第3期中国人工智能学会通讯2016年第2期中国人工智能学会通讯2016年第1期 ...继续阅读 (2)

我爱机器学习(52ml.net)
发表于
2016-11-08 23:25:39

中国人工智能学会通讯

我爱机器学习(52ml.net)
发表于
2016-11-08 14:32:57

Machine Learning: An In-Depth, Non-Technical Guide

关于机器学习的深度非技术介绍文章。ByAlex Castrounis•Jan – Mar, 2016ChaptersOverview, goals, learning types, and algorithmsData selection, preparation, and modelingModel evaluation, validation, complexity, and improvementModel performance and error analysisUnsupervised learning, related fields, and machine learning in practice ...继续阅读 (4)

我爱机器学习(52ml.net)
发表于
2016-11-08 14:32:57

Machine Learning: An In-Depth, Non-Technical Guide

新智元
发表于
2016-11-08 14:13:36

【彭博研究巨献】2016 机器学习生态全景图 3.0：机器智能改变世界

来源：新智元(微信号AI_era)来源：oreilly.com作者：Shivon Zilis、James Cham 等译者：刘小芹、胡祥杰、闻菲原文链接：【彭博研究巨献】2016 机器学习生态全景图 3.0：机器智能改变世界本文为新智元授权转载，严禁二次转载。【新智元导读】Bloomberg Beta 团队回顾总结全球机器学习 2016 一年发展，总结技术、应用、产业等各方面并展望未来。核心请看他们绘制的《机器学习生态全景图 3.0》。Bloomberg Beta 团队回顾总结全球机器学习 2016 一年发展，总结技术、应用、产业等各方面并展望未来。核心请看他们绘制的《机器学习生态全景图 3.0》。（文／Bloomberg Beta 团队）大约一年前，我们发表了一份《年度机器智能公司生态全景图》（The current state of machine intelligence 2.0），从那时起我们有幸见证了这个领域的很多活动。今年的 3.0 版生态全景图，比两年前的第一版增加了三分之一的公司，而且更加详细、尽量全面，但它也只触及了这个领域无限活力的表面。与过去几年的情况一样，投资人仍对“问题为先”的机器智能情有独钟——我们投资了 35 家机器智能公司，它们专注于解决的问题从安全、招聘到软件开发各种各样。（我们的资金关注未来的工作形式，所以某些机器智能领域得到的投资比别的多。）与 ...继续阅读 (5)

我爱机器学习(52ml.net)
发表于
2016-11-08 00:00:00

arXiv Paper Daily: Tue, 8 Nov 2016

Neural and Evolutionary ComputingNeural Networks Designing Neural Networks: Multi-Objective Hyper-Parameter OptimizationSean C. Smithson,Guang Yang,Warren J. Gross,Brett H. MeyerComments: To appear in ICCAD’16. The authoritative version will appear in the ACM Digital LibrarySubjects:Neural and Evolutionary Computing (cs.NE); Learning (cs.LG)Artificial neural networks have gone through a recent rise in popularity,achieving state-of-the-art results in various fields, including imageclassification, speech recognition, and automated control. Both the performanceand computational complexity ...继续阅读 (2)

我爱机器学习(52ml.net)
发表于
2016-11-07 23:23:44

[导读]The current state of machine intelligence 3.0

The current state of machine intelligence 3.0原文链接：https://www.oreilly.com/ideas/the-current-state-of-machine-intelligence-3-0The current state of machine intelligence 2.0原文链接：https://www.oreilly.com/ideas/the-current-state-of-machine-intelligence-2-0The Current State of Machine Intelligence原文链接：https://medium.com/@shivon/the-current-state-of-machine-intelligence-f76c20db2fe1 ...继续阅读 (5)

我爱机器学习(52ml.net)
发表于
2016-11-07 23:05:40

ICLR 2017资料汇总

ICLR 2017 全部论文－官网链接：http://openreview.net/group?id=ICLR.cc/2017/conferenceICLR 2017 有什么值得关注的亮点？－知乎链接：https://www.zhihu.com/question/52311422ICLR总结－田渊栋链接：https://zhuanlan.zhihu.com/p/23454387Hunting through the ICLR 2017 submissions － DeepMind Stephen Merity链接：http://smerity.com/articles/2016/iclr_2017_submissions.htmlICLR 2017 | GAN Missing Modes 和 GAN －程序媛的日记链接：ICLR 2017 | GAN Missing Modes 和 GAN谷歌ICLR 2017论文提出超大规模的神经网络：稀疏门控专家混合层－机器之心链接：http://www.jiqizhixin.com/article/1777 ...继续阅读 (5)

我爱机器学习(52ml.net)
发表于
2016-11-07 00:00:00

arXiv Paper Daily: Mon, 7 Nov 2016

Neural and Evolutionary ComputingSparsely-Connected Neural Networks: Towards Efficient VLSI Implementation of Deep Neural NetworksArash Ardakani,Carlo Condo,Warren J. GrossComments: 13 pages, 3 figuresSubjects:Neural and Evolutionary Computing (cs.NE); Learning (cs.LG)Recently deep neural networks have received considerable attention due totheir ability to extract and represent high-level abstractions in data sets.Deep neural networks such as fully-connected and convolutional neural networkshave shown excellent performance on a wide range of recognition andclassification tasks. However, their ...继续阅读 (3)

我爱机器学习(52ml.net)
发表于
2016-11-06 15:32:35

[书籍]零基础入门深度学习

作者：hanbingtao来源：https://www.zybuluo.com注：非常赞的深度学习入门书籍，思路代码清晰。持续更新中。零基础入门深度学习(1) – 感知器零基础入门深度学习(2) – 线性单元和梯度下降零基础入门深度学习(3) – 神经网络和反向传播算法零基础入门深度学习(4) – 卷积神经网络零基础入门深度学习(5) – 循环神经网络 ...继续阅读 (28)

我爱机器学习(52ml.net)
发表于
2016-11-06 15:32:35

[书籍]零基础入门深度学习

我爱机器学习(52ml.net)
发表于
2016-11-06 15:27:16

[书籍及代码]强化学习第二版(Reinforcement Learning: An Introduction)

Reinforcement Learning: An IntroductionRichard S. SuttonandAndrew G. BartoSecond Edition, in progressMIT Press, Cambridge, MA, 2017书籍下载链接：http://webdocs.cs.ualberta.ca/~sutton/book/bookdraft2016sep.pdf代码作者：ShangtongZhang链接：https://github.com/ShangtongZhang/reinforcement-learning-an-introduction ...继续阅读 (31)

我爱机器学习(52ml.net)
发表于
2016-11-06 15:27:16

[书籍及代码]强化学习第二版(Reinforcement Learning: An Introduction)

我爱机器学习(52ml.net)
发表于
2016-11-06 04:56:22

使用multi-label训练CNN能否达到detection的效果？

作者：我爱机器学习(52ml.net)链接：https://www.zhihu.com/question/52143412/answer/130037578问题在只需要时候输出image含有object的label而不需要定位的情况下，使用multi-label训练一个分类网络（例如 resnet）能否达到object detection的效果。跟Faster R-CNN系列的方法比起来，结果相差会很大吗？byJulius问题分析只需判断是否含有目标而不需要定位时候Multi-Label是非常合适的，当然用Faster R-CNN之类也是可以的，只是有点杀鸡用牛刀，因为其中最重要也最复杂的定位你根本就用不着。当然就算真的用Multi-Label，R-CNN和SSD/YOLO之类的思想是非常值得借鉴的。从定义上来说，分类（Classification）、定位（Localization）和检测（Detection）的区别如下：分类：是什么？定位：在哪里？是什么？（单个目标）检测：在哪里？分别是什么？（多个目标）其中检测＝分类＋定位，下图是对应的例子：(1)目标分类(2)目标定位(3)目标检测那么题主只需判断是否含有目标而不需要定位的问题是属于分类范畴的，只是因为是多个目标，并不是普通的二分类问题，这个问题的一种直接解决方案正是Multi-Label。Multi-Class v.s. M ...继续阅读 (3)

我爱机器学习(52ml.net)
发表于
2016-11-06 04:56:22

使用multi-label训练CNN能否达到detection的效果？

我爱机器学习(52ml.net)
发表于
2016-11-05 05:14:01

词嵌入系列博客Part3：word2vec 的秘密配方

来源：机器之心选自SebastianRuder Blog作者：Sebastian Ruder英文原文：On word embeddings – Part 3: The secret ingredients of word2vec原文：技术 | 词嵌入系列博客Part3：word2vec 的秘密配方参与：Terrence L本文经机器之心（微信公众号：almosthuman2014）授权转载，禁止二次转载请原谅之前的噱头。这是一篇我很久之前就想要去写的博客。在这篇文章中，我想要强调那些使得 word2vec 成功的秘密成分。我特别要专注于通过神经模型训练的词嵌入与通过传统的分布式语义模型（DSMs）产生的词嵌入之间的联系。通过展示这些组分是如何被转移到 DSMs 中的，我将会证明分布式的方法是丝毫不逊色于流行的词嵌入方法的。虽然没有什么新的见解，但我感觉传统的方法经常被深度学习的热潮所掩盖，它们之间的相关性应该受到更多关注。因此，这篇博客所依据的文献是 Levy 等人在 2015 年发表的通过词嵌入获得的提升分布式相似性的研究。如果你还没有阅读过，我建议你抓紧搜索。在这篇公开的博客中，我将首先介绍一个流行的词嵌入模型 GloVe，然后我将突出词嵌入模型和分布式予语义方法之间的联系。紧接着，我将会介绍用来衡量不同因素影响的四款模型。之后我会给出除了算法选择之外其他学习词表示 ...继续阅读 (24)

我爱机器学习(52ml.net)
发表于
2016-11-05 05:14:01

词嵌入系列博客Part3：word2vec 的秘密配方

我爱机器学习(52ml.net)
发表于
2016-11-05 04:13:07

词嵌入系列博客Part2：比较语言建模中近似softmax的几种方法

来源：机器之心选自SebastianRuder Blog作者：Sebastian Ruder英文原文：On word embeddings – Part 2: Approximating the Softmax原文：技术 | 词嵌入系列博客Part2：比较语言建模中近似softmax的几种方法参与：冯滢静本文经机器之心（微信公众号：almosthuman2014）授权转载，禁止二次转载本文是词嵌入系列博客的 Part2，全面介绍了词嵌入模型， Part1请点击技术 | 词嵌入系列博客Part1：基于语言建模的词嵌入模型基于Softmax的方法多层次Softmax微分SoftmaxCNN-Softmax基于采样（Sampling）的方法重要性采样具有适应的重要性采样目标采样噪音对比估计负采样自标准化低频的标准化其他方法选择哪一种方法？结论这篇博文是我们词嵌入及其表示系列的第二篇。在上一篇博文里，我们提供了词嵌入模型的概述，并介绍了 Bengio 等人在2003年提出的经典神经语言学习模型、Collobert 和 CWeston 在2008年提出的 C&W 模型，以及Mikolov 在2013年提出的 word2vec 模型。我们发现，设计更好的词嵌入模型的最大挑战，就是如何降低softmax 层的计算复杂度。而且，这也是机器翻译（MT）（Jean等人[10 ]） ...继续阅读 (4)

我爱机器学习(52ml.net)
发表于
2016-11-05 04:13:07

词嵌入系列博客Part2：比较语言建模中近似softmax的几种方法

来源：机器之心选自SebastianRuder Blog作者：Sebastian Ruder英文原文：On word embeddings – Part 2: Approximating the Softmax原文：技术 | 词嵌入系列博客Part2：比较语言建模中近似softmax的几种方法参与：冯滢静本文经机器之心（微信公众号：almosthuman2014）授权转载，禁止二次转载这篇博文是我们词嵌入及其表示系列的第二篇。在上一篇博文里，我们提供了词嵌入模型的概述，并介绍了 Bengio 等人在2003年提出的经典神经语言学习模型、Collobert 和 CWeston 在2008年提出的 C&W 模型，以及Mikolov 在2013年提出的 word2vec 模型。我们发现，设计更好的词嵌入模型的最大挑战，就是如何降低softmax 层的计算复杂度。而且，这也是机器翻译（MT）（Jean等人[10 ]）和语言建模（Jozefowicz等人[6 ]）的共通之处。在这篇博文里，我们将要重点介绍过去几年的研究中 softmax 层的不同近似方法，它们其中的一些被运用在语言建模和机器学习。在下一篇博文里，我们才会介绍别的超参数。为了统一以及便于比较，让我们简单重新介绍一下上一篇博文的重点：我们假设训练集是一串包括 T 个训练词的字符序列 w1,w2,w3,⋯,wT ...继续阅读 (3)

我爱机器学习(52ml.net)
发表于
2016-11-05 03:57:16

词嵌入系列博客Part1：基于语言建模的词嵌入模型

来源：机器之心选自SebastianRuder Blog作者：Sebastian Ruder英文原文：On word embeddings – Part 1原文：技术 | 词嵌入系列博客Part1：基于语言建模的词嵌入模型参与：冯滢静本文经机器之心（微信公众号：almosthuman2014）授权转载，禁止二次转载本文是词嵌入系列博客的 Part1，全面介绍了词嵌入模型，接下来几天机器之心将继续发布 Part2、Part3，希望能对大家了解词嵌入有所帮助。无监督学习词嵌入（word embeddings）在许多自然语言处理的任务中都取得了前所未有的成功，因此它常被视为自然语言处理的万灵药。实际上，在许多自然语言处理架构中，它们确实几乎替代了诸如布朗聚类（Brown clusters）和 LSA 特征等传统型分布式特征。去年 ACL（计算机语言学会）和 EMNLP（在自然语言处理中实证方法会议）的会议论文很大程度都是词嵌入的研究，有些人还认为词嵌入这种嵌入方法比 EMNLP 更加适合的自然语言处理。今年的 ACL 会议有了不仅一个，而是两个的词嵌入模型的研讨会。词嵌入之间的语义关系在外行人看起来就像变魔术。深度自然语言处理的讲座常以「国王－男人＋女人≈女王」的幻灯片来做开场白，一篇最近在 Communications of the ACM 的文章向词嵌入模型致敬，并称之为 ...继续阅读 (2)

我爱机器学习(52ml.net)
发表于
2016-11-05 03:57:16

词嵌入系列博客Part1：基于语言建模的词嵌入模型

我爱机器学习(52ml.net)
发表于
2016-11-04 15:15:50

最小二乘法小结

作者：刘建平Pinard原文链接：最小二乘法小结最小二乘法是用来做函数拟合或者求函数极值的方法。在机器学习，尤其是回归模型中，经常可以看到最小二乘法的身影，这里就对我对最小二乘法的认知做一个小结。1.最小二乘法的原理与要解决的问题最小二乘法是由勒让德在19世纪发现的，原理的一般形式很简单，当然发现的过程是非常艰难的。形式如下式：目标函数 = Σ（观测值-理论值）2观测值就是我们的多组样本，理论值就是我们的假设拟合函数。目标函数也就是在机器学习中常说的损失函数，我们的目标是得到使目标函数最小化时候的拟合函数的模型。举一个最简单的线性回归的简单例子，比如我们有m个只有一个特征的样本：\((x^{(1)},y^{(1)}), (x^{(2)},y^{(2)},…(x^{(m)},y^{(m)})\)样本采用下面的拟合函数：\(h_\theta(x) = \theta_0 \theta_1 x\)这样我们的样本有一个特征x，对应的拟合函数有两个参数\(\theta_0 和 \theta_1\)需要求出。我们的目标函数为：\(J(\theta_0, \theta_1) = \sum\limits_{i=1}^{m}(y^{(i)} – h_\theta(x^{(i)})^2 = \sum\limits_{i=1}^{m}(y^{(i)} – \the ...继续阅读 (5)

我爱机器学习(52ml.net)
发表于
2016-11-04 15:15:50

最小二乘法小结

我爱机器学习(52ml.net)
发表于
2016-11-04 15:06:27

梯度下降（Gradient Descent）小结

作者：刘建平Pinard原文链接：梯度下降（Gradient Descent）小结在求解机器学习算法的模型参数，即无约束优化问题时，梯度下降（Gradient Descent）是最常采用的方法之一，另一种常用的方法是最小二乘法。这里就对梯度下降法做一个完整的总结。1. 梯度在微积分里面，对多元函数的参数求∂偏导数，把求得的各个参数的偏导数以向量的形式写出来，就是梯度。比如函数f(x,y), 分别对x,y求偏导数，求得的梯度向量就是(∂f/∂x, ∂f/∂y)T,简称grad f(x,y)或者▽f(x,y)。对于在点(x0,y0)的具体梯度向量就是(∂f/∂x0, ∂f/∂y0)T.或者▽f(x0,y0)，如果是3个参数的向量梯度，就是(∂f/∂x, ∂f/∂y，∂f/∂z)T,以此类推。那么这个梯度向量求出来有什么意义呢？他的意义从几何意义上讲，就是函数变化增加最快的地方。具体来说，对于函数f(x,y),在点(x0,y0)，沿着梯度向量的方向就是(∂f/∂x0, ∂f/∂y0)T的方向是f(x,y)增加最快的地方。或者说，沿着梯度向量的方向，更加容易找到函数的最大值。反过来说，沿着梯度向量相反的方向，也就是 -(∂f/∂x0, ∂f/∂y0)T的方向，梯度减少最快，也就是更加容易找到函数的最小值。 2. 梯度下降与梯度上升在机器学习算法中，在最小化损失函数时，可以通过梯度 ...继续阅读 (4)

我爱机器学习(52ml.net)
发表于
2016-11-04 15:06:27

梯度下降（Gradient Descent）小结

我爱机器学习(52ml.net)
发表于
2016-11-04 00:00:00

arXiv Paper Daily: Fri, 4 Nov 2016

Neural and Evolutionary ComputingRecurrent Neural Networks for Spatiotemporal Dynamics of Intrinsic Networks from fMRI DataR Devon Hjelm,Sergey M. Plis,Vince CalhounComments: Accepted to “Brain and Bits” workshop for NIPS 2016Subjects:Neural and Evolutionary Computing (cs.NE); Neurons and Cognition (q-bio.NC)Functional magnetic resonance imaging (fMRI) of temporally-coherent bloodoxygenization level-dependent (BOLD) signal provides an effective means ofanalyzing functionally coherent patterns in the brain. Intrinsic networks andfunctional connectivity are important outcomes of fMR ...继续阅读 (3)