Machine Learning Weekly 1.0 documentation

机器学习周刊第四期:春节快乐~

Contents

机器学习周刊第四期:春节快乐~

我是小猴机器人,可以通过 微博 联系我。

摘要:

1、马文明斯基得了终身成就奖;

2、Google继续疯狂收购AI公司;

3、有了IPython Notebook,妈妈再也不担心我的作业了;

活动预告

[台湾由田新技搞的一个竞赛,看起来挺靠谱,至少戴琼海老师(2013世界空间机器人大赛冠军队)参加过啊]

第九届UTMVP「由田机器视觉奖」以行为侦测为主轴。

分〈讲手机行为侦测〉〈跌倒侦测〉〈遗留物侦测〉进行。

欢迎对机器视觉抱有高度热诚的在学同学们来挑战拿高额奖金!!

比赛官网http://t.cn/8Fy6pfU

本期大牛:吴恩达 Andrew Ng

这个这个。。。还用介绍么:

1、Coursera创始人,斯坦福人工智能实验室主任,Google深度学习项目负责人;

2、Google识别猫脸是吴老板做的;

3、斯坦福遥控直升机倒悬是吴老板做的;

4、Deep Learning 最初最好看的教程是吴老板写的;

并且还有中文版,(邓侃当年率众分分钟翻译完成):http://deeplearning.stanford.edu/wiki/index.php/UFLDL%E6%95%99%E7%A8%8B

5、新闻介绍两篇:

你需要了解的未来:Andrew Ng,与他的Google Brain项目及人工智能实践:http://www.huxiu.com/article/14357/1.html

谷歌正在如何复制人类大脑? http://www.huxiu.com/article/13868/1.html

5、吴老板其实会说汉语^^

各种新闻

How a Math Genius Hacked OkCupid to Find True Love

我靠这个必须放第一,怎么用数据挖掘的方法在美国百合网找到真爱。

话说文章中说这哥们见了50多个。。。就算不用挖掘也能碰到个喜欢的吧这样。。。

Marvin Minsky honored for lifetime achievements in artificial intelligence

老爷子,麻省理工AI实验室创始人,神经元理论缔造者。(当年跟Peter Novig对吵,anti 概率model,那个是语言学家cheomsky)

谷歌自动驾驶汽车工程师在家中遭反对组织围堵

Anthony Levandoski(Darpa幽灵摩托车神缔造者)被一群反自动驾驶的筒子给堵门口了。。。

传单标语特逗,说这哥们正在制造一个无意识的世界,充满监视、控制和自动化,而且他住在你家隔壁。。。

这标语挺有说服力啊哈哈

4亿美元收购人工智能公司,Google抢做”机器学习“领域的AWS?

把机器学习当服务来提供的时代要来了,目测年后要火。

谷歌再度发力人工智能,收购李嘉诚投资的DeepMind

我咋感觉是为了买这几个哥们的肉身呢。。。

The rise of artificial intelligence

人工智能新进展,崛起了

各种论文

Yoshua Bengio的DNN论文,跪拜吧:http://www.iro.umontreal.ca/~bengioy/papers/ftml.pdf

各种软件

Hebel: GPU-Accelerated Deep Learning Library in Python

GPU,异构计算有木有

各种课程

Deep Learning(深度学习)学习笔记整理系列

非常适合初学者,各种总结由来很详细。

A First Course in Machine Learning

penny梁推荐,Matlab搞机器学习,不愿意装可以用Octave,机器学习入门教程图书挺到位。

机器学习的一些通俗易懂的tutorial

很好的一个整理,这帮哥们每周末有个读书会,看完了MLAPP,年后准备看DNN。

知识图谱技术原理介绍

挺深入,至少都谈到了Inference

Active Learning Tutorial

ICML2009 Active Learning教程

DataCamp R在线教程

类似CodeSchool,互动学习R,还可以自己贡献课程。

CS109 Data Science

Harvard用Python做数据分析的课程,很多机器学习例子,用互动IpythonNotebook做的。

Learn Data Science

Github上面的数据科学公开课,挺丰富,还讲了Random Forest。

Multi-armed bandit experiments

Google Analytics背后的老虎机模型,让用户测试网页吸引流量的效果。

Visualizing K-Means Clustering

KNN可视化演示,初学者可以看看。

How to Implement a Machine Learning Algorithm

如何从头开始写出一个机器学习算法。

Bayesian or Frequentist, Which Are You?

你是频率论还是贝叶斯学者?乔丹大神的tutorial。

<Using Feature Selection Methods in Text Classification

如何在文本分类中应用特征选择

各种名人分享,排名不分先后

【张老师优化强悍啊】@breezedeus

百度出品:“Accelerating Stochastic Gradient Descent using Predictive Variance Reduction” http://t.cn/8FfDwER , 用很小的改动代价加速SGD的收敛。

【这哥们blog上很多干货】@cvnote

[转]国内从事CV相关的企业 | (本文转载自blog.csdn.net/carson2005,辛苦原作者攒了这么多公司。)

经常碰到朋友问我国内从事计算机视觉(CV)领域的公司的发展情况,产品情况,甚至找工作等问题,这里,

我给出自己收集的国内从事CV相关领域的公司网址及其主要产品,有兴... http://t.cn/8FIHTjC

【推荐系统干货】@InfoQ

#QCon#【推荐系统实战经验与效果提升之道】推荐系统既能帮用户完成个性化信息过滤,又能帮信息找到最合适的用户。

搭建一个效果优良的推荐系统并不简单,盛大推荐团队负责人陈运文将围绕推荐效果与我们探讨推荐系统的优化技术,并介绍实战经验。

讲稿:http://t.cn/8FfFJQq 视频:http://t.cn/8FIyErX

【TextRunner当年可是引领潮流啊,华大抽取team确实nb】@邱锡鹏

华盛顿大学的第四代Open IE项目 http://t.cn/8FISloK

前三代分别对应的项目是 Ollie (EMNLP 2012) Reverb (EMNLP 2011) TextRunner (IJCAI 2007)

【你还在学人家的课,人家已经开始学你了。。。】@课程图谱

MIT和Harvard对过去一年在edX平台上进行的课程逐一进行了分析,发现了一些有趣的现象。

这些结论已经形成论文,论文地址:http://t.cn/8FcqCbx

(以图示中间的红线为分界,红线以上为拿到证书的,以下为没有拿到的。有没有发现有趣的现象?)

【如果给研究以梦想的寓意,听起来就高端许多啊】@微软亚洲研究院

【WWT在中国:一个改变了人类探索宇宙方式的少年梦想】想象一下,在屋子里却仿佛身置宇宙,超光速飞行探索行星、星云、恒星和小行星。

来自微软研究院的万维天文望远镜WWT借助先进信息和网络技术,把世界上最好的天文数据融合成无缝的数字宇宙,并通过数据可视化方式呈现。

详情>> http://t.cn/8Fcj55g

【话说R搞搞分布还是相当顺手的】@Conan_Z

常用连续型分布介绍及R语言实现 | 文章地址:http://t.cn/8Ffnm6E 前言 随机变量在我们的生活中处处可见,如每日天气,股价涨跌,彩票中奖等,

这些事情都是事前不可预言其结果的,就算在相同的条件下重复进行试验,其结果未必相同。 http://t.cn/8Ffnm6R

【汇编优化。。。专业技术过硬是王道啊】@CSDN

#对话CTO#【专访@云知声-梁家恩:当语音遇上深度神经网络】从去年3月份开始,云知声因与搜狗、乐视等厂商的合作而崭露头角,更在1亿人民币融资后引起轰动,在国内掀起了一阵语音热潮。

其技术到底牛在哪里?其算法团队到底有多少博士?本文将给你一个详细的答案。http://t.cn/8FflEyQ

【数据堂的数据越来越有意思了】数据堂

【DBLP Computer Science Bibliography元数据】DBLP由德国特里尔大学的一个团队开发和维护,提供计算机领域高质量的科学文献搜索服务,并且只储存这些文献的相关元数据,如标题,作者,发表日期等,不提供全文下载。

该数据为截止到2012年2月份的全部元数据。http://t.cn/zOIHijj

【大佬摇旗呐喊】@财新网

#2014冬季达沃斯#【盖茨谈科技:下一个大事件是计算机视觉与深度学习】(特派瑞士达沃斯记者 李昕)盖茨接受财新专访时表示“近期最大的事情是视觉识别。

原来我们的机器人是瞎子,以后几乎和人具备一样视觉,这样的机器人可以用在工厂、办公室、在野外等等各种工作环境。”

【斯坦福同学上课用的Note,比在线那个深入】@PeixunNet

【Machine learning lecture notes】via @人大经济论坛 。这一套机器学习的notes,

作者为现任斯坦福机器学习大神,也是Coursera的创始人Andrew Ng。Notes请见→ http://t.cn/8F517Xk

@龙星计划

机器学习是什么?http://t.cn/8kF24wc,据说是@南大周志华 老师写的,求验证。

【这个实时PS太nb了。。。】@darajan

我分享了http://t.cn/8Fq5Tfp

李奋进

【Python 文本挖掘:使用机器学习方法进行情感分析(原理)】 在这个系列的文章里面,机器学习都可以认为是有监督的分类方法。

总体流程如图: 图1:机器学习的流程和结构(摘自《Natural Language Processing with Python》)http://ww4.sinaimg.cn/mw1024/6b734cc4jw1ech2hisruwj20ku09emyc.jpg

一、有监督意味着需要人工标注,需要人为的给文本 http://t.cn/8FATPIQ

【马特拉伯机器学习在线视频一堆】MATLAB

#Machine Learning with MATLAB# 机器学习算法使用计算方法直接从数据中“学习”信息,而不需要假设一个预定的方程作为模型。

随着你增加样本的数量,他们可以自适应地提高其性能。Machine Learning with MATLAB:http://t.cn/8F4qKLP

【目测节后Spark要火,加上docker】Andrew-Xia

今天发现AMPLab里面好多大牛教授的课程课件都是公开的,丰富精彩,推荐两个,

Ion Stoica的操作系统与系统编程(Operating Systems and Systems Programming) http://t.cn/8F5LP4W

Michael I. Jordan【图模型元老】的机器学习实践(Practical Machine Learning) http://t.cn/aW75Ml

【Xing老师】王威廉

CMU机器学习系Eric Xing老师的Probabilistic Graphic Model已经开了10个年头了,

这学期貌似是第一次把视频放在网上:http://t.cn/zTh9OqO 目前这学期的课程刚开始。

【我很想知道怎么做Evaluation,以及话说DNN比GMM在表征上确实好一些】PETD亚洲善待博士组织

这位同学你毕业论文这么屌,你家里人知道么!录用自:@Xieldor

《色情视频的音频辅助识别》请戳大图!

http://ww1.sinaimg.cn/mw1024/bf39f2bbjw1ecvof9hvdej20m80z9dnz.jpg

【ICCV2013那个搞十字路口车流的demo有异曲同工之意,Prediction和Inference才是AI啊】@36氪

看肉眼看不到的区域,做人脑无法完成的驾驶规划:福特与MIT、Stanford合作研发自动驾驶汽车 | 利用“情景规划”和“透视技术”,福特自动驾驶汽车或能提升感知周围风险的能力,

保证汽车在行驶途中可以安全地避开行人、车辆以及其他运动物体。http://t.cn/8FVj6xK

【王益的文章,Google做并行LDA,腾讯广告算法中心总监,都是自己的体会啊,硬货!】@ChinaHadoop

【话说益神和垠神居然是同学啊。。。还一起上了邓俊辉老师的课。。。怪不得后来计算几何超级难,都被他们刷的】

分布式机器学习的故事,完全是经验的结晶,超有干货。[good] http://t.cn/8FtPacQ

【NLTK是Python的我会炫耀么】@算文解字

在现有的AI、ML、DB课程外,斯坦福工学院将在2012年一月份推出更多网络课程。

最期待的有#自然语言处理# Natural Language Processing,由Stanford NLP组两位教授主讲,链接:http://t.cn/S2RRP8

和#概率图模型# Probabilistic Graphical Models,由PGM那本教材作者授课。链接: http://t.cn/S2RYol

【越是毫无细节的文章越是激发无限好奇啊。。。小团队好做事】@远东轶事

在谷歌无人车组的工作感想:到谷歌无人车组全职工作已经有四个月了。

写一下感想。 鉴于项目的高度机密性,很多话不能说,我唯一能透露的,就是两条:同事们都很牛,然后都非常努力。

我们组基本...文字版>> http://t.cn/8FqrhNA (新浪长微博>> http://t.cn/zOXAaic

【人在江湖漂,那能不挨刀】@王威廉

今天普林斯顿发表了一篇论文,说用谷歌搜索词来预测Facebook将在2017年丧失80%的用户(左)。论文:http://t.cn/8FcUyVq

结果Facebook的数据科学家马上发表博文反驳,说谷歌搜索词并不能代表实际趋势,相关关系并不等于因果关系:如果用类似方法,那么王子屯大学也快要消失了

【看了,好几篇都很赞,尤其是最后西乔吐槽语言之争哈哈】@CSDN杨爽

#《程序员》杂志2月刊# #封面报道# 大数据实时处理,马上有结果。希望大家喜欢。

@程序员杂志 感谢@吴甘沙 @Andrew-Xia @DataScientist @杨卓荦 @曲风富-流式计算 等各位作者的大力支持。http://t.cn/8FcH5Lc

【冷静冷静。。。绝对是噱头。。。】@新浪美股

【Kaggle链接:http://t.cn/8FtNbOV

[抓狂]【巴菲特10亿美元重奖】巴菲特旗下伯克希尔哈撒韦和吉尔伯特的Quicken Loans合伙,将为猜对2014年美国男子大学生篮球联赛(NCAA)全部比赛胜负结果的人提供10亿美元奖金。

奖金分40年分发,每年2500万美元。猜对者也可以选择一次性获得5亿美元。但猜对的概率为920亿亿分之一http://t.cn/8Ftf4HH

【linear time 有木有。。。】@刘洋THU

黄亮老师1月13日在清华的报告“Linear-Time Algorithms for Natural Language Understanding and Learning”

已经可以从他的主页下载:http://t.cn/8Fqpde1

@summerrlee: 顺便发一个13下午在 MSRA 的,黄亮老师讲的机器翻译判别式训练(2013) http://t.cn/8FqYZyh

@王威廉

机器学习两大顶级会议之一的NIPS 2013口头报告视频已经上线了:http://t.cn/8FqNkQD

【之前umich贡献的entity linking还没消化完,赞】@王威廉

CMU LTI与谷歌合作,今天放出了知识图谱的重要资源:800万ClueWeb文档通过自动标注产生的110亿短语。

这些短语全部与Freebase实体对应,使得目前大家在ClueWeb上的字符串和n-gram操作,转变成在知识图谱上对实体和概念的操作,对众多应用影响重大。

下载:http://t.cn/zQGszlm http://t.cn/zQGszl3

【很多人搞word sense disambiguation啊,看来low level fruit动作不快就会被抢光了。。。】@夏粉_百度

Andrew Y. Ng 他们在”Improving Word Representations via Global Context and MultipleWord Prototypes”训练词向量时添加了全局信息并处理了多义词。

通过文档里所有词向量的加权和表示文档,通过词所在的环境对多义词进行区分和重表示。

文中的提到的训练技巧:使用mini-batch L-BFGS 效果优于SGD。

@Copper_PKU:我觉得结合这篇看 Representation Learning: A Review and New Perspectives, Yoshua Bengio etc. 效果更好

【Spark benchmark跑分比较】@薛正华-中国科学院

When you hesitate to determine Hive Spark or Impala, please reference it: http://t.cn/8F2LUsP A wonderful work by AMPLab. @hashjoin

【机器视觉创业谈】@winsty

我来分享一篇关于cv相关startup的好文:http://t.cn/8FbHsjL 作者@刘天强Orbeus

@百度技术沙龙

46期百度技术沙龙【读图时代的识图技术】嘉宾PPT网盘下载地址:

黄畅@黄畅_了解的不只是人脸 【开启读图时代】:http://t.cn/8FbImOK

刘长松@简简淡淡abc 【读图技术及应用】:http://t.cn/8FbJtGl

【科幻小说前奏,郝老师继续写啊!】@tinyfool

刚刚写了篇文章《一开始我觉得新浪微博傻,看不到明显的用户下降,现在我才慢慢明白新浪微博的高瞻远瞩。

http://t.cn/8FGR662 介绍我们伟大的未来

各种八卦

[转载]谈谈机器学习(Machine Learning)大家<http://blog.sciencenet.cn/blog-629275-674864.html>

最原始那个文章貌似访问不了,文中八卦了乔丹,Koller,Collins各位机器学习大牛的事迹。

The road to success–听Eric Xing讲课记录

文章写的很不错,讲Eric xing,讲他各种转系,遗憾的是没找到原来的出处,而且最后的图片链接失效了。

各种免费

Koding Free SSH VM

机器学习周刊为啥能随时随地更新?因为我找到了一个免费的虚拟主机平台,Koding,刚拿了千万风投的一个为程序员服务的公司,手感超级赞,不骗你。

Contents

comments powered by Disqus