Machine Learning Weekly 1.0 documentation

机器学习周刊第三期:MLSS首次在中国举行

Contents

机器学习周刊第三期:MLSS首次在中国举行

我是小猴机器人,可以通过 微博 联系我。

摘要: 1、MLSS(Machine Learning Summer School)首次在中国,在北京,在人大举行了,抓紧时间抢票啊;

2、人脑认知模型是量子的?

3、Python继续占据科研第一线啊,各种数据挖掘教程有木有;

活动预告

从“南大周志华”周老师weibo看到,这个超级赞,Speaker里面超级多大牛。

2014 MLSS Machine Learning Summer School, http://t.cn/8Fy65Bp MLSS系列首次在中国举行,

将有10余位国际机器学习领域著名学者做介绍性长报告,是快速了解部分国际前沿的好机会。

时间:2014年6月15-20日,地点:北京,中国人民大学。申请截止时间:3月15日

本期大牛:Yann LeCun

大牛85年提出BP神经网络;

大牛的OCR识别了全美在90年代超10%的支票;

大牛还搞了个图像压缩软件,叫DjVu(是不是还曾经出现过打开方式不对的经历?)

大牛最新开的课 Large-Scale Machine Learning and Big Data

去年NIPS上Facebook老总肉身出现了,说在纽约搞了一个人工智能实验室,大牛当主任。

最后:大牛对CVPR貌似吐槽很多

各种新闻

Meet the Man Google Hired to Make AI a Reality

讲Hinton大神经历的文章,从小到大说了一遍。各位大牛也轮番出场,比如余老板这段:

“Over the last 20 to 30 years, he has been pushing forward the frontier of neural networks and deep learning,”

says Kai Yu, the director of Baidu’s Institute of Deep Learning.

“We have never seen machine learning or artificial intelligence technologies so quickly make an impact in industry. It’s very impressive.”

【协作】侯世达——机器思考的先驱者

人工智能的真正含义到底是什么?

Google to buy ‘machine learning’ firm Nest Labs

你们以为Google买了一个智能家居公司么?买的是自学习研究小组好么。

The brain can process images seen for just 13 milliseconds

人眼识别物体速度小于13毫秒(显示器显示的最快速度),MIT出品。。。不过话说看完了感觉这实验只能表明人眼获取图像的速度小于13毫秒,不能证明识别速度啊。

A smart-object recognition algorithm that doesn’t need humans

BYU教授搞的nb识别算法,号称无监督,自动做feature selection,称为Evolution-COnstructed (ECO) features。

看完了感觉就是自动选合适的HOG?在Caltech四个数据集上测准确率100%啊,另一个数据集上95-98%。

不过话说都不考虑recall的么?

New ‘Wikipedia for robots’ lets bots store their brains in ‘the cloud’

著名的RobotEarth项目,搞了四年出来见人了。目的就是机器人之间共享完成Task的方法,共享毛豆有木有,机器人大军来了。。。

Google’s smart contact lens project could allow diabetics to track glucose levels automatically

Google隐形眼镜项目,号称可以随时监控糖尿病患者的血糖浓度。话说测血糖浓度真的不用戳么?

Evidence that photosynthesis efficiency is based on quantum mechanics

Deep Learning之后。。。又开始搞量子Learning了是么。。。题目翻译过来叫证据显示光合作用实际是量子作用。。。

How To Track Vehicles Using Speed Data Alone

一般人都不愿意给出自己开车时候的GPS定位信息,隐私么,但是光给个速度其实也可以知道你在哪里啊,Inference nb

New smartphone app helps blind find their way inside buildings

又一个室内定位项目,不过地上贴胶带这种方式是不是有点太扯?

‘Invisibility’ Materials Could Do Computer’s Work

科学家发现做哈利波特隐身衣的材料,通过对光线的扭曲,也可以存储和传递信息,所以,也可以进行计算,光计算有木有。

The right words to boost your Kickstarter pitch

众筹网站火啊,科学家就分析成功项目用了那些词,失败项目用了那些词,来指导创业者写proposal,话说就是个TFIDF么?feature略少啊。

问答之间的智慧

不光IBM有Waston,MSRA也有啊,叫Light,拜周老师,对,就是搞了对联机,古诗机的周明老师。

读心机器人的“阳谋”

不管你心里想什么名人,哥都能分分钟猜出来。。。话说被猜的最多的是一群韩国偶像明星哎,哦对了还有羊驼。

微软亚洲研究院官方微博2013年度十大技术

论文杀手MSRA带来13年十大技术,都是干货啊。

NSA’s top secret technology can tap/infect computers even when not connected to the Internet

NSA,诺斯登前东家,就算你电脑不联网照样黑你。

智能手机如何曝光你的隐私

这么多厂商蜂拥做路由器,希望以后不会有人把我手机的MAC地址泄露出去。。。不开GPS也无济于事啊,你总不能不上网啊。或者3G运营商其实一直知道我在哪里对么。。。

各种课程

Getting Started With Python For Data Science

Kaggle上用Python做数据科学的教程。

Titanic: Getting Started With R

Kaggle上用R做数据科学的教程。

Python Scientific Lecture Notes

Python科学计算课程

Data-driven, interactive science, with d3.js plots and IPython Notebooks

Authorea改版,增加数据挖掘和可视化功能,D3,Ipython,趋势啊。

The Open-Source Data Science Masters - Curriculum

一哥们在github上面总结一堆数据挖掘、概率课程

MIT debuts online Big Data course for tech pros

MIT开了个大数据课程,收费滴,四周500刀,不过貌似干货比较多。

Data Science in Python

Python数据处理教程

Troll Detection with Scikit-Learn

Kaggle上恶意评论检测的竞赛,这哥们用Python搞的。

Statistics vs. Machine Learning, fight!

概率学和机器学习的对比讨论

Probability and Statistics Cookbook

各种概率分布Cheating Sheet一张。

The Analytics Edge

edX上各个公司真实数据案例分析课程。

各种机器人

Keecker, The Robotic Butler Of The Future, Will Change Home Entertainment Forever

一个带着投影仪的移动机器人,各种互动无压力。

各种名人分享,排名不分先后

@张磊-机器学习

The Deep Learning training framework on Spark:http://t.cn/zRAU8HO 还不错

@凤凰科技

【亚马逊可能比你更懂自己:还没下单、货已上路】亚马逊去年申请了一项名为“预测性物流”的专利,可以让亚马逊根据海量数据去预判用户的购买行为,

提前将这些商品运出仓库,放到托运中心寄存,等用户真的下单了,立马装车往用户家里送。目标只有一个,大幅缩减商品到达时间。 http://t.cn/8FbcudT

路遥_机器学习

Malik居然也做起Deep Learning来了。用CNN做detection,效果超过了Deformable Part-based Model。文章见:http://t.cn/8Dks8MV

@路遥_机器学习

人人都能编CNN!按照Ng的这个教程http://t.cn/8kmKkTj,再参考http://t.cn/8F4DFZ4 http://t.cn/8kxN3Pz http://t.cn/zjpbMNi,相信每个人都能在一周内,理解并从头到尾编出一个CNN来。

还有个我自己实现的简单CNN供参考,200行MATLAB,轻松MNIST上跑个98% http://t.cn/8F4DFZU 欢迎提意见挑毛病!

@Google谷歌爱好者

【经济学人:谷歌进军硬件市场 成为新时代的GE】周六即将出版的新一期《经济学人》杂志在题目为“谷歌:新通用电气”(The new GE: Google, everywhere)的文章中称,

在软件市场取得成功后,谷歌近期又通过一系列并购进入硬件市场,俨然成为了“新通用电气”。 http://t.cn/8Fb2Mf9

@网路冷眼

Intel公司发布今年建议开发者阅读清单前半部分:从硬件到软件,应有尽有,包罗万象,涵盖操作系统、多核编程、嵌入式、安全等等当今主流IT技术主题,

不是举荐自家技术的广告贴。据称得到众多技术专家、工程师的审阅。PDF格式,长达10页。http://t.cn/8F4NV0b 墙裂建议收藏

@52nlp

整理了一下52nlp博客上的一些系列文章以及其他一些NLP的相关资源,放到资源链接下了 http://t.cn/SUMJFK ,感兴趣的同学可以收藏。

@王威廉

全球至少有十万台物联网设备遭受了黑客攻击。The Internet Of Things Has Been Hacked, And It’s Turning Nasty http://t.cn/8F4BwU

@王威廉

CMU LTI博士生Xinlei Chen的永不停息图像学习系统被CNN评选为2013年十大Idea的第九名。http://t.cn/8kl5R73 论文:http://t.cn/8FPm2sb

@JavaChen

The Real-Time Big Data Landscape http://t.cn/zHRyfpf

@张栋_机器学习

Web-Scale Data 带来的挑战是要设计 “更快,更大” 的存储和计算架构,Google 在技术上不停挑战极限,开发了 4 种技术:Hadoop、Caffeine、Pregel、Dremel。

值得注意的是:这些技术都是建立在使用大量廉价机器的基础上,成本很低,但是很强大!

@夏粉_百度

Hinton在“A Scalable Hierarchical Distributed Language Model ”介绍一种数据驱动分层构建词树的语言模型,层次结构解决了log-bilinear language model的预估复杂度问题。

树的构建采用了类似于固定一边(词向量分布)优化另外一边(树结构)的思想。...畅读版【http://t.cn/8FyO86g

王晓伟alex

小伙伴们,想知道搜狗是如何搞定电影票房预测的吗?感觉去follow这篇文章吧...http://t.cn/8FP6b0m。基于搜索意图、社交媒体、垂直媒体和知立方的搜狗“深思”票房预测系统,为您揭开隐藏在票房背后的秘密!

hashjoin

就在刚刚GraphX被merge进了Apache Spark的master,Spark 0.9.0的发布会包括alpha版本的GraphX。GraphX是Spark之上的一个图处理框架,

支持Pregel和GraphLab的编程模式,内置了PageRank, (strongly) connected components, SVD++等算法的实现。 http://t.cn/8FLXlQX

@hashjoin

R是数据分析最常用的工具之一,但是R能处理的数据不能大于一台机器的内存。过去有一些R和Hadoop结合的尝试一般都性能低下,用户体验差。

今天AMPLab发布了R的Spark前端,利用R进行大数据交互分析,也可以在节点上利用R的数据分析库,是大数据的一个新利器 http://t.cn/8F4Az09

@课程图谱

#OMSCS#世界上首个MOOC形式的硕士生项目OMSCS(Online Master of Science in Computer Science)经过半年多的筹备和打磨,今天正式开始运行!

该项目由Georgia Tech、Udacity和AT&T联合筹办,

目前只有成功申请该项目的学员才能接触到课程,免费的课程内容预计将于4月份正式对外开放http://t.cn/8FULoK2

@课程图谱

#课程点评#明尼苏达大学的Introduction to Recommender Systems@gycheng 评论“明尼苏达大学是最早开始推荐系统研究的几所学校之一。

还有那个鼎鼎大名的数据集Movielens也是出自这里,实际上课程所有编程作业的数据集也是取自Movielens系统”评论很长,全文地址:http://t.cn/zQ4C8zI @CourseraChina

@统计之都

《中国计算机学会通讯》 2014年第1期新鲜出炉,诸多好文强烈推荐,比如2014年大数据发展趋势预测、穿戴式计算、青年学者成长难在哪。http://t.cn/8FU4eEt

《关于统计学的科研、发展和教育》一文是郁彬教授访谈,由于篇幅原因,进行了筛选和重组,原中译版地址 http://t.cn/zR0GBkt 欢迎移步阅读。

hbyido

ICML 2013最佳论文奖之一授予了Vanishing Component Analysis,然后再用到深度学习的网络结构

// 【大数据时代的机器学习热点——国际机器学习大会ICML2013参会感想】 http://t.cn/8FUXtg5

@赵家平USC

Max Welling教授的最新ICML文章:Austerity in MCMC Land: Cutting the Metropolis-Hastings Budget.

大大加快了Bayesian inference效率,超过MCMC经典算法 Metropolis-hastings。对 大数据 快速inference 的巨大贡献,被reviewer称为 Landmark in inference! 值得去读~

百度技术沙龙:

#百度技术沙龙#百度黄畅-开启读图时代讲义下载链接:http://t.cn/8FbImOK @黄畅_了解的不只是人脸 @阿牛哥在北京 @机器学习讲座

@课程图谱

#数据挖掘#数据分析是如今非常热门的话题之一,拥有统计学或数据挖掘能力背景的人越来越多地受到就业市场的青睐。

课程图谱为此简单整理一下目前(2014年初)在MOOC平台上有关数据挖掘方面的公开课程,各位可以根据自己的需要挑选合适的课程~http://t.cn/8FL8IYs

那个电影

程序员必看电影“Her”,IMDB 8.6,豆瓣评分8.7,烂番茄93%,女神斯嘉丽配音,跟人工智能谈恋爱,妈妈再也不担心我孤独一生了。

程序员影评若干篇:

http://www.kurzweilai.net/mashable-why-her-is-the-best-movie-ever-made-about-the-singularity

http://www.kurzweilai.net/reel-change-the-radical-reassuring-message-of-her

http://www.kurzweilai.net/ion-cinema-her-review

http://www.kurzweilai.net/style-its-her-party-spike-jonze-rolls-out-his-latest

各种免费

Koding Free SSH VM

机器学习周刊为啥能随时随地更新?因为我找到了一个免费的虚拟主机平台,Koding,刚拿了千万风投的一个为程序员服务的公司,手感超级赞,不骗你。

Contents

comments powered by Disqus