一天学会深度学习-李宏毅2入门人工智能小书单(上)

引言:

入门机器学习深度学习并不是一件容易的事情。须要学习大量的知识,初学者往往会茫然不知所措。如今我们给你带来一篇纯干货,帮助你入门机器学习和深度学习。

1哪些是人工智能

根据UCLA院长朱松纯院士的定义,AI大约可以分为一下六类:

(1)计算机视觉->人类的视觉能力

(2)自然语言处理->人类的语言文字能力

(3)语音辨识与生成->人类的听与说能力

(4)机器人学->人类的运动能力和运动智能

(5)博弈与合作->人类对抗与合作的能力

(6)机器学习->人类的学习能力

可以看出原先的技术是让新工具替代旧工具。而人工智能不同,它的目标就是模仿人类的智能,代替人类的智能,赶超人类的智能。

那现阶段的AI究竟是个哪些东西呢?

我认为现今的AI核心理念还是统计推论或则函数拟合。说人话就是找一个函数或则一个映射,致使一段声波进去能映射到语言,一张仓鼠的图片进去能映射到小狗。你跟siri说hi手动映射到回答hello~

图片[1]-一天学会深度学习-李宏毅2入门人工智能小书单(上)-唐朝资源网

三天学会深度学习-李宏毅

2入门人工智能小书单

给你们推荐一些书,同时提醒你们一些坑。书大致可以分为三类『科普书籍』『机器学习算法书籍』『编程书籍』。

2.1.科普书籍:

《数学之美》:用意趣横生的语言述说了自然语言处理和搜索引擎里的物理原理

《浪潮之巅》:述说IT产业发展和德国硅谷IT公司的变迁浮沉

《黑客与作家》:本书是硅谷创业之父PaulGraham的选集,程序员的世界观和眼中的世界

兴趣是最好的老师,阅读科普书籍有助于积累兴趣,对人工智能领域有个大约的了解。

2.2.机器学习算法书籍:

《统计学习技巧》:李航博士的精典教材。用最精炼的语言描述机器学习算法,改行AI必读书籍

《机器学习》:周志华院士的香蕉书。统计学习方式囊括面太窄,配合菠萝书来扩充间距。

《python机器学习及实现》:适宜入门,学习曲线平滑,理论书看累了,就跟随这本书打一遍代码,对kaggle都会大致的了解。

《集体编程的智慧》:有各类算法的实现代码,配合理论书看,能更深入的理解算法。

《PRML》:机器学习精典,贝叶斯精典。

《神经网路与深度学习》:邱老师的开源书(nndl.github.io/)

2.3.编程书籍:

《廖雪峰Python教程》:最好的Python入门教程,liaoxuefeng.com

《流畅的Python》:Python最好的进阶教程

《PythonforDataAnalysis》:作者是PythonPandas的作者,剖析数据就用Pandas

2.4.一些坑:

《Tensorflow实战》:真的还不如就看官方教程或则耶鲁的课程CS20SI

《深度学习》:Goodfellow的大作,但真心不适宜入门,适宜进阶

2.5.笔试书籍:

《百面机器学习》:俗名葫芦书,已提问的形式归纳机器学习笔试中的种种知识点,面算法建议打算一本

《剑指offer》:笔试必刷书籍,由于好多笔试官都是从上面找题

3入门人工智能小视频入门阶段:

2009版视频:哈佛课堂视频,内容比较充实,但要看板书,但是有些没必要的课堂互动,容易分心

晓得大家都是伸手党,链接也打算好了。

链接:哈佛学院公开课:机器学习课程

图片[2]-一天学会深度学习-李宏毅2入门人工智能小书单(上)-唐朝资源网

(open.163.com/special/opencourse/machinelearning.html)

2014版视频:这是吴恩达在coursera上的讲课视频,一段视频一个主题,愈发精炼清晰

链接:机器学习(MachineLearning)-吴恩达(AndrewNg)|哈佛学院课程CS229(2014)

(bilibili.com/video/av9909092/index_1.html%23page%3D1)

吴恩达的课程一大问题是中文讲课,有些男子伴惧怕英文,就胆怯了。

这样的话,日本学院林轩田老师的机器学习基石及技法是十分不错的选择。

这门课深度深一些,更物理一些,会讲一些特别基础的机器学习理论,如VC维,KKT条件等

我的建议是一开始听不懂直接过,学完以后再来反刍

链接:机器学习基石,完整版_讲演•公开课_科技_bilibili_哔哩哔哩

()

进阶阶段

讲神经网路估计没有比祖师爷更好的了,Hinton爷爷的思想十分深沉,换句话说可能不太好懂

但这不影响这是十分优秀的课程

链接:Hinton机器学习与神经网路英文课程-网易云课堂

(study.163.com/course/introduction.htm?courseId=1003842018&_trace_c_p_k2_=f9255270f1dd44fa93f9a6d282bd135f)

计算机视觉无疑是这波深度学习浪潮的弄潮儿,搞计算机视觉方向精典的入门视频

上面会介绍各色各样的前馈神经网路

链接:哈佛李飞飞-深度学习计算机视觉-网易云课堂

(study.163.com/course/friendly404.htm?courseId=1003223001&status=-5&_trace_c_p_k2_=cd961ca58a614f78a8b9a2623c0087da)

人工智能另外一个重要领域是自然语言处理,搞这个方向精典的入门视频莫过分CS224

链接:哈佛2017季CS224224n深度学习自然语言处理课程(byChrisManning&RichardSocher)(中文字幕)

(bilibili.com/video/av13383754/?from=search&seid=11933326047978202113)

【官方】【中英】CS224224n哈佛深度自然语言处理课

(bilibili.com/video/av41393758)

里面的视频似乎精典,而且英语讲课,这让好多小孩子很崩溃,但没事,来看日本学院的深度学习吧!

链接:【深度学习】李宏毅MachineLearning(2017,秋,日本学院)粤语

机器学习-李宏毅(2019)MachineLearning

(bilibili.com/video/av35932863?from=search&seid=3749004717372119178)

条理清晰,重点明晰ai入门视频教程,并且每位章节讲解才20分钟左右,up主语速偏慢,1.5或2倍速看也没有问题,特别适宜入门

图片[3]-一天学会深度学习-李宏毅2入门人工智能小书单(上)-唐朝资源网

链接:哔哩哔哩(゜-゜)つロ乾杯~Bilibili

(space.bilibili.com/97068901/channel/detail?cid=54167)

见到这儿,你们会发觉,虽然只要你想学,视频大把大把的,互联网让知识的获取不再困难,真正制约你的只有你的决心和毅力了。

最后,提个坑,别去看张志华老师的统计机器学习视频,张老师的水平是很高的,但视频里满屏幕的公式,又让我回想起大学期间被各类定律推导支配的焦虑。中国学院的课觉得就始终都在劝退,提醒你学不会的,你听不懂的,你情商不够的。但是吴恩达的课不会,他认为没有学不会的学生,只有教不好的老师~

4入门人工智能学习技巧

图片[4]-一天学会深度学习-李宏毅2入门人工智能小书单(上)-唐朝资源网

初学机器学习可能有一个误区,就是一上来就深陷到对各类高大上算法的追逐当中。动不动就我能不能用深度学习去解决这个问题啊?我是不是要用boosting算法做一些模型融合啊?我仍然持有一个观点,『脱离业务和数据的算法讨论是毫无意义的』。

实际上按我们的学习经验,从一个数据源开始,虽然是用最传统,早已应用多年的机器学习算法,先完整地走完机器学习的整个工作流程,不断尝试各类算法深挖这种数据的价值,在运用过程中把数据、特征和算法搞透,真正积累出项目经验才是最快、最靠谱的学习路径。

那怎么获取数据和项目呢?一个捷径就是积极出席国外外各类数据挖掘大赛,数据直接下载出来,根据大赛的要求去不断优化,积累经验。美国的Kaggle和国外的DataCastle以及阿里天池大赛都是挺好的平台,你可以在里面获取真实的数据和数据科学家们一起学习和进行大赛,尝试使用早已学过的所有知识来完成这个赛事本身也是一件很有乐趣的事情。和其他数据科学家的讨论能宽阔视野,对机器学习算法有更深层次的认识。

有意思的是,有些平台,例如阿里天池赛事,甚至给出了从数据处理到模型训练到模型评估、可视化到模型融合提高的全部组件,你要做的事情只是参与赛事,获取数据,之后使用这种组件去实现自己的idea即可。不屁话,直接划重点上干货。假如你认为机器学习难,那一定是你打开的方法不对(认真脸)。

机器学习看似难度大,但对入门者来说,也还是有一条通用的学习路径。正如前几个专栏里介绍的,还有好多优秀的入门资料可以大大减少学习门槛,同时迸发学习的乐趣。

简单的说,学习方式大约如下:

编程技能机器学习知识—->动手实践撸代码—->数据科学大赛—->实际项目经验物理基础

机器学习是一个将理论算法与计算机工程技术紧密结合的领域,你须要扎实的理论基础来帮助你剖析数据,同样是须要工程能力去开发模型和布署服务。所以须要【编程技能】【机器学习知识】【数学基础】三个师团齐头并进,能够最终夺回胜利的果实。

改行AI的人里也可以分三类,一类是程序员出身,具有挺好的工程经验;一类是统计学物理电子通讯类出身,具有较为扎实的理论基础;还有一类既没有丰富的编程经验也没有扎实理论基础,比如我们学材料的…这三类朋友入门AI,须要强化的部份是不一样的。

4.1.编程技能-python

Lifeisshort,Iusepython!

在google,facebook等大鳄钦定以后,人工智能领域的当红辣子鸡莫过分python。Python的工具库还是蛮全的,从数据获取到数据清除和机器学习算法应有尽有。与R相比,愈发全面。

对于python,除把握其自身句型外,还应当注重把握下边这种库:

pandas:超级excel,表格式操作数据,数据清洗和预处理的强悍工具。

numpy:数值估算库,快的不要不要的。

matplotlib:模仿MATLAB的数据可视化工具。

scikit-learn:封装超级好的机器学习库,一些简便的算法用上去不要太顺手。

ipythonnotebook:数据科学家和算法工程师的电脑,强力推荐。

4.2.物理基础

微积分:是机器学习中的核心知识之一,无论是梯度增长法中的求梯度还是反向传播中的偏差传递的推论都须要用到微积分。

线性代数:神经网路中大量的估算都是矩阵加法,这就须要用到线性代数的知识了。估算向量的正弦相像度也要用到内积运算。据悉,矩阵的各类分解办法也出现在主成份剖析和奇特值分解中。

机率论与统计学:广义的说,机器学习的核心是统计推论。所以机器学习的大鳄不少都是统计学大师,如迈克尔乔丹,杨乐坤,辛顿等。机器学习中大量的用到贝叶斯公式,隐马尔科夫模型等等。

固然,物理很重要,而且我建议,具有大专物理基础的你,不要耗费太多时间去刷语文书,这是南辕北辙,最好的办法还是击溃黄龙学习机器学习算法,到了看不懂的地方再去补充相应的物理知识ai入门视频教程,哈佛的教程里就有大量的语文补充材料,好多时侯读明白这种补充材料就够了。

34..项目经验

一个误区:好多菜鸟初学机器学习,上来就追求复杂的深度学习模型和高大上的算法如AlexNet,ResNet。tensorflow和keras各类API全部调用一遍,却不晓得自己在干哪些,也称掉包侠。

一个观点:脱离实际业务和数据的算法都是空中楼阁。

一条路径:根据我的学习经验,从数据清洗到特点工程,再用最传统的算法把整个流程走一遍,不断的比较和尝试各类算法,把特点和算法搞透,才是最快最靠谱的学习技巧。

两个项目:美国的Kaggle和阿里云天池都是获取项目经验的好途径。我的建议是每位入门机器学习的人都应当出席两个项目。一个传统机器学习应用场景的项目,如阿里联通推荐算法。通过传统应用场景熟悉逻辑斯特回归,支持向量机和梯度提高决策树等算法。一个深度学习应用场景的项目,如癌症辨识和确诊,通过深度学习应用场景熟悉深度学习各类算法的优势和应用场景。

就说那么多,你们放手去干吧!美丽的天使在远方召唤你,勇敢的少年啊,快去创造奇迹!

© 版权声明
THE END
喜欢就支持一下吧
点赞51赞赏 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情代码图片

    暂无评论内容