去哪里可以找到深度学习的资料呢?

2020-08-20 09:21发布

2条回答
是开心果呀 - 热爱生活
2楼 · 2020-08-20 10:13

想要了解深度学习的课程,可以到某公去看看,该课程是与中科院合作推出的,师资和课程内容都很强。

007
3楼 · 2020-09-09 10:06




本文是转载了别人的博客,然后还加上了自己到淘宝上买的百度云盘资料(还包括一些数据挖掘,大数据之类的教程)。


编者按:本文收集了百来篇关于机器学习和深度学习的资料,含各种文档,视频,源码等。而且原文也会不定期的更新,望看到文章的朋友能够学到更多。


《BriefHistoryofMachineLearning》


介绍:这是一篇介绍机器学习历史的文章,介绍很全面,从感知机、神经网络、决策树、SVM、Adaboost到随机森林、DeepLearning.


《DeepLearninginNeuralNetworks:AnOverview》


介绍:这是瑞士人工智能实验室JurgenSchmidhuber写的最新版本《神经网络与深度学习综述》本综述的特点是以时间排序,从1940年开始讲起,到60-80年代,80-90年代,一直讲到2000年后及最近几年的进展。涵盖了deeplearning里各种tricks,引用非常全面.


《AGentleIntroductiontoScikit-Learn:APythonMachineLearning

Library》


介绍:这是一份python机器学习库,如果您是一位python工程师而且想深入的学习机器学习.那么这篇文章或许能够帮助到你.


《HowtoLayoutandManageYourMachineLearningProject》


介绍:这一篇介绍如果设计和管理属于你自己的机器学习项目的文章,里面提供了管理模版、数据管理与实践方法.


《MachineLearningisFun!》


介绍:如果你还不知道什么是机器学习,或则是刚刚学习感觉到很枯燥乏味。那么推荐一读。这篇文章已经被翻译成中文,如果有兴趣可以移步 http://blog.jobbole.com/67616/


《R语言参考卡片》


介绍:R语言是机器学习的主要语言,有很多的朋友想学习R语言,但是总是忘记一些函数与关键字的含义。那么这篇文章或许能够帮助到你


《ChoosingaMachineLearningClassifier》


介绍:我该如何选择机器学习算法,这篇文章比较直观的比较了NaiveBayes,LogisticRegression,SVM,决策树等方法的优劣,另外讨论了样本大小、Feature与Model权衡等问题。此外还有已经翻译了的版本:http://www.52ml.net/15063.html


《AnIntroductiontoDeepLearning:FromPerceptronstoDeepNetworks》


介绍:深度学习概述:从感知机到深度网络,作者对于例子的选择、理论的介绍都很到位,由浅入深。翻译版本:http://www.cnblogs.com/xiaowanyer/p/3701944.html


《TheLIONWay:MachineLearningplusIntelligentOptimization》


介绍:<机器学习与优化>这是一本机器学习的小册子,短短300多页道尽机器学习的方方面面.图文并茂,生动易懂,没有一坨坨公式的烦恼.适合新手入门打基础,也适合老手温故而知新.比起MLAPP/PRML等大部头,也许这本你更需要!具体内容推荐阅读:http://intelligent-optimization.org/LIONbook/


《深度学习与统计学习理论》


介绍:作者是来自百度,不过他本人已经在2014年4月份申请离职了。但是这篇文章很不错如果你不知道深度学习与支持向量机/统计学习理论有什么联系?那么应该立即看看这篇文章.


《计算机科学中的数学》


介绍:这本书是由谷歌公司和MIT共同出品的计算机科学中的数学:MathematicsforComputerScience,EricLehmanetal2013。分为5大部分:1)证明,归纳。2)结构,数论,图。3)计数,求和,生成函数。4)概率,随机行走。5)递归。等等


《信息时代的计算机科学理论(FoundationsofDataScience)》


介绍:信息时代的计算机科学理论,目前国内有纸质书购买,iTunes购买


《DataSciencewithR》


介绍:这是一本由雪城大学新编的第二版《数据科学入门》教材:偏实用型,浅显易懂,适合想学习R语言的同学选读。


《TwentyQuestionsforDonaldKnuth》


介绍:这并不是一篇文档或书籍。这是篇向图灵奖得主DonaldKnuth提问记录稿:近日,CharlesLeiserson,AlAho,JonBentley等大神向Knuth提出了20个问题,内容包括TAOCP,P/NP问题,图灵机,逻辑,以及为什么大神不用电邮等等。


《AutomaticConstructionandNatural-LanguageDescriptionofNonparametricRegressionModels》


介绍:不会统计怎么办?不知道如何选择合适的统计模型怎么办?那这篇文章你的好好读一读了麻省理工JoshuaB.Tenenbaum和剑桥ZoubinGhahramani合作,写了一篇关于automaticstatistician的文章。可以自动选择回归模型类别,还能自动写报告...


《ICLR2014论文集》


介绍:对深度学习和representationlearning最新进展有兴趣的同学可以了解一下


《IntroductiontoInformationRetrieval》


介绍:这是一本信息检索相关的书籍,是由斯坦福Manning与谷歌副总裁Raghavan等合著的IntroductiontoInformationRetrieval一直是北美最受欢迎的信息检索教材之一。最近作者增加了该课程的幻灯片和作业。IR相关资源:http://www-nlp.stanford.edu/IR-book/information-retrieval.html


《Machinelearningin10pictures》


介绍:DenizYuret用10张漂亮的图来解释机器学习重要概念:1.Bias/VarianceTradeoff2.Overfitting3.Bayesian/Occam'srazor4.Featurecombination5.Irrelevantfeature6.Basisfunction7.Discriminative/Generative8.Lossfunction9.Leastsquares10.Sparsity.很清晰


《雅虎研究院的数据集汇总》


介绍:雅虎研究院的数据集汇总:包括语言类数据,图与社交类数据,评分与分类数据,计算广告学数据,图像数据,竞赛数据,以及系统类的数据。


《AnIntroductiontoStatisticalLearningwithApplicationsinR》


介绍:这是一本斯坦福统计学著名教授TrevorHastie和RobertTibshirani的新书,并且在2014年一月已经开课:https://class.stanford.edu/courses/HumanitiesScience/StatLearning/Winter2014/about


BestMachineLearningResourcesforGettingStarted


介绍:机器学习最佳入门学习资料汇总是专为机器学习初学者推荐的优质学习资源,帮助初学者快速入门。而且这篇文章的介绍已经被翻译成中文版。如果你不怎么熟悉,那么我建议你先看一看中文的介绍。


Mydeeplearningreadinglist


介绍:主要是顺着Bengio的PAMIreview的文章找出来的。包括几本综述文章,将近100篇论文,各位山头们的Presentation。全部都可以在google上找到。


Cross-LanguageInformationRetrieval


介绍:这是一本书籍,主要介绍的是跨语言信息检索方面的知识。理论很多


探索推荐引擎内部的秘密,第1部分:推荐引擎初探


介绍:本文共有三个系列,作者是来自IBM的工程师。它主要介绍了推荐引擎相关算法,并帮助读者高效的实现这些算法。探索推荐引擎内部的秘密,第2部分:深度推荐引擎相关算法-协同过滤,探索推荐引擎内部的秘密,第

3部分:深度推荐引擎相关算法-聚类


《Adviceforstudentsofmachinelearning》


介绍:康奈尔大学信息科学系助理教授DavidMimno写的《对机器学习初学者的一点建议》,写的挺实际,强调实践与理论结合,最后还引用了冯·诺依曼的名言:"Youngman,inmathematicsyoudon'tunderstandthings.Youjustgetusedtothem."


分布式并行处理的数据


介绍:这是一本关于分布式并行处理的数据《ExplorationsinParallelDistributedProcessing:AHandbookofModels,Programs,andExercises》,作者是斯坦福的JamesL.McClelland。着重介绍了各种神级网络算法的分布式实现,做DistributedDeepLearning的童鞋可以参考下


《“机器学习”是什么?》


介绍:【“机器学习”是什么?】JohnPlatt是微软研究院杰出科学家,17年来他一直在机器学习领域耕耘。近年来机器学习变得炙手可热,Platt和同事们遂决定开设博客,向公众介绍机器学习的研究进展。机器学习是什么,被应用在哪里?来看Platt的这篇博文


《2014年国际机器学习大会ICML2014论文》


介绍:2014年国际机器学习大会(ICML)已经于6月21-26日在国家会议中心隆重举办。本次大会由微软亚洲研究院和清华大学联手主办,是这个有着30多年历史并享誉世界的机器学习领域的盛会首次来到中国,已成功吸引海内外1200多位学者的报名参与。干货很多,值得深入学习下


《MachineLearningforIndustry:ACaseStudy》


介绍:这篇文章主要是以LearningtoRank为例说明企业界机器学习的具体应用,RankNet对NDCG之类不敏感,加入NDCG因素后变成了LambdaRank,同样的思想从神经网络改为应用到BoostedTree模型就成就了LambdaMART。Chirs

Burges,微软的机器学习大神,Yahoo2010LearningtoRankChallenge第一名得主,排序模型方面有RankNet,LambdaRank,LambdaMART,尤其以LambdaMART最为突出,代表论文为: From

RankNettoLambdaRanktoLambdaMART:AnOverview 此外,Burges还有很多有名的代表作,比如:ATutorialonSupportVectorMachinesforPatternRecognition


SomeNotesonAppliedMathematicsforMachineLearning


100BestGitHub:DeepLearning


介绍:100BestGitHub:DeepLearning


《UFLDL-斯坦福大学AndrewNg教授“DeepLearning”教程》


介绍:本教程将阐述无监督特征学习和深度学习的主要观点。通过学习,你也将实现多个功能学习/深度学习算法,能看到它们为你工作,并学习如何应用/适应这些想法到新问题上。本教程假定机器学习的基本知识(特别是熟悉的监督学习,逻辑回归,梯度下降的想法),如果你不熟悉这些想法,我们建议你去这里机器学习课程,并先完成第

II,III,IV章(到逻辑回归)。此外这关于这套教程的源代码在github上面已经有python版本了 UFLDLTutorialCode


*《DeepLearningforNaturalLanguageProcessingand

RelatedApplications》


介绍:这份文档来自微软研究院,精髓很多。如果需要完全理解,需要一定的机器学习基础。不过有些地方会让人眼前一亮,毛塞顿开。


UnderstandingConvolutions


介绍:这是一篇介绍图像卷积运算的文章,讲的已经算比较详细的了


《MachineLearningSummerSchool》


介绍:每天请一个大牛来讲座,主要涉及机器学习,大数据分析,并行计算以及人脑研究。https://www.youtube.com/user/smolix (需FQ)


《AwesomeMachineLearning》


介绍:一个超级完整的机器学习开源库总结,如果你认为这个碉堡了,那后面这个列表会更让你惊讶:【AwesomeAwesomeness】,国内已经有热心的朋友进行了翻译中文介绍,机器学习数据挖掘免费电子书


斯坦福《自然语言处理》课程视频


介绍:ACL候任主席、斯坦福大学计算机系ChrisManning教授的《自然语言处理》课程所有视频已经可以在斯坦福公开课网站上观看了(如Chrome不行,可用IE观看)作业与测验也可以下载。


《DeepLearningandShallowLearning》


介绍:对比DeepLearning和ShallowLearning的好文,来着浙大毕业、MIT读博的ChiyuanZhang的博客。


《RecommendingmusiconSpotifywithdeeplearning》


介绍:利用卷积神经网络做音乐推荐。


《NeuralNetworksandDeepLearning》


介绍:神经网络的免费在线书,已经写了三章了,还有对应的开源代码:https://github.com/mnielsen/neural-networks-and-deep-learning 爱好者的福音。


《JavaMachineLearning》


介绍:Java机器学习相关平台和开源的机器学习库,按照大数据、NLP、计算机视觉和DeepLearning分类进行了整理。看起来挺全的,Java爱好者值得收藏。


《MachineLearningTheory:AnIntroductoryPrimer》


介绍:机器学习最基本的入门文章,适合零基础者


《机器学习常见算法分类汇总》


介绍:机器学习的算法很多。很多时候困惑人们都是,很多算法是一类算法,而有些算法又是从其他算法中延伸出来的。这里,我们从两个方面来给大家介绍,第一个方面是学习的方式,第二个方面是算法的类似性。


《机器学习经典论文/survey合集》


介绍:看题目你已经知道了是什么内容,没错。里面有很多经典的机器学习论文值得仔细与反复的阅读。


《机器学习视频库》


介绍:视频由加州理工学院(Caltech)出品。需要英语底子。


《机器学习经典书籍》


介绍:总结了机器学习的经典书籍,包括数学基础和算法理论的书籍,可做为入门参考书单。


《16FreeeBooksOnMachineLearning》


介绍:16本机器学习的电子书,可以下载下来在pad,手机上面任意时刻去阅读。不多我建议你看完一本再下载一本。


《ALargesetofMachineLearningResourcesforBeginnerstoMavens》


介绍:标题很大,从新手到专家。不过看完上面所有资料。肯定是专家了


《机器学习最佳入门学习资料汇总》


介绍:入门的书真的很多,而且我已经帮你找齐了。


《Sibyl》


介绍:Sibyl是一个监督式机器学习系统,用来解决预测方面的问题,比如YouTube的视频推荐。


《DeepLearning》


介绍:YoshuaBengio,IanGoodfellow,AaronCourville著


《NeuralNetwork&TextMining》


介绍:关于(Deep)NeuralNetworks在NLP和TextMining方面一些paper的总结


《前景目标检测1(总结)》


介绍:计算机视觉入门之前景目标检测1(总结)


《行人检测》


介绍:计算机视觉入门之行人检测


《DeepLearning–importantresourcesforlearningandunderstanding》


介绍:Importantresourcesforlearningandunderstanding.Isawesome


《MachineLearningTheory:AnIntroductoryPrimer》


介绍:这又是一篇机器学习初学者的入门文章。值得一读


《NeuralNetworksandDeepLearning》


介绍:在线NeuralNetworksandDeepLearning电子书


《Python

网页爬虫&文本处理&科学计算&机器学习&数据挖掘兵器谱》


介绍:python的17个关于机器学习的工具




《神奇的伽玛函数(上)》


介绍:下集在这里神奇的伽玛函数(下)


《分布式机器学习的故事》


介绍:作者王益目前是腾讯广告算法总监,王益博士毕业后在google任研究。这篇文章王益博士7年来从谷歌到腾讯对于分布机器学习的所见所闻。值得细读


《机器学习提升之道(Level-UpYourMachineLearning)》


介绍:把机器学习提升的级别分为0~4级,每级需要学习的教材和掌握的知识。这样,给机器学习者提供一个上进的路线图,以免走弯路。另外,整个网站都是关于机器学习的,资源很丰富。


《MachineLearningSurveys》


介绍:机器学习各个方向综述的网站


《DeepLearningReadinglist》


介绍:深度学习阅资源列表


《DeepLearning:MethodsandApplications》


介绍:这是一本来自微的研究员liPeng和DongYu所著的关于深度学习的方法和应用的电子书


《MachineLearningSummerSchool2014》


介绍:2014年七月CMU举办的机器学习夏季课刚刚结束有近50小时的视频、十多个PDF版幻灯片,覆盖深度学习,贝叶斯,分布式机器学习,伸缩性等热点话题。所有13名讲师都是牛人:包括大牛TomMitchell(他的[机器学习]是名校的常用教材),还有CMU李沐.(1080P高清哟)


《Sibyl:来自Google的大规模机器学习系统》


介绍:在今年的IEEE/IFIP可靠系统和网络(DSN)国际会议上,Google软件工程师TusharChandra做了一个关于Sibyl系统的主题演讲。Sibyl是一个监督式机器学习系统,用来解决预测方面的问题,比如YouTube的视频推荐。详情请阅读 googlesibyl


《Buildingadeeperunderstandingofimages》


介绍:谷歌研究院的ChristianSzegedy在谷歌研究院的博客上简要地介绍了他们今年参加ImageNet取得好成绩的GoogLeNet系统.是关于图像处理的。


《Bayesiannetwork与python概率编程实战入门》


介绍:贝叶斯学习。如果不是很清可看看概率编程语言与贝叶斯方法实践


《AMA:MichaelIJordan》


介绍:网友问伯克利机器学习大牛、美国双料院士MichaelI.Jordan:"如果你有10亿美金,你怎么花?Jordan:"我会用这10亿美金建造一个NASA级别的自然语言处理研究项目。"


《机器学习&数据挖掘笔记_16(常见面试之机器学习算法思想简单梳理)》


介绍:常见面试之机器学习算法思想简单梳理


《文本与数据挖掘视频汇总》


介绍:Videolectures上最受欢迎的25个文本与数据挖掘视频汇总


《怎么选择深度学习的GPUs》


介绍:在Kaggle上经常取得不错成绩的TimDettmers介绍了他自己是怎么选择深度学习的GPUs,以及个人如何构建深度学习的GPU集群: http://t.cn/RhpuD1G


《对话机器学习大神MichaelJordan:深度模型》


介绍:对话机器学习大神MichaelJordan


《DeepLearning和KnowledgeGraph引爆大数据革命》


介绍:还有2,3部分。http://blog.sina.com.cn/s/blog_46d0a3930101gs5h.html


《DeepLearning教程翻译》


介绍:是Stanford教授AndrewNg的DeepLearning教程,国内的机器学习爱好者很热心的把这个教程翻译成了中文。如果你英语不好,可以看看这个


《DeepLearning101》


介绍:因为近两年来,深度学习在媒体界被炒作很厉害(就像大数据)。其实很多人都还不知道什么是深度学习。这篇文章由浅入深。告诉你深度学究竟是什么!


《UFLDLTutorial》


介绍:这是斯坦福大学做的一免费课程(很勉强),这个可以给你在深度学习的路上给你一个学习的思路。里面提到了一些基本的算法。而且告诉你如何去应用到实际环境中。中文版


《TorontoDeepLearningDemos》


介绍:这是多伦多大学做的一个深度学习用来识别图片标签/图转文字的demo。是一个实际应用案例。有源码


《Deeplearningfromthebottomup》


介绍:机器学习模型,阅读这个内容需要有一定的基础。


《R工具包的分类汇总》


介绍:(CRANTaskViews,34种常见任务,每个任务又各自分类列举若干常用相关工具包)例如:机器学习,自然语言处理,时间序列分析,空间信息分析,多重变量分析,计量经济学,心理统计学,社会学统计,化学计量学,环境科学,药物代谢动力学等


《机器学习常见算法分类汇总》


介绍:机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。本文为您总结一下常见的机器学习算法,以供您在工作和学习中参考.


《DeepLearning(深度学习)学习笔记整理系列》


介绍:很多干货,而且作者还总结了好几个系列。另外还作者还了一个文章导航.非常的感谢作者总结。


DeepLearning(深度学习)学习笔记整理系列之(二)


DeepLearning(深度学习)学习笔记整理系列之(三)


DeepLearning(深度学习)学习笔记整理系列之(四)


DeepLearning(深度学习)学习笔记整理系列之(五)


DeepLearning(深度学习)学习笔记整理系列之(六)


DeepLearning(深度学习)学习笔记整理系列之(七)


DeepLearning(深度学习)学习笔记整理系列之(八)


《TutorialsSessionA-DeepLearningforComputerVision》


介绍:传送理由:RobFergus的用深度学习做计算机是觉的NIPS2013教程。有mp4,mp3,pdf各种下载 他是纽约大学教授,目前也在Facebook工作,他2014年的8篇论文


《FudanNLP》


介绍:FudanNLP,这是一个复旦大学计算机学院开发的开源中文自然语言处理(NLP)工具包FudanNLP里包含中文分词、关键词抽取、命名实体识别、词性标注、时间词抽取、语法分析等功能,对搜索引擎文本分析等极为有价值。


《OpenSourcingml-ease》


介绍:LinkedIn开源的机器学习工具包,支持单机,Hadoopcluster,和Sparkcluster重点是logisticregression算法


《机器学习周刊》


介绍:对于英语不好,但又很想学习机器学习的朋友。是一个大的福利。机器学习周刊目前主要提供中文版,还是面向广大国内爱好者,内容涉及机器学习、数据挖掘、并行系统、图像识别、人工智能、机器人等等。谢谢作者


《线性代数》


介绍:《线性代数》是《机器学习》的重要数学先导课程。其实《线代》这门课讲得浅显易懂特别不容易,如果一上来就讲逆序数及罗列行列式性质,很容易让学生失去学习的兴趣。我个人推荐的最佳《线性代数》课程是麻省理工GilbertStrang教授的课程。 课程主页


《Big-data》


介绍:大数据数据处理资源、工具不完备列表,从框架、分布式编程、分布式文件系统、键值数据模型、图数据模型、数据可视化、列存储、机器学习等。很赞的资源汇总。


《machinelearningforsmartdummies》


介绍:雅虎邀请了一名来自本古里安大学的访问学者,制作了一套关于机器学习的系列视频课程。本课程共分为7期,详细讲解了有关SVM,boosting,nearestneighbors,decisiontrees等常规机器学习算法的理论基础知识。


《Entanglement-BasedQuantumMachineLearning》


介绍:应对大数据时代,量子机器学习的第一个实验 paper下载


《HowaMathGeniusHackedOkCupidtoFindTrueLove》


介绍:Wired杂志报道了UCLA数学博士ChrisMcKinlay(图1)通过大数据手段+机器学习方法破解婚恋网站配对算法找到真爱的故事,通过Python脚本控制着12个账号,下载了婚恋网站2万女用户的600万问题答案,对他们进行了统计抽样及聚类分析(图2,3),最后终于收获了真爱。科技改变命运!


《UnderactuatedRobotics》


介绍:MIT的UnderactuatedRobotics于2014年10月1日开课,该课属于MIT研究生级别的课程,对机器人和非线性动力系统感兴趣的朋友不妨可以挑战一下这门课程!


《mllib实践经验(1)》


介绍:mllib实践经验分享


《GoogleTurnsToDeepLearningClassificationToFightWebSpam》


介绍:Google用DeepLearning做的antispam(反垃圾邮件)


《NLP常用信息资源》


介绍:NLP常用信息资源* 《NLP常用信息资源》


《机器学习速查表》


介绍:机器学习速查表


《BestPapersvs.TopCitedPapersinComputerScience》


介绍:从1996年开始在计算机科学的论文中被引用次数最多的论文


《InfiniTAM:基于深度图像的体数据集成框架》


介绍:把今年的一个ACMTrans.onGraphics(TOG)论文中的代码整理为一个开源的算法框架,共享出来了。欢迎大家使用。可以实时的采集3D数据、重建出三维模型。Onlinelearning,GPURandomforest,GPUCRF也会后续公开。


《Hacker'sguidetoNeuralNetworks》


介绍:【神经网络黑客指南】现在,最火莫过于深度学习(DeepLearning),怎样更好学习它?可以让你在浏览器中,跑起深度学习效果的超酷开源项目convnetjs作者karpathy告诉你,最佳技巧是,当你开始写代码,一切将变得清晰。他刚发布了一本图书,不断在线更新


《BuildingaProductionMachineLearningInfrastructure》


介绍:前Google广告系统工程师JoshWills讲述工业界和学术界机器学习的异同,大实话


《DeepLearningSentimentAnalysisforMovieReviewsusingNeo4j》


介绍:使用 Neo4j 做电影评论的情感分析。


《DeepLearning.University–AnAnnotatedDeepLearningBibliography》


介绍:不仅是资料,而且还对有些资料做了注释。


《Aprimerondeepinglearning》


介绍:深度学习入门的初级读本


《Machinelearningisteachingusthesecrettoteaching》


介绍:机器学习教会了我们什么?


《scikit-learn:用于机器学习的Python模块》


介绍:scikit-learn是在SciPy基础上构建的用于机器学习的Python模块。


《对话机器学习大神MichaelJordan:解析领域中各类模型》


介绍:乔丹教授(MichaelI.Jordan)教授是机器学习领域神经网络的大牛,他对深度学习、神经网络有着很浓厚的兴趣。因此,很多提问的问题中包含了机器学习领域的各类模型,乔丹教授对此一一做了解释和展望。


《A*搜索算法的可视化短教程》


介绍:A*搜索是人工智能基本算法,用于高效地搜索图中两点的最佳路径,核心是g(n)+h(n):g(n)是从起点到顶点n的实际代价,h(n)是顶点n到目标顶点的估算代价。合集


《基于云的自然语言处理开源项目FudanNLP》


介绍:本项目利用了MicrosoftAzure,可以在几分种内完成NLPonAzureWebsite的部署,立即开始对FNLP各种特性的试用,或者以RESTAPI的形式调用FNLP的语言分析功能


《吴立德《概率主题模型&数据科学基础》》


介绍:现任复旦大学首席教授、计算机软件博士生导师。计算机科学研究所副所长.内部课程


《机器学习入门资源不完全汇总》》


介绍:好东西的干货真的很多


《收集从2014年开始深度学习文献》


介绍:从硬件、图像到健康、生物、大数据、生物信息再到量子计算等,AmundTveit等维护了一个DeepLearning.University小项目:收集从2014年开始深度学习文献,相信可以作为深度学习的起点,github


《EMNLP上两篇关于股票趋势的应用论文》


介绍:EMNLP上两篇关于 stocktrend 用到了deepmodel组织特征; Exploiting

SocialRelationsandSentimentforStockPrediction 用到了stocknetwork。


《Bengio组(蒙特利尔大学LISA组)深度学习教程》


介绍:作者是深度学习一线大牛Bengio组写的教程,算法深入显出,还有实现代码,一步步展开。


《学习算法的NeuralTuringMachine》


介绍:许多传统的机器学习任务都是在学习function,不过谷歌目前有开始学习算法的趋势。谷歌另外的这篇学习Python程序的 LearningtoExecute 也有相似之处


《LearningtoRankforInformationRetrievalandNaturalLanguageProcessing》


介绍:作者是华为技术有限公司,诺亚方舟实验室,首席科学家的李航博士写的关于信息检索与自然语言处理的文章


《Rumorhasit:IdentifyingMisinformationinMicroblogs》


介绍:利用机用器学习在谣言的判别上的应用,此外还有两个。一个是识别垃圾与虚假信息的 paper.还有一个是网络舆情及其分析技术


《R机器学习实践》


介绍:该课程是网易公开课的收费课程,不贵,超级便宜。主要适合于对利用R语言进行机器学习,数据挖掘感兴趣的人。




《大数据分析:机器学习算法实现的演化》


介绍:本章中作者总结了三代机器学习算法实现的演化:第一代非分布式的,第二代工具如Mahout和Rapidminer实现基于Hadoop的扩展,第三代如Spark和Storm实现了实时和迭代数据处理。BIGDATAANALYTICS

BEYONDHADOOP


《图像处理,分析与机器视觉》


介绍:讲计算机视觉的四部奇书(应该叫经典吧)之一,另外三本是Hartley的《多图几何》、Gonzalez的《数字图像处理》、RafaelC.Gonzalez/RichardE.Woods的《数字图像处理》


《LinkedIn最新的推荐系统文章Browsemaps》


介绍:里面基本没涉及到具体算法,但作者介绍了CF在LinkedIn的很多应用,以及他们在做推荐过程中获得的一些经验。最后一条经验是应该监控log数据的质量,因为推荐的质量很依赖数据的质量!


《初学者如何查阅自然语言处理(NLP)领域学术资料》


介绍:初学者如何查阅自然语言处理(NLP)领域学术资料


《树莓派的人脸识别教程》


介绍:用树莓派和相机模块进行人脸识别


《利用深度学习与大数据构建对话系统》


介绍:如何利用深度学习与大数据构建对话系统


《经典论文LeoBreiman:StatisticalModeling:TheTwoCultures》


介绍:FrancisBach合作的有关稀疏建模的新综述(书):SparseModelingforImageandVisionProcessing,内容涉及Sparsity,DictionaryLearning,PCA,MatrixFactorization等理论,以及在图像和视觉上的应用,而且第一部分关于Whydoesthel1-norminducesparsity的解释也很不错。


《ReproducingKernelHilbertSpace》


介绍:RKHS是机器学习中重要的概念,其在largemargin分类器上的应用也是广为熟知的。如果没有较好的数学基础,直接理解RKHS可能会不易。本文从基本运算空间讲到Banach和Hilbert空间,深入浅出,一共才12页。


《Hacker'sguidetoNeuralNetworks》


介绍:许多同学对于机器学习及深度学习的困惑在于,数学方面已经大致理解了,但是动起手来却不知道如何下手写代码。斯坦福深度学习博士AndrejKarpathy写了一篇实战版本的深度学习及机器学习教程,手把手教你用Javascript写神经网络和SVM.


《【语料库】语料库资源汇总》


介绍:【语料库】语料库资源汇总


《机器学习算法之旅》


介绍:本文会过一遍最流行的机器学习算法,大致了解哪些方法可用,很有帮助。


《ReproducibleResearchinComputationalScience》


介绍:这个里面有很多关于机器学习、信号处理、计算机视觉、深入学习、神经网络等领域的大量源代码(或可执行代码)及相关论文。科研写论文的好资源


《NYU2014年的深度学习课程资料》


介绍:NYU2014年的深度学习课程资料,有视频


《计算机视觉数据集不完全汇总》


介绍:计算机视觉数据集不完全汇总


《MachineLearningOpenSourceSoftware》


介绍:机器学习开源软件


《LIBSVM》


介绍:ALibraryforSupportVectorMachines


《SupportVectorMachines》


介绍:数据挖掘十大经典算法之一


《100BestGitHub:DeepLearning》


介绍:github上面100个非常棒的项目


《加州大学欧文分校(UCI)机器学习数据集仓库》


介绍:当前加州大学欧文分校为机器学习社区维护着306个数据集。查询数据集


《AndrejKarpathy个人主页》


介绍:AndrejKarpathy是斯坦福大学LiFei-Fei的博士生,使用机器学习在图像、视频语义分析领域取得了科研和工程上的突破,发的文章不多,但每个都很扎实,在每一个问题上都做到了state-of-art.


《AndrejKarpathy的深度强化学习演示》


介绍:AndrejKarpathy的深度强化学习演示,论文在这里


《CIKM数据挖掘竞赛夺冠算法-陈运文》


介绍:CIKMCup(或者称为CIKMCompetition)是ACMCIKM举办的国际数据挖掘竞赛的名称。


《GeoffreyE.Hinton》


介绍:杰弗里·埃弗里斯特·辛顿FRS是一位英国出生的计算机学家和心理学家,以其在神经网络方面的贡献闻名。辛顿是反向传播算法和对比散度算法的发明人之一,也是深度学习的积极推动者.


《自然语言处理的深度学习理论与实际》


介绍:微软研究院深度学习技术中心在CIKM2014上关于《自然语言处理的深度学习理论与实际》教学讲座的幻灯片


《用大数据和机器学习做股票价格预测》


介绍:本文基于<支持向量机的高频限价订单的动态建模>采用了ApacheSpark和SparkMLLib从纽约股票交易所的订单日志数据构建价格运动预测模型。(股票有风险,投资谨慎)GitHub源代码托管地址.


《关于机器学习的若干理论问题》


介绍:徐宗本院士将于热爱机器学习的小伙伴一起探讨有关于机器学习的几个理论性问题,并给出一些有意义的结论。最后通过一些实例来说明这些理论问题的物理意义和实际应用价值。


《深度学习在自然语言处理的应用》


介绍:作者还著有《这就是搜索引擎:核心技术详解》一书,主要是介绍应用层的东西


《UndergraduatemachinelearningatUBC》


介绍:机器学习课程


《人脸识别必读的N篇文章》


介绍:人脸识别必读文章推荐


《推荐系统经典论文文献及业界应用》


介绍:推荐系统经典论文文献


《人脸识别必读的N篇文章》


介绍:人脸识别必读文章推荐


《第十二届中国"机器学习及其应用"研讨会PPT》


介绍:第十二届中国"机器学习及其应用"研讨会PPT


《统计机器学习》


介绍:统计学习是关于计算机基于数据构建的概率统计模型并运用模型对数据进行预测和分析的一门科学,统计学习也成为统计机器学习。课程来自上海交通大学


《机器学习导论》


介绍:机器学习的目标是对计算机编程,以便使用样本数据或以往的经验来解决给定的问题.


《CIKM2014主题报告的幻灯片》


介绍:CIKM2014JeffDean、QiLu、GerhardWeikum的主题报告的幻灯片,AlexSmola、LimsoonWong、TongZhang、Chih-JenLin的IndustryTrack报告的幻灯片


《人工智能和机器学习领域有趣的开源项目》


介绍:部分中文列表


《机器学习经典算法详解及Python实现--基于SMO的SVM分类器》


介绍:此外作者还有一篇元算法、AdaBoost python实现文章


《NumericalOptimization:UnderstandingL-BFGS》


介绍:加州伯克利大学博士AriaHaghighi写了一篇超赞的数值优化博文,从牛顿法讲到拟牛顿法,再讲到BFGS以及L-BFGS,图文并茂,还有伪代码。强烈推荐。


《简明深度学习方法概述(一)》


介绍:还有续集简明深度学习方法概述(二)


《Rlanguageforprogrammers》


介绍:R语言程序员私人定制版


《谷歌地图解密:大数据与机器学习的结合》


介绍:谷歌地图解密


《空间数据挖掘常用方法》


介绍:空间数据挖掘常用方法


《UseGoogle'sWord2Vecformoviereviews》


介绍:Kaggle新比赛”Whenbagofwordsmeetsbagsofpopcorn“aka”边学边用word2vec和deeplearning做NLP“里面全套教程教一步一步用python和gensim包的word2vec模型,并在实际比赛里面比调参数和清数据。如果已装过gensim不要忘升级


《PyNLPIR》


介绍:PyNLPIR提供了NLPIR/ICTCLAS汉语分词的Python接口,此外 Zhon 提供了常用汉字常量,如CJK字符和偏旁,中文标点,拼音,和汉字正则表达式(如找到文本中的繁体字)


《深度卷积神经网络下围棋》


介绍:这文章说把最近模型识别上的突破应用到围棋软件上,打16万张职业棋谱训练模型识别功能。想法不错。训练后目前能做到不用计算,只看棋盘就给出下一步,大约10级棋力。但这篇文章太过乐观,说什么人类的最后一块堡垒马上就要跨掉了。话说得太早。不过,如果与别的软件结合应该还有潜力可挖。@万精油墨绿


《NIPS审稿实验》


介绍:UTAustin教授EricPrice关于今年NIPS审稿实验的详细分析,他表示,根据这次实验的结果,如果今年NIPS重新审稿的话,会有一半的论文被拒。


《2014年最佳的大数据,数据科学文章》


介绍:KDNuggets分别总结了2014年14个阅读最多以及分享最多的文章。我们从中可以看到多个主题——深度学习,数据科学家职业,教育和薪酬,学习数据科学的工具比如R和Python以及大众投票的最受欢迎的数据科学和数据挖掘语言


《机器学习经典算法详解及Python实现--线性回归(LinearRegression)算法》


介绍:Python实现线性回归,作者还有其他很棒的文章推荐可以看看


《2014中国大数据技术大会33位核心专家演讲PDF》


介绍:2014中国大数据技术大会33位核心专家演讲PDF下载


《使用RNN和ParagraphVector做情感分析》


介绍:这是T.Mikolov&Y.Bengio最新论文EnsembleofGenerativeandDiscriminativeTechniquesforSentimentAnalysisofMovieReviews,使用RNN和PV在情感分析效果不错,[项目代码](https://github.com/mesnilgr/iclr15)

公布在github(目前是空的)。这意味着Paragraph Vector终于揭开面纱了嘛。


《NLPIR/ICTCLAS2015分词系统大会上的技术演讲》


介绍:NLPIR/ICTCLAS2015分词系统发布与用户交流大会上的演讲,请更多朋友检阅新版分词吧。我们实验室同学的演讲包括:孙梦姝-基于评论观点挖掘的商品搜索技术研究 李然-主题模型


《MachineLearningisFun!》


介绍:ConvexNeuralNetworks解决维数灾难


《CNN的反向求导及练习》


介绍:介绍CNN参数在使用bp算法时该怎么训练,毕竟CNN中有卷积层和下采样层,虽然和MLP的bp算法本质上相同,但形式上还是有些区别的,很显然在完成CNN反向传播前了解bp算法是必须的。此外作者也做了一个资源集:机器学习,深度学习,视觉,数学等


《正则表达式优化成Trie树》


介绍:如果要在一篇文章中匹配十万个关键词怎么办?Aho-Corasick 算法利用添加了返回边的Trie树,能够在线性时间内完成匹配。但如果匹配十万个正则表达式呢?这时候可以用到把多个正则优化成Trie树的方法,如日本人写的 Regexp::Trie


《DeeplearningReadingList》


介绍:深度学习阅读清单


《Caffe》


介绍:Caffe是一个开源的深度学习框架,作者目前在google工作,作者主页 YangqingJia(贾扬清)




《GoogLeNet深度学习模型的Caffe复现》


介绍:2014ImageNet冠军GoogLeNet深度学习模型的Caffe复现模型,GoogleNet论文.


《LambdaNet,Haskell实现的开源人工神经网络库》


介绍:LambdaNetLambdaNet是由Haskell实现的一个开源的人工神经网络库,它抽象了网络创建、训练并使用了高阶函数。该库还提供了一组预定义函数,用户可以采取多种方式组合这些函数来操作现实世界数据。


百度余凯&张潼机器学习视频》


介绍:如果你从事互联网搜索,在线广告,用户行为分析,图像识别,自然语言理解,或者生物信息学,智能机器人,金融预测,那么这门核心课程你必须深入了解。


《杨强在TEDxNanjing谈智能的起源》


介绍:"人工智能研究分许多流派。其中之一以IBM为代表,认为只要有高性能计算就可得到智能,他们的‘深蓝’击败了世界象棋冠军;另一流派认为智能来自动物本能;还有个很强的流派认为只要找来专家,把他们的思维用逻辑一条条写下,放到计算机里就行……"杨强在TEDxNanjing谈智能的起源


《深度RNN/LSTM用于结构化学习0)序列标注ConnectionistTemporalClassificationICML06》


介绍:1)机器翻译 SequencetoSequenceNIPS14 2)成分句法 GRAMMAR

ASFOREIGNLANGUAGE


《DeepLearning实战之word2vec》


介绍:网易有道的三位工程师写的word2vec的解析文档,从基本的词向量/统计语言模型->NNLM->Log-Linear/Log-Bilinear->层次化Log-Bilinear,到CBOW和Skip-gram模型,再到word2vec的各种tricks,公式推导与代码,基本上是网上关于word2vec资料的大合集,对word2vec感兴趣的朋友可以看看


《Machinelearningopensourcesoftware》


介绍:机器学习开源软件,收录了各种机器学习的各种编程语言学术与商业的开源软件.与此类似的还有很多例如:DMOZ-Computers:ArtificialIntelligence:MachineLearning:Software, LIBSVM

--ALibraryforSupportVectorMachines, Weka3:DataMiningSoftwareinJava, scikit-learn:Machine

LearninginPython, NaturalLanguageToolkit:NLTK, MAchine

LearningforLanguagEToolkit, DataMining-FruitfulandFun, OpenSourceComputer

VisionLibrary


《机器学习入门者学习指南》


介绍:作者是计算机研二(写文章的时候,现在是2015年了应该快要毕业了),专业方向自然语言处理.这是一点他的经验之谈.对于入门的朋友或许会有帮助


《ATourofMachineLearningAlgorithms》


介绍:这是一篇关于机器学习算法分类的文章,非常好


《2014年的《机器学习日报》大合集》


介绍:机器学习日报里面推荐很多内容,在这里有一部分的优秀内容就是来自机器学习日报.


《Imageclassificationwithdeeplearning常用模型》


介绍:这是一篇关于图像分类在深度学习中的文章


《自动语音识别:深度学习方法》


介绍:作者与Bengio的兄弟Samy09年合编《自动语音识别:核方法》3)李开复1989年《自动语音识别》专著,其博导、94年图灵奖得主RajReddy作序


《NLP中的中文分词技术》


介绍:作者是360电商技术组成员,这是一篇NLP在中文分词中的应用


《Usingconvolutionalneuralnetstodetectfacialkeypointstutorial》


介绍:使用deeplearning的人脸关键点检测,此外还有一篇 AWS部署教程


《书籍推荐:AdvancedStructuredPrediction》


介绍:由SebastianNowozin等人编纂MIT出版的新书《AdvancedStructuredPrediction》http://t.cn/RZxipKG ,汇集了结构化预测领域诸多牛文,涉及CV、NLP等领域,值得一读。网上公开的几章草稿:一,二,三,四,五


《AnIntroductiontoMatrixConcentrationInequalities》


介绍:Tropp把数学家用高深装逼的数学语言写的矩阵概率不等式用初等的方法写出来,是非常好的手册,领域内的paper各种证明都在用里面的结果。虽说是初等的,但还是非常的难


《Thefreebigdatasourcesyoushouldknow》


介绍:不容错过的免费大数据集,有些已经是耳熟能详,有些可能还是第一次听说,内容跨越文本、数据、多媒体等,让他们伴你开始数据科学之旅吧,具体包括:Data.gov、USCensusBureau、EuropeanUnionOpenDataPortal、Data.gov.uk等


《ABriefOverviewofDeepLearning》


介绍:谷歌科学家、Hinton亲传弟子IlyaSutskever的深度学习综述及实际建议


《ADeepDiveintoRecurrentNeuralNets》


介绍:非常好的讨论递归神经网络的文章,覆盖了RNN的概念、原理、训练及优化等各个方面内容,强烈推荐!本文作者NikhilBuduma还有一篇 DeepLearninginaNutshell 值得推荐


《机器学习:学习资源》


介绍:里面融合了很多的资源,例如竞赛,在线课程,demo,数据整合等。有分类


《Statisticalfoundationsofmachinelearning》


介绍:《机器学习的统计基础》在线版,该手册希望在理论与实践之间找到平衡点,各主要内容都伴有实际例子及数据,书中的例子程序都是用R语言编写的。


《ADeepLearningTutorial:FromPerceptronstoDeepNetworks》


介绍:IVANVASILEV写的深度学习导引:从浅层感知机到深度网络。高可读


《Researchprioritiesforrobustandbeneficialartificialintelligence》


介绍:鲁棒及有益的人工智能优先研究计划:一封公开信,目前已经有StuartRussell,TomDietterich,EricHorvitz,YannLeCun,PeterNorvig,TomMitchell,GeoffreyHinton,ElonMusk等人签署 TheFutureof

LifeInstitute(FLI).这封信的背景是最近霍金和ElonMusk提醒人们注意AI的潜在威胁。公开信的内容是AI科学家们站在造福社会的角度,展望人工智能的未来发展方向,提出开发AI系统的Verification,Validity,Security,Control四点要求,以及需要注意的社会问题。毕竟当前AI在经济领域,法律,以及道德领域相关研究较少。其实还有一部美剧《疑犯追踪》,介绍了

AI的演进从一开始的自我学习,过滤,图像识别,语音识别等判断危险,到第四季的时候出现了机器通过学习成长之后想控制世界的状态。说到这里推荐收看。


《metacademy》


介绍:里面根据词条提供了许多资源,还有相关知识结构,路线图,用时长短等。号称是”机器学习“搜索引擎


《FAIRopensourcesdeep-learningmodulesforTorch》


介绍:Facebook人工智能研究院(FAIR)开源了一系列软件库,以帮助开发者建立更大、更快的深度学习模型。开放的软件库在Facebook被称作模块。用它们替代机器学习领域常用的开发环境Torch中的默认模块,可以在更短的时间内训练更大规模的神经网络模型。


《浅析人脸检测之Haar分类器方法》


介绍:本文虽然是写于2012年,但是这篇文章完全是作者的经验之作。


《如何成为一位数据科学家》


介绍:本文是对《机器学习实战》作者PeterHarrington做的一个访谈。包含了书中部分的疑问解答和一点个人学习建议


《Deeplearningfromthebottomup》


介绍:非常好的深度学习概述,对几种流行的深度学习模型都进行了介绍和讨论


《Hands-OnDataSciencewithRTextMining》


介绍:主要是讲述了利用R语言进行数据挖掘


《UnderstandingConvolutions》


介绍:帮你理解卷积神经网络,讲解很清晰,此外还有两篇 ConvNets:AModularPerspective,Groups

&GroupConvolutions.作者的其他的关于神经网络文章也很棒


《IntroductiontoDeepLearningAlgorithms》


介绍:DeepLearning算法介绍,里面介绍了06年3篇让deeplearning崛起的论文


《LearningDeepArchitecturesforAI》


介绍:一本学习人工智能的书籍,作者是YoshuaBengio,相关国内报道


《GeoffreyE.Hinton个人主页》


介绍:GeoffreyHinton是DeepLearning的大牛,他的主页放了一些介绍性文章和课件值得学习


《PROBABILITYTHEORY:THELOGICOFSCIENCE》


介绍:概率论:数理逻辑书籍


《H2O》


介绍:一个用来快速的统计,机器学习并且对于数据量大的数学库


《ICLR2015会议的arXiv稿件合集》


介绍:在这里你可以看到最近深度学习有什么新动向。


《IntroductiontoInformationRetrieval》


介绍:此书在信息检索领域家喻户晓,除提供该书的免费电子版外,还提供一个 IR资源列表 ,收录了信息检索、网络信息检索、搜索引擎实现等方面相关的图书、研究中心、相关课程、子领域、会议、期刊等等,堪称全集,值得收藏




相关问题推荐

  • 回答 3

    换行。比如,print hello\nworld效果就是helloworld\n就是一个换行符。\是转义的意思,&#39;\n&#39;是换行,&#39;\t&#39;是tab,&#39;\\&#39;是,\ 是在编写程序中句子太长百,人为换行后加上\但print出来是一整行。...

  • 回答 42

    十种常见排序算法一般分为以下几种:(1)非线性时间比较类排序:a. 交换类排序(快速排序、冒泡排序)b. 插入类排序(简单插入排序、希尔排序)c. 选择类排序(简单选择排序、堆排序)d. 归并排序(二路归并排序、多路归并排序)(2)线性时间非比较类排序:...

  • 回答 70
    已采纳

    前景很好,中国正在产业升级,工业机器人和人工智能方面都会是强烈的热点,而且正好是在3~5年以后的时间。难度,肯定高,要求你有创新的思维能力,高数中的微积分、数列等等必须得非常好,软件编程(基础的应用最广泛的语言:C/C++)必须得很好,微电子(数字电...

  • 回答 28

    迭代器与生成器的区别:(1)生成器:生成器本质上就是一个函数,它记住了上一次返回时在函数体中的位置。对生成器函数的第二次(或第n次)调用,跳转到函数上一次挂起的位置。而且记录了程序执行的上下文。生成器不仅记住了它的数据状态,生成器还记住了程序...

  • 回答 9

    python中title( )属于python中字符串函数,返回’标题化‘的字符串,就是单词的开头为大写,其余为小写

  • 回答 6

    第一种解释:代码中的cnt是count的简称,一种电脑计算机内部的数学函数的名字,在Excel办公软件中计算参数列表中的数字项的个数;在数据库( sq| server或者access )中可以用来统计符合条件的数据条数。函数COUNT在计数时,将把数值型的数字计算进去;但是...

  • 回答 1

    head是方法,所以需要取小括号,即dataset.head()显示的则是前5行。data[:, :-1]和data[:, -1]。另外,如果想通过位置取数据,请使用iloc,即dataset.iloc[:, :-1]和dataset.iloc[:, -1],前者表示的是取所有行,但不包括最后一列的数据,结果是个DataFrame。...

  • Python入门简单吗2021-09-23 13:21
    回答 45

    挺简单的,其实课程内容没有我们想象的那么难、像我之前同学,完全零基础,培训了半年,直接出来就工作了,人家还在北京大公司上班,一个月15k,实力老厉害了

  • 回答 4

    Python针对众多的类型,提供了众多的内建函数来处理(内建是相对于导入import来说的,后面学习到包package时,将会介绍),这些内建函数功用在于其往往可对多种类型对象进行类似的操作,即多种类型对象的共有的操作;如果某种操作只对特殊的某一类对象可行,Pyt...

  • 回答 8

     相当于 ... 这里不是注释

  • 回答 4

    还有FIXME

  • 回答 3

    python的两个库:xlrd和xlutils。 xlrd打开excel,但是打开的excel并不能直接写入数据,需要用xlutils主要是复制一份出来,实现后续的写入功能。

  • 回答 8

    单行注释:Python中的单行注释一般是以#开头的,#右边的文字都会被当做解释说明的内容,不会被当做执行的程序。为了保证代码的可读性,一般会在#后面加一两个空格然后在编写解释内容。示例:#  单行注释print(hello world)注释可以放在代码上面也可以放在代...

  • 回答 2

    主要是按行读取,然后就是写出判断逻辑来勘测行是否为注视行,空行,编码行其他的:import linecachefile=open(&#39;3_2.txt&#39;,&#39;r&#39;)linecount=len(file.readlines())linecache.getline(&#39;3_2.txt&#39;,linecount)这样做的过程中发现一个问题,...

  • 回答 4

    或许是里面有没被注释的代码

  • 回答 26

    自学的话要看个人情况,可以先在B站找一下视频看一下

没有解决我的问题,去提问