搜索引擎优化入门与进阶( 3.入门方法与学习路径典型算法:编程语言、工具和环境)
优采云 发布时间: 2022-03-06 17:11搜索引擎优化入门与进阶(
3.入门方法与学习路径典型算法:编程语言、工具和环境)
机器学习进入高级学习路线
参考:
1. 定义
机器学习研究计算机如何模拟人类的学习行为以获取新的知识或技能,并重新组织现有的知识结构以不断改进自己
2. 机器学习问题
分类和回归问题需要用已知结果的数据进行训练,属于“监督学习”;聚类问题不需要已知标签,属于“无监督学习”。
3. 入门和学习路径
典型算法:
编程语言、工具和环境
4. 工作流程如下:将数据抽象成数学问题
特征预处理和特征选择
训练和调整模型诊断
如何确定模型调优的方向和思路?这需要诊断模型的技术。
模型融合
在线运行
从一个数据源出发,即使是使用了很多年的最传统的机器学习算法,也要先走一遍机器学习的整个工作流程,不断尝试各种算法,挖掘出这些数据的价值。是真正积累项目经验的最快、最可靠的学习途径。国外的Kaggle和国内的DataCastle、阿里天池比赛都是不错的平台,可以拿到真实的数据,和数据科学家一起学习和比赛
5. 自学习能力 信息检索、过滤和整合能力
谷歌搜索引擎技能——组合替换搜索关键词、站点搜索、学术文献搜索、PDF 搜索等——是必不可少的。一个好的习惯是寻找信息的原创来源,比如个人网站、公众号、博客、专业网站、书籍等。这样可以找到系统的、不失真的高质量信息。百度查到的技术资料不够好。学习搜索常见的优质信息源:stackoverflow(程序相关)、quora(高质量答案)、wikipedia(系统知识,比维基百科好很多)、知乎(中文,有资料)、网盘搜索(大量免费资源)等。将采集到的网页放入分类好的云采集夹中,并经常整理。这样,无论是在工作还是在家,在电脑前或手机上,你可以找到你喜欢的。采集到的文档、代码、电子书等也放在云网盘中,经常整理。提炼和总结的能力。
经常记笔记并总结所学知识是成长的唯一途径。在云笔记、印象笔记中,提出问题和寻求帮助的能力。
学习正确的提问方式:明确说明你的业务场景和业务需求是什么,已知情况是什么,具体是哪个节点遇到了困难,做了哪些努力。有一个经典的文章告诉你如何通过提问获得帮助:“提问的智慧”的习惯。6. 介绍资源推荐相关资源
首先,coursera是一个很好的学习网站,专注于世界上最好的课程。
• 微积分相关。
微积分:单变量
多元微积分。
• 线性代数。
线性代数。
• 概率和统计。
统计学概论:描述性统计
概率系统分析和应用概率。
• 编程语言。
适合所有人的编程:Python。
DataCamp:通过 R 教程和编码挑战学习 R:R。
• 机器学习方法理论。
《机器学习》:周志华
统计学习(R)
机器学习:强烈推荐,吴恩达老师的课程
机器学习技术:林轩天老师的课相对比较深入,完成作业会提高对机器学习的理解。
自然语言处理:斯坦福大学课程
• 日常阅读资源
@爱可可 - 爱情生活微博。
机器学习日报的电子邮件订阅等高级资源。
• 带有源代码的教程。
scikit-learn 中各种算法的例子
《机器学习实战》有中文版,附python源码。
《统计学习要素(豆瓣)》这本书有对应的中文版:《统计学习基础(豆瓣)》。这本书附带一个 R 包。可以参考代码学习算法。网盘上有中文版。
《Natural Language Processing with Python(豆瓣)》NLP经典,其实主要讲python的NLTK包。网盘上有中文版。
《神经网络与深度学习》迈克尔尼尔森的神经网络教材,通俗易懂。中国有一些翻译,不完整。建议直接阅读原版。
• 书籍和教科书。
数学之美:很好的阅读介绍。
《统计学习方法(豆瓣)》:李航经典教材。
《模式识别与机器学习(豆瓣)》:中文经典教材。
《统计自然语言处理》自然语言处理经典教材
《应用预测建模》:英文版,专注于工程实践的机器学习教材
《UFLDL教程》:神经网络经典教材
《deeplearningbook》:深度学习的经典教材。
• 参考书。
《SciPy与NumPy(豆瓣)》
《Python for Data Analysis(豆瓣)》的作者是Pandas包的作者。
• 其他网络信息
机器学习和深度学习数据总结()。