# 1  数学

• 麻省理工学院线性代数（18.06）胡安H Klopper博士

• 统计学导论Thomas Haslwanter

• 使用Python的统计简介

• Python中的计算统计

• Python中的统计信息

“统计在Python”euroscipy 2015教程的材料。

# 3  CS 109数据科学，哈佛大学，2014

# 4  文学文本分析艺术，麦吉尔，2015年冬

# 5  频率主义和贝叶斯主义

# Python中的6个贝叶斯统计分析

• Python中的贝叶斯建模

# 7  模式分类

# 8  Nitin Borwankar学习数据科学

1. 线性回归

2. Logistic回归

3. 随机森林

4. K均值聚类

# 10  用IPython介绍科学计算

IPython中进行机器学习方面的研究的入门教程。

# 11  简单机器学习方法教程

0 - Python Intro.ipynb

1 - PCA.ipynb

2 - KMeans.ipynb

3a - 线性回归1D.ipynb

3b - 线性回归2D.ipynb

4 - Logistic Regression.ipynb

5 - k最近Neighbors.ipynb

# 12  机器学习

01_Introduction.ipynb

02_Linear_Regression.ipynb

03_Linear_Classification.ipynb

04_Neural_Networks.ipynb

05_Decision_Trees.ipynb

06_Graphical_Models.ipynb

Performance_Prediction.ipynb

REF_linear_algebra.ipynb

# 13  挖掘社交网络（第2版）

# 魏旭14社交媒体与文本分析

# 15  数据分析

# 用Python实现数据挖掘 16

# 17  Scipy讲义

1.开始使用Python进行科学研究

1.1。科学计算与工具和工作流程

1.2。Python语言

1.3。NumPy：创建和操作数字数据

1.4。Matplotlib：绘图

1.5。Scipy：高级科学计算

1.6。获得帮助和查找文档

2.高级主题

2.1。高级Python构造

2.2。先进的Numpy

2.3。调试代码

2.4。优化代码

2.5。SciPy中的稀疏矩阵

2.6。使用Numpy和Scipy进行图像处理和处理

2.7。数学优化：找到函数的最小值

2.8。与C接口

3.软件包和应用程序

3.1。Python中的统计信息

3.2。Sympy：Python中的符号数学

3.3。Scikit-image：图像处理

3.4。特点：建立交互式对话框

3.5。与Mayavi 3D绘图

3.6。scikit-learn：Python中的机器学习

# 18  计算和推理思维：数据科学的基础，2015年秋季

# 19  非参数方法

• Dirichlet分布和Dirichlet过程：通过类比Dirichlet分布快速回顾Dirichlet分布和Dirichlet过程的介绍。

• 非参数潜在狄利克雷分配

• 关于Hierarchal Dirichlet过程模型中Gibbs抽样的注记

• 显微镜-LDA

• 第十届贝叶斯非参数会议

# Part II。  机器学习库

• 数据科学之5个最佳的Python库，为初学者定制的教程

• 一系列教程和示例，用于解决和理解机器学习和模式分类任务

• 使用NumPy，Matplotlib和Pandas进行Python数据探索的最终指南

• Bot or Not：在Python中进行端到端的数据分析

• IPython中的笔记本电脑

• 概率，悖论和合理的人本原则

# 20只  熊猫

• 用大熊猫做Python数据分析和数据科学

• 熊猫的事情我希望我早就知道了

• 14个最佳的Python Pandas功能

• 黑客教育与Python - 数据挖掘Coursera流行课程

• 熊猫教程

https://bitbucket.org/hrojas/learn-pandas

• 在Python Pandas中汇总，汇总和分组数据

• 10分钟到熊猫

# 21  Scikit学习

• 学习scikit-learn：Python中的机器学习

• PyCon 2015简介Scikit-Learn教程，由Jake VanderPlas提供

1.预赛

01-Preliminaries.ipynb

2.使用Scikit-Learn介绍机器学习

02.1，机器学习，Intro.ipynb

02.2-Basic的Principles.ipynb

3.深入监督学习

03.1分类，SVMs.ipynb

03.2回归 - Forests.ipynb

4.无监督学习深入

04.1维性，PCA.ipynb

04.2聚类，KMeans.ipynb

04.3密度，GMM.ipynb

5.模型验证深入

05-Validation.ipynb

• 用scikit-learn介绍机器学习

• 介绍机器学习使用scikit学习

• SciPy 2015 Scikit-learn教程

• 办公NFL池

• Sklearn-大熊猫

• 10 Scikit学习案例研究，示例和教程

• 5使用SciKit学习的文本分类案例研究

• 2015年开放数据科学大会的幻灯片和笔记本

• 深入机器学习

# 22  PyMC

• 概率规划与黑客贝叶斯方法

• 橄榄球分析和FinTech - 教程

• 贝叶斯相关与PyMC

• 贝叶斯回归与PyMC：一个简单的教程

• 采用PyMC封装的LDA算法

# 23  Gensim

• Gensim和LDA：快速浏览

# 24  bnpy

bnpy支持最新的在线学习算法以及标准的离线方法。我们的目标是提供一个推理平台，使研究人员和从业人员可以轻松比较模型和算法。

# 25  将军

Shogun是一个机器学习工具箱，专注于用C ++编写的支持向量机（SVM）。它是积极开发和维护的，提供了一个Python接口，并且Python接口大部分记录良好。但是，与Scikit-learn相比，我们发现它的API很难使用。此外，它不提供许多诊断或评估算法。但是，它的速度是一个很大的优势。

# 26  NLTK

• 原型ML / NLP代码教程系列Lessonhs22 06KC580（ML / NLP入门教程Python版）

# 27  算法实现

• 18大经典数据挖掘算法小结

• 十大机器学习算法库

K均值

k-最近的邻居

C4.5

• 10种机器学习算法的要点（附Python和R代码）

SVM

ķ最近邻算法

ķ均值算法

• Python中实现ID3算法

• 文本的向量空间模型

• 从示例中了解支持向量机算法（以及代码）

• 在Python的中使用线性回归预测数据

• 线性回归简介

• 使用Python进行回归分析

• Logistic回归与scikit学习

• 逻辑回归Vs决策树VS SVM：第一部分

Logistic回归vs决策树vs SVM：第二部分

• 在netflow数据中使用机器学习进行异常检测

• 如何在Python中从零开始实现朴素贝叶斯

• 主题建模

• 我们来写：逻辑回归分类器

• 简单易学的机器学习算法 - 谱聚类（Spectal Clustering）

• 深入学习和Python入门

• 使用scikit-learn的外核学习和模型持久化

• 如何实现一个神经网络：第1部分

• 用于机器学习应用程序的内核函数

• Python中的随机森林

• 学习随机森林的强大指南（带有R＆Python中的代码）

• 随机森林解读与scikit学习。

• 基于密度的聚类

• 我的与MCMC算法的幽会

• MCMC采样傻瓜

Python的实现

• 随机森林介绍 - 简体中文

• 学习随机森林的强大指南（带有R＆Python中的代码）

• 简单遗传算法在15行Python中的应用

• Python中从头开始实现神经网络 - 介绍

• 什么是TF-IDF？10分钟指南

• 理解经验贝叶斯估计（使用棒球统计）

[R代码实现

• 关于贝叶斯方法的阅读列表

TomGriffiths的一个比较老的贝叶斯方法方面的论文列表：

EM算法

• 比较Python聚类算法

• 迁移学习的资源

• 机器学习中提高算法的快速入门

• 机器学习：用初等数学解读逻辑回归

# Part III。  机器学习相关应用

• 真棒机器学习

# 28  网络爬虫

• Python爬虫学习系列教程崔庆才的博客

Python的入门

1. Python爬虫入门一之综述

2. Python爬虫入门二之爬虫基础了解

3. Python爬虫入门三之Urllib库的基本使用

4. Python爬虫入门四之Urllib库的高级用法

5. Python爬虫入门五之URLError异常处理

7. Python爬虫入门七之正则表达式

8. Python爬虫入门八之美丽的汤的用法

Python的实战

1. Python爬虫实战一之爬取糗事百科段子

2. Python爬虫实战二之爬取百度贴吧帖子

Python爬虫实战三之计算大学本学期绩点

4. Python爬虫实战四之抓取淘宝MM照片

5. Python爬虫实战五之模拟登录淘宝并获取所有订单

Python的进阶

1. Python爬虫进阶一之爬虫框架Scrapy安装配置

• Python中写爬虫抓站的一些技巧

• 蟒蛇实现带验证码网站的自动登陆

• 蟒下用Scrapy和MongoDB的构建爬虫系统（1）

• Scrapy +瓶+的MongoDB +夫特开发全攻略（1）（2）（3）（4）

• python3爬虫之入门和正则表达式

• 斗志旺盛入门：百度贴吧图片爬虫

• 报纸3k：文章刮和策展

• Python模块学习 - httplib HTTP协议客户端实现

• 硒定向爬取海量精美图片及搜索引擎杂谈

• 利用scrapy集成社区爬虫功能

scrapyd：一个用于运行爬虫任务的Web服务

GitHub的上的一个项目。

• Python爬虫的工具列表

# 29  数据处理

• Python的数据分析入门

• 用Python分析英国肥胖症

• 数据处理和机器学习与Python

• 用Python进行文档聚类

http://nbviewer.ipython.org/github/brandomr/document_cluster/blob/master/cluster_analysis_web.ipynb

• 橄榄球分析和FinTech - 教程

• 鲨鱼，Landsharks，Geoplotting和KDTrees！

• 实际上是关键的数据科学工作技能的网页搜索

• 机器学习系列（3）_逻辑回归应用之Kaggle泰坦尼克之灾

• CIKM竞赛数据挖掘竞赛夺冠算法

• 实用的自然语言处理技术来确定旅馆的无线网络质量

## 29.1  数据清理

• 美丽的汤

• 解决10行数据提取问题

• 快速指南：在Python中执行文本数据清理的步骤

• 常用的开源中文分词工具

• 机器学习中的数据清洗与特征处理综述

## 29.2  特征选取

• 结合Scikit学习介绍几种常用的特征选择方法

• （Python）的专注于特征工程的工具库FeatureForge

• 数据分析领域中最为人称道的七种降维方法

## 29.3  相似度度量

• 5种常用的相似度度量的蟒实现

• “这样的人也喜欢...”

## 29.4  评价指标

• sklearn：自动学习方法的选择和调整

# 30  话题模型

• 主题建模在多方面评论

IPython Notebook文本详细介绍了方法，实现和结果

• NMF主题建模与scikit学习

• 主题模型及其变种的实现代码汇总

• dynamic-nmf：动态主题建模

• LDA的实施

• 大规模主题模型：对Spark LDA算法的改进

• 通过仿真理解概率主题模型

# 31  情感分析

• 情绪分析的现代方法Michael Czerny

• 电影标语的情感分析

• gensim doc2vec和IMDB情绪数据集

• 使用Python和情感API探索故事的形状

• 情感分析的新方法

# 32  行为分析

• 利用Python，SciKit和文本分类来实现行为分析

# 33  推荐系统

• 协作过滤推荐引擎在python中的实现

• 推荐系统列表

• “纽约时报”如何打造新一代推荐系统

• 应用k近邻算法预测豆瓣电影用户的性别

# 34  可视化

• Python的可视化工具概述

• ROC曲线在Python和R

• 如何在Python中创建NBA镜头图表

• 映射NYC出租车数据

• 使用Bokeh进行交互式数据可视化（在Python中）

• Python中的数据可视化：Seaborn中的高级功能

Seaborn是一个强调统计图的Python数据可视化库。

• 时间映射的辩论动态

• 用Python的在地图上模拟疫情扩散

SIR模型的可视化。

• 数据可视化教程

• 创建NBA镜头图表

## 34.1  Matplotlib

• 如何使用matplotlib在Python中制作漂亮的数据可视化文件

## 34.2  平

• 平装IPython笔记本

• 用Python，Pandas和Plotly生成HTML报告

## 34.3  文本网络分析

• 文本网络分析工具包textplot

# 35  计算

• 大数据简介

• 解密神经网络

• 一个11行Python代码实现的神经网络

• 大数据开源工具综述

## 35.1  大数据

• 本杰明·本福特（Benjamin Bengfort）开始使用Spark（Python）

• 推荐引擎使用Spark和Python构建

• 加州大学伯克利分校的AMP Camp 5动手练习

*用Spark构建一个电影推荐器

• 用MLLib和Spark分类客户

• pyspark画面

• SparkHub

Databricks公司搞了一个叫SparkHub的网站把所有的星火资源集中在一起

• 火花

• Databricks Referenece

• 数据科学家在Spark中的快速开发和性能

• 从scikit学习到Spark ML

• 初学者指南：带有大输入数据集的Apache Spark机器学习场景

## 35.2  并行计算

• 并行机器学习与scikit学习和IPython

• Python并行分布式框架：芹菜超详细介绍

## 35.3  Numpy＆SciPy

• 用Python的做科学计算

• 从NumPy中获得最佳性能

• “Python的科学计算”作者：张若愚

• 科学计算项目

• 用Python进行科学计算讲座

• SciPy和NumPy教程的收集

# 36  资源整理

• Python的网页爬虫和文本处理和科学计算和机器学习和数据挖掘兵器谱

• Python的机器学习库

• Python机器学习开源项目

• Python的语言下的机器学习库

• ZEEF网站上聚合的关于蟒蛇的资源

• Jobbole网站上的蟒蛇教程

• 真棒Python

• 不断更新的数据科学Python笔记本

• 算法：人工智能，数据挖掘，聚类，数据结构，机器学习，神经，自然语言处理，...

• 基于Theano的深度学习库（展开式，循环神经网络等等）

• Python备忘单

• 用于机器学习的Python工具

• 真棒令人敬畏

• 真棒Python

• 3000多个Python模块

GitHub的上流行的3000+个流行的Python项目，可以作为的Python代码搜索引擎使用

• IPython提示，技巧和笔记

• IPython书籍

IPython Cookbook包含超过100个有关Python数值计算和数据科学的食谱。代码的完整性可以在GitHub上免费获得。另外，我已经发布了几个特色食谱。这些食谱不仅包含代码，还包含完整的食谱描述，解释和所有参考。它们涵盖了本书涵盖的各种主题。我打算在未来发布更多特色食谱。

• 16免费数据科学书籍

• 学习朴素贝叶斯算法的6个简单步骤（用Python中的代码）

• 免费的数据科学书籍

• 数据结构，动物园

• Python中最好的机器学习库

• 8个最好的Python数据科学书籍

• 用Python掌握机器学习的7个步骤

• 数据科学iPython笔记本

• 用Python的和Pygame的写游戏

# 37  基础教程

• 8步从Python的白板到专家，从基础到深度学习

• Python科学家的速成课程

• 一个有趣的IPython笔记本画廊

• 一些ipython笔记本上的nbviewer的教程

• 国内的IPython笔记本分享平台

• 全栈Python

• 14个最受欢迎的Python的开源框架

• “零基础学蟒”（第二版）

• 慕课网（http://www.imooc.com）的Python的课程

• 学习的Python编程的19个资源

• 科学家的Python碰撞课程（IPython Notebook教程）

• “Python Cookbook”第3版翻译

• Snakify - 通过挑战性的问题来学习Python 3

• 旅游销售人员问题（IPython Notebook教程）

• 劳拉的数据科学笔记

• 模式分类

• 一组有用的脚本，教程和其他Python相关的东西

• 学习机器学习的材料

iPython笔记本

R降价

MOOCS

OpenCV机器学习

• 八大排序算法的Python的实现

• 我常用的Python调试工具

• 贝叶斯机器学习

**