项目/活动
电赛
商城
文档笔记
仿真/工具
参考设计
AI助手
发布项目
登录
/
注册
首页
>
文档笔记
>
应用
>
人工智能
完备的 AI 学习路线,最详细的资源整理!
收藏
分享
脑图
完备的 AI 学习路线,最详细的资源整理!
以下文章来源于Datawhale ,作者AIUnion
基础知识
1 数学
数学是学不完的,也没有几个人能像博士一样扎实地学好数学基础,入门人工智能领域,其实只需要掌握必要的基础知识就好。AI的数学基础最主要是高等数学、线性代数、概率论与数理统计三门课程,这三门课程是本科必修的。这里整理了一个简易的数学入门文章:
数学基础:高等数学
数学基础:线性代数
数学基础:概率论与数理统计
机器学习的数学基础资料下载:
1) 机器学习的数学基础.docx
中文版,对高等数学、线性代数、概率论与数理统计三门课的公式做了总结。
2) 斯坦福大学机器学习的数学基础.pdf
原版英文材料,非常全面,建议英语好的同学直接学习这个材料。
提取码: hktx
2 统计学
入门教材:深入浅出统计学
进阶教材:商务与经济统计
推荐视频:可汗学院统计学
3 编程
入门人工智能领域,首推Python这门编程语言。
1) Python安装:
Python安装包,我推荐下载Anaconda,Anaconda是一个用于科学计算的Python发行版,支持 Linux, Mac, Windows系统,提供了包管理与环境管理的功能,可以很方便地解决多版本Python并存、切换以及各种第三方包安装问题。
下载
推荐选Anaconda (python 3.7版本)
安装教程:
Anaconda+Jupyter notebook+Pycharm
Ubuntu18.04深度学习环境配置(CUDA9+CUDNN7.4+TensorFlow1.8)
2) python入门的资料推荐
a.廖雪峰python学习笔记
b.python入门笔记
作者李金,这个是jupyter notebook文件,把python的主要语法演示了一次,值得推荐。
提取码: 2bzh
c.南京大学python视频教程
3)补充
代码规范
numpy练习题
pandas练习题
数据分析/挖掘
1 数据分析的基础书籍
《利用python进行数据分析》
这本书含有大量的实践案例,你将学会如何利用各种Python库(包括NumPy,Pandas、Matplotlib以及IPython等)高效地解决各式各样的数据分析问题。如果把代码都运行一次,基本上就能解决数据分析的大部分问题了。
2 特征工程
3 数据挖掘项目
机器学习
公开课 吴恩达《Machine Learning》
中文笔记及作业代码
公开课 吴恩达 CS229
课程主页
中文视频
中文笔记
速查表
作业代码
公开课 林轩田《机器学习基石》
中文视频
中文笔记
配套教材
配套书籍为《Learning From Data》
公开课 林轩田《机器学习技法》
中文视频
中文笔记
书籍 《机器学习》
读书笔记
公式推导
课后习题
书籍《统计学习方法》
讲课 PPT
读书笔记
参考笔记
代码实现
书籍 《Scikit-Learn 与 TensorFlow 机器学习实用指南》
全书代码
实战 Kaggle 比赛
Kaggle 主页
Kaggle 路线
工具 Scikit-Learn 官方文档
官方文档
中文文档(0.19)
深度学习
公开课 吴恩达《Deep Learning》
课程视频
网易云课堂
Coursera
课程笔记
参考论文
课程PPT及课后作业
公开课 Fast.ai《程序员深度学习实战》
视频地址
B站地址(英文字幕)
CSDN地址(2017版中文字幕)
课程笔记
英文笔记原文
由ApacheCN组织的中文翻译
公开课 CS230 Deep Learning
秋季CS230视频列表
春季CS230课程大纲
Cheetsheet(斯坦福助教给出)
书籍 神经网络与深度学习 - 复旦邱锡鹏
书籍 《深度学习》
在线阅读
书籍 《深度学习 500 问》
项目地址
TensorFlow 官方文档
官方文档
中文文档
PyTorch官方文档
官方文档
中文文档(版本0.3)
强化学习
Reinforcement Learning-David Silver
视频地址
B站地址(中文字幕)
课程原地址
课程资料
课程PPT
课程笔记
李宏毅《深度强化学习》
视频地址
B站地址(中文字幕)
课程原地址
课程资料
课程PPT
课程笔记
前沿Paper
1 Arxiv
Arxiv Stats
Arxiv Sanity Preserver
2 Papers with Code
Papers with Code(Browse state-of-the-art)
主页地址
CV
NLP
Papers with Code(Sorted by stars)
GitHub 项目地址
3 Deep Learning Papers 阅读路线
GitHub 项目地址
这份深度学习论文阅读路线分为三大块
1 Deep Learning History and Basics
2 Deep Learning Method
3 Applications
4 Deep Learning Object Detection
GitHub 项目地址
5 知名会议
会议
NeurIPS
ICML
ICLR
AAAI
IJCAI
UAI
计算机视觉
CVPR
ECCV
ICCV
自然语言处理
ACL
EMNLP
NAACL
知名期刊
JAIR
JMLR
其它
机器人方面,有 CoRL(学习)、ICAPS(规划,包括但不限于机器人)、ICRA、IROS、RSS;对于更理论性的研究,有 AISTATS、COLT、KDD。
理论应用
自然语言处理
1 NLP是什么
自然语言处理(NLP,Natural Language Processing)是研究计算机处理人类语言的一门技术,目的是弥补人类交流(自然语言)和计算机理解(机器语言)之间的差距。NLP包含句法语义分析、信息抽取、文本挖掘、机器翻译、信息检索、问答系统和对话系统等领域。
2 课程推荐
CS224n 斯坦福深度自然语言处理课
17版中文字幕
课程笔记
2019版课程主页
自然语言处理 - Dan Jurafsky 和 Chris Manning
B站英文字幕版
学术激流网
3 书籍推荐
Python自然语言处理
自然语言处理综论
统计自然语言处理基础
4 博客推荐
我爱自然语言处理
语言日志博客(Mark Liberman)
natural language processing blog
5 项目推荐
基于LSTM的中文问答系统
基于RNN的文本生成器
基于char-rnn的汪峰歌词生成器
用RNN生成手写数字
6 开源NLP工具包
中文NLP相关
英文NLP相关
NLTK
TextBlob
Gensim
Pattern
Spacy
Orange
Pineapple
7 相关论文
100 Must-Read NLP Papers
计算机视觉
1 计算机视觉的应用
无人驾驶
无人安防
人脸识别
车辆车牌识别
以图搜图
VR/AR
3D重构
无人机
医学图像分析
其他
2 课程推荐
李飞飞:CS231n课程
3 书籍推荐
1.入门学习
《Computer Vision:Models, Learning and Inference》
2.经典权威的参考资料
《Computer Vision:Algorithms and Applications》
3.理论实践
《OpenCV3编程入门》
推荐系统
推荐课程
《Recommender Systems Specialization》
这个系列由4门子课程和1门毕业项目课程组成,包括推荐系统导论,最近邻协同过滤,推荐系统评价,矩阵分解和高级技术等。
书籍推荐
《推荐系统实践》(项亮 著)
《推荐系统》(Dietmar Jannach等 著,蒋凡 译)
《用户网络行为画像》(牛温佳等 著)
《Recommender Systems Handbook》(Paul B·Kantor等 著)
算法库
LibRec
项目地址
官网地址
LibMF
项目地址
SurPRISE
项目地址
Neural Collaborative Filtering
项目地址
Crab
项目地址
常用数据集
MovieLen
Douban
BookCrossing
推荐论文
项目地址
推荐项目
1.今日头条推荐系统机制介绍,面向内容创作者。分享人:项亮,今日头条推荐算法架构师:
2. 3分钟了解今日头条推荐系统原理
3.facebook是如何为十亿人推荐好友的
4.Netflix的个性化和推荐系统架构
风控模型(评分卡模型)
推荐书籍
《信用风险评分卡研究——基于SAS的开发与实施》
评分卡模型建模过程
样本选取
确定训练样本、测试样本的观察窗(特征的时间跨度)与表现窗(标签的时间跨度),且样本的标签定义是什么?一般情况下风险评分卡的标签都是考虑客户某一段时间内的延滞情况。
特征准备
原始特征、衍生变量
数据清洗
根据业务需求对缺失值或异常值等进行处理
特征筛选
根据特征的IV值(特征对模型的贡献度)、PSI(特征的稳定性)来进行特征筛选,IV值越大越好(但是一个特征的IV值超过一定阈值可能要考虑是否用到未来数据),PSI越小越好(一般建模时取特征的PSI小于等于0.01)
对特征进行WOE转换
即对特征进行分箱操作,注意在进行WOE转换时要注重特征的可解释性
建立模型
在建立模型过程中可根据模型和变量的统计量判断模型中包含和不包含每个变量时的模型质量来进行变量的二次筛选。
评分指标
评分卡模型一般关注的指标是KS值(衡量的是好坏样本累计分部之间的差值)、模型的PSI(即模型整体的稳定性)、AUC值等。
知识图谱
1 知识图谱是什么
知识图谱是一种结构化数据的处理方法,它涉及知识的提取、表示、存储、检索等一系列技术。从渊源上讲,它是知识表示与推理、数据库、信息检索、自然语言处理等多种技术发展的融合。
2 推荐资料
为什么需要知识图谱?什么是知识图谱?——KG的前世今生
什么是知识图谱?
智能搜索时代:知识图谱有何价值?
百度王海峰:知识图谱是 AI 的基石
3 主要内容
知识提取
构建kg首先需要解决的是数据,知识提取是要解决结构化数据生成的问题。我们可以用自然语言处理的方法,也可以利用规则。
使用规则
正则表达式
pythex 在线测试正则表达式
推荐资料进阶
Python wrapper for Google's RE2 using Cython
Parsley :更人性化的正则表达语法
中文分词和词性标注
推荐资料入门
jieba 中文分词包
中文词性标记集
推荐资料进阶
genius 采用 CRF条件随机场算法
Stanford CoreNLP分词
命名实体识别
推荐资料
Stanford CoreNLP 进行中文命名实体识别
使用深度学习
使用自然语言处理的方法,一般是给定schema,从非结构化数据中抽取特定领域的三元组(spo),如最近百度举办的比赛就是使用DL模型进行信息抽取。
序列标注
推荐资料
序列标注问题
seq2seq
推荐资料
seq2seq详解
详解从Seq2Seq模型到Attention模型
知识表示
JSON和YAML
json库
PyYAML: 是Python里的Yaml处理库
RDF和OWL语义:
JSON-LD
知识存储
需要熟悉常见的图数据库
a.知识链接的方式:字符串、外键、URI
b.PostgreSQL及其JSON扩展
Psycopg包操作PostgreSQL
c.图数据库 Neo4j和OrientDB
Neo4j的Python接口
OrientDB
d.RDF数据库Stardog
Stardog官网
知识检索
ElasticSearch教程
4 相关术语及技术路线
本体
RDF
Apache Jena
D2RQ
4.1 Protege构建本体系列
protege
protege使用
4.2 开发语言
python或java
4.3 图数据库技术
Neo4j
AllegroGraph
4.4 可视化技术
d3.js
Cytoscape.js
4.5 分词技术
jieba
hanlp
5 项目实战
基于知识图谱的问答
Agriculture_KnowledgeGraph
贡献平台
由知名开源平台,AI技术平台以及领域专家:ApacheCN,Datawhale,AI有道和黄海广博士联合整理贡献:
1.ApacheCN:片刻,李翔宇,飞龙,王翔
2.Datawhale:范晶晶,马晶敏,李碧涵,李福,光城,居居,康兵兵,郑家豪
3.AI有道:红色石头
4.黄海广博士
平台介绍
Datawhale
一个专注于AI领域的开源组织,上海交通大学国家级孵化项目,目前有7个独立团队,聚集了一群有开源精神和探索精神的团队成员,汇聚了来自各个高校和企业的优秀学习者,致力于构建纯粹的学习圈子和优质的开源项目,提供的组队学习涵盖了数据分析,数据挖掘,机器学习,深度学习,编程等16个内容领域。
AI有道
一个专注于 AI 领域的技术公众号。公众号主要涉及人工智能领域 Python、ML 、CV、NLP 等前沿知识、干货笔记和优质资源!我们致力于为广大人工智能爱好者提供优质的 AI 资源和切实可行的 AI 学习路线。
黄博(机器学习初学者)
机器学习课程在国内还不够普及,大部分初学者还是很迷茫,走了很多弯路,黄海广博士希望能尽自己的微薄之力,为机器学习初学者提供一个学习交流的平台。
ApacheCN
一个致力于提供优质开源项目的开源组织,致力于AI文档翻译,Kaggle比赛交流、LeetCode算法刷题、大数据交流等项目。我们希望做出广大 AI 爱好者真正需要的东西,打造真正有价值的长尾作品。
评论
0 / 100
发表评论
查看更多
我叫搞事情
2019-11-01
2958
硬禾服务号
关注最新动态
0512-67862536
info@eetree.cn
江苏省苏州市苏州工业园区新平街388号腾飞创新园A2幢815室
苏州硬禾信息科技有限公司
友情链接
STEP小脚丫
纳芯微电子
Copyright © 2024 苏州硬禾信息科技有限公司 All Rights Reserved 苏ICP备19040198号