先导
对应代码练习:传送门
1 分类
对文本进行分类在自然语言处理的各种应用中都十分重要。
1.1 有监督机器学习
对文本进行分类所用的方法一般就是有监督机器学习。
有监督机器学习就是给你一组特征(\(X\))以及特征的标签(\(Y\)),通过最小化预测方程的输出(\(\hat{Y}\))与标签(\(Y\))的误差来调整预测方程参数(θ)的过程。
1.2 文本分类之情感识别
文本分类的应用有许多许多,其中之一就是情感识别。
逻辑回归分类器实现推文情感识别
完整项目见另一博客:传送门
朴素贝叶斯分类器实现推文情感识别
完整项目见另一博客:传送门
2 向量空间(vector space)
什么是词向量,见另一篇博客传送门
利用词向量进行推理传送门