先导

对应代码练习:传送门

1 分类

对文本进行分类在自然语言处理的各种应用中都十分重要。

1.1 有监督机器学习

对文本进行分类所用的方法一般就是有监督机器学习。

有监督机器学习就是给你一组特征(\(X\))以及特征的标签(\(Y\)),通过最小化预测方程的输出(\(\hat{Y}\))与标签(\(Y\))的误差来调整预测方程参数(θ)的过程。

1.2 文本分类之情感识别

文本分类的应用有许多许多,其中之一就是情感识别。

逻辑回归分类器实现推文情感识别

完整项目见另一博客:传送门

朴素贝叶斯分类器实现推文情感识别

完整项目见另一博客:传送门

2 向量空间(vector space)

什么是词向量,见另一篇博客传送门

利用词向量进行推理传送门