接下来的几天,我会把一个完整的文本分类的Project项目更新在这里。今天我就简单讲一下这个项目的需求、所需要的知识,所用到的方法等。

项目背景:

这是一个文本多分类任务,一共有接近5000篇文章,共计13类文章,我们现在要去一部分文章作为训练集对他进行训练,同时取一部分文章作为测试集,进行测试分类的效果。

所需知识:

  1. Jieba分词
  2. 词向量空间和语言模型
  3. Word2vec
  4. Text-CNN

所用到的方法:

  1. SVM
  2. Text-CNN

我会一边浅显化地讲一些知识,一边把代码放上来一步一步分析。

分类: Machine-Learning

发表评论

电子邮件地址不会被公开。 必填项已用*标注