朴素贝叶斯文本分类器的特征向量是怎么定义的?是统计词频吗?那维数起不是大的很?最近看的论文提到了这个分类方法,希望专家、学者、高手帮助,

来源:学生作业帮助网 编辑:作业帮 时间:2024/05/05 05:24:18

朴素贝叶斯文本分类器的特征向量是怎么定义的?是统计词频吗?那维数起不是大的很?最近看的论文提到了这个分类方法,希望专家、学者、高手帮助,
朴素贝叶斯文本分类器的特征向量是怎么定义的?
是统计词频吗?那维数起不是大的很?最近看的论文提到了这个分类方法,希望专家、学者、高手帮助,

朴素贝叶斯文本分类器的特征向量是怎么定义的?是统计词频吗?那维数起不是大的很?最近看的论文提到了这个分类方法,希望专家、学者、高手帮助,
一般是先分词,然后用TFIDF方法来向量化,只用词频效果不是很好,然后可以用特征选择方法或特征抽取方法来降低维度,一般的方法有信息熵、信息增益等等很多种的.如果你的机器跑得动的话不降也可以,不过一般来说还是要降的