我在进行文本分类时,使用了朴素贝叶斯算法,但是我对于停用词的处理不是很清楚。我知道停用词是一些经常出现但对于文本分类并没有特别贡献的单词,比如“的”、“是”等等。我想请教大家,在朴素贝叶斯算法中如何处理停用词,是直接剔除还是有其他方法?对于不同的文本分类任务,处...
提问者:雁过南山我正在进行一个文本分类项目,希望使用逻辑回归模型。我已经准备好了数据和标签,但是我想知道如何在模型中处理停用词。我已经使用了NLTK软件包删除了停用词,但是我不确定是否应该在模型中保留它们或者在模型之前删除它们。是否有一种更好的方法来处理停用词,可以在逻辑回归模型中...
提问者:青春心动