逻辑回归可以用于多分类问题,其中一种方法是使用"一对多"的策略,将原问题转化为多个二分类问题。具体来说,对于每一个类别,我们将其视为“正”类,而把其它所有类别视为“负”类。这样我们可以训练多个二分类逻辑回归模型,在测试时,输入一个新的数据,每个模型给出一个预测概率,最后选择预测概率最大的类别为输出结果即可。
在选择特征变量时,我们可以采用特征选择算法,如方差过滤,卡方检验等等进行特征筛选。
关于阈值的确定,可以借助于ROC曲线或Precision-Recall曲线来进行选择。对于不同的问题有不同的评估指标,如准确率、ROC曲线下面积、F1-score等等,可以按照问题特点选择适当的评估方法。
最后,为了确保模型的泛化能力,我们可以进行交叉验证来评估模型的性能。