我在进行机器学习的时候,面临着选择一组有代表性的训练样本集的问题。我不想使用过于庞大的样本集,因为这会导致训练时间变慢;同时也不想使用过于简单的样本集,因为这会不足以覆盖模型可能出现的各种情况。我该如何选择一个具有代表性的训练样本集呢?是否有任何技巧或常用的方法...