#分出

如果使用交叉验证,是否还需要单独分出测试集?

比方说,用100k条数据,有两个思路1.用这100k条数据做k-fold交叉验证,来调模型参数2.先随机划分出70k条数据做训练集用来根据交叉验证调参数,调好之后再用剩下的30k条数据做测试集【答】虽然这两个都没有错对之分,但是在数据量允许的情况下,更建议第2个思路。对于思路1,如果用交叉验证的预测误差作为模型的预测误...