[论文阅读](SHAPING DATASETS: OPTIMAL DATA SELECTION FOR SPECIFIC TARGET DISTRIBUTIONS ACROSS DIMENSIONS)
文章目录摘要引言方法补充:分支界定法实验结果摘要提出了一种基于混合整数线性规划(MILP)的数据集操作方法。提出的优化可以将数据集缩小到特定的大小,同时在不同维度上强制执行特定的分布。它本质上利用了初始数据集的冗余,以生成更紧凑的版本,并在每个维度上具有特定的目标分布。如果期望的目标分布是均匀的,那么效果就是平衡的:所有不同维度的所有值都被平等地表示出来。根据问题的性质,还可以指定其他类型的目标分