spark 数据处理 -- 数据采样【随机抽样、分层抽样、权重抽样】

绝地灬酷狼 2022-09-12 01:50 195阅读 0赞

发表评论

表情:
评论列表 (有 0 条评论,195人围观)

还没有评论,来说两句吧...

相关阅读

    相关 水库抽样算法

    问题描述 输入:一组数据,大小未知 输出:这组数据的K个均匀抽取 要求:仅扫描一次 总体要求:从N个元素中随机的抽取k个元素,其中N无法确定,保证每个元素抽到的概率