海量数据TOPK 问题

墨蓝 2021-11-09 11:36 269阅读 0赞

发表评论

表情:
评论列表 (有 0 条评论,269人围观)

还没有评论,来说两句吧...

相关阅读

    相关 TopK问题

    典型问题 :给定一个100亿(N)个数字,让你找出其中前1000(M)大的数字 两种不同解决方案: 1.用一个数组保存刚才的那些数字,直接在这个数组上建大堆,循环1000

    相关 海量数据问题

    1. 给定a、b两个文件,各存放50亿个url,每个url各占64字节,内存限制是4G,让你找出a、b文件共同的url? 方案1:   可以估计每个文件安的大小为50G×6

    相关 海量数据分析问题总结

     1)给⼀个超过100G⼤⼩的log file, log中存着IP地址, 设计[算法][Link 1]找到出现次数最多的IP地址? 第一题:首先我们的思路就是利用哈希进

    相关 TopK问题

    从文件中输出请求最频繁的10个 HTTP 接口,及其相应的请求数量 数据格式如下 GET /mdc/city/queryAllCities.json?arg1=v