博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
MapReduce入门小例子
阅读量:4585 次
发布时间:2019-06-09

本文共 611 字,大约阅读时间需要 2 分钟。

实验介绍

A,B,C,D,E 五个人的好友关系如下图所示,其中实线表示互为好友关系。那么,如何获取两个不是好友的两个人之间的好友数,并以此为参考,向用户推荐陌生人呢?

主要通过以下几个步骤实现:

 

  1.将好友关系分配到两个 Map 进行处理,其中每个 Map 包含 3 条好友关系。对每一条好友关系进行拆分,若 Key 中的两个人为朋友,则记录 value 值为0,否则 value 值为 1。将拆分的结果进行排序,其中(A B)和(B A)作为同一个 key(A B)。

  2. 分别对两个 Map 处理的记录进行初步合并,若两个记录的 Key 值相同且每条记录的 Value 都不为 0,则 Value 值加 1。

  3. 通过 Reduce 方式,合并两个 Map 处理的 Combine 结果。

    1. 若两个记录的 Key 值相同且每条记录的 Value 都不为 0,则 Value 值加 1。
    2. 将 Value 值为 0 的记录删除。

    3. 获取不为好友的两个用户之间的公共好友数:Key 为两个不为好友的用户,Value 是两个不是好友的用户之间的共同好友数。社交网站或者 APP 可以根据这个数值对不是好友的两个用户进行推荐。

posted on
2017-11-17 15:38 阅读(
...) 评论(
...)

转载于:https://www.cnblogs.com/olenji/p/7851909.html

你可能感兴趣的文章
Random随机库
查看>>
AFNetworking 3.0x版本最新特性
查看>>
PHP排序算法实现 与sort性能对比
查看>>
manage partitions
查看>>
Java快速入门
查看>>
C++中函数重载
查看>>
BLE广播数据的抓包解析
查看>>
基于 Android NDK 的学习之旅-----HelloWorld
查看>>
JAVA CAS原理深度分析
查看>>
initWithFrame方法的理解
查看>>
cocos2d-x的lua脚本加载CocostudioUI两种方式
查看>>
目标文件符号《深入理解计算机系统》笔记(三)链接知识【附图】
查看>>
The import org.cocos2dx.lib cannot be resolved
查看>>
SolrCloud使用问题记录
查看>>
提高mysql千万级大数据SQL查询优化30条经验(Mysql索引优化注意)
查看>>
mybatis入门基础(二)----原始dao的开发和mapper代理开发
查看>>
linux网络流程分析(一)---网卡驱动
查看>>
2016年毕业设计指导与总结
查看>>
TypeError: Cannot read property 'tap' of undefined
查看>>
scikit-learn文本特征提取之TF-IDF
查看>>