博客
关于我
推荐系统项目实战一(推荐业务架构介绍)
阅读量:215 次
发布时间:2019-02-28

本文共 550 字,大约阅读时间需要 1 分钟。

架构与业务流

基础数据层

该层主要处理业务数据和用户行为日志数据,数据来源于前端埋点和系统日志。其中,用户数据包括注册信息、个人资料等基础信息;文章数据则涵盖用户上传的内容、发布信息等基础属性。用户行为日志数据实时流向Kafka,用于实时计算和分析;而业务数据则以批量形式存储在HDFS上,为后续的离线分析提供数据支持。

数据处理层

这一层面对基础数据进行深度处理,主要包括用户画像和文章画像的构建。具体流程包括:基于离线数据和实时数据,通过多种算法进行数据分析和特征提取,构建用户兴趣模型和阅读习惯模型。

召回与排序

召回环节通过算法逻辑从海量文章中筛选出用户感兴趣的候选集合,集合规模通常在上千级别。排序环节则对候选文章进行用户画像模型结果的排序,生成最终的推荐列表。

推荐业务层

该层通过提供RESTful接口为推荐业务场景服务,主要包括以下功能:

  • Feed流推荐:支持用户在今日推荐场景中通过不断下拉刷新获取内容流。

转载地址:http://jvxp.baihongyu.com/

你可能感兴趣的文章
pandas.DataFrame.copy(deep=True) 实际上并不创建深拷贝
查看>>
pandas.read_csv()的详解-ChatGPT4o作答
查看>>
PANDAS.READ_EXCEL()输出‘;溢出错误:日期值超出范围‘;而不存在日期列
查看>>
pandas100个骚操作:再见 for 循环!速度提升315倍!
查看>>
Pandas:如何根据其他列值的条件对列进行求和?
查看>>
Pandas:对给定列求和 DataFrame 行
查看>>
Pandas、groupby 和特定月份的求和
查看>>
Pandas、Matplotlib、Pyecharts数据分析实践
查看>>
Pandas中文官档 ~ 基础用法1
查看>>
Pandas中文官档~基础用法2
查看>>
SpringBoot+Vue+OpenOffice实现文档管理(文档上传、下载、在线预览)
查看>>
Pandas中文官档~基础用法5
查看>>
Pandas中文官档~基础用法6
查看>>
Pandas中的GROUP BY AND SUM不丢失列
查看>>
Pandas中的GROUP BY AND SUM不丢失列
查看>>
Pandas之iloc、loc
查看>>
pandas交换两列
查看>>
pandas介绍-ChatGPT4o作答
查看>>
pandas删除指定列里面内容的行
查看>>
pandas去除Nan值
查看>>