|
本帖最后由 123457321 于 2025-4-22 15:10 编辑
最近,抖音弄了个算法公开日,把它家神秘莫测的算法公开了,引发了一堆内行人的学习兴趣。
我逐字看完咯,写的很通俗易懂。
抖音算法主要是Wide&Deep模型和双塔召回模型。
Wide&Deep模型是谷歌提出的混合推荐模型,wide是宽度的意思,deep是深度,什么意思呢,前者是挖掘你跟一支视频的直接联系,譬如你在看运动鞋,它就给你推同款。后者是挖掘你跟这支视频的泛联系,你在看鞋,那么你可能会去旅游,想要买运动手表。
充分挖掘你人生的宽度与深度。
双塔召回模型很有意思,一座是用户塔,一座是内容塔,两个都是深度学习模型,把一些内容特征做了数字转化。
譬如你是用户,爱看游戏,做菜,唱歌,熊猫,用户塔便赋予她们数学代号为0,1,2,3。短视频为X,长视频为Y。
做菜短视频就变成了(1,X),又做菜又唱歌的短视频是(1,2,X),像搞怪、诗意、科技都是可以被数字化的内容特征。
抖音还有座内容塔,识别到了你家用户塔的数学特征后,会粗筛一批口粮给你,搞笑大厨,薄肌体育生,杀死比尔等等,排序到了你的预存储空间里。
上下一划,大概率是你想看的。
抖音总结推荐算法,就是以数学计算学习人类行为。
抖音还公布了推荐优先级,设定了一些行为的“推荐价值”,不再是只看完播率了,在中长视频+短剧生态繁荣后,发展出来了多目标建模,让推荐更加均衡。
除了把算法黑盒拆开给大家看,还讲了怎么治理内容。
建立有专门的标准管理团队,已对违法违规、色情低俗、公序良俗、危险行为等十余大类、数百种风险设置了独立标准条款,每条标准条款都匹配典型违规案例及对应执行手册。
流量越高的内容经过评估的次数越多,标准也越严格。
在这块是“机器+人工”的审核,又有一点Wide&Deep的味道,机器主要负责宽度,主动对所有投稿进行评估,筛掉最直观的问题点。人工主要负责深度,确保疑难问题尽可能精准研判,减少错判。
这个安全网站还会更新。
甚至聊到了APP会“窃听”用户谈话吗?
副标题是:平台“窃听”在技术上不“划算”,在法律上不被允许。
里面聊到了跨平台营销推荐,是造成用户被窃听的主要幻觉。
例如,用户在A电商平台搜索了一款猫粮。关闭A平台后,打开了B社交平台,发现B平台也在推荐猫粮。这并不是B平台对用户做了监控,是A平台作为B平台的广告主,通过程序化广告利用A平台的数据定向给用户展示了广告,实现跨平台的广告营销。
啊这个算法公开日太有意思了。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
×
|