趣文网 > 作文大全

这份GitHub 2.3k星的ML论文清单拿好 工作用得上

2020-11-23 23:55:01
相关推荐

鱼羊 发自 凹非寺量子位 报道 | 公众号 QbitAI

工欲善其事,必先利其器。

在工作中动手实施自己的ML项目之前,了解领域里的前沿进展,吸收前人的经验,是很有必要的。

不过,现在arXiv上每天都有成百篇新论文冒头,哪些值得看?

为此,亚马逊工程师Eugene Yan等人打造了一个论文合集,在这个GitHub项目中,持续共享Google、亚马逊、Facebook等等大公司在数据科学和机器学习方面的论文和博客文章。

这些论文/文章涵盖24种不同分类,从搜索排名到NLP、CV,都能在这里找到:

数据质量数据工程数据挖掘分类回归推荐算法搜索排名嵌入自然语言处理序列建模预测计算机视觉强化学习异常检测图形优化信息提取弱监督生成效率验证和A/B测试伦理道德实践失败

目前标星2.3k。

以推荐算法为例。

对于不同的行业,业务差别很大。即使算法基础框架大同小异,想要训练出精准的推荐模型,细节上还是有许多不同之处。

而这份清单,收集了电商、视频、音乐、课程种种不同业务的推荐算法技术博客/论文。

比如阿里的《Behavior Sequence Transformer for E-commerce Recommendation in Alibaba》。

论文介绍了行为序列Transformer在阿里电子商务推荐系统中的应用。

研究人员提出,利用Transformer模型来捕捉用户行为序列背后的顺序信号,以增强个性化推荐的有效性,提升点击量。经过实验验证后,他们将该模型部署在了淘宝线上,证明与基线相比,该方法能显著提高在线点击率。

论文链接:https://arxiv.org/abs/1905.06874

在视频个性化推荐方面,YouTube、网飞、TikTok的技术方案都有收录。

比如YouTube这篇引用次数达到1039次的《Deep Neural Networks for YouTube Recommendations》。

论文重点介绍了深度学习给YouTube推荐系统带来的巨大性能提升。首先,研究人员详细介绍了深度候选征程模型和深度排名模型。而后,研究人员还在论文中分享了从设计、迭代到维护一个拥有海量用户的大规模推荐系统这个过程中,获得的实践经验和启示。

论文地址:https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf

另外,比较有趣的是,这份论文/文章列表还收录了一些失败的经验。

比如Google Photos在给照片打标签时,曾经严重翻车:把黑人标记成了“大猩猩”。

最近大火的GPT-3,则没有解决前代GPT-2的“偏见”问题,在生成的文字中,总是将穆斯林和暴力、死亡联系在一起。

关于作者

这一项目的主要维护者,是亚马逊应用科学家Eugene Yan。

他本科毕业于新加坡管理大学,专业是心理学和人力资源管理,后于佐治亚理工学院获计算机科学硕士学位。

现在的主要工作是利用消费者数据,构建机器学习系统以提升用户体验。

传送门

项目地址:https://github.com/eugeneyan/applied-ml

— 完—

阅读剩余内容
网友评论
相关内容
延伸阅读
小编推荐

大家都在看

财富作文400字 请听我解释作文 喜欢的季节作文 写给闺蜜的作文 以我为话题的作文 小男孩打屁股作文 一年级小学生作文大全 妈妈的手600字作文 我是一名医生作文 重拾旧梦作文 进入初中作文600字 考试之后作文450字 班级建议作文 追梦路上作文800字 50年后的生活作文 慎终追远作文 初二优美作文 欢度六一作文结尾 童年趣事作文放风筝 高二作文600字 竹子的作文500字 关于知足常乐的作文 做好事的作文800字 爸爸妈妈关爱我的作文 关于信任的作文素材 关于挫折作文的结尾 记什么事的作文 走进秋天作文600字 鱼的天堂作文 套作作文