据讲师介绍,ElasticCTR源于产业实践,融合了百度在推荐排序业务方面成熟的经验,具备较多工业级的属性。目前其使用的流式并行训练设计模式已经在百度内部的信息流产品、搜索产品、原生广告中得以验证应用。讲师随后与现场开发者分享了利用飞桨分布式训练设计模式的优势。由于企业在开发过程中需要处理大量的数据,如何节省时间和成本,毫无疑问是企业关注的重点。深度学习模型的效果迭代对训练速度非常敏感,能够带来高性能并行训练的深度学习框架也符合企业开发和应用的需求。飞桨目前开源的Parameter Server分布式训练架构在此体现了显著特性,可支持千亿级别特征规模的训练,低成本即可扩展CPU节点,提高数据下载、上传并发能力,同时还可以保障模型收敛效果,并提供同步训练、半异步训练、全异步训练、 GEO异步训练四种训练模式,开发者可根据特定需求选择最优模式,达到降本增效的目的。
除此之外,在推荐场景下ElasticCTR可采用飞桨高性能分布式训练Fleet引擎,作为一个分布式 High-level API,Fleet可以通过十行代码完成单机到多机的转换,Fleet的全异步并行训练设计,可以在保证模型效果的情况下大幅度提升训练吞吐,节省大量机器资源。
(ElasticCTR 开源软件栈)
紧接着,讲师与大家分享了ElasticCTR的其他优势。ElasticCTR提供完全开源的软件栈,保证企业开发人员能够快速二次开发和部署。飞桨还提供了远程预估服务Paddle Serving,其基于Baidu-RPC的高性能预测服务部署框架,来源于内部大规模业务线,通过开源面向企业用户,具备完整的在线服务能力,并提供易用的client API。此外ElasticCTR采用Kubenetes社区下的Volcano进行任务排版、资源调度,兼容Hadoop生态的文件系统HDFS,训练过程中的指标可视化集成了MLFlow。无论帮助大厂适配部署自己研发的推荐系统,还是为中小型企业减少“基层”研发时间提供通用的模型,ElasticCTR都在尽最大努力解决企业从开发到部署过程中遇到的问题。
(ElasticCTR配置训练)
在活动最后的应用实战环节,导师从环境准备、参数配置、执行训练、监控状态、预测服务的整体流程,让学员们一步步体验ElasticCTR推荐排序系统解决方案的实际应用。活动现场学员们热情极高,“没想到ElasticCTR这么容易操作,一键就可以完成配置训练”,一位学员这样说道。另外,大家也表示对于ElasticCTR之后能适用更多特定业务场景表示期待,也希望百度AI快车道能多举办ElasticCTR的活动,让更多人了解它的优势。
(百度AI快车道ElasticCTR北京活动现场)
百度 AI 快车道企业深度学习实战营是百度依托自身深厚的深度学习技术实践经验,面向有 AI 技术需求企业的算法工程师、架构师群体提供的快速应用扶持计划。计划的学习内容囊括了10套工程实施与深度学习技术落地结合的详细方案,覆盖百度领先的AI技术和业务应用场景的深入剖析,如OCR、精密仪器质检、推荐排序经典场景、遥感图像处理等;源于百度业务实践的深度学习平台飞桨的性能优势、模型优势、生态优势的解读;百度自研和顶级学术会议魁首算法、预训练模型的详细介绍,还有与案例和算法紧密相扣的在线实验,并以"学来即用"的课程,进行业务问题定位、框架及算法的快速应用培训,为更多企业带去深度学习技术和经验分享。
今年百度AI快车道带着自研精品课程已在全国多个城市开讲,干货满满的课程赢得开发者一致好评。虽然AI快车道在2019年的行程即将告一段落,但对于想要重温课程或错过现场听讲的开发者朋友,可以进入“IT大咖说”网站后搜索“AI快车道”收看活动直播,百度AI快车道随时与你相伴,在今后继续为你带来“惊喜”。
---------------------------------------------------------
免责声明:
1.本文援引自互联网,旨在传递更多网络信息,仅代表作者本人观点,与本网站无关。
2.本文仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
评论 {{userinfo.comments}}
{{child.content}}
{{question.question}}
提交