近期,京东云人工智能团队凭借多模态分析与生成技术在零售领域的产业落地,分别在2022年度国际多媒体学会会议(IEEE ICME)和中国多媒体大会(ChinaMM)上荣获两项大奖。这些获得顶尖学术荣誉的领先技术不仅展现出京东云在人工智能领域的扎实技术积累,也正在通过京东云这个平台对外输出,推动产业数字化发展。
其中,京东云完成的“Transforming Online Shopping Experience with Multimedia Computing”技术在国际多媒体学会会议(IEEE ICME)上,获得多媒体创新引领者奖(Multimedia Star Innovator);同时京东云凭借“多模态视觉内容分析”技术,在中国多媒体大会(ChinaMM)上荣获全国十佳企业创新技术奖。
京东云凭借“多模态视觉内容分析”获得全国十佳企业创新技术奖
京东云AI团队获得多媒体创新引领者奖
斩获AI顶会双项大奖 京东云以数智技术推动产业发展
京东作为一家新型实体企业,持续深耕数智技术积累。截至2021年底,京东体系在基础科学和技术研发上已累计投入近800亿元,技术成果遍布智能零售、物流仓储、智能城市等诸多数智供应链应用场景,在不断夯实自身数智化效能的同时,以京东云为技术与服务品牌对外输出核心技术,为合作伙伴数字化转型升级和降本增效拓展空间。近期,京东云在AI顶会斩获两项大奖,全面展示京东云在多模态视觉技术和多媒体技术应用方面的行业领先性。
京东云AI团队作为多模态内容理解的早期推动者,在视觉与语言、多模态内容交互领域完成多项前沿创新。在视觉与语言方面,围绕跨模态自洽、交互到共生的研究脉络打造了一系列视觉与语言的代表性工作(LSTM-A [1],GCN-LSTM [2],HIP [3],X-LAN [4],COS-Net [5]),在计算机视觉和多媒体领域国际顶级会议和刊物上发表论文十余篇,并开源了业界首个模块化、标准化的多模态视觉内容分析平台X-modaler [6],获ACM Multimedia 2021最佳开源项目奖。在多模态内容交互方面,依靠多项原创成果(ViCo [7], Tree-Block [8], SPT [9]),团队积累了完备的多模态实时内容交互技术,研究成果ViDA-MAN [10]获得ACM Multimedia 2021最佳演示论文奖,同时在聆听态数字人、演讲数字人等前沿领域组织国际竞赛持续增强影响力。此次京东云凭借“多模态视觉内容分析”技术,在中国多媒体大会(ChinaMM)上荣获全国十佳企业创新技术奖,再次印证了京东云在该领域的创新性和前瞻性。
此外,京东云凭借“Transforming Online Shopping Experience with Multimedia Computing”技术,在国际多媒体学会会议(IEEE ICME)上,获得多媒体创新引领者奖(Multimedia Star Innovator)。该奖项由国际多媒体大会IEEE ICME颁发,每年在国际范围内仅遴选一个引领多媒体技术的创新团队。京东作为本年度唯一获奖者,体现了其深耕零售领域的多媒体技术深度,也展示了在多媒体领域的技术影响力。
以京东云数字人技术为例,目前京东数字人主播已在零售场景中广泛应用,覆盖3C、家电、母婴等类型的京东自营店铺。在AI技术的驱动下,京东云数字人主播能够结合商品的不同功能,配合打招呼、双手摊开、握拳、点赞等丰富多样的动作。在京东云数字人主播的推荐下,消费者可以更直观、详实地了解商品信息,商家仅需一次性导入商品功能,就可以将这些信息转化为可感知的视频内容,并在直播间中介绍商品、智能地回答观众问题,7×24小时不间断直播卖货。
近年来,产业数字化浪潮的兴起,已经让人工智能等前沿技术落地拥有了越来越多的场景,不只是数字人直播间,智能语音识别技术、智能图片处理技术、智能审核技术等广泛应用,优化了用户体验的同时,也助力产业侧的降本提效。京东云也正在将自身场景中锤炼出的领先技术,对外释放,助力产业实现数智化升级。
京东云解耦京东技术能力,为千行百业打造数智供应链
京东在自身19年转型实践中,不仅沉淀了扎实的技术能力,更在复杂场景中反复验证出一套数字化转型方法论——数智供应链,旨在用数智化技术横向联结生产、流通、服务的各个环节,贯穿供应链全链条,从而降低社会成本,提高社会效率,助力城市、企业客户在数字化转型中提升韧性。
目前京东云已将这套供应链能力解耦出来,打造七大解决方案,包括1个数智化基础设施,以及覆盖数智采购、协同研发、智能制造、全域链接、价值服务、供应链一体化等全链路的6大业务场景。通过数智供应链建设,企业能够从产业链全局优化效率,以数智技术驱动数实融合,同时联结更多生态伙伴,实现更高效的数字化转型。
京东云依托领先的人工智能技术,以“智能终端+弹性算力”模式,为常州区域实现供需对接,将闲置产能及算力有效利用,在增加企业效益的同时,赋能区域生产产能“一网通享”,目前京东工业互联网平台已成功接入常州区域内3百余家工厂的3万多台设备,并成功消化价值近15亿的剩余产能,实现区域内产业结构转型升级。
在京东云人工智能技术加持下,保定12345政务服务便民热线实现了“接诉即办”数字化监管平台建设,大大提升了全渠道、全时段、全方位响应效率,22年上半年共受理群众诉求960190余件次,同比增长122.78%,响应率100%,满意率由65%提高到97%以上。群众诉求在哪里,回应就在哪里,12345热线数智化升级切实助力打通服务民生的“最后一公里”。
京东云的AI技术之所以能取得如此优异的成绩,得益于其在真实复杂场景的有效实践。未来,京东云将秉承开放共生的理念,将“更懂产业”践行到底,以领先的数智技术为千行百业打造数智供应链,助力产业重塑全球竞争力。
[1] Ting Yao, Yingwei Pan, Yehao Li, Zhaofan Qiu, Tao Mei, “Boosting Image Captioning with Attributes,” ICCV, 2017.
[2]Ting Yao, Yingwei Pan, Yehao Li, Tao Mei, “Exploring Visual Relationship for Image Captioning,” ECCV, 2018.
[3] Ting Yao, Yingwei Pan, Yehao Li, Tao Mei, “Hierarchy Parsing for Image Captioning,” ICCV, 2019.
[4] Yingwei Pan, Ting Yao, Yehao Li, Tao Mei, “X-Linear Attention Networks for Image Captioning,”CVPR, 2020.
[5] Yehao Li, Yingwei Pan, Ting Yao, Tao Mei, “Comprehending and Ordering Semantics for Image Captioning,” CVPR, 2022.
[6] Yehao Li, Yingwei Pan, Jingwen Chen, Ting Yao, Tao Mei, “X-modaler: A Versatile and High-performance Codebase for Cross-modal Analytics,” ACM MM, 2021.
[7] Mohan Zhou, Yalong Bai, Wei Zhang, Ting Yao, Tiejun Zhao, Tao Mei, “Responsive Listening Head Generation: A Benchmark Dataset and Baseline,” ECCV, 2022.
[8] Jiahang Wang, Tong Sha, Wei Zhang, Zhoujun Li, Tao Mei, “Down to the Last Detail: Virtual Try-on with Fine-grained Details,” ACM MM, 2020.
[9] Sijie Song, Wei Zhang, Jiaying Liu, Tao Mei, “Unsupervised Person Image Generation with Semantic Parsing Transformation,” CVPR, 2019.
[10] Tong Shen, Jiawei Zuo, Fan Shi, Jin Zhang, Liqin Jiang, Meng Chen, Zhengchen Zhang, Wei Zhang, Xiaodong He, Tao Mei, “ViDA-MAN: Visual Dialog with Digital Humans,” ACM MM, 2021.
评论 {{userinfo.comments}}
{{child.content}}
{{question.question}}
提交