- 手机:13048294178
- 电话:0772-816794737
- Q Q:508565590
- 邮箱:admin@shfareast.net
- 地址:宁夏回族自治区固原市涉县洛标大楼87号
封面传媒的主流媒体算法研究与实践
来源:hth华体会全站app 发布时间:2023-03-10 00:47nbsp; 点击量:
封面传媒的主流媒体算法研究与实践 智媒体时代的价值观构建 ——深入主流媒体算法的研究与实践 摘 要:技能赋能在传统媒体融合转型的历程中起到越来越大的感化,将人工智能算法应用在媒体出产流传的各个环节。可是以内容个性化推荐为代表的算法技能在为用户提供精准化、智能化办事的同时,也带来了宁静风险因素增高、不良信息泛滥风险增加以及传统权利掩护难度加大等风险和问题。如何解决人工智能算法技能在赋能同时所带来的问题,封面新闻早在2015 年就自建团队投入对 AI 算法在媒体应用的研究,颠末近 5 年时间与实际业务的磨合,也逐渐探索出一套适合主流媒体应用的算法模型。
同时公布智媒云 3.0,基于封面智媒体转型经验打造了主流媒体算法平台,赋能更多传统媒体转型。关键词:主流媒体算法;人工智能;推荐算法;智媒云;封面新闻 本文著录格局:徐桢虎,张 华,余 欣 . 智媒体时代的价值观构建——深入主流媒体算法的研究与实践 [J]. 中国传媒科技,2020(12):13-17. 作者简介:徐桢虎 (1986-),四川达州,四川日报报业集团特聘首席工程师兼封面传媒首席数据官;张华(1973-),男,重庆 ,封面传媒副总司理、技委会主任;余欣(1977-),男,四川,封面传媒首席宁静官。作者单元:四川封面传媒有限责任公司 NO.1 智能媒体的成长痛点 比年来,技能赋能在新闻范畴的泥土里蓬勃生长,已经逐渐形成了当前人工智能应用的一个重要分支。
在移动互联网、大数据、人工智能等新技能的驱动下,再加上硬件设备如智能手机普及、软件情况如移动互联网崛起、技能成长如算力晋升和算法进化,数据资源如社会化大数据进程,交互场景厘革如虚拟现实人机对话的遍及应用, 这些因素为传统媒体融合转型的快速成长提供了情况铺垫。人工智能并不是一个新观点,可是技能应用尚处于低级阶段,即“弱人工智能时代”。今朝在成长成熟的新闻范畴,对于人工智能技能的应用偏重点聚焦在晋升效率上。
在新闻的“策采编审发”这五大内容出产环节中对反复性较高的人力劳动的替代。较为常用的人工智能应用包括:通过全网监控热点来筛选新闻选题,操纵抓取技能获取实时的全网信息,举行各类类型的快讯呆板写稿,算法实现自动审核校对,借助个性化推荐实现内容精准分发等。可是以内容个性化推荐为代表的人工智能算法技能在为用户提供精准化、智能化办事的同时,也带来了宁静风险因素增高、不良信息泛滥风险增加以及传统权利掩护难度加大等风险和问题。
如何解决人工智能算法技能在赋能同时所带来的问题,尤其是在技能实力还不敷强大,处于转型期的传统媒体来说,成了摆在媒体行业的一个大问题。NO.2 主流媒体算法的研究与应用 2.1 应用根基环境 封面新闻早在 2015 年就投入对人工智能技能在媒体应用研究,颠末近 5 年时间与实际业务的磨合,逐渐探索出一套适合主流媒体应用的算法模型。封面推出的主流媒体算法包括内容质量、内容分发、内容流传、内容出产四大类算法模型,已经实际应用在封面的各个业务场景中不变运行。
对于每个算法模型的详细研究与应用,我们从各偏向做出了具体解答。2.2 内容分发算法 内容分发算法以 App 应用为主要载体,包括推荐算法、相关新闻算法、搜索算法等。个中推荐算法一直处于舆论的接头热点中。
《人民日报》曾持续三天撰文从内容出产、信息分发和社会创新等角度对某算法型信息分发平台举行了全方位立体式的批判。[1] 在今朝主流的推荐算法中,用户的内容阅读习惯成为内容推荐的主要指标。
个性化内容推送让用户过滤掉本身不感乐趣的信息内容,着迷于最初想看的信息内容中,实现“看我想看,听我想听”的体验。这无形间强化了用户的偏好,影响了用户对于信息内容的自主选择,导致用户对于信息内容打仗面越来越狭隘、单一和固化,形成“信息茧房”效应。
[2] 因此,推荐算法的革新势在必行,各信息平台应该履行其责任意识,国度网信办也多次发文要对网络信息情况举行专项整治。2019 年 12 月 20 日,国度互联网信息办公室公布了第 5 命令《网络信息内容生态治理划定》[3],个中针对当前网络信息内容办事平台接纳个性化算法推荐技能推送信息所带来的问题,给出了一套全新的解决方案。
即将算法推荐模型 + 人工干预 + 用户自主选择三者举行有机联合,旨在构建一个具备整体性、群体性以及个别性的网络信息内容生态,实现信息内容的高度和宽度。随之而来的问题是,传统媒体凡是并不具有高程度的技能团队举行算法研发,而互联网资讯平台又不具有传统媒体那么强的信息宁静敏锐性和内容出产专业性,因此适合于主流媒体的推荐算法并没有在很大水平上告竣共鸣。
封面此刻应用的主流媒体推荐算法,颠末了多个版本的迭代,在封面新闻 App6.0 上线的最新版本。其推荐计谋与《网络信息内容生态治理划定》的要求是高度一致的,即将算法推荐模型 + 人工干预 + 用户自主选择三者有机联合生成及时推荐流,确保内容的规模、标准可控,同时越发突出正能量信息和主流价值观。2.2.1 健全人工干预机制 包管信息内容的多样化,在推荐信息流中增加内容绿区和电子围栏,增加媒体原创稿件和重大事件的曝光权重,限制低质量 UGC 内容进入推荐频道,包管主流价值引导,同时也可以或许弥补算法无法判断信息内容所表现的价值倾向的毛病。人工干预机制的健全,对于算法成见和主流媒体自身内容出产的优化也能起到重要感化。
同时业务部分通过对推荐频道各种型新闻的发稿量、曝光率、阅读转化率等指标举行数据阐发、针对性的内容增补和算法计谋优化,以到达用户获取信息多样性的目的。2.2.2 成立用户自主选择机制 强化用户的自我决定和主观能动性,防止人类成为算法的奴隶。传统的推荐算法仅仅是在用户第一次使用App 时,接纳冷启动的方式让用户举行乐趣选择。依托封面的用户阐发模型,用户不仅能及时看到小我私家的乐趣标签画像,同时还能以可交互的方式自主选择内容乐趣及其权重,选择成果会通过系统阐发计较并及时生效。
想要实现用户自主选择机制,前提是要构建一个完善的用户标签系统和数据堆栈,以支撑对于用户个性化的办事应用。2.2.3 优化个性化算法推荐机制 个性化的算法推荐,依然是推荐系统中不行缺少的一部门。
封面的推荐算法由用户乐趣阐发、用户场景阐发、新闻内容阐发、行为及时计较、新闻推荐召回五大模块组成,接纳算法包括:基于用户乐趣标签的 tag 算法,基于协同过滤的 CF 算法、以及基于 NLP 的召回算法等。个性化推荐的流程主要包罗三层逻辑,第一层是内容召回,主要垂青新闻内容特征的应用和搜索排序,对于文本、视频的标签编目是焦点;第二层是乐趣召回,主要按照第一层的排序成果,再与用户的行为特征信息举行匹配,第三层主要是敏感信息的过滤,包括黑白名单以及文章分类的权重的鉴定,通过内容质量算法模型提供支撑。对于内容分发来说,推荐算法是焦点,而相关新闻算法和搜索算法中不仅应用到推荐的部门算法计谋和详细技能,也应用了内容质量、内容流传的一些基础算法,在后面会具体讲到。
2.3 内容质量算法 内容质量算法以智能化内容出产系统“封巢”为主要载体,包括热点聚合算法、内容审核算法、新闻标签算法、价值判断算法等。热点聚合算法通过对全网数据的抓取和阐发,举行及时热点的判断。我们已经成立了全网抓取平台,通过及时监测汇聚网站、微信、微博、论坛社区等各大媒体平台内容大数据,现已经支持凌驾 1000 个海内主流媒体的图文、视频源收罗。可作为舆情信息搜集、区域资讯同步、记者编辑素材,支持二次编辑或自动公布,同时支持将收罗资源举行敏感词、反复度等计谋过滤。
联合及时收罗的多平台热榜热点举行阐发,为编辑提供热点选题参考。2.4 内容流传算法 内容流传算法主要包括媒体区块链算法、用户阐发算法、舆情阐发算法等,这部门的算法凡是都不是独立的算法模型,而是由多个基础算法整合应用到详细的业务场景中。
好比媒体区块链算法是由智能合约算法、共鸣算法、哈希算法、公钥暗码算法等基础算法构成,今朝应用在封面传媒自主研发的区块链数字内容版权存证系统里。每一篇记者创作的原创稿件,公布即“上链”,并生成唯一无二的存证证书,可以在封面新闻 App 的新闻详情页看到及时上链信息。在当前媒体行业中,数据的共享互换往往是个难题,直接开放本身的数据库会带来宁静隐患,开放接口办事又需要本身去维护繁琐的权限关系,今朝主流的爬虫方式又面对不变、法令限制等诸多因素的影响。
在基于区块链数字内容版权存证系统的同盟链中,同盟各成员只需要颠末授权就可及时获取其他节点的数据。极大地降低了数据共享成本和庞大性。[4] 用户阐发算法主要应用于用户阅读行为研究,应用到的算法包括相关阐发、对应阐发、聚类阐发、因子阐发等。
我们成立了智能阐发云系统,通过对用户分类分层、事件漏斗、阅读偏好、用户行为路径等各个维度提供日常数据阐发能力和自动生成报表。操纵数据辅助 App 精准运营。
不仅支持对 App 用户阅读乐趣、小我私家偏好、寓目时长、点评赞等互动信息的数据阐发,提供新增用户、用户留存率、用户活跃度、使用时段等维度的数据阐发功效,还可以或许提供对图文、视频、公布量、公布渠道内容流传环境等多维度的数据阐发。作为主流新闻媒体来说,舆情阐发算法长短常有须要的。通过全网抓取平台对全网信息举行监测,当互联网上有与话题相关的舆情发生时能实时发明,对这些舆情信息举行阐发,包括全网的各大新闻媒体网站以及各种社交平台。详细可以从时间、感情、网友接头度、主题等几个方面入手举行阐发,并以此来相识舆情的感情倾向。
应用到的基础算法包括分类聚类、线性和非线性、时间序列以及决议树等。2.5 内容生成算法 内容流传算法主要包括呆板写作算法、视频生成算法、文本生成算法等。传统媒体在转型历程中的另外一大问题是原创出产内容效率不敷。
此刻这个信息爆炸的时代,用户注意力不再像以前纸媒时代那样集中,假如媒体还是以以前的内容出产方式来做新闻 App,出产内容的量级是远远满意不了用户的需求的。而 UGC 平台的大部门流量都被头条、几家头部互联网平台所占据,再加上自媒体的鼓起,所以在原创内容出产上主流媒体也要拥抱人工智能技能。操纵呆板撰写时效性要求高、强调客观事实的新闻快讯,能在时效性和产出量同时获得包管,从而使有限的人力资源可以或许投入在越发专业深度的报道中去。除了在报道质量上能满意要求之外,呆板写作的主要优势在于极大地晋升了新闻产出的效率。
生成一篇新闻耗时短,可同时生成多篇新闻,呆板写作已经帮忙新闻出产摆脱时间和人力的桎梏。[5] 而且技能进步正在慢慢实现呆板人举行基于理解的新闻创作。
语法阐发使语言流畅,深度进修可以或许自适应多种场景、更多信息粒度和维度构建的常识图谱、多样化的输出形式。封面从 2016 年开始试水呆板写作,此刻自研的 AI自动化写作平台每月写稿量已凌驾 50000 篇,包括文本和视频两种类型,写稿的范畴涉及体育、财经、糊口、科技等 10 大类 40 多个小类。
频道接纳呆板辅助编辑办理,实现了全国 34 个省区市新闻内容的自动抓取、地理定位、智能分发。并将这些新闻接入谈天呆板人语料、语音查询功效、个性化推荐定制化写作等多种交互渠道中去。NO.3 应用路径与将来规划 在业内提出了“主流算法”的基础上,封面进一步把主流媒体算法的观点举行了富厚和完善。
在应用路径上,需要从以下 4 个维度执行算法实践的详细事情: 3.1 明确方针偏向 也就是需要解决业务场景中的哪些问题和创新应用点。要跟业务部分保持常态化的相同机制,相识业务的痛点在哪。把业务痛点细化为业务需求。
3.2 明确能力模型 也就是对算法自己要到达的应用能力的要求。明确哪些算法能力是需要完全自主研发,哪些能力是自身不具备可以通过先互助共建,后期再进修鉴戒的。3.3 明确产物化拟定 也就是对算法在业务中的实际应用场景要拟定具体的方案,有了明确的规划并要在详细的事情摆设中同步推进环境。
3.4 明确评估体系 也就是对算法效果要有相应的评估尺度,才能找准进级优化的重点。包括曝光率、点击率、召回率等,都需要明确每次算法迭代时需要晋升的指标,量化算法的效果。
总结下来,就是从拟定方针偏向-到明确能力模型-到算法产物场景-到应用评估晋升,扎扎实实走好这四步,主流媒体算法的构建与应用事情才能落到实处,这也毫不是一个短期内就能做完的项目,需要长时间在业务场景的实践。颠末持久与业务部分磨合的积聚,封面在主流媒体算法的应用逐渐成熟,把算法应用平台化但愿可以或许赋能给更多的媒体。
以具有价值观判断的主流媒体算法为焦点,贯串内容质量、内容分发、内容流传、内容生成这四大场景,这也是我们今朝正在做的工作。个中智能推荐、搜索、内容审核等算刑场景已经应用到多个对外输出项目。封面一直以来专注智媒技能的聚能进化,在主流媒体算法的研究与应用只是本年重点推进的一个偏向,在智媒体的路上另有更久远的规划。
作为封面传媒的又一重磅产物,“智媒云”3.0 版本进一步通过数据驱动、算法重构,为媒体在视频流传、社群营销等范畴强力赋能。智媒云对外的定位,是封面传媒自主研发的全系统解决方案。
智媒云对内的定位,是智能技能赋能聪明内容、智库运营的创新引擎。以人工智能为代表的新技能正在深度重构流传,催生智媒体新物种。
这是封面智媒体“新物种进化论”的科技 + 媒体成长观与认识论,智媒云正是基于智媒体的创新引擎与解决方案。智媒云创新引擎赋能封面新闻焦点产物,是连续推进媒体深度融合“封面智媒体模式”的路径摸索:智媒云通过智能技能、聪明内容、智库运营、智媒新基建 4 大矩阵的研发进级,实施数据驱动首位战略,连续富厚智媒体多范畴、市场化的应用场景,拓展“科技 + 传媒”业务范畴,晋升中国封面品牌影响力,完成从头毗连世界的使命,构建引领人工智能时代的泛内容平台。[6]。
参考文献 [1] 喻国明,韩婷 . 算法型信息分发:技能道理、机制创新与将来成长 [J]. 新闻喜好者,2018(04):8-13. [2] 杨婕 . 中心研究 | 善用算法——个性化内容推送的中国智 慧 [EB/OL]. 信通院互联网法令研究中心,2019-12-20. https://mp.weixin.qq.com/s/Nrxq-Vrv1nskJQD9vCpeGw [4] 徐桢虎 .“呆板写作”驱动智媒时代 [J]. 青年记者,2017(31):54-55. [5]张华,徐桢虎.封面新闻智媒云的摸索与实践[J].青年记者,2020(21):17-18. [6] 徐桢虎 . 当科技“链”上传媒:区块链在封面新闻的应用[J]. 中国报业,2020(05):29-31.返回,检察更多。
本文关键词:封面,传媒,的,主,流媒体,算法,研究,与,实践,hth华体会最新网站
本文来源:hth华体会最新网站-www.shfareast.net
推荐新闻 MORE+
- 封面传媒的主流媒体算法研究与实践 2023-03-10
- 美媒:美国人担忧,他们的社交媒体正在 2023-03-10
- 用心用情讴歌新时代 磨炼“四力”建设“ 2023-03-10
- 你爆料,我曝光!8796222,等着有“料”的 2023-03-10
- 园艺显著改善老年女性健康状况 2023-03-10
- 专家称超级细菌不会像SARS猛烈源于滥用抗 2023-03-10
- 卫计委:登革热病例超2.7万输入性病例仍 2023-03-10
- 医保异地结算落地揭异地结算的好处 2023-03-10
- 选公司必看|新媒体部门在公司里的3种角 2023-03-07
- 杯子主题LOGO设计合集鉴赏 2023-03-07