系统由数据采集模块通过定制的分布式爬虫根据规则库及种子资源抓取数据,传送数据预处理模块由ETL(结构化与数据清洗)节点进行数据过滤,该模块将每篇文章进行结构化处理后分流存入本地内容库。固化后的数据实时进入全文库中,进行中英文分词和索引建立,之后由数据分析模块对新闻信息进行多种应用层计算后返回数据给前端由数据可视化模块
进行大屏展示。
1
2
新闻大数据模块架构图
本地内容库
架构图
119
3
3. 数据分析模块
数据分析模块通过在应用层对Elasticsearch的数据进行处理,得到多种数据分析结果供前端调用,这
些处理方法结合了TF-IDF、Word2vec、余弦相似度
aliyuncs/ossrs/srs:encoder \
ffmpeg -re -i ./doc/source.200kbps.768x320.flv -c copy \ -f flv -y rtmp://localhost/live/livestream
3. 5G+XR与高精度智能抠像、真三维虚拟演播室的融合使用
随着5G技术的不断发展与完善,探索面向受众的低延时、高带宽的节目和场景,已经成为电视媒体融媒体发展的重点工作。在诸多融媒体形态中,XR 有望成为电视节目样态大规模应用的最佳展示和发展趋势,将成为广电5G时代的典型应用之一。
在XR技术应用融合平台上,我们采用了Sobey 公司的LiveHand系统平台,该平台集多路音视频信号切换、虚拟现实演播室、图文包装、字幕机、DDR播出、调音台等功能为一体。在节目制作中,北京演播室通过5G网络传回来的视频流,调用本地GPU资源对画面进行渲染,最后将结果转换成SDI 信号输出到系统平台。
系统平台获取渲染后的音频、视频,并利用通用音、视频编码器(音频编码支持AAC,视频编码支持H.264和H.265)将其压缩成通用格式,然后使用系统平台的智能化高精度抠像功能,通过一键抠像方式可以很方便地把人物完美呈现,同时还可对抠像的人物进行实时颜修正及任意场景裁切和大小缩放。
最后利用虚拟现实演播室功能,通过XR技术将抠像后的人物实时导入到预先创建好的“云访谈”演播室中,
北京演播室的人大代表与主持人就完美地“坐”到同一张桌前,从而实现了跨越千里的面对面云访谈。4. 远程视频备份技术
网络是不可控的,但代表的时间是有限的,我们要在有限的时间内,万无一失地完成整个节目的录制工作,为此我们采用了远程视频备份技术。
在节目录制开始,我们就要求北京演播室利用5G聚合网络设备,同时传输两路采访画面。其中一路采用WebRTC方式传输,侧重于网络传输的低延时特性,以满足“云访谈”节目主持人与北京人大代表实时面对面访谈的节目制作需求。另外一路回传画面对延时要求不高,可以放宽至两至六秒延时,但对画质和稳定性要求相对较高。当节目录制因低延时造成画面受影响时,我们就会使用北京回传的备份画面,通过虚拟现实演播室技术重新渲染生成稳定的节目制作画面,这样我们就做到了一次录制,可以无数次对节目画面质量进行修正,以求达到最好的观看效果。
四 总结
全国两会不仅是关乎国计民生的一次重大会议,同时也是一场有关科技展示的盛大秀场。江西广播电视台技术团队以技术创新为引领,助力电视、广播、新媒体等各大平台个性化生产、可视化呈现、互动化传播,全景报道两会盛况。我们将始终以“自主研发”为制胜法宝,将“技术创新”发挥到极致,采用新技术手段,不断突破传统媒体发展边界,实现媒体的全面转型,全力以赴不断攀登技术巅峰。
(上接121页)
新闻大数据系统的建设优化了广电行业新闻生产的流程,节省了大量的人力、物力和财力,并实现了跨地域、跨行业的平台资源整合,相应地也对系统的安全性、稳定性、可用性、开放性都提出了相当高的要求。
浙江广电融媒体中心新闻大数据系统于2018年9月完成大部分系统建设并投入实际生产,陆续为浙江广播电视集团内各频道提供全网新闻线索汇聚、全网舆情检测、新媒体发布统计考核等服务。同时浙江广播电视集团响应号召,协同丽水、青田等多个浙江省内地县市打造省市县三级媒体联动的融媒
参考文献:
[1]广播电视行业应用大数据技术白皮书(2018)[S].国家广播电视总局科技司,2019.
数据可视化大屏设计[2]顾建国,吴昊.《广播电视行业应用大数据技术白皮书(2018)》解读[J].广播与电视技术,2019,46(08):12-16.
[3]张宁, 贾自艳, 史忠植. 数据仓库中ETL技术的研究[J]. 计算机工程与应用, 2002(24): 213-216.
体平台,新闻大数据系统就是其中的重要组成部分,未来系统还将为更多的地县市及垂直领域用户提供新闻大数据服务。
128
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论