智能媒体的技术演进与“后真相”时代辨析
The Technological Evolution of Smart Media and the Discrimination on the Post-truth Era
◎沈浩元方
Shen Hao Yuan Fang
摘要:随着大数据时代来临,数据和计算机算力增强,特别是机器学习、深度学习、人工智能和区块链等技术的发展,为媒体带来了新机遇和新的生态环境,使其变得更加智能化。计算机在处理视频、图像、声音、语言和文字等最主要的传播介质方面,有了智能的进展和技术突破。与此同时,生成式对抗网络深度的出现,也使得假视频、假新闻的制作更加容易。对真相的颠覆把公众带入了“后真相”时代。本文总结了智能技术在媒体中的应用,也分析了深度对媒体的影响和发展趋向。技术可以制造虚假,也可以辨别真实。技术进步无可阻挡,问题并不在于技术本身,而在于使用技术的人。
关键词:人工智能,智能媒体,深度,后真相
Abstract:With the advent of the era of big data,data and computer computing power has increased.Technologies such as machine learning,deep learning,artificial intelligence and blockchain have brought new opportunities to media and put them in new ecological environment,making media more in
telligent.Computers have made intelligent advances and technological breakthroughs in processing the most important media,like video,images,sound,language and text.At the same time,adversarial network also makes the production of fake video and fake news easier.The subversion of the truth has brought the public into the era of“post-truth.”This paper summarizes the application of intelligent technology in the media,and also analyzes the impact and trend of deep fraud on the media.Technology can create falsehoods and distinguish true ones.Technological progress is unstoppable.The problem is not technology,but people who use technology.
Keywords:artificial intelligence,smart media,deepfake,post-truth
技术往往遮蔽在文化中,只有当技术产生革命性变革时,人们才会意识到技术的重要性。技术一直是推动传媒产业发展的一个重要原动力,从报纸、杂志这样的文字媒体到广播、电视再到互联网,特别是移动互联网和社交媒体出现,媒体的演变历史就仿佛技术的发展史。近些年,大数据时代的计算机技术促进了机器学习、深度学习、人工智能等数据科学的快速发展。2017年国务院印发的《新一代人工智能发展规划》中指出:“人工智能作为新一轮产业变革的核心驱动力,将进一步释放历次科技革命和产业变革积蓄的巨大能量,并创造新的强大引擎,重构生产、分配、交换、消费等经济活动各环节,形成从宏观到微观各领域的智能化新需求,催生新技术、新产品、新产业、新业态、新模式,引发经济结构重大变革,深刻改变人类生产生活方式和思维模式,实现社会生产力的整体跃升。”①在这样的大趋势下,以机
器学习、深度学习和人工智能为代表的计算机技术,也在媒体行业中扮演越来越重要的角,新技术究竟会如何影响媒体的发展成了一个亟待思考的问题。
一、人工智能赋能智能媒体
媒体智能化的时代已经开启。2018年,路透新闻研究院对194名主编、CEO等相关媒体人员进行了调查,其中有关新闻业如何使用人工智能技术这一问题的调查结果显示,接近3/4的受访者已经在使用某些人工智能技术,他们提到的项目包括市场营销的优化、自动事实核查以及对标注和元数据的加速。②
大数据背景下的人工智能技术究竟为媒体带来了什么首先,技术可以作为媒体工作的协助者,尤其是在媒资管理和选题开发领域。媒体中的典型数据———文本、音频和图像、视频都是非结构化数据,较早时候,对这种数据的处理和分类非常困难,只能依靠人工完成。但是现在,随着自然语言处理、语音识别、人脸识别和计算机视觉等技术的发展,计算机工具在元数据管理和标注方面越来越有效,计算机视觉技术可以用来自动识别照片中的内容,对其进行标记并到类似的概念,从而加快图片编辑的工作流程。《福布斯》(Forbes)杂志使用一个名为“Bertie”的人工智能内容管理系统,
①②国务院.关于印发新一代人工智能发展规划的通知[EB/OL].(2017-07-20)[2019-08-13].http://www.gov.cn/ zhengce/content/2017-07/20/content_5211996.htm.
NICNEMAN.Journalism,media and technology trends and predictions2018[EB/OL].(2018-01)[2019-08-13].https://reutersinstitute.politics.ox.ac.uk/sites/default/files/2018-01/RISJ%20Trends%20and%20Predictions% 202018%20NN.pdf.
为记者提供报道主题的实时趋势、引人注意的标题推荐和相关图片。①而另一些工具,例如路透社(Reuters)的新闻追踪工具,则帮助记者到报道热点,这套系统每天识别超过1 200万条推文,从中选择出可能成为新闻的信息,并判断其新闻价值、准确性、新颖性和范围。②英国《金融时报》(Financial Times)通过一个机器人程序,分析报道中的声音来源是男性还是女性,如果男性声音太多,程序就会发出警告,从而试图扭转受众心中《金融时报》长期充斥男性声音的印象。③
除了协助之外,技术也在改变媒体的消费方式。由于移动互联网、社会化媒体的兴起和媒体融合的发展,即使是传统媒体也开始进入直接面向消费者的模式。这不同于过去媒体传播单向、体的特性。机器学习和人工智能算法可以用于对媒体受众的个体用户建模。根据用户的行为模式,可以建立起用户属性和偏好模型,根据模型向用户提供个性化内容和互动体验。Facebook从2006年起就开始使用信息流的个性化推荐算法,根据用户的点击、点赞、评论和分享等活动分析用户兴趣点,从而决定信息流的呈现顺序。谷歌也会根据用户偏好改变搜索结果的权重。更为我们所熟知的应用是类似“今日头条”和“天天快报”这样的资讯类应用App,它们利用用户画像推荐用户可能感兴趣的文章给他们。技术的进步提高了媒体对受众的洞察力,这种洞察力除了用于个性化推荐,还可以用于广告和客户维持。
技术对媒体的第三种影响是当下最受关注的热点之一,这就是它对于作为信息载体的符号———文本、声音、图像和视频的生成。这就意味着技术进入了媒体的内容生产,甚至意味着技术参与了传播媒体的内容建构。文本生成的技术在媒体中已经有很广泛的应用,2014年美联社开始使用自动化洞察公司的wordsmith软件撰写财报分析新闻,在国内,也有腾讯的Dreamwriter、新华社的“快笔小新”以及今日头条的“张小明”等新闻写作机器人参与到网站新闻的撰写中。内容生产不仅出现在重复和公式化的地方,也开始带有创意。《华盛顿邮报》(The Washington Post)正在使用的人工智能写作机器人从2016年9月到2017年9月的一年中写作了大约850篇稿件。④深度学习技术应用于机器翻译领域,可以用来解读丢失的语言。麻省理工学院和
①②③④ZALATIMO S.Entering the next century with a new forbes experience[EB/OL].(2018-07-11)[2019-08-15].https:// www.forbes.com/sites/forbesproductgroup/2018/07/11/entering-the-next-century-with-a-new-forbes-experience.
LIU X,NOURBAKHSH A,LI Q,et al.Reuters tracer:toward automated news production using large scale social media data[C].Boston,2017.
WATERSON J.Financial times tool warns if articles quote too many me[EB/OL].(2018-11-14)[2019-08-15].https://www.theguardian.com/media/2018/nov/14/financial-times-tool-warns-if-a
rticles-quote-too-many-men.MOSES L.The Washington Post’s robot reporter has published850articles in the past year[EB/OL].(2017)[2019-08-15].https://digiday.com/media/washington-posts-robot-reporter-published-500-articles-last-year/.reddit
谷歌人工智能实验室的一些研究者,以历史语言学中记录的语言变化模式为依据,利用序列机器翻译的方法捕捉语言间的字符及对应关系,①从而使得语言过渡到语音的生成看起来很自然。2017年Adobe公司推出了一种人工智能语音工具,它可以复制人类的声音。只要提供20分钟的讲话录音,人工智能就能分析它,并学习这个人如何说话。然后,计算机就可以利用这个人的声音朗读输入的文字内容。Adobe建立这个语音工具的目的是帮助音频编辑修复播客或者电影中的音频错误,但是它也引发了人类对技术潜在影响的担忧,因此并没有被实际发布。谷歌的深度大脑项目实现了一个语音生成模型,以帮助他们的智能助理设备与人更好地交流,这个模型将美国英语和普通话语音生成与人类表现的相似性提高了50%以上。
图像同样是深度学习大展身手的领域,2017年,英伟达(NVIDIA)公司的研究人员开发出一个系统,使用在两个相似的数据上训练的模型通过重叠的方式生成新的图像。计算机可以想象不同天气,白天或者夜晚下同一个场景的样子,这种技术可以应用于图片编辑,为媒体添加逼真的效果。②而有了声音和图像,接下来就该视频了。一家英国公司利用人工智能将演员的唇形与新的对话音轨同步,可以让大卫·贝克汉姆用9种语言发起终止疟疾的全球呼吁,这会为受众带来完全不同的体验。2019年6月,斯坦福大
学、马克斯·普朗克信息学研究所、普林斯顿大学和Adobe研究所的科学家展示了一种新软件,它通过深度学习让用户编辑视频的文本记录,以添加、删除或更改某个人说出的文字。③
人工智能时代的一个典型特征是计算机不再需要人告诉它如何做,而是自己学习如何做。它可以从大量文本中学习如何写一条新闻,从大量语音中学会如何模仿人类说话,从大量视频中学会如何模仿人类动作。当把这些技术综合起来的时候,我们会看到“机器人”的出现。Instagram上有一些由计算机生成的账号,它们会发表文字、发布图片,有大量粉丝,甚至还可以和粉丝进行消息互动。萨尔瓦多·达利去世30周年时,位于佛罗里达州圣彼得堡的达利博物馆利用人工智能“复活”了达利,他可以与观众交谈和合影。媒体行业中的一个热点是人工智能新闻主播。2018年,新华通讯社和搜狗公司联合开发的“智能新闻主播”在第五届世界互联网大会上亮相。计算机程
①②③LUO J,CAO Y,BARZILAYR.Neural decipherment via Minimum-Cost Flow:from Ugaritic to Linear B[C]// Proceedings of the57th Annual Meeting of the Association for Computational Linguistics,2019.
KNIGHT W.NVIDIA’s tag-teaming AIs imagine night as day,and house cats as tigers[EB/OL].(2017)[2017-08-20].https://www.technologyreview.com/f/609667/nvidias-tag-teaming-ais-imagine-night-as-day-and-house-cats-as-tigers/.
FRIED O,et al.Text-based editing of talking-head video[J].ACM Trans.Graph.,2019,38(4).
序模拟了语音、表情和唇部动作,只要输入文本,它就可以24小时不间断播报新闻。2019年央视网络春晚中,撒贝宁等主持人的“孪生兄弟”参与了主持工作。这种虚拟孪生主播基于主持人的面部和录音数据生成模型,可以模拟主持人的表情、语言表达、手势、肢体动作等。日本国家公共广播机构NHK创建了动画新闻主播“Yomiko”,从2018年4月起,Yomiko每周都会在一档新闻节目中出现。除了在节目中进行播报外,它也在谷歌和亚马逊的一些智能设备中为用户朗读新闻内容。
上述应用也可以被综合起来,新华社发布的“媒体大脑”系统就是一个很好的例子。该系统包含智能媒体生产、新闻分发、录音内容转写、版权监测、人脸核查、用户画像等多项功能,作为新闻生产基础设施发挥了重要作用。
二、技术颠覆真相,“后真相”时代
从对智能媒体应用的梳理中我们可以看到,技术的发展极大地方便了媒体及相关从业人员,为他们带来了更多能量,协助他们更好地完成工作。但是,技术的发展也带来了一些隐忧———技术如此深刻地渗入媒体行业的方方面面,是否走得太远了呢?李普曼在《公众舆论》一书中提出了媒介再现和社会现实的概念,正因为媒介所反映的现实不是真正的现实,记者作为公共利益的维护者和捍卫者所承担的职能
才更加重要。而现在,技术可以作用于传播内容符号,影响内容生产,还可以把关媒体向受众传播的渠道。那么技术是否在某种意义上成为控制社会环境的主体之一呢对这个问题的探讨还让我们注意到被称为“深度(deepfake)”的一种技术。这个词起源于2017年,一位以此命名的Reddit用户在社区上发布了一些交换人脸的视频。也许他发布帖子的时候并不会想到,这个词接下来会如何深刻地改变我们的世界。从字面意义来看,深度合并了深度学习(deep learning)和虚假(fake),代表了使用“深度”(deepfake)的技术。
深度技术使得我们可以比较容易地创建虚假的视频内容。2018年4月,BuzzFeed发布了一段视频,视频中奥巴马警告了假新闻的危险性,但这其实是电影制作人乔丹·皮尔制作的片段。网站“此人不存在”利用GAN制作不存在的人脸,每当刷新一次页面,网站就会展示一张新的脸。这些人脸大部分都非常逼真,他们基于英伟达公司名为StyleGAN的生成式对抗网络(generative adversarial networks),使用被称为“风格转移”的深度学习技术。这也许对于机器人账户来说是一个利好消息,它们不需要用已经存在的照片来伪装人类身份了。2018年10月,在佳士得拍卖会上,由GAN创建的肖像画以432 500美元成交。我们看到,深度学习算法已经能够模仿创造力。比起深度造
版权声明:本站内容均来自互联网,仅供演示用,请勿用于商业和其他非法用途。如果侵犯了您的权益请与我们联系QQ:729038198,我们将在24小时内删除。
发表评论