当前位置: 首页 机器人 机器人作家将取代记者?

机器人作家将取代记者?

如果你认为媒体行业的颠覆是老生常谈,那么你需要再想一想。这仅仅只是开始,最大的威胁正在浮出水面——机器人作家,当然,这也有可能是机遇。

记者是什么样子?在美国,通常是一个穿着防水短上衣、带着呢子帽、手拿媒体票的小作家;在报社集聚的伦敦福利特街上,可能是一名酗酒工作狂;或随时做好牺牲生命、无所畏惧、满世界寻求真相的人。我们都认为新闻记者是“人”,是民主的重要组成部分,敢于向当权者说真话、推动思想与言论自由。

然而,记者与其他文字工作者似乎面临越来越多的威胁:互联网与数字化出版业颠覆其商业模式,“假新闻”引发的恐慌和招致的谴责严重破坏了新闻媒体的公允与可信。除此之外,现在还有一种新型的、可能是更致命的威胁。这种威胁与商业无关、与新闻发布的方式无关,而是关乎新闻的撰写方式。

英国广播公司近期的新闻报道称,到2022年,约有90%的新闻内容将由机器人撰写。随着数字化的发展与数据量迅速增加,未来很多新闻可以由计算机撰写,天气、足球与股市新闻都是首当其冲的领域,“自然语言生成”程序已经可以交付质量较好、可读性较强的新闻报道。

目前,挪威NTB通讯社的计算机甚至已经开始负责大部分选举报导的撰写。主编马斯·英格威·斯托维克(Mads Yngve Storvik)强调,他不认为机器人很快有能力进行采访。美国美联社的计算机已经可以每月撰写一万份经济与棒球新闻报导。亚马逊的创始人、亿万富翁杰夫·贝索斯拥有的华盛顿邮报正在快速开发新的内容管理系统(CMS),将可以自动生成内容作为核心功能。

机器人记者可能会导致世界各地成千上万名媒体人失业。但这并不意味着记者失去了一切。类似“巴拿马文件泄密”的调查性新闻报导或出色的个人专访类内容仍可以在新的媒体时代蓬勃发展,使出版方从竞争对手中间脱颖而出。无论作者是人类还是机器人,关于股市的新闻报道写得再好也不会赢得任何新闻奖项。除了这种专业的报导,其他新闻媒体能否实现完全自动化?日常的高频与个性化新闻业务可以由计算机撰写,但始终需要人类修改。新闻自动化后,怎么判断新闻价值?

机器学习已经有能力很好地复制特定的媒体风格与表达方式( 小报、严肃媒体、B2B 等),但如果没有人类提前提供实例来解释关键信息的话,人工智能仍很难从文档与数据中总结出最有价值的信息。迄今为止,软件还无法很好地认知世界,比如对于大型汽车制造商这样股票市场上的“重量级选手”而言,一天内股票下跌幅度超过3% 是很少见的,但如果揭露出柴油丑闻之类的事件,这种大幅下跌也非常有可能发生。不过,软件目前可以从之前的价格趋势分析中找到合适的报价,并配以合适的内容与语言写成文章,这在一年前仍是完全无法想象。

机器人记者正在为下一步发展做准备,但仍需要人类告诉它值得写的主题和应该使用的数据。这种情况将很快改变。机器人记者已经可以使用相对简单的算法,对互联网搜索的关键字频次以及社交网站上热点事件讨论的潜在主题进行交叉检验,计算出新闻话题。因此,机器人适合撰写当前正在引导舆论观点的话题,而且机器人还可以使用关键字从数据库中检索图片,用这种方式也能自动制作出视频内容。

由人工智能独立撰写的新闻稿:

快速开发迅速更新的新媒体内容还有另外一个重要原因。法国自然语言生成初创企业Récital 公司的研究人员托马斯·施罗姆(Thomas Scialom) 指出:“使用手机媒体意味着帮助读者理解内容的视觉辅助越来越少,信息量也受屏幕大小的限制,在手机上的阅读时间也在下降。”人类作者无法编写出更短、更个性化、更有针对性、更符合目标读者要求的内容,但人工智能记者可以。比如,如果只需要关于苹果公司股票走势的报告,人们就无需阅读全部纳斯达克指数的报告。关于苹果股票的报告不仅能够总结历史走势,还可以提供排名信息:当前是否只有苹果公司的股票受压力影响?亚马逊是否上涨?这种趋势是否也影响到了中国的腾讯公司?阿里巴巴是否暴跌?这与美国和中国的假期是否相关?最近是否发布了一些负面的经济数据?文章使用的数据源越多,与图表相比,文章的效果就越好。

英德商业新闻社dpa-AFX是首家开发模板解决方案的新闻社,可以在预先写好的句子空白部分简单地填上新数据。这些句子越来越多样化、更加复杂,但其原理仍基本保持不变。在汉堡工作的计算机语言学家帕特里克·麦克雷(Patrick McCrae) 解释:“完美的内容自动化解决方案不仅需要具备语言的多样化特点,还需要拥有强大的分析能力。如果没有人工智能参与其中,生成的文本不过是句子填空而已。如果可以从相关的数据源中提取有趣的、重要的关键点,人工智能就可以创作出内容多样化的文章。这正是我们需要人工智能的原因。” 比如,德国数字化出版商可以一键生成月度就业与培训市场观察报告,针对不同职业或受教育水平的群体设计内容,覆盖德国411个地区。该软件还能精确地提炼出人类编辑只能偶然发现的分析结果。

在这种自动化写作环境中,最大的挑战是从动态的文本源自由生成文本,而非特定的存储数据。麦克雷表示:“计算机科学尚未解决没有主题限制的自动化文本理解的问题。”

这个问题得到解决,将带来巨大的回报,形成一种永动式的媒体报道,计算机将创作新文章。新闻机构可以从软件撰写的一个文本开始,将其转化为向120个读者提供的120 种不同版本,这可能将拯救新闻机构。但软件能够理解反语、讽刺和注释等动态文本吗?施罗姆认为:“让机器理解非结构化的数据是目前最大的挑战。”一旦我们解决了这个问题,媒体行业将会迎来哪些变化,让我们拭目以待。

版权属于:大风号

原文地址:http://78soft.com/article/29753.html

转载时必须以链接形式注明原始出处及本声明。

猜你喜欢

最热文章

热门标签