如何用chatgpt收集新闻资讯 作为“对话”的新闻——ChatGPT带来的新闻业态变革可能 | 芒种观点

AI资讯1年前 (2023)发布 fengdao
26 0

点击上方蓝色文字

关注“腾讯媒体研究院”

颠覆了人们对于人机交互的传统设想,也推动信息传播模式的新一轮变革。尤其值得关注的是:的底层技术架构、模型算法采纳与大规模算力支撑等,使其具备与人类“对话”的能力,并初步达到通用智能的水平,或以基础设施的定位给各行业带来新的变革想象。从新闻学视域来看,随着人工智能技术与新闻生态的深度融合,新闻采集至新闻呈现的生产过程将发生结构性变化,新闻生产者与传播者之间的互动身份与关系会得以重塑,从而推动新闻传播业态的深度变迁。

腾讯媒体研究院转载的本篇文章尝试回应如何理解人工智能技术的底层逻辑,并从一个更加开放和创新的视角,来理解什么是人工智能时代的新闻及传播。

来源| 新传播智库

作者|宁鹏莉 王建磊

人工智能技术与新闻传播领域一直是深度融合的关系,“机器写作”“数字人播报”“AI剪辑”等前沿科技不断刷新数字新闻行业的面貌。从人类传播史来看,每次技术革命不但带来信息传播效率和方式的转变,还会从微观层面影响新闻文本的结构及新闻表达方式,体现出媒介表达的时代性,像以和新浪微博为代表的社交媒体,曾带来“喃喃自语和碎碎念为表达方式”的“私语式”新闻[1],以各类直播平台为载体所带来的直播社会事件的“剧场式”新闻[2]等。

如今,火爆全球的通过学习和理解人类的语言来回答问题、撰写文稿、编写代码等,意图建构一种高表达质量、高智慧度的信息传播方式。从新闻学视域来看,与较早出现的新闻聊天机器人一样,都专注于对话生成的语言模型,能够根据用户的文本输入,产生相应的智能回答。这种人-机对话的结果在于提供一种精准的、客观的信息服务,而这与新闻业长期以来专注于“讲述事实” 和“提供理性分析”的传统[3]不谋而合。正是从这一逻辑出发,将会给新闻形态和传播范式带来怎样的变化,成为值得认真探讨的话题。

“新闻”的本质:

作为一种信息模型

(一)新闻与信息的融合

新闻是新近发生或者正在发生的事实的报道。从广义上来说,信息的内涵大于新闻,新闻只是信息的一种类型,是具有新闻价值或具备新闻条件的信息[4]。学者方晓恬基于史料梳理了从20世纪80年代中国国内“信息热”的兴起,到“信息”作为概念被新闻学正式引入和发展的历程,她认为“信息”经历了一个不断转型的过程,逐渐实现了与“新闻”的融合[5]。结合新的社会现实背景,有学者提出“新闻是新近信息的媒介互动”,强调信息对事实的取代、传受双方的审视以及媒介互动的过程[6]。而随着传统媒体在生产流程、体制机制、渠道建设及内容范式上进入深度调整期,“新闻供应”的理念和实操逐渐被“信息获取”的大众需求所超越。由此带来的变化是:第一,新闻的类型和外延不断扩展,以“软新闻”为代表,各类非事件性的信息及富有人情味、趣味性的信息等被纳入“新闻”序列,与之相对应,也出现了很多包含主观叙事、流水账、数据可视化等另类表达样态的新闻文本。这些新样态解构了新闻固有的报道模式,但并未消解新闻价值和新闻事实本身,且顺应了数字化转型的趋势和用户接受习惯的转变。第二,在媒介竞争逻辑嬗变的背景下,新闻的服务功能得到更多强调,有学者提出主流媒体不仅是新闻内容发布者,也需要成为信息内容服务商[7]。这要求媒体及其从业者在新闻生产、传播过程中建立“信息观”,并通过关联、交叉、溯因等方式整合信息产品,贯彻信息的服务性与多功能性,以增强自身在媒体生态中的竞争力。

可见,新闻与信息的融合是新闻业不断扩展自我边界,拓展更多功能和获得更多市场支持的过程。在信息产业与媒体产业的双向进入中,新闻与信息的融合既是应然趋势,也是必然结果。一方面,二者的融合为新闻生产的语境和新新闻样态的实践创新提供了宽松的土壤,消除了新闻本身可能的身份顾虑。另一方面也大大拓宽了新闻传播的主体,降低了新闻发布的门槛,尤其在混合自媒体的语境中,信息和新闻的边界进一步走向模糊和消弭。

(二)对话式的新闻形态

从词源上来说,“对话”() 源于希腊语 “”,意为“穿越于不同主体间的词语及意义”。苏格拉底最早开启对话实践,他在与别人的交谈中表达和发展思想,通过问答式的教育方式来开启民智。学者奥伦·索弗(Oren )于2009年最早提出“对话新闻学”,他把“客观”和“对话”当做理解新闻功用和记者角色的两种不同思维方式,强调对新闻民主的倡导,以及对客观性新闻规范的反思[8]。蒋晓丽认为与“客观新闻学”及其所倡导的新闻“反映论”不同,新闻“对话观”承认新闻传播主体自身所携带的历史性、社会性、意识形态性,不以“是否真实”“是否客观”作为唯一的新闻准则,而以是否促成平等、和谐、民主的对话为目标为旨归[9]。更有学者进一步指出,“新闻的本质就是一种对话,新闻写作的‘对话性’可以让新闻报道回归事实本源,同时更具有故事性和可读性,尊重受众的阅读体验和反馈”[10]。

疏通了“新闻”与“对话”的理论逻辑后,在两者的嫁接方式上出现了两种情形:一是将“对话”作为新闻报道的具体实操,如2022年两会期间,新闻媒体许多关于两会的报道就是一种“对话性”主导的新闻实践,其为社会问题找到建设性方案而开展对话[11]。另一种就是直接将“对话”作为呈现样态置入传播流程,比如早先出现的新闻对话机器人(News ),通过与用户进行双向互动,以对话形式呈现新闻资讯,并带来聊新闻的体验和点对点的个性化新闻分发模式,“这种‘对话式新闻’具有交流感、拟人化等特征,在传递信息的同时也满足了用户的情感需求”[12]。

尽管有学者指出,“新闻交互的底层逻辑和哲学其实就是对话理念”[13],但如果把“对话”作为一种新新闻样态,会面临两个主要的挑战:一是“对话”的样式与“5W”“华尔街体”“新华体”等正统写作格式存有巨大差异,很难被新闻专业人员接受;二是“对话”的发生需要两个主体的互动共建,这意味着新闻将不再被记者单向“报道”。具体到这样的技术方式,假设要呈现同一件新闻事实的影响和评价,会因为一千个哈姆雷特的提问而导致一千个截然不同的信息输出——面对这样的挑战与质询,笔者认为一是要回归新闻的本质,从信息模型及传播功能的角度重溯新闻业流变:从19世纪之前记者还不是一份正式职业,到传统媒体历经黄金时代,到今天专业媒体不再是人们获取新闻的主要渠道,在传播历史百年巨变的背景下,新闻文体的变化恰是传媒业不断转型的外显,也是媒介时代性的体现,需要时代本身对其有一定的宽容度;二是要跳出传统媒体的局囿。“新闻”作为概念历来是被其隐含的主体——传统媒体所界定的,近来有学者通过受众观和受众参与新闻事业的研究,提出“用户新闻”的概念,描述了用户发挥主观能动性,使用数字技术进行内容生产、传播泛新闻内容的现象[14]。这一视角的转换让人们在理解新闻的定义上更加开放,也更具备现实意义。在过去几个月,全球用户与的互动狂欢中,“对话”被熟稔地炮制和源源不断地生成,其中包含了大量的新闻资讯信息,只不过,这种“对话式新闻”在文本本身的结构和阅读顺序上都被使用者改变了,确切地说,是用户界定了自己如何接受新闻的所有秩序,这一变化只是开始,新闻的类型、风格、承载终端等,在人工智能时代都会变得更加多元。

对话何以发生:

的技术结构与实现逻辑

是什么?它自己的回答是:“是一款由开发的聊天机器人,它具有出色的自然语言处理能力,能够与人类进行真实的对话”。这句话中“真实”的使用是很大胆的,这意味着必须做出对以往同类产品的真正超越,并得到人类对这一感受的广泛认同。要实现这一目标,需从技术架构设计、语法训练等源点开启自己的生长。

(一)技术结构:强大算力支撑大型语言模型

诸多使用案例表明,自然语言能力突出,在完成问答、聊天、翻译等任务时,逻辑清晰,自然流畅,比较接近与真实人类对话的感觉。从技术角度来看, 能讲“人话”是因为GPT-3.5架构的大型语言模型,该训练模型的计算逻辑来自一个名为的算法,相比于以往的RNN(循环神经网络)算法,是打破时序计算的逻辑、具有并行算力模式的更高级的神经网络深度学习算法[15],其特征在于采用了“自注意力机制”,不但能直接学习大容量样本,更善于找出整篇文章或不同文章之间词汇的相互关系,有学者将此能力描述为“联结主义”[16],等同于打造出人脑中神经元的连接系统。这种算法不再对既有信息进行“复制”,而是通过将相关语句的重组,再按照一定的逻辑和结构输出。因此,基于GPT-3.5架构的大型语言模型,才能体现出模拟人类思维和表达的能力。当然,为了支撑这一大型语言模型,高性能计算机群、高速存储设备、网络通讯设备等需要大量堆叠以构成强大算力,这也成为推动人工智能实现质变的必经之路。

(二)实现逻辑:大规模数据占有结合人类的反馈

作为一个面向公众的公共工具,海量数据的占有是高质量多轮对话的关键和基础,有学者将形容为一个需要无限吞噬数据或投放语料库的“科技怪胎”[17]。实际上,大规模的数据占有只是进化生长的一个基本前提,在人们以极大热情参与到与对话的过程中,发现始终能够保持对话主题的一致性和专注度,还能结合用户的反馈和上下文来识别并理解用户意图,——这种超出人类预期的反应能力在于使用了RLHF ( from Human ),即人类反馈强化学习模型,该模型的训练方式首先是收集数据,进行有监督的数据调优,输出有监督的策略模型;接下来在具体应用场景中,人工标注者对输出的候选模型进行投票、排序,从而训练得到一个符合人类偏好的奖励模型( Model,也被称为打分模型);最后使用这个奖励模型的近端策略优化算法PPO( )来进一步展开训练。整个过程不断重复、循环,并融入更多人工监督的微调(fine-tune),最终促成能够根据对话的上下文进行理解、记忆,更好地完成人类问题或指令,体现其智慧度与类人性。

总的来说,是一种基于统计模型的深度神经网络和大语言模型,它从海量、高频的数据及自然语言中进行学习、深度建模,再凭借千万亿级参数调校,使其对话内容质量更高、更智能,也更具创造性。从全球用户的使用体验反馈来说,的互动表现和对话能力堪称惊艳。尽管也出现了类似“劝用户离婚”等事件,但是可以笃信的是,本质上依然是一套计算公式和数学模型[18],尚不具备真正的主体意识和充分理解人类情感的能力。

新闻收集器_如何用chatgpt收集新闻资讯_搜索新闻资料

对话成为新闻:

对新闻业态的冲击

(二)传播泛化与主体多元

根据保罗·莱文森的媒介进化理论,人性化是一切媒介进化的终极目标,主要体现为媒介处理信息的类人化,以及媒介发展以促进人类的感官平衡为趋向两个方面。依循这一思路,将进化为一种全面的智慧体,它不仅能够处理复杂事务和强大运算,还拥有拟人的情感反应和信息交流能力,在自然对话中与用户建立“类人化”的社会关系——基于这样的终极想象,对现有的新闻传播业态会带来更多结构性的影响。

(一)新闻生产:用户提问成为反向算法

首先,的智慧基因融入传统媒体新闻生产与策划环节,可以带来的改变有:在前期新闻来源的采集过程中,能够针对不同的采访对象迅速生成个性化邮件,根据对象个人的特殊经历写出专属的采访大纲,减少采访者前期的重复性工作;同时,它也能够作为高效率的辅助工具,在写作中迅速生成框架草稿,之后再由专业记者打磨润色……以上是本身的技术功能所导致的结果,而在未来生产流程中,真正值得注意的是用户的广泛介入所带来的新闻表达和接受上的丰富变化。一是用户不断与对话,对话成为显见的主流的新新闻表达样态;另外,“对话”也是一个深化交流、多轮互动的过程,用户所接受的新闻是按照使用者对新闻事实的探索顺序所呈现,不但突破了新闻单条消息的推送模式,还能将新闻的事态起因、后续发展、人物关系、舆情态势等按需生产,在多轮对话中推动新闻报道的深入,加深新闻事件对个体的印象和传播效果。

此外,平台时代算法的崛起一方面让个体得到精准推荐的资讯服务,另一方面又加大了信息茧房的风险。生成的新闻包裹于一个动态的对话流中,它的内容结构取决于用户对于新闻的主动思考和态度立场,即最终的内容状态是由的算法模型与用户强势介入下的思考方向共同决定。这相当于平台时代全部交由算法来判定用户兴趣的做法可能要部分逆转,即用户本身也代表了一种主动选择机制,可以反过来制约完全按照机器模型行事。在这样的传播路径中,用户成为最大的主动型变量,甚至成为“算法”本身,全面参与信息筛选与传播的把关。可以认为,随着用户媒介素养的进一步提升,用户通过补充、印证新闻信息,还原新闻事实真相,推动观点平衡等方面将会更加纯熟,对话式新闻完全有能力让新闻导向更加客观和深入。

(二)新闻分发:多模态叠加多渠道

移动时代的新闻分发主要体现为用户以手机端的资讯类APP为主要接收渠道,这导致传统媒体生产流程多采取“移动优先”策略,以回应该变动。的出现以及良好的通用适配能力,让对话式的信息分发增加了更多途径与方式。

其一,是文字类型的对话升级为多模态的互动,目前的文字交互方式将陆续扩充至语音互动、视频互动等形式,这在下一代GPT-4的语言模型中即可实现。基于升级的接口能力,智能音箱系统引入,可以为语音聊天机器人打开新的发展空间。眼镜、头盔等可穿戴设备引入可强化视觉识别和反应能力;同时,更值得期待的是,也可以为目前火爆的虚拟数字人注入灵魂,改善其智慧化能力的不足。文字结合语音、视频等多模态的交互和使用者个性化的驯化,能够创造出更多AI产品,提供更优质的新闻互动服务。

其二,搜索引擎业已加入分发阵列。目前,微软已经在Bing搜索引擎中添加 功能,并开展了小流量测试;谷歌CEO 表示,将在近期推出类似的基于人工智能的大型语言模型;百度也计划在搜索引擎中加入类似的对话式机器人“文心一言”。随着以为代表的大型语言模型与搜索引擎的融合,意味着AI问答平台将成为新的流量入口和新的新闻分发渠道。

(三)价值获得:人机共创激发更大满足

从本身的技术突破来说,第一,智能技术和产品“所具有的数据思维,可以超越记者的个体视角和人的感官局限,提供新的认识事物的线索,丰富人们对于新闻对象的认识”[19],也就是说,在占有世界数据基础上所输出的信息及看法,可能具备人类并不具备的视角。同时,随着机器人伦理学的发展,提倡技术道德化,使得人工智能在新闻写作过程中逐步提高纠正算法技术与偏见等问题的道德鉴赏力[20],这一点也会保证在道德观上符合社会规范,减少对人类的伦理挑战。所以,如果既能给人类提供超越性视角,同时能保证普世价值观的导向,相信的内容体验会越来越好。

第二,促进传统新闻客户端从严肃的“读新闻”,转变为轻松人性化的“聊新闻”,对话语体让原本严肃的新闻以更生动有趣的、个性化的形态进行展现,同时让使用者在对话中获得更多启发。早先,BBC 的新闻实验室开发的聊天机器人,通过问题的层层深入、及时查阅所需信息,帮助读者了解复杂的新闻事件和背景,在一定程度上避免了因认知差异和认知鸿沟所导致的阅读障碍,提高了新闻阅读获得感;新闻聚合网站通过聊天机器人在向用户推送新闻时会主动向使用者提问,如是否关注该新闻、对这一事件有何态度,甚至还会邀请用户上传照片或视频等,增强用户的被服务感;国内的“下文”聊天机器人则通过创造虚拟对话场景,在推送新闻内容时使用更平易近人的语气,发送动图或表情包,拉进与读者的距离,提高新闻阅读的趣味性——以上做法在媒介消费的层面大大提升了用户综合体验,也必将在这一维度上继续推进。

当然,我们注意到所带来的前所未有的用户动员和参与深度,必须从更深远的角度思虑其带来的精神文化影响。既往,在理解人机关系的历程中,人们常以“工具性”的思路来理解技术,技术只是被用来弥补人类某些能力的缺陷和匮乏。而后随着物质转向的发生和行动者网络理论等的影响,人们逐渐认识到:人相对于非人的因素来说,并没有绝对支配性的中心地位,在某些情况下,非人或物也有可能在行动者网络中起到决定性的作用[21]。尤其在人工智能时代,更需要克服人是绝对主体的认识,摆脱人类中心主义,关注物的主体性,探索人与非人物质更平等、更紧密的关系。只有充分重视技术的积极、主动和价值意图,将其视为“活”的基础设施,才会有助于在人工智能时代规避更多伦理争辩,将精力放在促进技术和社会的和谐进步上——在这一认知基础上再看,其展示了“人-机”作为共创主体进行新闻生产和开展信息传播活动的形态,即按照提问者意志和需求重组了新闻素材,人类引导机器输出了新闻形态、段落结构和观点主张。从这一意义而言,比起之前媒体致力于供给的舒适度或消费体验,用户在主动参与信息创造过程中的成就感与满足感,理应是最高级的新闻体验。

总结

在人工智能时代,技术加速向高级智能演进,人与机器的深度交流成为理解新闻的出发点。不同的技术可供性极大地扩展了新闻的类型、表现形式、文本结构,无论从以往的网页图文新闻到智能时代的H5新闻、数据新闻、算法新闻,还是从新闻文本角度出现的问答式、剧场式、策展式、交流式新闻等,都呈现了新闻发展的一个重要方向:强调受众的视角和立场,重视受众对新闻传播的全程化参与,注重在媒体与受众之间建立一个双向、循环、更多元的交流关系—— “对话”即在这一逻辑下产生,借力的技术内核,采纳对话机制来达到一种信息共识与观点协商,为新闻叙事与实践的信息模型创新,提供了人工智能时代的现实样本。

但要看到,目前的训练数据绝大部分是英文,中文数据占比较少,将的英文能力迁移到中文能力的桥梁,可能在于训练数据中一些中英对照的平行数据[22]。故需要注意的是,英文世界所对应的欧美主流国家的庞大数据和价值体系,在对长期渗透并难以在短期内形成有效调适的情况下,可能会加剧数据中原本存在的偏见与西方价值观传播。此外,正是基于GPT 的模型训练需要大量存储数据、计算资源和算力成本,大部分组织和个人难以承担,也引发学者对于人工智能可能导致另一种新平台、新中心权力崛起的担忧。

总而言之,的出现值得我们予以极高的关注,尤其是想起卡普兰在《人工智能时代》一书中“决策权部分或完全实现了由人向机器的转移”[23]这句话——或已开启人类与人工智能真正共生共在的时代,除了对新闻业态带来的从技术到文本的变化,更要看到其嵌入整个社会运转系统,成为高效连接中介的身份演进的宏大图景。

【本文是广东省教育科学“十三五”规划2020年度研究项目(项目编号:)的研究成果】

参考文献

[1]王建磊.社交型媒体与变形的新闻[J].新闻记者,2010,9.

[2]USHER N.Re- trust in the news:a “ of ”. ,2018,4.

[3]田浩,常江.回归社区与重构真实:剧场新闻的理念与实践[J].中国编辑,2023,1-2.

[4]方金根.信息与新闻的区别[J].新闻爱好者,1996,3.

[5]方晓恬.走向现代化:“信息”在中国新闻界的转型与传播学的兴起(1978-1992)[J].国际新闻界,2019,7.

[6]陈响园.“新闻是新近信息的媒介互动”——试论新媒体传播背景下“新闻”的定义[J].编辑之友,2013,11.

如何用chatgpt收集新闻资讯_新闻收集器_搜索新闻资料

[7]陈伶娜.从新闻到信息:互联网时代媒体内容范式的转变[J].青年记者,2019,27.

[8] O.The of and in [J]. , 2009, 10(4): 473-491.

[9]蒋晓丽,李玮.从“反映论”到“对话观”——论多重语境下新闻的转向[J].湘潭大学学报(哲学社会科学版),2012,6.

[10]王凡华.对话理论下新闻写作的“对话性”研究[J].新闻界,2012,12.

[11]李玮,胡旋.“两会”报道:一种“对话性”主导的新闻实践——兼论“对话新闻研究”的类型学进路[J].新闻知识,2022,5.

[12]王晓培,令倩.“聊新闻”:新闻对话机器人对新闻分发方式的再定义[J].现代传播(中国传媒大学学报),2017,12.

[13]杜付贵.数字新闻交互性的概念阐释[J].青年记者,2022,16.

[14]背后的核心技术[EB/OL].战略前沿技术公众号,2023-02-05.

[15]刘鹏.用户新闻学:新传播格局下新闻学开启的另一扇门[J]. 新闻与传播研究, 2019,2.

[16][17]令小雄,王鼎民,袁健.爆火后关于科技伦理及学术伦理的冷思考[J].新疆师范大学学报(哲学社会科学版),2023,2.

[18]Lund B D,Wang T. about :how may AI and GPT and ?[J]. Hi Tech News, 2023.

[19]彭兰.数字新闻业中的人-机关系[J].新闻界,2022,1.

[20]林凡,林爱珺.打开算法黑箱:建构“人-机协同”的新闻伦理机制——基于行动者网络理论的研究[J].当代传播,2022,1.

[21]李日容,张进.拉图尔的科学实践建构论对物的非现代性追问[J].兰州学刊,2018,6.

[22]张家俊:关于八个技术问题的猜想[EB/OL].机器学习算法与自然语言处理公众号,2023-02-17.

[23] 卡普兰.人工智能时代.杭州: 浙江人民出版社,2016:12.

【作者简介】作者宁鹏莉系深圳大学传播学院硕士生、作者王建磊系深圳大学传播学院副院长、副教授

本文刊登于《新传播》杂志2023年第一期。

话题互动

你看过用生成的新闻报道吗?

你觉得与传统新闻报道相比

哪些方面更具优势或者劣势?

欢迎在评论区留言

END

主编 | 井婷婷

编辑 | 张浩

推荐阅读

点击下方图片即可阅读

腾讯正式发布AI智能创作助手“腾讯智影”;李子柒油管广告收益登顶热搜;《纽约时报》拒绝为认证服务付费 | 一周热议

© 版权声明

相关文章

暂无评论

暂无评论...