清华大学徐博博士:基于信息检索与数据挖掘的食品安全舆情监测与引导:以大型农贸市场食品安全微博舆情实证

2023-06-16作者:来源:责任编辑:食品界 字体A+AA-

民以食为天,食品安全是最重要的民生问题,是媒体和公众时刻关注的热点话题之一。目前食品安全舆情监测体系与社交媒体的高速发展不相匹配,带来的问题层出不穷。由于食品安全舆情具备传播速度快、传播范围广和存在虚假不实信息等特征,因此目前的舆情监测难度不断增加。农贸市场作为食品流通的重要场所之一,在维护民众日常生活秩序、保持生产生活平稳有序发展中扮演着关键的角色。一直以来,关于农贸市场食品安全舆情的监测和引导机制都有待提高,借助人工智能、云计算和大数据等先进技术的优势能够优化并改进目前的监测机制。

清华大学新闻与传播学院徐博基于目前舆情研究态势与媒介传播特点,开展食品安全舆情样态和传播特质分析研究,建立基于人工智能和大数据技术的食品安全事件舆情热度监测体系,提出针对大型农贸市场的食品安全微博(指新浪微博,下同)舆情的舆情挖掘机制,以期为政府和企业对食品安全舆情预警和监测开展研究提供依据,也为食品安全协同治理提供技术支撑。

1 食品安全舆情现状

首先,食品安全是一个社会概念,也是一个政治概念。食品安全与生存权紧密相连,具有唯一性和强制性,属于政府保障或者政府强制的范畴。近年来,国际社会逐步以食品安全的概念替代食品卫生、食品质量,更加凸显了食品安全所担负的政治责任。食品安全更加侧重从农田到餐桌全链条、全过程的监管。鲜活农产品具有新鲜、美味和营养丰富等特点,受到很多消费者的青睐,但其也常面临难以长期贮藏、容易腐坏的问题,在种植、养殖、加工、包装、贮藏、运输、销售、消费环节都容易发生污染和变质,此外,农产品还可能存在农兽药残留超标、滥用添加剂、重金属污染等问题。因此,在食品产业链整合的大背景下,食品工业全过程的监管制度正逐渐完善,媒体监督已成为食品安全体系的重要组成部分。
食品安全不仅仅要求食品本身的质量安全,更需要消费者对食品安全有正确而清晰的认识。手机智能设备的普及推动了互联网新兴媒体平台的急遽演进,互联网对人们生活产生巨大影响,而互联网中介到互联网平台再到内容生态的演化路径则诞生了超级平台,这些超级平台不但形成了集“中介+平台+内容生态”的三位一体体系,还扮演着“平台+数据+算法”三元融合的“把关人”角色。
在食品安全问题上,不同传播者发布的食品安全话题也有不同。虽然传统媒体致力于宣传食品安全并科普健康信息,但新兴的自媒体平台上仍存在许多隐含谣言等虚假信息,食品安全的谣言屡见不鲜,层出不穷的负面信息会造成不同的舆情导向,误导大众,即使政府及时回应,由于信息茧房的存在,也可能造成“错位”,从而导致信息撕裂的情况。因此,食品安全舆情是食品安全、网络舆情在多因素、多环节、多层面交织后的结果,具有专业性、复杂性以及关联性等特征。食品安全舆情监测应该渗入到舆情爆发、波动、稳定的各个环节,使整个食品安全的监管系统能够更长期、更健康、更可持续发展。

2 食品安全舆情传播特质

网络舆情的传播反映了公众对某个社会事件的态度。在互联网高速发展的当下,网络舆情已成为社会舆论的重要组成部分。城市的大型农贸市场是居民的“菜篮子”和“米袋子”,关乎民情民生,其舆情更加复杂多变,一旦产生舆情,在网络媒介平台传播速度快、范围广,容易引起民众的恐慌。所以大型农贸市场相关的食品安全舆情呈现出以下3 种特征:来源渠道多样化、传播发酵速度快、传播媒介形式多。

舆情来源渠道多样化

互联网的发展和普及使得人人皆媒体,万物皆媒介,主流媒体的舆情中心地位被撼动,社交媒体正逐步成为一类重要的舆情发声体。除传统媒体外,个人或团体均可通过微博、抖音和快手等平台将农产品相关事件以直播、录播或评论性形式即时发布,因此舆情来源渠道更加多样。面对多元的舆情来源,有关食品安全的宣传报道应当真实、公正。

舆情传播发酵速度快

社交媒体的传播呈现网状结构,而食品安全的舆情更兼具人际传播与大众传播的特点。网络舆情传播点多线杂面广,信息量庞大,互动性、即时性、自主性传播特点突出。食品安全关乎公众的日常生活和健康,相关的舆情传播具有互动性强、范围广、速度快的特点。农产品相关网络热点或者议题一旦触发,食品安全舆情就会点线面、多渠道、多路径、全通道传播扩散,其信息量大、互动性高、自主选择性强的特征格外突出。

舆情传播媒介形式多

互联网技术的发展推进了媒体形态的演变,从最初的网站、论坛、博客,到现在的微博、微信、抖音等,网络传播媒介的演变使得信息以文字、音频、视频等多种形式传播,此外,具有即时性的在线直播成为了当下最常见的内容传播形式,如直播带货、热点事件爆料等。随着新媒体的发展,人们选择和接受信息的方式发生着改变,农贸市场中舆情的传播形式呈现出新的方式。目前,农贸市场中舆情传播媒介形式有客户端、网站、微信、报纸、微视频等都多个渠道,在实际传播过程中,这些传播形式经常同时出现,并且相互影响。

3 基于大数据和人工智能的舆情引导分析框架

当前,互联网时代的舆情治理存在谣言、公众存在异见、公众情绪缺少宣泄途径、官方支持匮乏等不足,要求政府机构拥有全面的舆情洞察、准确的舆情审核、迅速的舆情引导能力。如图1所示,大数据和人工智能技术作为强有力的信息化手段,可以提供全新的信息资源、技术手段和治理模式,帮助网络舆情的监测实现全面化、自动化、科学化和精准化,在网络舆情治理中提前抵达舆论制高点,更好引领网络舆论发展,大幅度提高网络舆情治理效率。本文基于先进的大数据和人工智能技术,结合多种媒体资源和形式,形成集舆情洞察、舆情审核和舆情引导为一体的舆情大数据与人工智能管理解决方案,推动政府舆情监管决策由经验驱动到数据驱动的转换,有利于政府掌握新闻舆论的管理权、话语权、领导权,同时有益于巩固并提升整体媒体声誉形象。

舆情大数据与人工智能管理系统

1 核心模型
本文使用Scrapy框架和Selenium语言开发的Python爬虫工具,于2022年8月30日通过微博API接口进行微博平台上的舆情数据收集,以“农贸市场食品”“农批市场食品”“农贸市场食品安全”“农批市场食品安全”为关键词,对2018年11月15日至2021年11月15日微博平台的博文数据进行大规模分布式爬取。删去广告等无效数据,最终共获得16989 条有效数据,每条数据共选取10 个数据变量(表1)。

本文基于舆情大数据与人工智能管理系统的舆情处理核心模型(图2),输入关键词“农贸市场”后,采用智能化监测和自然语言处理技术进行多维度识别,筛选产品为“农副产品”,舆情本体为“农贸市场”,以提高数据的准确性;同时通过关键词确定主要的触发词“舆情”,由此构建舆情处理框架。

2 技术框架
舆情监测的技术框架主要由舆情信息采集模块、舆情信息处理模块和舆情信息分析展示模块组成。其中舆情信息采集模块可以从众多媒体媒介获取最全面的舆情信息,对全网舆情点进行分析;舆情信息处理模块能对收集到的数据进行处理和过滤;舆情信息分析展示模块的目的是根据提供的主题和关键词通过分类算法,确定是否出现相关危险舆论,尽快发现并处理。
食品安全网络舆情监测与引导的技术框架模型是根据网络舆情受众、网络舆情事件与网络舆情传播方式的三维体系构建而成。如图3所示,整个模型分为3 个模块:数据获取、数据预处理和数据分析,其中包含了数据获取模块、文本信息抽取模型(named entity recognition,NER)、核心事件感知库、事件抽取和摘要抽取模块以及触发词发现模块等要素。数据获取模块使用数据爬虫脚本对制定网页中内容进行爬取;数据预处理模块是对抓取的内容进行归一化处理,主要是去重操作,使计算机识别到向量;数据分析模块可分为两部分:1)对筛选得到的文本信息进行情感分析和事件抽取分析,随后分别对应进行实体情感分数计算和事件抽取分析;2)将预处理得到的文件进行摘要抽取,得到文章摘要。
3 舆情词云统计分析结果
由于大部分文本分析工具依托英文平台,因此本文根据爬虫数据构建了农业行业为基础的中文语义词典,并使用Python的Jieba分词工具将用户发表的微博正文进行语义分割。基于农贸市场商品的属性,同时使用了Jieba的商品评价词典,并在此基础上加入常见停用词表,去除大部分无效词语(如“的”“和”“我们”等),随后本文应用TF-IDF算法进行词云统计和词频分析,得到有效评价的特征词,再通过提取评价词排序较前的特征词,制作词云分布图,提取关键词,参数依次为:文本、抽取关键词的数量、返回结果按照权重排序、提取关键词的词性。近3 年关于“农贸市场食品”“农批市场食品”“农贸市场食品安全”“农批市场食品安全”的高权重词汇如图4所示,农贸市场中的食品产品种类繁多,从舆论的集中度上看,品类较为分散,权重较高的产品集中在“海鲜”“生鲜”“肉类”“猪肉”“蔬菜”等品类上。

4 舆情分类及重点事件示例分析结果
媒体平台在报道之前要有以下考虑:首先,不但要借助大数据和新媒体平台快速了解社会民意,获得大众的真实诉求,还要实时了解并收集相关舆情信息,在此基础上加强追踪;其次,要通过全面及时了解和掌握舆情的发生过程和最新变化来判断未来走势,选择最佳的干预时机和治理方式;再次,还要及时制止各类违法行为,避免舆情信息在传播过程中出现失控现象;最后,希望可以为政府决策提供相应的信息支撑,健全相关措施,缓解社会矛盾。因此,本文以大型农贸市场的食品安全舆情监测为例,选取实际案例进行分析,梳理不同方面的食品安全舆情、总结出现的问题并给出改进建议。
本文通过BosonNLP情感词典和3.1.3节的停用词表判断舆情数据的情感阈值,使用Jieba处理分词,解析出相应的情感词,通过权重法将博文分为正面(情感值=1)、中性(情感值=0)和负面(情感值=-1)三类,按照点赞数进行排序后,使用分层抽样的方法分别抽取500 条高赞(点赞数超过10000)、500 条中赞(点赞数为3000~10000)和500 条低赞(点赞数低于3000)的舆情数据,且根据情感值的不同,采用了情感值排序后的等距抽样,使用内容分析处理舆情数据,重点事件舆情介绍及建议如表2所示。由于食品安全是较为专业的话题,微博平台上话题的创作者主要是官方媒体(如《人民日报》)和专业媒体(如‘每日经济新闻’‘观察者网’)等,话题讨论较为中性。此外,不同话题的热度差异性也较为明显,正面舆情的点赞数远低于负面舆情。

5 舆情反馈
基于3.1.4节1500 条舆情数据,舆情反馈可分为信息型(寻求-分享)、协商式、对抗式三类(表3)。从一方面看,在专业媒体所发布的同类型话题中,受众的反馈也契合这样的结构主义意图;对比来看,受众在食品安全话题中对于官方媒体与专业媒体为舆情主体的解读视角趋向一致,与此同时,他们更倾向于关注于监管的动态。而从情感强度上看,部分高赞微博用户的舆论反馈较为激烈,表现出对抗式解码的立场,反馈较为激烈。除了对抗式解码,受众回应的类型则类似于协商式解码(negotiated code)。除了以上两种解码行为,受众也表现出了一定程度上的信息寻求和分享的行为。这些舆情反馈表明,在微博的舆论场域中,关于农贸市场食品的舆情反馈还是基于霍尔的结构化集体主义意识,在此建构的参与式舆论也凸显了目前我国的舆论结构,然而在这种语境下的舆情客体也可能会产生平移:一旦虚假信息或不实信息大量传播,受众的信息行为容易导致社交网络间的大量传播转移,也很可能改变后续的舆情走势,引起更负面的舆论声浪。

针对于农贸市场的舆情情况,本文发现,在微博平台上关于食品安全的舆情大部分主要来自于“食品生产”环节;在对农贸市场中食品安全舆情客体进行了进一步细化分类后,本文从1500 条样本数据中整理了3 类舆情客体:产品生产、产品运营和市场运营。由于食品安全的舆情客体与食品及农业行业深度耦合,对于农贸市场中舆情的监测和引导很大部分依赖于专业的市场运营方,运营方在食品安全事件发生时,应及时采取应对措施,有效引导舆情,协调信息的对称性,减少真空地带,杜绝虚假信息或不实信息的产生,有效掌握舆情的发展结构态势,同时引入实时性强的行业专家发声或特写,引领媒体、网民科学地发布信息、公正地发表观点,降低社会的不良影响。对于舆情客体的重视还需要加强,例如虽然有新媒体平台报道部分商户的“不涨价行为”,并引起了关于产品定价舆情客体的正面讨论。所以要加强舆情的监测和引导,拓展舆论引导阵地,由传统媒体向新型媒体阵地迁移,建立与网络平台相适应的舆论引导机制,提升影响力;要广泛利用各种媒体资源,加大正面宣传报道力度,增强正面形象,营造良好的舆论氛围。

基于大数据与人工智能的食品安全舆情建议

1 全面洞察舆情:食品安全舆情治理的基础
不同途径产生的热点信息从开始发酵到引起关注,再到最终形成舆情,需要一定的时间。通过媒体舆情监测对舆情形成之前的“弱信号”进行快速捕捉是将舆情风险化解于萌芽阶段的最有效手段。
2 准确审核舆情:食品安全舆情治理的关键
除了传统的凭空捏造或以讹传讹的虚假信息,如今社交媒体上还涌现出大量的误导性信息。对舆情进行准确审核,首先要全面及时掌握真实的舆情信息,在这个基础上对舆情信息进行梳理分析,探索和认识舆情规律,还需强调实时性,使舆情的审核更具科学性和时效性。
3 迅速引导舆情:食品安全舆情治理的手段
食品安全舆情的监测与引导应当是政府宣导、公众参与、社会赋能,即政府从被动解决问题转变为主动发现问题;给公众赋权,将食品安全监管权力下放;从单向沟通转变为双向沟通,纳入更多的利益相关体。从行业趋势上看,代表政府声音官方媒体的“专业媒体化”也逐渐形成,通过主流传媒的科学解读与正向传播,引导民众形成正确的食品安全认知,消除民众饮食恐慌,提升媒介素养。
4 结语
本文从目前食品安全网络舆情现状分析入手,构建基于大数据和人工智能技术的舆情管理系统,以大型农贸市场为实例,提出了食品安全舆情管理一体化解决方案。研究成果为有效应对食品安全网络舆情提供技术借鉴、帮助政府提高公信力、维护社会稳定起到一定支撑作用。
在社交媒体兴起的时代,“信息茧房”效应所带来的舆论场撕裂使官方媒体和专业媒体越来越难以进行大众议程设置,而食品安全相关的舆情与公众的联系极为紧密。因此,政府和官方媒体作为媒介生态系统的舆情主体,在传播食品安全舆情内容时,不但需要发挥舆情传播链路的监督作用,还应着重于在建立完善的处理机制的基础上,引导公众更多地参与到整个媒介生态系统之中,并针对性地在专业问题上进行祛魅,调动正面的舆情传导,实现食品安全领域的社会共治。

本文《基于信息检索与数据挖掘的食品安全舆情监测与引导:以大型农贸市场食品安全微博舆情实证研究为例》来源于《食品科学》2023年44卷07期404-412页,作者:徐博. DOI:10.7506/spkx1002-6630-20221125-297.