当前,新冠病毒肺炎疫情在(zài)国内已(yǐ)经得到有(yǒu)效控制,复工复产(chǎn)正在全面推进之(zhī)中。那么(me),目前经济复(fù)苏的情况究竟如(rú)何?各行(háng)各业(yè)以及各地区的发展形势(shì)有何(hé)差异?百度公司最近发(fā)布的2篇论(lùn)文 [1, 2] 研究发(fā)现,这些答案,都“藏”在海量的大(dà)数据里。
研(yán)究表明,百度地图(tú)的用户(hù)和(hé)商户数据情况与GDP走势呈现高度相(xiàng)关性,成为呈现行(háng)业和地区经济(jì)复苏情况的(de)“晴雨表”。同(tóng)时,百度地(dì)图、搜索(suǒ)和健康平台的数据显示,某一地(dì)区人口流动情况以及搜索习(xí)惯,与该地区的疫(yì)情形(xíng)势紧密相关。由此可见,百度多维度(dù)大数据能够有效地为(wéi)疫情(qíng)发展及其社会影响“画像”。
中国传媒大(dà)学调查统计研究(jiū)所(suǒ)所长、大数据(jù)挖掘与(yǔ)社会计算实验室主任沈浩表示(shì),在抗(kàng)击新冠肺炎疫情的斗争中,全国(guó)各地的政府、企(qǐ)业和科(kē)研机构都在探索运用大数据手段提升治理能力、加强抗(kàng)疫效果。未来,百度(dù)的大数据不仅能够作为政(zhèng)府防控(kòng)疫情(qíng)的有益(yì)参考,同(tóng)时也可以为(wéi)推动复工复产(chǎn)、提振经(jīng)济发展提供(gòng)有(yǒu)力的(de)决策(cè)依据。
L型、勾(gōu)型、V型(xíng):百(bǎi)度大数据直(zhí)观量化疫情对经济发展的冲击情况 [1]
成都闹市区的(de)奶茶已经回归了往日的热闹,而天津旅游景区(qū)的(de)小饭馆却迟迟难以复苏;西北县(xiàn)城的超市恢复(fù)了元气(qì),长江中部的(de)工厂则尚未将产量提升至(zhì)疫情之(zhī)前的平均(jun1)水平……这些情况,百度大数据都“看”到了。
百度大(dà)数据的研究者在试图摸(mō)清地(dì)图数据与经济(jì)复苏(sū)情况的关联时,发现(xiàn)了两(liǎng)个关(guān)键因子(zǐ)——地图(tú)用户到(dào)店数量(Volumes of Visits to Venues,简(jiǎn)称V3)与商户(hù)新开设的地(dì)理(lǐ)位置点数量(New Venues Created,简(jiǎn)称NVC)。V3可以反(fǎn)映用户的活跃程度(dù),NVC则反映商(shāng)户的活跃(yuè)程度。
于(yú)是,研究者(zhě)将这两(liǎng)个数据的走势与GDP走势做成可视化图表,结果发现(xiàn),NVC、V3与(yǔ)GDP的走势,呈现强烈的正相关(guān),也就是说,地图用(yòng)户到店的情况与商户新开设的地理位置点情(qíng)况(kuàng),可以反(fǎn)映经济活(huó)动的强弱。
图1:从2018年第(dì)一季度到2020年第一季度,每个(gè)季度的国内GDP与百度(dù)地图用户(hù)到店数量,新开设的(de)地理位置点数量,呈现(xiàn)强烈正相关。(注:分析所(suǒ)用(yòng)的数据(jù)皆为脱(tuō)敏数据,所有处理环(huán)节均不涉及个体隐(yǐn)私。下同。)
那么,这一发现(xiàn),除(chú)了作为经济活动的晴雨表,还(hái)有什(shí)么作用呢?
百度(dù)研究人员(yuán)又做出了进一步的分析。他们对各个行业、各个地区省份的经济活跃程度进行了(le)细致分析,结(jié)果发现(xiàn),不同行业(yè)、不同地区(qū)之间,经济复苏情况呈现巨大差异(yì),主(zhǔ)要分为(wéi)以下三类(lèi)——L型、勾型、V型。
先来看L型。这一曲线显示复(fù)苏缓慢(màn),说明受疫情影(yǐng)响很(hěn)大(dà),目前仍然(rán)无法回到(dào)2018年同期(qī)的水平;教育(yù)、交通运输、酒旅等行业(yè)遭受非常严重的打击(jī)。下图分(fèn)别是(shì)机场、火车站、教育培(péi)训机构、酒店(diàn)的用户到店情况。可以看到(dào),代表(biǎo)今年情况的红色V3曲线,呈现“L”形状(zhuàng),依旧在低(dī)谷摇摆。
图2:上图为机场、火车站、教育培(péi)训机构(gòu)、酒店的用户到店情况(V3)和新开设的地理(lǐ)位置点情况(kuàng)(NVC)
再来看勾型。虽遭(zāo)受疫情影响(xiǎng),但(dàn)是疫情缓和之后,能(néng)够恢(huī)复到(dào)2018年与(yǔ)2019年同期之间的经济水平。餐饮酒吧(ba)、休闲娱乐、公园景点等是典型的行业代表。这一复苏情况在V3的可(kě)视化图表里很像一个反(fǎn)写的“对勾”。
图3:勾型:疫情(qíng)缓和之后,餐馆酒吧、娱乐设施、旅游景点等(děng)行业(yè)能够(gòu)恢复到2018年与(yǔ)2019年同期之间的(de)经济(jì)水平
最后看(kàn)V型。尽管疫情(qíng)的影响严重,但是一旦疫情缓(huǎn)和之(zhī)后(hòu),能够快速(sù)触(chù)底反(fǎn)弹,恢(huī)复到2019年同(tóng)期水(shuǐ)平,甚至(zhì)比那时(shí)情况更好。代表行业有工作(zuò)居住的地点、商超(chāo)、医院药店等。
图4:V型:疫情(qíng)缓和之后(hòu),工作(zuò)居住地点(diǎn)、商超、医(yī)院药店等景气程度快速反弹,走势(shì)看上去像字母V
研究人员用类似的思(sī)路,将全国经济按照区域进行分析,发现湖北、北京及天津的经济复苏情况为L型,复苏缓慢,与持续的(de)疫情管控以及旅(lǚ)行限制有关;南部沿海、黄河中游、东部沿海、长江中游和北部沿(yán)海的数(shù)据显示出明显的勾(gōu)型复苏(sū)趋势(shì);大西北、东北和西南区域则展现出强劲(jìn)的(de)V型反(fǎn)弹趋势。
百度(dù)大数据研(yán)究专家表示(shì),五大经济区(南(nán)部沿海,黄河中游,东部沿海(hǎi)、长江中游(yóu)、北部沿海)高度依赖全球供应链(liàn)的经济,在国内疫情(qíng)结束之后,依然(rán)受到国际整体疫(yì)情(qíng)和经济形势的影响,未能快速反弹,呈现(xiàn)中(zhōng)间态(tài)的勾型;而西北、东北、西南等地区(qū)经济对外依赖性相对较小,疫情感染人(rén)数没有其他五大经济区多,恢(huī)复快,经济经历短暂阵痛之后,触底反(fǎn)弹。
搜索COVID-9越多,疫情防控工作(zuò)越好?百度大数据“揭秘”疫情防治、人口迁徙(xǐ)与(yǔ)搜索(suǒ)行为间的显(xiǎn)著关联 [2]
百度大数据还发现了人口出行情(qíng)况、搜索情(qíng)况与疫情防控之(zhī)间的紧密关联。
先来看(kàn)第一项发(fā)现:从武汉移出到中国其他主要城市人口(kǒu)情况,与当地疫情(qíng)传(chuán)染(rǎn)情况的关系(xì)存在显著的正相(xiàng)关。
百度大数据统计了截至3月31日中国内地(dì)300个除湖北外(wài)主要城市的确诊感染人数,将(jiāng)其与1月23日迁入(rù)该城市的(de)人口数做出了对比。
图5:截至2020年3月31日(rì)中(zhōng)国内地(dì)各主要城市(shì)确诊(zhěn)人数 (上图) /当(dāng)地确诊率(lǜ) (下(xià)图) vs 2020年1月1日至23日从武汉迁入人数
上(shàng)面左图展示了全国主要城(chéng)市每个城市从武汉迁入人数(x-轴)与截(jié)止到3月(yuè)31日当地累计确诊人数(y-轴)的关(guān)联。二者存在显著正相关(guān)。说明,当(dāng)地累(lèi)计确诊人(rén)数与(yǔ)当地迁入的武汉人数存在(zài)直(zhí)接(jiē)的(de)关联。
考(kǎo)虑到城市(shì)大小的关系,百度研究者(zhě)也以(yǐ)当地(dì)感染率(每百万人平(píng)均感确诊人数)与(yǔ)从武汉迁(qiān)入人数做出了分分析统计(jì),如右(yòu)图。结果依然是显(xiǎn)著正相关。
由(yóu)此可以得出结论——在武汉封城之(zhī)前(qián),从(cóng)武汉迁入人口更多的城市,会有更高的感染人数;同(tóng)理推断,武汉越早采取封城措施,则疫情波及范(fàn)围越小。
再来看第二项研究结果。数据显示,疫情越严重的(de)地方(fāng),人均搜(sōu)索COVID-19相关关键词的次数也越(yuè)多。
图6:2020年1月(yuè)33月31日中国大陆各主要(yào)城市(shì)人均COVID-19搜索次数(shù) v.s 该城市确诊人数 (上图) /确(què)诊率(下图)
可以看出,中(zhōng)国内地除湖北外主(zhǔ)要(yào)城市确诊感染人数与(yǔ)该城市人均搜索COVID-19相(xiàng)关关键词的次(cì)数存在显著正相关。由此得出(chū)结论,可(kě)能是由于感染情况引发的恐慌心理,人(rén)们更愿意搜(sōu)索相关信息。
百度的研究还发现(xiàn),全国除湖北外主要城市的(de)出行恢复率与当地人通过百度搜索(suǒ)COVID-19次数呈现(xiàn)显(xiǎn)著的负相关。也就(jiù)是说,人均通过百度搜索(suǒ)COVID-19关键字(zì)较(jiào)多的城市,人们出(chū)行(háng)意愿更低、或是当地疫情(qíng)管控(kòng)措(cuò)施更为严格 (在排除了其他潜在因素(sù)的偏相(xiàng)关性分析后,此关联依然显著)。
图7:截至2020年3月(yuè)31日中(zhōng)国大陆各主(zhǔ)要城市出(chū)行恢复率 v.s 该(gāi)城市人均COVID-19相关信息搜索(suǒ)次数:上图(tú)(Log-Log Plot), 下图正(zhèng)常(cháng)尺度(dù) 。
可以看出,当人们(men)主(zhǔ)动搜索信息得到了更多(duō)有关疫情(qíng)的消(xiāo)息时,便(biàn)更愿意待在家里。可以说,百度(dù)数据对人口隔离政策和移(yí)动限制政策提供了重要参考。
大(dà)数(shù)据全面赋(fù)能疫情防控:真实掌握+有效预(yù)警+精准施策
从上数(shù)研(yán)究结果可(kě)以看出,百(bǎi)度地(dì)图、搜索和健康的(de)多维度数据(jù)能够直观呈现疫情发展(zhǎn)及其社会影响。沈浩认为,百度(dù)大(dà)数据(jù)对(duì)于征(zhēng)服开展疫情防控与社会治理而言(yán),有(yǒu)着突出(chū)意义。
其(qí)一,有利(lì)于全面、真实、动态掌握疫情防控情况。平时访问(wèn)发热门诊(zhěn)数量的人是(shì)否(fǒu)显著增多?疫(yì)情期间居(jū)家隔离情况(kuàng)执行如何?百度都能够第(dì)一时间给予(yǔ)直(zhí)观、真实的数据化呈现。
其二,对可能发(fā)生(shēng)的疫情相关风险(xiǎn)提出预警。百度地(dì)图数据可以(yǐ)直接为疫情期间居家隔离政策、出行限制政策(cè)执行情况提供参考,对危(wēi)险信号提出预警。
第三,动(dòng)态掌(zhǎng)复(fù)工复(fù)产、经济发展的真实情况,形成(chéng)真实全面的“景气指数”。各(gè)地、各(gè)行业复工复产(chǎn)情况究竟如(rú)何(hé)?百(bǎi)度地图的商户和用户(hù)活跃程度,便可以给予(yǔ)客观的回应,作为政府机构精准(zhǔn)施策的基础(chǔ)。
利用大数(shù)据提升社会治(zhì)理(lǐ)能力也是中国政府近年来(lái)不断努(nǔ)力的方向。
2月18日,工(gōng)业和(hé)信息(xī)化部(bù)印发了《关于运用新一代(dài)信(xìn)息技术(shù)支撑服务疫情防控和复工复产工作的通知》,提出有(yǒu)效应(yīng)用信息(xī)化手(shǒu)段助力(lì)疫情防控和复工复产。在中央精神的指导下,社会(huì)各(gè)界纷纷探索(suǒ)以信息化途(tú)径高(gāo)效开展疫情防控。
实(shí)际上,在新(xīn)冠肺炎疫情发生(shēng)之前(qián),大数据在国(guó)内外公共卫生事(shì)件中的应用效果已经得(dé)到了较好的检验。此次(cì)疫情发生后,韩国、日本、新加坡等国(guó)家均(jun1)采用了大数据(jù)手段防控疫情、指导(dǎo)经济活动,取得了良好的效果。
在(zài)中国,相(xiàng)较(jiào)17年前(qián)的SARS疫情,大数(shù)据在此次(cì)新冠(guàn)疫情防控中的作用尤为明显,涵盖(gài)个人健(jiàn)康状况认证(zhèng)、远程医疗问诊、应急物资调配等方(fāng)方(fāng)面面。
“互联网公司掌(zhǎng)握社会许多(duō)层面的数据,政府(fǔ)一(yī)方面要对数据的合规性(xìng)加强监管,另(lìng)一(yī)方面,也要积极利用互联网公司(sī)的(de)大数据,可以(yǐ)联合科研院(yuàn)所和(hé)企(qǐ)业大数据机构协同进行大数据研究,助力疫情防控、应急管理(lǐ)和(hé)社会(huì)的精细化治理(lǐ),为决(jué)策提供有益参(cān)考。”沈浩表示。