当前,商品市场的持续丰富和信息技术的不断进步,网络数据、扫描数据等大数据应用于居民消费价格指数(CPI)采价必要性逐步显现。本文结合浙江地区电子扫描数据试点开展情况,针对当前方法制度下应用扫描数据试点过程中存在的问题,谈几点思考,供各位同仁参考。
从当前各地试点开展情况来看,扫描数据相较于传统人工采价数据,具有样本更具代表性、有利于编制分类权数、采价人工误差减少等优势。但各地区在使用扫描数据时还存在着一些不足之处,主要有如下几点。
一是现行采价报送制度与扫描数据采价并不完全兼容。由于当前的电子扫描数据采价方式依然采用传统方案的抽样调查方式,仍需报送抽中规格品的时点价格,因此在实际操作中,调查点联络员仍需逐一从数据库中查询代码填报相关价格数据,并需查询抽中商品当日是否有折扣情况进行折算。
二是扫描数据试点扩面缺乏制度性保障。扫描数据是商业大数据中较为敏感的一种,因此仅靠基层统计机构建立的双边自愿性合作伙伴关系较为困难。
三是传统抽样方式下扫描数据采价精准性仍需进一步验证。通过电子扫描方式采集商品价格数据时,如果规格品断档缺货或下架,往往在该超市的内部数据库系统仍然可以查询到相关规格品价格信息,还需要甄别。
电子扫描数据作为一种新的CPI源头数据,有着巨大的发展前景。对此,笔者认为应从组织,制度和技术这三方面着手,进一步完善电子扫描数据应用。
——在组织层面建立大数据应用协调机制。鼓励各地探索大数据模式下的数据采集方式和指数编制方法,积极与各大电商总部协商合作,制定长期互赢的战略性政企合作框架,探索与各大电商以及线下商超建立自上而下的扫描数据获取机制。
——在制度层面明确企业数据报送义务。扫描数据报送方式与传统的采价员现场人工采价模式有明显的区别,更接近于工业生产者价格调查中的企业报送数据方式,而传统采价在实际操作中更多的是依靠基层多年工作积累的人情和企业自觉配合来进行。建议从制度层面明确CPI调查中被抽中的调查单位需按制度要求及时报送有关电子交易数据,保障数据获取的连续性和可靠性,继而提高基层推进电子扫描数据应用的积极性和规范性。
——在技术层面上升级CPI处理程序。建议CPI数据处理程序应增加以下三个基本功能。一是自动清洗分类数据。将扫描数据产品分类转换成现行CPI制度中的规格品分类,并将不纳入计算的部分剔除。未来随着数据量越来越大,依靠人工进行清洗分类是不可能完成的工作,必须依靠计算机程序进行自动清洗分类。二是建立标准化数据模板。不同的商场、超市,其企业数据管理系统内的扫描数据格式均有不同,但无论是什么格式的数据库,作为商品的电子扫描数据,其销售金额、销售单价等核心指标必然是统一的,因此需要建立统一的标准化数据报送模板,并根据模板编制计算程序。三是具备计算动态权数功能。未来扫描数据等信息化大数据均包含计算权重相关的数据,因此未来处理软件中也应包含利用扫描数据的动态权重计算、修正权数的功能,使指数计算更符合大数据时代的需要,为基层研究大数据在CPI指数编制上的应用提供更便捷的技术支持。(记者 陈斌峰 华磊波)