国家统计局南充调查队探索 高质量采集居民消费价格指数

中国信息报

国家统计局南充调查队积极探索,运用不同技术手段,降低调查成本、提高工作效率,高质量采集居民消费价格指数(CPI)调查中各项调查数据。

部门行政记录具有真实性高、数据量大等特点,南充队积极构建多部门间信息共享和常态合作机制,采集部门行政记录,召开联席会议研究数据的接收、分析和评估应用,多维度利用各部门行政数据开展数据加工,从而获取较为准确且全面的价格数据。通过与市发改委合作,实时共享最新水电气价格调整相关文件,掌握最新水电气价格变化情况,同时,与水、电、气运营管理部门加强沟通联系,核实了解水电气价格实际执行情况,随机走访部分客户进行实地核实,从而获取更为准确的价格数据。

为减轻调查员工作量,同时减少数据采集的人为差错,南充队积极探索,大胆实践,在药房、商场、超市、大型生鲜市场等具备扫描器的调查点,探索扫描技术在价格数据采集中的应用。通过与人工采价双轨运行,将采集结果交叉比对进行多源验证,扫描数据更具真实性与便捷性。在报表企业(单位)数据后台管理部门,确定一名工作人员从后台提取数据,减轻了调查员和调查对象的负担,有效节约了人力成本,提高统计调查的工作效率。后台数据所具有的规模性降低了同质可比数据采集的难度,系统自动生成数据,有效降低了调查数据的人为差错。

通过开展大量市场调研,南充队细研网采规格品种类,将网络价格更符合市场走势的规格品采集方式进行更替,同时根据网采特点创新建立数据采集调查台账,实时保存规格品价格网采页面,以便后期复验。南充队以资料收集为基础,建立数据可视化资料库,利用“爬虫”技术,增加数据规模量,在原有规格品的采价资料库中利用Python语言模拟浏览器模版,快速引入商超大数据、携程旅行网重点航线机票价格,增加数据规模量。同时,做好资料库数据整理工作,重点整理近年来食品、猪肉、房价等市、片区、省、国家相关指数和具体价格,特别是食品类引入中国农业信息网重点农产品市场平台价格,尽可能保证资料库数据的丰富性、关联性、可比性。打破用基本图形阐述数据的传统方式,学用、活用统计数据分析SPSS软件,多角度多侧面观察数据达到数据可视化,搭建多元线性回归模型。在规格品选取中可能受商品地区、代表性、采价时间等多变量影响,需要研究多个自变量的回归分析来论证价格数据质量的准确性。通过结合多个来源的价格数据,获得动态可视化图表达,以达到丰富的交互式可视化效果,使当期采集的价格数据可以快速与历史数据、周边数据“横纵向”比对,为更加有效地评估调查数据质量奠定基础。(作者 李锦楠 冷丁)

[责任编辑:]