过去几天,网友连续吃瓜,而最令人惊叹的当属头部网红主播薇娅因偷逃税罚款共计13.41亿元一事了。
据EDN小编发现,浙江省税务局的官方通报显示:案件是“经过大数据分析发现”的。
无独有偶,2021年11月22日,浙江省杭州市税务部门依法对朱宸慧(微博ID:雪梨Cherie)、林珊珊(微博ID:林珊珊_Sunny)偷逃税案件进行处理中也提到“税收大数据分析”。
这让人不免好奇,什么是税收大数据分析?税务系统的大数据是如何分析出这些网红主播们偷逃税的?
“税收大数据”,本身是指在税收征管过程中形成的一类大数据集,包含结构化数据和非结构化数据,具有及时性,税种全、动态强以及跨平台交互信息等特点;此外,在数据应用层面,将机器学习、云计算以及数据挖掘等技术综合应用于税收征管和经济分析等领域是目前的主流趋势。
而税收大数据和风险管理局,其职责就是风控。各个省市都有设立该机构对税收数据进行风险管理等,还会定期开展人才培训。
通过查询国家税务总局可以得知,最早提到数据分析是在2015年6月26日,当时国地税还未合并。该新闻发布介绍了可数据化的“管事”模式。
深圳地税局在前海试行取消税收管理员,以大数据分析比对为基础,以风险管理为导向,建立风险预警模型和风险指标,生成、下派和应对风险任务,将有限的征管资源运用到涉税风险较高的企业,税收管理员变身为“风险管理员”。
2021年12月16日则更新了最新的数据分析,介绍了几个省市税收大数据的应用情况:
通过网站搜索是可以看出国家非常重视税收大数据这个工具的,2021年以来已提到36次。
那么,税务局是如何发现这场重大偷逃税问题的? 业内人士表示,“金税系统”才是国家税务总局的查税利器。
它指的是中国税收管理信息系统(CTAIS),该系统的建设强调进一步强化对增值税开票、认证、交叉稽核和协查的管理,将增值税一般纳税人专用发票的认定、领购、纳税申报、税款缴纳的全过程实现网络运行。
金税工程的进展,代表着税务管理从“信息化”走向“数字化”。究其发展的源头还要从1994年分税制改革初期说起。
由于那时国家对增值税专用发票的防伪需求和稽核管控有需求,加上传统的“人盯人”征管方式已经无法满足大规模税收的发展需要。作为国家信息化建设工程(即“十二金”工程)重要组成部分的“金税工程”应运而生。
发展至今,已经走完三个主要阶段:
金税工程一期(1994年至1998年):1994 年,为防止不法分子利用伪造、倒卖、盗窃、虚开专用发票等手段进行偷、骗、逃国家税款的违法犯罪活动,国家决定在纸质专用发票物理防伪的基础上,引入现代化技术手段强化增值税征收管理。该防伪税控系统,由航天部负责开发,在珠海、鞍山和镇江3个地级市试运行。与此同时,电子部负责开发“交叉稽核系统”,并在50个大中城市试点。从结果看,金税一期的双系统由于“手写+人工录入”导致采集信息时常出现错误,加上试点范围有限,效果并不显著。
金税工程二期(1998年至2003年):从1998年8月开始,国务院决定在全国推行金税工程二期建设,目标为建立一个对增值税专用发票进行监控的全国性的网络。从2000年1月1日起,应国家税务总局要求,全国所有十万元版以上的增值税专用发票全部纳入防伪税控系统的监控。
这一时期主要有两项重要工作:第一,在全国范围内建立覆盖总局、省局、地(市)局、县(区)局的四级交叉稽核;把稽核和防伪税控原本相互独立的系统捆绑在一起运行,做到数据共享、功能互补,解决交叉稽核中由于人工录入数据造成的数据错误;同时把海关增值税完税凭证纳入金税工程管理。第二,将增值税征管各环节都放在网络上运行,尤其要采集纳税人的增值税申报信息和税款缴纳信息,以此对纳税人进行纳税评估和监控。
二期取得的主要成果是增值税交叉稽核系统和发票协查系统在全国范围内联网运行;防伪税控认证子系统在全国范围内推广运行,防伪税控开票子系统已经大规模推广。从2003年8月1日起,一般纳税人的增值税专用发票全部交由防伪系统开具,手写发票的历史宣告结束,金税工程二期建设原定目标圆满完成。
金税工程三期(2008年至2021年):2008年9月24日,发改委正式批准金税工程三期初步设计方案和中央投资概算。2009年,金税工程第一阶段建设全面启动,具体包括了金税三期信息系统的开发、测试,以及全国广域网机试点单位计算存储、安全等基础设施建设。2013年底,金税三期采用“生产数据在省局落地,数据的集中处理和应用在税务总局”的模式,优化形成了全国推广的信息系统版本。2019年,金税三期(并库版)完成全国上线,原国税、地税两套金税三期系统实现了流程统一、数据合流、功能升级,解决了一个机构两套系统办税的问题。
金税三期集合大数据评估和云计算功能,实现了国地税数据的合并,同时对岗责体系和征管流程进行梳理和配置,实现岗位设置、工作流程以及参数配置等统一,其主要是对税务系统业务流程的全监控。
亟待上线的“金税四期”,功能更是不容小觑。
从升级方向来看,以后无论是什么维度的数据、何种交易对手之间的资金来往,都将有更加清晰完整的链路呈现。
据公开资料显示,金税四期不仅仅是涵盖税务方面,还会纳入“非税”业务,实现对业务更全面的监控。同时搭建了各部委、人民银行以及银行等参与机构之间信息共享和核查的通道,实现企业相关人员手机号码、企业纳税状态、企业登记注册信息核查三大功能。
一位税务行业人士透露,在金税四期,税务、工商、社保等机构随时合并接口,企业人员、收入等信息相互关联,企业很难少交个税和社保。
他提到,税务系统需要纳税实体开户并申报收入,若未申报、少申报,则很难有真实收税依据,税务部门也难以核实,必须通过其他渠道再做核查。
但如果能实现多机构间的信息共享与核查,跨到银行等机构进行数据收集,自然会更接近纳税主体的实际情况。像薇娅那样虚假申报佣金收入的做法,相信也会无所遁形。
有从事过税务大数据系统设计的技术人员直言,利用大数据技术,对网络直播开展税收监管的入手维度其实很多。
在技术层面,鉴于各地方政府在开展税务监管层面选择合作的技术提供方不一致,不同地方的偷逃税监管稽查手段与方法可能不太一致。但在底层的技术原理上,原理是相同的。
“事实上,通过公开的主播成交量等信息,对应收税款进行估算,是可以推测出是否存在偷逃税行为的,而且技术难度不大”。
在该人士看来,在获取到主播们的税务数据之后,通过对主播们的历史直销售数据、实际成单情况以及营收预测,利用大数据技术对网络直播开展税收监管的入手维度其实很多。
在郑爽涉嫌偷逃税新闻发生时,一位机器学习工程师就表示,可以通过AI寻找某些数据指标和真实收入之间的关联性,预测的真实收入与实际报税收入的差距,就是一个怀疑的理由。
一位深耕于监管科技的CEO也称,这类技术应用的研发难度不大,可以拿足够多的财务报表去训练模型,去计算相关结果有没有偏离财税比率——“难点主要在税务数据的打通,和税务模型的构造上。”
而公开资料也显示,“金税工程”也嵌入了一定的AI技术。
就在上个月,国家税务局长王军透露,智慧税务正在向“两化、三端、四融合”迈进,其中:
“两化”,是以数字化电子发票改革为突破口,将各类业务标准化、数据化,实现可归集、可比较、可连接、可聚合;以及基于大数据、云计算、人工智能、区块链等新一代信息技术,对实现数字化升级后的税费征管信息,做智能化改造。
“三端”,就是指智慧税务建成后,将形成以纳税人端、税务人端和决策人端为主体的智能应用平台体系,基于全局视角建成覆盖税收征管全部环节、全部流程、全部主体的一体化应用平台。
目前,中国经济进入了大数据时代的“新常态”,数据在作为税务机关执法和监管的有力“利器”的同时,大数据时代的纳税人隐私和商业秘密保护也非常重要。
通常而言,税务机关在使用纳税人申报的税务数据时,除非法律另有规定,原则上只能针对个案进行税务评估和征收管理层面的使用,不能将未脱敏的税务数据提供给其他市场主体、其他机关或组织使用。即便是税务机关在征管或执法过程中形成的与纳税人有关的数据,其使用也应当仅只限于税务用途或依法规定的其他相关用途。
从法理上讲,基于公共利益需要,在数据脱敏后,税务机关和有关部门可以从区域、行业和细分市场等多维度对相关税务数据进行分析,形成相关分析数据和统计报告作为公共资讯,或应用于经济社会治理事项。
需要指出的是,根据《信息安全法》《个人信息保护法》等有关法律法规的规定,税务机关如何采集和使用这些数据,应当事先告知纳税人以及可能被使用的情形和具体用途,并依据相关法律法规规定的权限和程序进行。
至于税务机关在税务征管过程中形成的数据以及从第三方及政务或公共信息平台合法获取的信息,也应当结合数据安全和隐私保护的基本原则,妥善加以使用。
未来,国家需要在《信息安全法》《个人信息保护法》等法律法规的基础上,加强税务数据领域的立法和政策制定工作,特别是针对税务数据的分类治理以及税务数据的取得、使用、收益、处分等权益运行要制定相关的公平、合理和有效的规则,既使得税务征管和服务能够依托大数据和云计算大幅提升其效能,减少对纳税人和市场主体不必要的打扰,同时也要充分保护纳税人和市场主体的隐私和商业秘密,让税务数据在安全、可靠、权利有保障、权力有制约的治理环境下充分发挥社会功用和效能。
综合整理自:知乎、澎湃新闻、新浪科技、36氪、雷锋网等
责编:Demi