谢谢各位!跟前面几位教授和专家讲的有点不同,他们的精彩讲演都是从微观视点,从职业开展的视点论说和剖析,都是前瞻性比较强的。而我说的内容,榜首,比较限制、微观,说才智化也只触及监管;第二,更多的是向后看,便是回顾曩昔的事,中心发生过的一些问题,如安在向前进的时分纠正;第三,今日仅仅提到监管,并且是从工程的视点看问题。方才听了几位专家的讲话后感觉,邮政业与国家大的开展方向和政策密切相关,前面几位专家从工业的开展,从邮政部分对工业的服务视点深入剖析,说的都是大事,我今日只限于才智监管。
一、监管需求信息技能的支撑
前几年,咱们阅历了邮政业安全出产信息化工程和后来的“绿盾”工程,都在讲要用信息技能和才智化的技能处理邮政业监管方面存在的问题。我自己感觉才智化、数字化、信息化实际上说的是一回事,只不过每个阶段需求有个新颖一些的名词来代表。才智化实际上跟信息化并没有什么实质区别。叫数字XX、信息XX、或是才智XX,没有实质的不同。咱们现在说才智监管,实际上是在说,要用信息技能处理监管中全局性的、针对性、灵敏性问题和完成高效率低成本监管。是邮政业信息化的一个组成部分,也是信息化整个进程中的一个阶段。
二、数据剖析是根底
其时阶段才智化的要害技能离不开数据和数据剖析技能。早在90年代,使用软件的规划上有“Data-centric”和“Process-centric”两种不同的技能道路。其时国内使用首要技能道路是以进程为中心的规划,也便是“Process-centric”,这基本上契合其时信息化的大的需求和大的趋势,其时一件重要的事,是企图经过信息化的进程,把曩昔涣散的、不标准的、各行其是的做法凭借信息体系一致起来、标准化。但在这种技能道路下,数据往往仅仅进程中的处理方针,是中心产品,一般不会将数据当作一个名贵的资源保存下来。而其时像美国IBM公司等,提出了“Data-centric Computing”这一理念。数据与进程比较,数据更重要,数据是信息体系中最名贵的财物。进程处理完毕就把数据丢掉,不保存了,是极大的糟蹋。其时评论的时分,我是站在“以进程为中心”的态度上说活,当然,也没办法否定人家说的理念很先进,只能说各有所长、各有六合。
到今日,时刻现已过了大约20年,回过头来看,今日要走的道路肯定是“Data-centric”,便是以数据为中心规划体系,将数据当作体系最重要的财物,继续使用数据的价值。
数据这种财物与其他实体财物不一样的当地是:实体财物多半是耗尽型的,越用越少,比方动力;可是信息财物、数据财物是越用它的价值越高,越堆集它的价值也越高。真实的数据财物的价值不完全体现在收集期间和及时处理阶段,而是在精心保护收拾之后。
三、大数据的开展进程
最近几年业界十分热衷于大数据,可是存在一个欠好的现象:一开始聚集于数据量的“大”就看成是归集的进程,认为越多越好,只需有数据就行,归集了许多即使是其时看也没有价值的所谓“大数据”,之后毫无用处,能够说是存了一堆“数据废物”。许多所谓大数据项目,建了很大的机房,购买了许多的服务器和存储设备,却忘记了数据的用处,更忘记了使用数据要靠软件、办法和模型。今日,大多数人现已意识到,需求有目的地收集数据,依据需求收集数据;需求对数据进行必要的分类和标引;特别是要聚集于数据的剖析使用,以用为纲。
四、大数据工程的要害
现在简直全部信息化项目,比方才智邮政、才智海关等等各种才智化项目中,大数据肯定是占有了重要的方位。立项之初必需求处理的问题是:切当界说数据剖析所要处理的问题。用什么办法能够使用数据处理这些问题,使用数据能不能处理这些问题,能够处理到什么程度。这便是大数据工程部分的需求剖析有必要答复的问题。
收集来的数据量大到必定程度,特别是进入PB数量级的时分,假如没有分类标引,这些十分有价值的数据就有或许无法有用使用,前期数据库房项目就现已意识到这一问题,因此除了库房,还提出了“集市”的概念,依“专题”将数据和剖析使命分类,这已被证明为行之有用。
别的一个问题,便是建造要点究竟是什么,是数据归集量,仍是核算存储等硬件设备,仍是处理剖析办法和模型?到今日为止咱们遇到的最大问题,便是不舍得和不知道在模型和办法上多投入。剖析办法和模型不属于IT职业的特长,可是正因为咱们不具备这个才能,才更需求从外部,从研讨机构、大学,乃至学者个人那里去寻觅资源。假如立项阶段不能确认模型、剖析办法及其出资,正好阐明咱们还没有找到适宜的答案。
五、监管才智化
监管面临两个需求处理的问题:一是监管方针数量多,散布广泛;二是不标准行为随机散布。这对监管构成不小的应战。在“绿盾”工程中,提出视频联网、联机监测等联网工程,这些体系建立起来之后,能够监测有毒化学品、毒品和非法出版物吗?这种巨大体系能够做到合理的投入产出比吗?能够继续运转和开展吗?这阐明了现代信息技能虽然有一些人力无法企及的才能,但假如没有精心规划,盲目使用,也未见得能到达希望的效果。发现有用处理问题的办法之前就大规模的铺开,最终的效果很或许是糟蹋。科学规划实验试点办法,在实验中探究、改善,或许尽力之后会有效果。
六、数据剖析
海关和税务在多年的探究中,构成了所谓的危险操控机制。面临巨量监管方针和有限的监管力气的对立,提出了“风控体系”的概念。在随机抽取查看方针的根底上,为了进步开箱、掏箱的成功率,有必要剖析监管方针的行为,区别货品、包装,依据剖析私运、违规的危险,确认挑选方针,这便是风控体系。税务稽察与之十分相似,仅仅买卖行为触及两边,两边的联系成了通同作弊的条件,也成了风控剖析的要点,联系图谱成为一个有力的东西,实践证明对图谱的剖析和使用,能够发生很好的效果。
关于方针的分类和按类处置,听起来十分简略,可是要想在真实实践进程中去做好并不简单。特别对错结构化数据,分类、标引和检索没有找到满足、完美的处理计划。邮政业无妨学习海关和税务等部分的老练经历,在监管作业中充沛使用数据剖析这一利器。
前些年在数据处理才能大幅度增加的情况下,有人提出不再需求采样,全部能够全量处理,并且全量剖析能够防止不妥采样形成的歪曲。但是所谓的“全量”是真实的全量吗?假如选用科学的抽样办法,样本的特点能够反映全量的特点,为什么还要消耗巨大的精力和时刻,对所谓“全量”进行无谓的剖析处理?更何况抽样办法自身便是一个研讨、发现的宝库,能够协助你从不同的视角研讨数据,供给许多赋有想象力的或许挑选。
七、猜测预警
数据剖析的一大用处是猜测,用模型对已知效果进行剖析,许多时分是为了对未来、不知道的效果进行猜测。
八、进步效益是要害
假如信息化不能带来效益,对事务作业效率、成效不起效果,就失去了含义,就没有理由冠以“才智”二字。发改委项目批阅中极其重要的一项作业是确认项目建造的方针,拟定可查核的量化方针。财政资金则着重“绩效评价”,绩效评价的首要方针是“产出”方针和“效果”方针,上一年9月份中共中央、国务院关于财政资金绩效评价文件中说:“花钱必问效、无效必问责”,并且是毕生追责。咱们有必要对此有充沛的知道和警惕,慎重再慎重。请求全部项目,有必要做到方针清晰,鸿沟确认,计划详细,办法妥当,出资合理。有必要对事务作业发生尽或许高的效益。
我讲的内容很窄,或许效果不大,“效益不高”,抱愧!
感谢我们的倾听,谢谢!