自学习与共享支持,是SaaS的重要趋势吗?从“拍发票”的发展可见端倪

牛透社 2016-03-02 09:22:29
敦和信息,坚持专注发票识别领域的产品创新,力图突破桎梏,为平常的财会工作赋能,促进发票电子化。从拍发票可靠识别上万种发票,可以识别的品种还在不断增加,我们感受到另外一种共享经济的味道。

编者按:敦和信息,坚持专注发票识别领域的产品创新,力图突破桎梏,为平常的财会工作赋能,促进发票电子化。从拍发票可靠识别上万种发票,可以识别的品种还在不断增加,我们感受到另外一种共享经济的味道。

这其实是敦和信息创始人陈健庆的实践带给我们的重要启发。

访谈嘉宾

陈健庆:广州敦和信息技术公司CEO

10年软件&互联网创业经验,从事过通讯、软件、移动互联网、手游等行业的技术要职。

现专注于图像识别方面&智能硬件应用开发及运营,擅长云计算、人工智能深度学习及实际问题算法研究。同时参与人工智能项目的一些投资

扎根发票识别领域,打破传统行为,做行业的“先行者”

“其实大部分的情况下,使用通用信息就可以了,但要想做得更好,就得有一个人工智能的过程。”敦和信息CEO陈建庆先生这样说到。这也是敦和信息作为行业先行者,推出“拍发票”软件,一直致力于做得更好的一种态度。

记者:您能简单介绍一下拍发票这款软件吗?这款产品的研发过程中,有什么技术问题最难解决呢?

敦和:拍发票这款产品的使用其实很简单,用手机拍摄所对应的发票,软件会把拍摄到的内容整体保存下来,并识别有效信息。目前,这款产品在号码方面的识别率,已经接近100%。但我们面临的一个难题是:发票识别中,会有很多图像模糊的地方,这是最难的一部分。

这其中,大部分的技术点都是来自于OCR。未来,我们会加另一个只拍摄和识别两个指定条码的OCR。当然,我们现在也在尽力尝试,能否最终做到不用贴票。如果贴票这个“传统行为”能打破,对这个细分领域将很有意义。

记者:市场上有非常多各种类型的发票,这款软件是如何进行有效识别的呢?

敦和:如果某一类发票是早已作为模板收集了,那么意味着软件在之前就已经“学习”过这类发票,就能实现自动匹配。事实上每一种发票都是软件先“学习”,然后通过人工智能实现自动匹配。系统已经”收集“了全国几万种发票,每一张都进行学习匹配,这样才能了解发票情况,并对应的进行技术处理,以便在之后能识别同一种类型的发票。

其实大部分的情况下,使用通用信息就可以了,但要想做得更好,就得有一个人工智能的过程。首先就要捕获物体的边缘,捕获之后将其变为3D效果,最终还原成模型,这就是人工智能。在这方面,我们也做过很多尝试。

我们的处理方式是:如果是发票上定额的部分,我们让其匹配到号码就可以了;如果是增值税的部分,我们就会增加这个名称,并完成中文的识别。

记者:我了解到您以前是做游戏的,那个领域是“短平快”的风格吗?

敦和:是的,短平快的风格。以前的游戏领域和现在拍发票所做的事情,在发展风格上有所不同。现在,我们花更多的时间去研究一个新领域内创新的技术,需要更多时间和精力。而且,我现在希望能把纸质发票和电子发票连接在一起,这样更有价值。现在,我们也在加快电子发票的接入。

做发票识别,“难”在哪里?

企业创新,在极大程度上取决于决策者的考量;产业创新,则需行业大环境的支持;一家在行业中极具代表性的企业要保持创新活力,就需要决策者的审时度势加上市场环境的向前推动,方能走出新的产业格局。

记者:国内有一些做报销的产品,他们会有涉及发票识别领域的工具吗?

敦和:国内的一些财务报销产品都只是涉及报销,而没有做发票识别的部分,基本的处理发票信息真伪的功能也不具备,其产品主要是为了处理费用问题。但是在国家的电子会计出现之后,未来许多企业的办公凭证会更加电子化,仅仅只是做报销工具,是没有办法打破这个大环境限制的。而我们做了发票识别这个几乎算是全新的领域,是有希望能突破桎梏的。未来十年,企业财务报销肯定是电子化的,而我相当于是加快了会计的电子化进程。

现在发票识别这个方面,以及OCR领域,在国外也有企业在研究,就连我们的一些代码也是来源于国外的。但我们自己也有很多这方面的人才,我的老师在图像识别领域有着多年深入的研究。我的目标还是往机器人的方向走。

我在广州做过通信、软件、SP、移动互联网、游戏等等,基本上技术行业我都做过了,所以我时常说,现在技术行业哪个企业比较大,我都很清楚。

我们的第一个版本识别一张发票需两分钟,随后,我们将其识别时间优化、浓缩到了15秒钟。而现在,我们把几个步骤浓缩到一个步骤,基本完成了集成。这样能快速识别出发票类别,以及各项具体信息。当然,在今后,识别的时间还将进一步缩短。

记者:您刚才提到,每一张发票建模的尺寸都是需要考虑的,因为发票的类型和尺寸太多。我认为其实政府是可以直接统一发票的,而您恰好以另一个方式完成了政府需要做的事情。

敦和:目前,国内有几万种类型的发票,之所以难以统一,其实涉及了很多问题,首当其冲的是:各省各自为政,难以统一规定。比如:深圳在报税方面拥有自主权,但很多城市却没有这样的权利,这其中的差异就会很大。

我们的本意是希望收集大量数据,再透过这些数据去作出反馈,帮助发票行业快速发展,解决企业发票相关的问题。由于现在的发票是没形成闭环的,不论通过什么渠道都难以查到全面的发票信息。

举个例子:有家企业,有一个仓库,整个仓库都是发票,这是由于企业的发票需要存放十年,仓库中堆积了大量发票。这也就意味着如果国家发现这家公司在偷税漏税,就需要翻开大量发票来查账。这个行业的痛点太多,远不止如此,这也是我一直在竭力完善拍发票这款产品的一个推动力。

记者:现在国内致力于OCR的企业并不多,我认为这就是您的核心技术,未来的确是大有可为的。加之您现在掌握了上万种发票的格式,从另一方面来说,市场上只有您掌握了这样多的发票格式,从创业者的角度来说,这是一个红利。用户的诉求是报销,但其实也是在推进电子发票的落地。

敦和:现在大部分发票都是纸质的,电子版也只是一张图片而已,我们希望把纸质发票和电子发票汇集在一起,找一个起始点,至少先做到不用贴票。如果能打破现有状况,不再需要贴票,未来,电子发票就会发展很快。从这个角度来看,我们是在通过这种技术来加快发票的电子化。

目前,全国31省发票的真伪在我们公司都能查到。我们也已经有了C端用户,但这个阶段,我们是致力于做B端服务。我们也计划后续可能开始做地推,扩大市场。此前我也提到了,我们对现在的用户企业已经开始进行增值收费。

用“被集成”为应用场景赋能,期待形成集群效应

合作的意义在于价值的整合和创造,单打独斗、傲视群雄的“乔峰式”发展从来不是企业应当考虑的路径。尤其在新的产业萌芽的时候,联合一切可以联合的“队友”,结合市场特性,精准出击、不断优化,才是上策。也只有这样,才能实现多方共赢,推动产业发展。

记者:现在在税务方面和别的企业或是其他类型的单位有合作吗?产品面世后使用情况如何?

敦和:其实当时我在做这个方案的时候,有幸和一位对税务方面颇为了解的友人讨论过,他的观点是这件事可做,这就让我有了更充足的信心。目前也在和一些企业洽谈合作,希望能做得更好。

其实当时我在做这个方案的时候,有幸和一位对税务方面颇为了解的友人讨论过,他的观点是这件事可做,这就让我有了更充足的信心。目前也在和一些企业洽谈合作,希望能做得更好。

其实也有人问我们能不能做成平台,觉得做成平台或许更利于我们快速发展,并得到市场认可。我们目前在和会计网以及其它几家企业合作做泛财务,但我始终坚持一点:我们只是做发票识别,以后可能发展成票据识别,其他的还不会触及。

记者:我认为其实可以把拍发票理解为一种SaaS服务,或许可以扁平化成为一些软件的一个插件,比如一些财务软件、协同软件。企业员工的工作中很可能会涉及到差旅问题,也就需要报销,因此发票问题是必不可少的。

敦和:您所说的这种产品发展模式,我们也有所考虑,也在积极联系国内的大厂商进行合作,我相信这样的方式是可以推动这个产业发展的。

记者:您是专注于自己所研究的领域,不忘初心。凭借自身的核心技术在提供服务,这是技术创业。专注技术,然后盈利,我相信,您这样的发展思路能将产品做得很扎实,报销领域也能做得更透彻。

敦和:在当时做产品的时候,我就问自己,如果我不做报销的话,怎样获得使用场景?如果我做报销领域,那么我希望它是贯穿一条线的。一开始的团队只有一两个人,没有人知道我们在做这件事,我们也不知道市场到底是怎样的情况,只是不断打磨产品、优化技术,一步步向前走,到了今天才逐渐走通这条路。

记者:根据我对国内市场的了解,这个产品一经面世,就会出现大量的抄袭产品,您有没有考虑过快速覆盖市场以放大自身优势,以保证企业较高的竞争能力?

敦和:目前,我们要做的是收集到足够多类型的发票,这可能需要半年到一年以上,数据并非用技术就能解决的。

我也曾思考过市场问题,权衡未来的拍发票是否要快速覆盖市场,占据先机。但我的考虑是即使我现在能通过这个方式将自身优势放大一些,别的企业也会这样去做。与其如此,不如将其迅速变成一个公众性的功能,推得快一些,因为最终是这家企业能不能真正使用产品。我也相信,这种技术可以颠覆整个财务的过程。很多企业的财务一旦用上了我们的产品,就会很快产生用户习惯,因为产品本身的粘度是非常高的,比如验发票真伪的功能。

访谈编辑整理:记者首席编辑 张科

审校修订:记者主笔 王甲佳

和一位有情怀的技术男聊互联网环境下的创业,你会感受到一种清新之气,纯洁得不忍直视。陈健庆大抵就是这样的人。2月27日,他刚刚组织完“2016泛财务智能产品发布会”,其实就是具有内在合作关系的2B服务企业的联合发布会,发布会的主题是“在一起更精彩”,我很赞同,在骨子里面就是具有互联网精神的一场活动。就此,崔牛会支持的第一个主题行业联盟也进入了我们的视野。

资源、技术与商业模式,构成了企业竞争力的互生铁三角,在更多的创业缘起中,技术以及商业模式往往来自于创始人的“基因”。如果这三个要素能弥漫着互联网精神,那么极有可能在一个细分领域做成类似PC时代的CPU一样的格局,那你的事业就成为别人所稀缺的资源。我对敦和的拍发票是这样分析与展望的。

发票识别自然有许多核心技术,据说敦和信息可以申报的专利有20多项,而且还在增长。最让我兴奋的是他们设计的具有共享经济特性的商业机制。一种新的发票格式系统经过学习、沉淀,可以迅速给更多的人使用,从而再次提高识别效率。

在传统的ERP公司中,都谈“行业最佳实践”,拍发票给我们的启发是可以将更小颗粒度的实践进行系统抽象与共享,更多的用户可以拿来就用。尤其是细分行业里面的业务模板,更具有独特的价值,在我们去年的“牛透访谈录”中,今目标也有类似的做法。这会不会成为一个趋势呢?

企业简介

广州敦和信息技术有限公司,主要从事基于人工智能深度学习的互联网智能分析产品

目前重点产品之一拍发票,财务领域的移动报销SaaS应用,通知发票识别解决报销&财务领域的问题。

另外OCR识别云,在识别云领域包括发票识别、小票识别、票据单据识别、文档识别、银行卡、身份证、快递单据、车牌等识别,通知开放SDK方式与各大软件厂商进行合作。

现在高级工程师20多人,与广东各大高校都建立密切的合作。

长按二维码关注我们