您当前的位置: 首页 > 法律

慧聪网CTO郭刚自己数据很强也需要外部数

2019-03-13 02:10:34

慧聪CTO郭刚:自己数据很强,也需要外部数据 「节省下来的时间,工程师可以去参与新的研发,建立新的模型。业务部门可以多去接触客户,提升客户体验。这些都是比重复的数据分析更有价值的工作。」

慧聪是国内既老牌又强大的 B2B 平台,无需过多介绍。近,TECH2IPO 有机会采访慧聪 CTO 郭刚,就企业数据一事向其提问。出乎意料的是,慧聪作为国内 B2B 领域几乎强大的数据源,居然也有自己的「数据愁」。

以下问答根据采访内容整理。

Q:您现在身为 CTO,在慧聪负责哪些领域?

A:作为 CTO,首先是负责慧聪整个研发体系。还有就是内部信息化产品的体系,这些产品主要是在内部进行管理和优化升级。在此之外,慧聪还在今年 6 月组建了云计算部门,我也负责这个部门。是的,慧聪在建立自己的 PaaS,希望将来能有很多的 SaaS 入驻。

Q:简要介绍下慧聪的现状。

A:慧聪现在的注册企业用户中,有 1500 多万卖家,超过 1000 万买家,每天流通的商品数量超过 6 亿。这个数据的规模可想而知。

Q:慧聪自己的数据分析水平如何?

A:13 年就在做自己的数据平台了,有 20 人左右的数据分析师团队。用户库,产品库,

慧聪网CTO郭刚自己数据很强也需要外部数

交易库,物流库,金融库,还有一些营销数据和外部数据。还是要搞清楚一点,大数据的意思不是数据量大,而是数据的维度多。慧聪作为一个 B2B 平台,我们需要采集的数据维度就相当多。

Q:B2B 的数据内容和 C2C、B2C 有什么不同?

A:差距很大。可以简单这么理解:你在淘宝、天猫看到一件衣服不错,可能自己喜欢,就自己买了。但是在企业的决策中,采购这个问题涉及的不仅是一个人一个团队,而是一个链条的许多环节许多人。人越多,决策就越不能凭「个人喜好」,而是偏向理性。理性决策,就非常依赖数据分析。向企业进行销售,需要结合多个环节的数据,对多个环节的人同时展开营销,每个人都过关,东西才能卖给企业。

说具体一点,比如天津有个工厂是买家,有一个广州的卖家价格便宜,有一个山东的卖家价格贵,你一定会买广州的吗?那必然不是,产品便宜,物流可能是昂贵的。还要考虑产品的质量,以及企业的账期与自己是否匹配——简单来讲,是考虑总的成本,而不是任何单一环节的成本。

Q:所以说 B2B 经常是「熟客交易」?

A:大概有 80% 的交易发生在熟客之间。工艺水平如何,账期是否对胃口,会不会突然倒闭,这些细节问题,一般来说还是熟人更放心。不过这么说来,我们做 B2B 平台大概就没意义了。平台要解决的还是生客交易的问题,必须在这个方向找到出路。出路是什么呢?就是数据了。一些上不容易搜集的数据,比如资质认证,比如实地认证,慧聪都会自己积累,或者于其他认证公司合作。这些数据非常有价值,因为越了解就会越信任。数据越多,生客与熟客之间的距离就越短。这就能把生变熟,从生到熟,促成生客交易。

Q:企业筛选这些数据的成本不会太高吗?

A:不会,重要的不是数据,而是相对数据。发展状况,络经营能力等,这些问题,垂直于地域,垂直于行业,都可以做个排名出来。我们可能不会显示具体的数据是多少,也不透露具体的排名,但是能够根据范围划分等级,告诉你是好还是一般。这些数据内容分为两个级别,对于慧聪会员来说,基础服务是完全免费的。

Q:我们还引用了一些外部的 SaaS?

A:是的,2015 年中期吧。自己的数据平台可视化水平不够,就用了海致的 BDP。

Q:需要的原因是?

A:解放生产力。IT 部门的工程师,有很多精力和时间耗费在基础的数据分析工作上,这种重复的机械劳动是在浪费他们的智力。如果一个数据服务有可视化,自带一些模型,有基础的报表生成功能,那么可以让业务部门自己分析自己的数据,不需要 IT 部门帮他们出报表。引入 BDP 以后,大概节省了 7 个数据工程师的人力吧。

Q:效率有提升吗?

A:比较明显的是报表的生成,靠人手动做的时候,需要 1 到 2 个工作日。现在 SaaS 有这个功能,几个小时就可以完成。还有更多的其实是间接提升。节省下来的时间,工程师可以去参与新的研发,建立新的模型。业务部门可以多去接触客户,提升客户体验。这些都是比重复的数据分析更有价值的工作。

Q:有价值的工作比如什么?

A:我们可以建立一些新的模型,代入数据去验算,不断优化算法,开发新的算法。基于这些算法,可能会产生新的产品,比如我们的「流量宝」,就是按效果付费的产品,用户的推送越,对双方就越有利。而推送的不断,肯定是依靠大数据,依靠相应的算法。因为 B2B 领域数据维度很多,模型的建立一方面靠业务部门的直觉,一方面就靠猜测和验算、倒推了。

Q:这听起来很奇怪,也就是说还有很多的数据工作没有使用海致提供的 SaaS 来展开,反而是放在本地?

A:这要区分来看。云端的计算能力确实很强,所以要用于急迫的事情,用于优先级高的计算,分钟级、小时级可以用海致 BDP。但是算法的研发和优化这些,不算是急迫的工作,所涉及的数据规模又非常庞大,相应的就是这些数据的价值密度比较低,很多都不算有效数据。这些数据全部参与计算,占用资源太多,速度也慢,再加上不是很急迫,这种大规模计算放在本地进行就好。全部上传这些数据,也是对 BDP 的浪费。

Q:数据是需要上传到海致的吗?

A:其实是开始对接好,基本是同步的。

Q:对接数据的成本是?

A:不算高,三个工程师用了两、三个星期吧,这是准备工作。之后还有一些持续性的工作。我们本身的数据很规范,使用 BDP 的成本就低。

Q:也就是说我们使用的主要是 BDP 的通用模块?

A:开始看中的肯定是通用模块,但是海致其实也有一些个性化的能力。他们有专门做模型的团队吗,如果他们四五个博士开发出的模型好用,我就没必要再花四五个博士的工资自己开发。这是一个经济问题。只要价格合理,我们也可以将海致的服务应用到新的产品上。就现在来看,引入第三方的 SaaS,的用途还是对内部产品的指导和改进,直接作用于外部的情况少。

Q:我们的云计算部门要做 PaaS?

A:是的,将来希望很多 SaaS 能够入驻。交易只是中小企业运营的一个环节,在其他环节,中小企业同样需要云服务的帮助。

本文由 TECH2IPO / 创见() @小田一成 撰写,转载或使用本文素材进行二次创作请参阅 版权信息 。

推荐阅读
图文聚焦