• 初创公司如何快速低耗实现数据化运营


    摘要: 对初创公司来讲,要达到数据化决策业务这一点, 时间对于我们来讲是非常宝贵的,资金也是需要花在刀刃上...

    云栖大会—成都峰上,大数据分论坛中货车兄弟CEO甘小勇为我们带来了《初创公司如何快速低耗实现数据化运营》精彩的演讲,以下为甘小勇的演讲实录。

    为什么需要业务数据化?

    大家好,我是货车兄弟CEO甘小勇,首先要讲的是初创公司为什么需要业务数据化?
    image
    大数据不是成本,而是资源。
    我们货车兄弟产品的定位:货车维修互联网服务平台。在IT时代的视角下,只需要展现一个维修服务商的简单信息,但在DT时代,需要更精准的数据提供服务,故障详情、车辆状况、维修费用、服务评价等,都是非常有价值的数据资产。数据对于初创公司的发展至关重要,初创公司同样需要数据化。

    image

    我们目前已经有了足够的数据,但是想要做数据化运营还需要一些前提。
    1、 数据的积累,精准的用户数据,比如张师傅他是否会修重型机的发动机,再比如每一次维修,像常规的数据:时间、地点、车辆信息,维修数据:对应多少个零部件、多少个工时,以及后续的每一次的行为记录:下单、接单、维修工什么时候到、什么时候拍照上传,司机什么时候评价等这些数据,我们每次交易都会接收到成百上千条数据。
    2、 需要借助移动互联网技术以及移动互联网的数据和能力,打通我们平台以及车辆之间的障碍,形成了一个非常庞大的数据服务。

    所以可以这样讲,货车兄弟,其实是一个坚决以用户数据为基础,为用户提供一个精准服务的大数据公司。
    但是,如果想做数据化,对于初创公司来讲,如果要花很多很多精力去做事,毕竟不太现实,刚才不老老师也讲了,大数据对我们来说是我们的资源,是我们很重要的财富,可是,对初创公司来说,如果我们要投入很多人来做数据开发,来做预测,那可能这些人真的变成我们的成本。

    我们应该做擅长的事情,把行业规律找到,把数据的价值最充分地发挥出来。
    所以我们在此基础上,先对我们的数据首先做了一个梳理。

    数据能用来做什么?

    首先是我们手上的数据都有哪些,那么这些数据,我们能拿来干什么呢?
    image
    以前这些数据都躺在我们的系统里面。那时候我们用起来的是API,以及这个平台使用了阿里云的一些弹性计算服务等,再加上自己的MySQL数据库,以及我们的日志数据。但这其实对于用户价值的感知并不清楚。这时,数据对我们来说就真的就成本了,我们内部也在想,是时候想想怎么应用这些数据了。
    于是今年再去考虑数据建设的时候,就想要用活我们的数据,要从data0.0升级到data1.0,所以有了1的价值。 
    image
    那我们在data1.0的时候要把数据展示出来,那么这个数据展示给谁看呢?
    公司的运营部门、线下的地推部门、后台产品的设计部门、以及我作为公司的高层管理者,都随时要看这个数据,我希望能看到我的业务、我的产品问题出现在什么地方,不能凭我的想象来做决策和判断。

    如何对数据化实践做选型

    image

    对初创公司来讲,要达到数据化决策业务这一点, 时间对于我们来讲是非常宝贵的,资金也是需要花在刀刃上。

    在成立货车兄弟之前,我之前在运营商做市场做了大概7、8年时间。运营商其实做BI系统做了非常长的时间,
    但是这个BI系统有一个问题,他面临的数据量非常庞大,光用户就接近2000万。这个报表系统,我们运营商最擅长的就是数据汇总后通过短信发送到我们各级管理者,但这种就是不老老师讲的,看到的是历史数据,而不是实时数据。

    第二个问题是这个数据并不是最直观的。我并没有看到跟过去的对比、各个区域的发展情况,只能看到这些简单冰冷的数字在这个地方,没有这种体系化的东西。而且,如果我是一个业务人员要分析某一个具体的业务的时候,我是拿不到这些数据的,我可能得给BI系统的工程师打电话说我有这个需求。然后工程师会说大概今天晚上或者明天再给这些数据,他的实时性也没有办法保证。

    image

    所以,当我们今年需要把数据用起来,那么它的及时性、他的可视化以及对每一个人的个性化,能够得到实时的支撑。能达到这种系统的途径,会有几种方式:
    1、 自建系统,举例来说之前我所在的运营商自建BI系统,这想都不要想了,他们投了几十个亿这样的规模去支持他们的海量数据。
    2、 要么购买成熟的产品。其实大家知道大部分BI产品是基于传统的,互联网基因是不够的,而且做BI的领域的又需要庞大的业务体系,底层的技术,以及中间的数据集成还有上层的应用,这存、通、用这三个环节,一般的厂商是做不到的。所以我们在设计怎么搭建这个数据体系时,就想找一些第三方的工具自己来做。我们当时考虑了几种:
    1) 比如国外的Tableau、PowerBI,但是配置内容要传到国外服务商上面,可能在网络传输过程中,数据的安全性、传输的及时性,获取的方便性等方面,都会有很大的很多的障碍。 
    2) 于是在技术上我们再把目光转向我们国内的一些巨头,比如帆软:可以做私有部署,但收费部署维护是一个问题,也依然存在网络传输的问题。
    3) 再就是考虑到阿里云数加。当时让我最震撼的就是每年双十一的数据大屏,对数据的展示,这个工具对我们来说很豪华,适用于做展厅的大屏,但是我相信阿里作为一家最具互联网精神的公司,一定会有一个适用于外部中小企业内部日常做数据分析的工具,所以在今年初的时候,我们就联系阿里数加的Quick BI的工作人员,并且我们也做了一个比较,发现这是一个最符合我们当前情况的产品。我们本身就是用的阿里云的基础设施,不存在数据同步和抽取的问题,可以快速上手实现。时间对于我们中小企业来说是最宝贵的。 
    image

    我们要与时间赛跑,在初创期间希望能够快速成长,不能把时间耗费在不是我们最擅长的地方。
    还有另外一个就是考虑人力的投入,其实我们在人力储备上真正的就只有一个开发人员,还有一个是之前做数据分析的工程师,大概只有两个人。
    再接着是费用,当时数加的Quick BI是可以免费试用的,所以我们觉得可以试用一下,觉得试用效果还不错,于是再根据试用结果做了一个判断。 
    image

    因为我们这个初创企业刚刚开始的时候,其实系统的用户不多,但是我们内部也有一些管理系统,比如说考勤,还有一些业务、地推工具等等,再加上一些数据展现的工具。
    但是我们不可能让每一个人装很多,所以Quick BI他有一个非常大的特点,它可以非常方便的嵌入第三方系统。
    这里非常幸运的是,正好我们用的是阿里的钉钉,阿里钉钉其实对第三方的兼容是非常强的,由于我们在15年的时候就全面对接这个系统,所以,也对我们使用Quick BI扫清了我们后面的障碍。

    于是我们基本的方式就从原来的业务系统ECS就是弹性计算服务,把Quick BI接入到上面来部署数据服务和支持。
    那么在构建这些我有几个考虑,第一个是除了我们自己开发的系统,还使用了钉钉,比如我们签到系统、会话系统、员工管理系统等等,这几个系统的对接,对于我们来说没有障碍,加上又在同一个网络之下,团队开发的体验也没问题。
    最关键的是,我们投入成本是非常少的,不管是人力、时间、还是费用,我本身也做技术也很长时间,做CEO之后,虽然我没亲自没有来实现这个系统,但我看到这个Quick BI工具,加上我们前期的考虑,所以我说它非常适用于我们。

    如何实现数据化?

    那我想我们怎么解决问题,解决我们说快速低耗的解决数据问题,
    image

    第一个问题是,要保证数据能够同步。
    因为我们为货车兄弟们提供很多服务,每天都实时的在产生数据:用户要上线,无线端要上线,然后同时我们的交易也在很多地方在发生,而且维修方既有轮胎服务、保险服务、也有加油服务,同时我们的发动机修理等等,这些数据是不停的,所以我们在建的时候,Quick BI要保持相对的独立,这就需要一个独立的一个数据库系统来做支撑。
    于是我们的业务生产数据库和Quick BI的这个数据库,它们之间一个同步。要保证他们的组成关系,却又不影响生产数据库的正常运作。

    image
    而第二个问题,就是数据的整理和更新。
    我们同时还有很多用户的日志,这些日志是非结构化的数据,比如说用户的行为数据、还有语音、图片,像司机的行驶证、每个订单的上传的照片,以及他们之间沟通的信息,那么就需要进行简单的清洗,做抽取之后放到BI库中。 也就是说,我们的数据如果不进行分析、整理、抽取、归纳、钻取,那这个数据是没有价值的。
    于是我们就需要一个通用的工具:事件调度,来对我们的每一个环节做调度。这个是非常简单的工具,主要是在背后借助了Quick BI非常强大的分析开发能力。另外,我们所同步的数据,以及日志数据,还有我们本地的数据,我看了一下,其实Quick BI主要分析云上的数据,但是它的数据的来源是非常充分的。包括我们其他格式,他都是支持的,所以对于我们中小企业来讲,尤其最早这种体系不完善的,这对我们其实非常方便的。

    image
    第三个问题就是这个数据在操作的时候,会有操作权限的问题,比如我们内部,我们有运营部门、有做开发的、有做地推的、有数据分析的,也有像我这个层面去看这些数据的。
    那么,这种全新的管理上,权限就是非常必要的。尤其有我们很多货车司机,他就说车辆有什么问题需要做修改、或者需要查看订单去修改等,所以说一个数据库的管理权限有多么重要。一是Quick BI跟我们生产数据库完全隔离,是独立的数据库系统。二是数据整理的权限,我们设为一个用户,他在操作,它是一个独立的用户。那第三呢,我们对其他的访问者也做了隔离,就是说我们用户去看的报表和我们开发人员去看的报表是有差别的。

    image
    那么第四块就是我们最直观的展示了,也就是看数据仪表盘,人们在小时候开始对数字的交流就是看图说话,但一组枯燥的纯数据对于人来说理解是有困难的,尤其是在我们这个行业。 比如说我们的地推人员,他原来可能并对司机并不了解,但是通过数据的分析展现,精准的定位用户,图很直观。包括我们的运营人员,通过数据分析可以了解数据,但是如果这个图很复杂,不能简单直接地描述那他看起来也很痛苦。所以说,Quick BI很适合这种场景使用。
    比如我们这边就有给我们客户使用的仪表盘:客户效率。我们说每一单审核的时间、审核的平均通过率,以及在每个时段我们用户的并发情况,我们算出来每个客户大概是20分钟。 其实,情景也不多,但要求的工具一定要非常简单,不能太复杂。

    image
    另外一个我们要说,我们的用户发展。**用户发展是给谁看?**
    一个是我们的运营人员,一个是我们的地推人员。而地推人员他对数据的复杂性不care,他更多时候在外面跑。那么在跑的过程中,我们说要让他的数据能够更加直观的看到他的跑的情况。他用手机就能够看到这一点,如果他还搞不定,那说明他就有问题。
    比如我找一家合作商,要跟他说明货车兄弟产品的价值,给我们司机说明这些价值,我们其实是需要数据来说服他们的。如果说我们手上没有这个工具,它很难继续进行。

    所以实际上,我们在异地的移动端,我们检测我们的服务商、检测我们的用户。Quick BI对我们工作的发展,起到了重要的作用。

    image

    这是我们今天做管理平台的效率,我们在实践过程中,大概用了两天时间做出了对应的仪表盘,一周之内把我们的关键数据做了展现,一个月之内我们主要分析嵌入现有系统。投入只有一个人加上一个开发人员,但如果我们自建系统会投入非常巨大。 这也正是因为像阿里这样一个互联网公司,它的非常大的效应,这是我们这个数据的整体架构,具体我就不再赘述。 
    image

    Data1.0时代我们把BI数据体系搭建完成,那我们说下一步,更希望这个数据有一些预测,能辅助我们更好的决策。所以再接着我们看到数加有那么多款工具,而现在只用到了数加的冰山一角Quick BI,所以接下来我们的用户画像、实时预警、图像识别以及数据大屏。这是我们下一步努力的方向。
    image
    更重要的是,我更赞同数加的理念,目前我要求我们公司所有部门都需要做数据的展示、用数据来做衡量。我相信在不久的未来,一定会把数加所有的工具都应用起来。今天我的演讲就到这里,谢谢大家!

    本文为云栖社区原创内容,未经允许不得转载,如需转载请发送邮件至yqeditor@list.alibaba-inc.com
  • 相关阅读:
    django migration
    Jenkins Jobs status dashboard by Build Monitor Plugin
    PyWebIO Write interactive web app in script way.
    Infrastructure as Code
    sqlalchemy
    reactsketch
    CI/CD System and gerrittrigger keypoints.
    mysql backup
    Alembic A database migrations tool for SQLAlchemy.
    docker support for inner loop
  • 原文地址:https://www.cnblogs.com/jzy996492849/p/6972377.html
Copyright © 2020-2023  润新知