透过共享单车数据分析投放问题
发布时间:2017-05-25 , 发布人:华恒智信分析员
由于共享单车在城市各区域的投放并不均匀,DT君常常遇到“想骑车却无车可骑”的尴尬。共享单车到底分布在哪里?魔都的哪些地方是单车公司忽略的“需求旺地”?数据侠周宁奕爬取了27万辆共享单车的数据,结合地铁流量数据和房屋地产数据,从用户角度为共享单车的投放问题开了一份“药方”。
5公里内才是单车出行的黄金距离
对于魔都这种超级大城市来说,投放足够的单车数量,是共享单车要面对的首要问题。那全上海到底有多少共享单车呢?从平时的观察看,摩拜和ofo是上海市场占有率最大的两家共享单车公司。于是我爬取了所有ofo和摩拜在上海的单车,去重后,理出超过27万辆摩拜单车,ofo则少很多。我觉得这基本是ofo单车没装GPS的问题,很多单车无法被系统找到。
仔细想想,27万这个数字既不多也不贵。截止到2015年底,上海大约有2400万人口,如果按人头算,只有约1%数量的摩拜单车。假如平均造价500元,把全上海的单车加起来,也不一定换得汤臣一品的一套房子。
把上海的凌晨摩拜的所有单车画出来,一副星光闪耀的地图展现在面前:
我从数据发现,其实大部分人都只骑了很短的路,12小时里移动了600米到700米的车是最多的。
根据腾讯企鹅智酷的一份调查报告,61.3%的用户骑行距离在3千米以内,骑行距离超过5千米的用户只占8%左右。也就是说,对于共享单车的用户,5千米以内的短途通勤需求是最普遍的情况。4月12日摩拜联合其他机构发布的《2017年共享单车与城市发展白皮书》中显示,上海的人均骑行距离只有1.8千米。因此大致上,单车是城市局部的微交通,随着短距出行的需求随波逐流。
此时我的脑海里浮现出一个模型:往半壶热水中倒入半壶冷水,最后总会变成均匀的温水。热水瓶就是单车的投放车,每辆车走的距离很短,但可能以每天1km的速度向四周扩散,日积月累的扩散效应应该还是很大的。所以单车一开始的投放可能是不均匀的,但最终会形成一种平衡。不过,其实用户的需求也是不均匀的,所以需要不断地对单车进行调度调整。
当然,也有一些特例,比如黄浦江应该就是一个保温的热水瓶胆。黄浦江流经市区,而桥梁、隧道、地铁都是不通自行车的,唯一可行的也许就是去码头坐船。如果浦西投放了10万辆自行车,浦东没有,那长期来说浦东浦西的供需关系就是不等价的。
黄浦江是屏障,铁路是屏障,更大的屏障还有跨距离的卫星城。也许,摩拜单车作为新生事物,并没有成熟到可以刻画全上海的人口流动,因此我爬取了上海所有的公交线路和站点,以此来刻画经年累月里城市各个部分的连接关系。
可以看出公交车的网络内部致密,连接却稀疏,松江、金山、嘉定新城已经变成了离开市区的卫星城,在市区投放单车,自发去卫星城的人应该非常寥寥。
南京西路也成了被忽略的地铁站点?
摩拜单车的一份报告说,人们的出行基本都围绕地铁展开。我以地铁站周边1km画圈,来看地铁一公里范围内覆盖了多少摩拜单车。这一区间基本涵盖内环里的核心地段,画出来的结果也确实如此,63%的摩拜单车都被圈到了里面。
当然,这只能说地铁和单车关系很大。但是上海有几百个地铁站,也不可能每个站点都均匀投放单车,有的站点人流大,有的人流小。那哪些地铁站被摩拜单车忽略了呢?
好在俺手上还有一份地铁的数据。以某个星期一的数据为例,我在下图中统计了每个站点进出站的总和,很快我们能发现个基本面:
和房价分布比较一致,2号线是上海交通的中流抵柱,尤其是虹桥火车站、北新泾、中山公园、南京西路、人民广场、陆家嘴;1号线老大哥,也很热闹,尤其是莘庄、徐家汇、人民广场和上海火车站,9号线的泗泾和九亭也不可小视,漕河泾的白领好多住在那。
然后,我们要统计每个地铁站周边500米的范围内的自行车数量。我把进出站人数和自行车数量做了个比例,那基本就算出供需关系了。下图,我用点的大小代表地铁人流,颜色用来表示人均保有的自行车数量,又蓝又大的点,可能就是单车公司需要去优化自行车投放的,如南京西路、莘庄、徐泾、共富新村、泗泾、九亭这些站点。
此外,图中还有一个明显的特点:在上海地铁路网的外部,基本都是大蓝色的圆圈。换句话说,摩拜单车集中布局在了上海的核心地段,而忽略了市郊的部分地区。这也符合我上文关于卫星城城市屏障的猜测。虽然卫星城的单车不容易与市区的进行流动,但是这些地区的地铁站点人流量也很大,满足这些居民的单车需求是不是也是潜在的市场呢?
不同城区板块反映了不同的单车供需关系
刚才,我们以地铁站为维度去区分流量,我想,还有一种途径,就是根据板块来看待投放的问题。我们先做一个较粗暴的假设:上海的房子“都是用来住的,不是用来投资的”,忽略群租房一类的特殊情况,板块内的居住人口,大致等于这个板块包含的户数(有多少套房子)* 3。
因此用链家的数据计算板块内总户数,基本可以代表每个板块夜间的常住人口,只要我们配合凌晨的单车存量,基本可以刻画第二天一早的单车供需关系。下图中颜色越黄的地方,说明越密集;颜色越绿的地方代表数量较少。
你会发现,三林、江桥、顾村、金山都是蓄积人口的大户,但是郊区面积也大,真正适合刻画人多人少的,还是按照户数 / 板块面积算人口密度比较合适,可以发现,环市中心是最密集的部分,包括了甘泉/宜川、光新、曲阳这些地方。
因此,人均保有单车,更准确的说是每天早晨从家出发的路程的单车供需关系如下:人均保有单车率 = 这个板块的单车数 / 这个片区的小区户数 。我们会发现漕河泾、外滩、张江、五角场和金桥比率很大。
当然,我们关注的不是哪里单车多而是哪里单车缺,上图显示深红色的板块,在早上是缺乏共享单车的,当然,这个单车很缺的地方可能人也很少,我们以5万户为界限,删掉人口很少的板块。此刻我们发现,普陀区的甘泉/宜川板块、 闸北区的彭浦板块、奉贤区的南桥板块、浦东的周浦、浦江板块,这些都是比较缺共享单车的,这也许值得共享单车公司去优化布局。
从这份数据里,我们还可以推测单车公司的投放策略,只要看今天系统中新捕获的单车分布,亮点代表在一个地方叠加了许多单车,这种分布,应是自然过程无法形成的。下图是从4月10日的数据来看单车公司在流量最大的2号线的某几个站点附近的投放情况。
我们今天分析的单车数据非常之简单,经度纬度和时间id,而且还不是连续的轨迹,但还是能够反映出一些问题。当然,我觉得共享单车最重要的不是今天我们讨论的怎么投放车辆,而是变成一面数据的镜子,反射出社会更多层面的问题。
作者:程一祥
来源:网络
来源:网络