因为体检有一项指标偏高,需要复检,所以我体检日期推迟一周。尽管体检没过的那一项是小问题,但也给我敲响了警钟,我需要好好注意身体了。另外在体检过程中,医生告诉我我鼓膜有些松动,尽量不要戴耳机了。
想起我实习入职的时候,开始什么都不会,连着前一个月都再打酱油。但这次回来就不同了,开始就接手了我之前一直想做的数据分析的活,主要是想通过分析alimama每个广告位的点击、消耗、展示量来判断这个广告位有没有出问题,从而减少损失。未来可能要做到预测下一时刻的数据来判断广告位是否出问题了,说实话,这一直是我想做的工作,但现在感觉自己知识欠缺,很难在短时间内创造出一个好的可用的模型。确实本周前三天里,我也有了个模型,但误差太大,部分时段模型处于不可用状态。
前几天我调出了几个广告位很多天的数据,然后用excel绘出了曲线图,我发现每天的总的消耗、PV、点击量差别太大,甚至部分广告位两天的数据差别能到200%,看多天的走势,如果仅依赖前几天的数据来预测当下一天的数据根本不可能,需要选取更多的特征,而我也没办法获取到其他特征,就放弃了以天为维度预测的想法。
后来我发现其实每天的变化趋势都是差不多的,所以我用 每个时段/全天总收入 的方式将全天的变化趋势保存下来,因为我发现工作日和非工作日趋势不同,我取了前十个周同天的数据,然后取每个时段的平均值,得到一条平均曲线。我判断异常的思路是这样的,如果几天的数据变化趋势和平均变化趋势在某个时段相差太大,我就可以认为这个时段是有问题的。
这就是9天各个时段的走势
这个工作的前期是找出之前有问题的数据,后期是要预测下一时刻的数据,我的想法是只要用本天前几个小时已知的数据去拟合这条曲线,就可以预测接下来时刻的值了。得到真实数据后和预测值比较,偏差太大就可能出问题了,然后加入这一时刻的数据去优化当天的预测模型,使其下一时刻的预测值更准确。
说实话,模型很简单,然后可能因为真实数据确实误差很大,有些时段的预测值会和实际偏差非常大,正因如此,所以在考虑换一种模型了。这个时候就感觉到自己数学的不足了,没办法用数学公式把模型描述出来,也没办法用概率论的方法优化模型,我决定各个时段值是有权重的,我也没办法去量化这种权重。做任何事总要有产出,不说对其他人,对自己也不好交代。
另外说一些其他的感悟。这两天在看《叔本华心灵咒语》这一书,书中摘录了叔本华著作中对人生的一些观点,其实我对很多观点很赞同,因为通过这两年的经历也感悟到一些。还有一些观点对我也有启迪作用,毕竟很多事我都没有经历过。之前看过叔本华的《人生的智慧》一书,当时就感叹为什么没有早看到这本书,然后就想看他其他的著作,但始终没有抽出时间来看,《叔本华心灵咒语》也算稍稍弥补这些遗憾了。另外,看这本书的时候,我在想鸡汤和真正有价值的内容区别,鸡汤只是给了你慰藉,而有用的内容却给你指明了方向。
我也一直在学着去观察周围的人和事,每个人都有自己的特点,每件事都能让你学到新的东西。周围的几个同事,之前在我实习的时候指导了我很多,我说的并不是具体的事,而是做事的方法、思考的方法。周围的人很优秀,都有自己的特长,而我的特长在哪? 这两天又虚度了两天,也提不起什么兴趣去做什么事,看了天天向上,汪涵和何炅,湖南台的两台柱子,他们身上有太多值得学的东西了,尤其是汪涵的睿智和幽默。
一直想着去改变一群人、一个行业甚至是全世界,但看自己现在的状态,似乎一直在原地踏步,所以那天我给一年后的自己写的一句话“你还在原地踏步吗?”。希望自己能找对方向和方法,用最快的速度前进。