是他们想要的东西,他们非常满意。”
“这个倒是有点意思。”冯啸辰听出了一些眉目,点头赞道。根据客户的具体情况来寄报价单,这也是一个很常规的操作了。但如果客户的数量很多,要准确地识别出客户的特点,就不是那么容易的事情。姚富杰的贡献,在于他把这种识别工作交给计算机去完成了,这的确是一个很了不起的成就。
得到冯啸辰的夸奖,姚富杰更来劲了,他说:“后来,我去找了包成明叔叔,他手里有一个非常大的数据库,记录了全国几百万家企业的资料,我现在正在对这些资料做分析,看看能不能分析出一些名堂来。”
“你是说,你的兴趣是在分析数据上?”冯啸辰问。
姚富杰说:“我做的可不是简单的分析数据,我做的这种工作,现在在国外特别流行,叫做data_mining,翻译过来就是数据挖掘。它和传统的统计分析不是一回事,最大的区别就是它是针对海量数据的分析,所有的分析模型都是通过机器学习完成的。”
冯啸辰哑然失笑了,数据挖掘技术时下在国内还不太受到重视,但国外的确已经应用得非常广泛了。再过十几年,这种技术会以一个更接地气的名字在国内出现,并且迅速泛滥成灾,许多互联网公司都以应用这种技术为荣。这个更接地气的名字,就是“大数据”。
大数据分析其实并没有什么神秘的,不过就是在海量的数据中寻找相似的模式。由于数据量极大,可能存在的模式也数不胜数,靠人力去识别这些模式是不可能的,只能通过计算机来自动识别,这其中就涉及到人工智能、机器学习、神经网络之类的知识。对于外行来说,这些知识是非常玄妙的,但对于内行而言,不过就是一些套路而已。
大数据分析的价值是毋庸置疑的。在营销中,通过大数据分析,能够在海量数据中找到不同的用户行为模式,可以对用户进行精准营销,从而有效地提高营销效率、降低营销成本。在生产上,大数据分析能够优化生产调度,及时发现生产中的问题,识别故障,是实现智能生产的重要前提。
当然,在后世,有许多打着大数据分析旗号的研究,其实并不是真正的大数据分析,而只是传统统计分析方法在海量数据库中的应用,使用的依然是求均值、求方差、解线性回归之类的传统算法,并没有进行模式识别的能力。这种所谓的大数据分析大行其道,倒让真正的大数据分析被人误解了。
“富杰,你在大学是学什么专业的,怎么会做data_mining?”冯啸辰好奇地问。
姚富杰说:“我学的是工业自动化,不过我更喜欢的是数学和计算机,在大学里选修了这方面的课程。我还有几个计算机系的朋友,他们在这方面的能力更强。我说的那些模型就是他们帮忙做出来的,光靠我一个人可搞不出来。”
“这么说,你的理想就是开一家专门做数据挖掘的公司?”冯啸辰试探着问道。姚富杰说了这么老半天,当然不会是无的放矢的。
姚富杰