弈聪软件卓建超:大数据通识性将进一步促进传统行业精细化发展

大数据是这几年的一项热门技术。它和人工智能、云计算已经成为大科技公司的技术标配。但是该如何理解大数据技术?大数据技术对我们有什么影响?对此我们专访了大数据处理信息服务商西安弈聪信息技术有限公司(简称:弈聪软件)总经理卓建超,卓总表示,大数据技术的发展为人类研究事物的方式提供了重要基础,使思考不再局限于单纯的猜测和推断。随着技术的深入,数据的真实性、精准性将愈加增强,因而数据在使用方面也将更加多元。针对不同目标而进行的数据样本甄选与研究将更有利于结论的获得。大数据行业的通识和通用性将进一步促进传统行业向精细化方向发展。

大数据技术

卓建超表示,大数据这个名字本身会给人一种误解,认为大数据的关键在于数据量很大。数据集的大小经常被高估。其实所需要的数据集的大小,跟数据本身的效果、数据的真实程度等都有关系。谷歌的数据之所以这么有价值,其实原因也不完全是因为谷歌能拿到的庞大的数据量,还因为人们在自己的电脑上输入关键词进行搜索时,都很诚实。他们不需要考虑社交压力、周围人的眼光等等。大数据革命跟收集更多的数据无关,而是跟收集正确的数据有关。还是以谷歌为例谷歌不是仅仅凭借着能够比其他搜索引擎搜索到更多的内容,就成为世界上最大的搜索引擎公司,它凭借的是可以搜索到更好的数据。这跟谷歌的算法有关。谷歌的算法,按照一个网页被链接的数量来对搜索结果排序。

大数据和机器学习经常一起出现,因为我们会使用机器学习这个工具做大数据的分析工作。机器学习是一种让计算机利用数据而不是指令来进行各种工作的方法。可以把机器学习看做我们做大数据分析的一个比较好用的工具。数据挖掘是指从数据中提取潜在的、有价值的信息。数据挖掘可以看成是对大数据处理的一种方式,但是大数据的处理方式并不止数据挖掘。城市中每时每刻都会产生海量数据,应用数据挖掘、机器学习和可视化技术,分析出的数据可以改进城市规划,缓解交通拥堵,抓捕罪犯,利于大数据为交通决策提供辅助。智慧交通卡口分析项目就是基于海量数据挖据出问题卡口,问题通道,分析主干道拥堵情况,为决策者决策提供辅助。

现在大数据时代的研究者,有了一项让那些过往思想家羡慕不已的数据:人们在互联网上搜索和观看色情作品的数据。这些独特的数据来源能够让研究者进入以前只能靠推理和猜测的领域。大数据的力量在于重新想象什么东西有资格成为数据,提供之前从来没有收集过的信息让人们可以研究。我们可以把焦点放在人口中的一个很小的子集进行研究。当然这要求对小的子集,也有大数据量。打个比方为了将照片的一小部分放大后还能看清楚,照片需要有很高的像素。同样为了能够清楚放大检视数据的小子集,每一个小子集中都需要大量的数据。

同时大数据可以允许研究者进行快速而且可控的因果关系实验,而不仅仅是相关性。脸书每天能进行上千次A/B测试。所谓的A/B测试指的是,在同一个时间维度,分别让相似的两组访客随机访问这些版本,收集数据,来评估出用户更喜欢的版本。这种方法互联网公司已经大量使用,而现在和将来,社会科学家也可以使用,从而把以往模糊的研究变得更科学。

陕西弈聪软件信息技术股份有限公司
电话:13679229477    02989322522
陕西省西安航天基地神州四路科为城墅20栋4301