7月29日,搜狐财经“中国创客”线下系列活动“创江湖”第二季第二期活动在深圳南山洲际酒店开启。

  CA创投合伙人、挚金资本创始合伙人杨溢,东方富海合伙人、富海深湾移动创新基金管理人周绍军,小i机器人总裁兼首席技术官朱频频,碳云智能联合发起人兼首席信息官黎浩,分别就本期活动主题“人工智能”展开探讨。

  路演环节,八爪鱼大数据的创始人刘宝强展示了他的创业项目。这是一家以大数据技术与服务为核心的高新技术型企业,可简单快速的将网页、文件等转化为结构化数据,通过云采集实现精准,高效,大规模的数据采集。

  非常感谢有机会跟大家伙儿一起来分享我们八爪鱼这一个项目。我们八爪鱼应该说很形象,大家看这一个名字必须要知道可拿来干嘛,可拿来抓数据,还是最简单的。我们八爪鱼是目前整个市场上能看到的最简单的,通过一个工具平台获取整个互联网数据的方式。简单到什么程度呢?我们今天刚发了一篇文章,讲我们最新的版本,用户只要输一个网址,点击一个按纽,就能获取海量数据,只有这两个步骤。像百度一样,你要说明,输入关键词,点击按纽就能获取数据。

  通过八爪鱼,我们也可以交付结构化的数据结构,比如说Excel或者数据库,还可以通过API编程的方式将数据平台和你的BI平台和各个应用系统来进行直接连通,进行数据实时的同步。

  我们的客户大多分布在在金融、科研教育以及大数据行业,我本人也是从事全球金融行业的经验。现在市场上接近一半的大数据公司都是我们的客户。除了提供简单的数据,我们也提供了数多多这样的平台,杨总投过房多多,我们取名字的时候也采取这个好寓意。我们像淘宝一样,拥有海量数据资源,用户都能够像在淘宝买东西一样,搜索、预览数据,看一下评论好不好。甚至你拿到数据之后,如果不满意还可以退款。

  当然,数多多数据不仅仅限于从互联网获取数据,也有大量线下的数据,我们定位是数据领域的一个天猫。我们平台目前有28万以上的用户,每个月新增用户超过3万。当然刚才有几位嘉宾提到说机器学习的早期阶段是知识库、规则库等等,其实我目前有超过120万的规则库,涵盖了所有主流网站,我们大家都知道所有主流网站有什么数据、大家想要什么数据。我们平台云上面每天有超过5000万的数据新增。

  我们取得的一些成绩就不一一念了(见PPT),我们在去年年底的时候获得了大数据企业评级五星,这个是行业之内400多家主流的大数据企业,当然排除了BAT这种非大数据做主营业务的企业。

  我们的一些公司分布在各个行业,比如说中国建设银行,包括东亚银行这种大型的银行,以及联想或者当当网这种互联网的巨头,以及清华大学这类的高校。另外,包括凯丰投资这样的私募,他们获取大规模的数据,以往是靠对行业有研究的专家,靠他的经验和知识,他们通过数据科学家进行全景数据的分析预算,最终用来指导在证券交易市场的投资。

  我们把大数据产业链分成三层,供需链条、平台、具体应用场景。我们企业主要应用点在黄色部分(见PPT),我们会提供各种各样的工具意义大数据资源共享交易众包的平台。

  这是我们在英国的一家对标企业(见PPT),下面三家都是国外的。在网络数据采集我们在国外没有竞争对手的,下面主要是在数据交易环节的。

  我们的优势大多数表现在三个方面,比如说工具大多数表现技术优势,我们做到只有一个输入框、一个按钮,并且适应所有网站,因为我们背后有很复杂的机器学习的算法。另外,我要重点讲一下我们的生态优势,我们有几十万的用户,这些用户为我们贡献了大量的内容。我们在2014年3月份上线了八爪鱼,后面逐渐地进行了海外版本。另外,介绍一下我们的团队,我和联合发起人一起做了五年全球金融资源的收集,整个团队有很多年互联网的相关经验。

  杨溢:我来点评不知道合不合适,因为我2014年初的时候就投了八爪鱼这一个项目,我是一步一步看到他们的发展和成长。其实最开始的时候是很艰难的,因为最开始的时候你的产品其实是不那么完善的,而且产品的体验也是不那么完善的,而且你要改变用户的习惯。以前用户都是习惯用蜘蛛爬虫写数据、编程序,但是你要改变用户习惯,产品还不够好的时候,这样一个时间段做市场是蛮难的。但是八爪鱼的产品是一直在完善,到今天它的使用者真实的体验已经到了最简单,一个按钮,就像搜索一样,输入一个网址或者一个关键词,就能找到你所需要的数据,我觉得这是非常不容易的过程。当然,数据是有了,我觉得下一步是这个数据的价值怎么去挖掘出来,怎么去分析出来,做到对行业和商业化更有价值,预测的程度我觉得还需要更深入的努力。

  刘宝强:感谢杨总。我首先非常感激杨总在我连BP都不知道是什么的时候就给钱。我们确实在产品方面投入巨大,我们在前面三年多时间没组建销售团队,今年3月份才组建了销售团队,我们从始至终在技术产品持续投入很重要的。杨总点评的很到位,我们今年才逐渐总结了企业文化,其中一条是我们要关注用户价值,要做用户价值的东西,后面才有其他东西。

  朱频频:杨总的眼光还是很不错的,这一个项目很棒,真的很棒。因为现在人工智能钻是大数据应用的方向,这些质量比较好的数据是各个地方争夺的来源。我们做AI,数据大多数来源于三个方面,第一个是通过垂直爬虫自己爬的数据,我们为此也付出了很多的资源,也组建了大数据团队,有两三个人负责爬虫,但是开始的时候技术上面有解决了很多这类问题。所以说,我认为这一款产品应该有非常巨大的价值,其实还不仅仅是爬取,还做了初步的数据处理和分析。在整个未来应该会有非常好的趋势,因为我个人觉得整个未来世界就是人工智能的,什么样的事情都是人工智能的,人工智能重要的基础就是更多更好的数据,光多也不好,要更好。我觉得做到这种程度还是很不错的。

  有两个问题是需要问一下。第一是生态模式是怎样的?第二是数据爬取出来以后,能拷贝到我的企业内部吗?

  刘宝强:很谢谢您的点评和鼓励。您提到两个问题,一个是我们的收费模式,我们是to B的模式,产品基础功能是免费的,但是你想要更快,你想要100台服务器在云端爬取数据源源不断地输送到后台,这个就需要付费。另外,数据能不能拿到本地,可完全,我们支持各种各样的数据格式,以及从一分钟到一个月这种灵活的定时,包括我们允许用户对云端资源进行人为的分析和调控。

上一篇:BT查找引擎TorrentSpy永久性封闭
下一篇:天极网_专业IT门户

产品展示