加入收藏 | 设为首页 | 会员中心 | 我要投稿 PHP编程网 - 黄冈站长网 (http://www.0713zz.com/)- 数据应用、建站、人体识别、智能机器人、语音技术!
当前位置: 首页 > 站长资讯 > 动态 > 正文

线性资本王淮:明年人工智能泡沫将达到顶点

发布时间:2016-10-30 06:32:42 所属栏目:动态 来源:网易科技
导读:副标题#e# 网易科技讯10月28日消息,由网易科技和网易智能主办的第七季“网易开物沙龙”今日在杭州浙江大学召开,本次沙龙的主题为“AI将引发生活大爆炸?”。会上,线性资本创始人王淮从投资人的角度发表了主题演讲。 王淮表示人工智能曾在一段时间被忽视
副标题[/!--empirenews.page--]

undefined

网易科技讯10月28日消息,由网易科技和网易智能主办的第七季“网易开物沙龙”今日在杭州浙江大学召开,本次沙龙的主题为“AI将引发生活大爆炸?”。会上,线性资本创始人王淮从投资人的角度发表了主题演讲。

王淮表示人工智能曾在一段时间被忽视,并只能以数据挖掘、机器学习等其他称呼来代替。

王淮提出投资人工智能更看重三大要素:大数据、深度方法以及应用场景。其中,王淮指出大数据应该是大规模、结构化并且被标注好的;而应用场景则要有决策整合,要么能达到更快的效率或者更好的决策质量。王淮认为投资尽量避免投入无法形成自由大量的高质量额数据公司,从而避免数据孤岛效应。

王淮提到深度并不是投资人关注的重点,投资人要看到的是有用的算法。应用场景在商业上的点一定要够细, 能用一两个简单的指标来去衡量。

最后,王淮建议尤其是学者型创业者,应多注重销售团队的建设,这是要成功的必要条件,是一个鸿沟。王淮认为明年AI泡沫到顶点,资本会越堆越大,5年内会走一个挤泡沫的过程。 (无比一)

以下是王淮演讲实录:

王淮:谢谢大家,我从投资人的角度谈谈我们投一些AI项目之后的感受,有一些经验,还有一些是属于教训,不该做的。

以投资人的身份在跟大家分享之前,我想加一句其实我原来做技术的,除了刚才提到的做过很多前端后端的事情之外,我最后两年做的都是跟现在称之为人工智能,那个时候不敢叫人工智能,因为那个年代叫人工智能大家一定觉得你在忽悠,我们那时候叫数据挖掘,最多叫机器学习,人工智能这个词应该是过去两年才真正的没有变成老鼠过街人人喊打的状态,以前大家是不怎么敢提的。像我们以前读书的时候,我们翻到人工智能那章的时候老师说这个东西不重要,过吧,都是属于这种状态。在工业圈的时候,以前手下有三个KGD,这种你就用数据模型之类来干活就行了,千万不要提NOP,这种乱七八糟的各种模型,还是用很多传统统计的学习方式。

我最后在负责的是大数据反欺诈,我不知道有多少人创业的,都是学生是吧?在杭州我们投过一家公司做的非常不错,做大数据反欺诈的,同盾,那家公司的创始人原来是阿里巴巴负责风控的工程总监,我以前干的事跟他干的基本一模一样,我们也是他天使+轮的投资人。进入分享经验和教训之前,可能先讲讲人工智能整个流程当中的一些必要步骤,这可能会对于我待会分享的时候会有比较清晰的结构。

简单的分成这三大块,第一块还是数据源,第二块是当中算法的处理,所谓的人工智能处理的方法,第三块就是它的应用,最后处理完东西要发生作用才行的。

数据这块典型的三个大的特征我们所认为的,一个规模要大,小孩子你只要给他一个苹果的照片,再让它看苹果问题不大,但是机器不行。结构化数据,尤其在深度学习出现之前的可能更多的是像做反欺诈的时候,很多都是1是1,2是2,都是结构化的数据。第三是标注好,什么是好人什么是坏人,他是什么特征,这个都要标注好,深度学习理论就是机器识图,这是过去两三年产生成熟的技术。人的人脸在哪里,苹果在哪里,你要标注好。

第二块方法论,典型的这两类属于机器学习的,统计,原来统计的学习方法,更多的可能叫回归算法,决策树,SVM,我们以前大部分是这套,现在比较流行的深度学习,这是过去两三年才真正成熟进入到主流的视野当中的,这些做人脸的都是在过去两三年起来的,以前都没有他们的生意可做的,大部分都是在学校科研角度。

还有一个是叫Buzz,规则,深度学习之前那是规则系统,更土了。

第三个很重要的是我们投资人关注的就是它的应用场景,搞了一堆数据,搞了一堆处理,完了之后不能解决商业实质解决的问题,要么让别人的商业决策更快,要么让决策质量更高,如果做不到这个,这个东西没人愿意买单的,你没有办法依赖你刚才在数据处理技术上面建立的优势去实现我们称之为产品到商品的这个转变过程,如果这点没实现的话,这家公司是不可投的,再牛也没用。

从数据这个角度,我分享一点经验,可能说是该做什么?我们这个里面有一个比较坚持的看法是说有一个原始数据积累的强策略,这个什么意思呢?就典型的这些做,大部分做人工智能的公司都存在这两个大的问题:数据不是你的,应用场景不是你的,你强的是有这种原来所积累的处理的能力,那些算法能力,调优能力,数据不是你的就意味着你是无源之水,很多事情干不了,业务不属于你的,付钱这一段,这个时间决策点是别人的,你要求着人家,像绝大多数的公司起点都是很困难的,如果没有特殊的方法,有两种我们看到典型的方法:一种你有历史的数据积累,像我们投的中科院计算所专注在人脸识别19年的,我们把整个实验室商业化了,这个合作应该是中科院计算所50年来第一次跟商业化的VC合作。他们历史上跟华为还有跟政府,咱们出入境的时候人脸都要扫一圈的,都是上一代的技术,这是有历史的数据积累。另外你技术很强,别人愿意用你,同盾就是这样的,是阿里巴巴原来负责风控的工程总监,出来之后大家觉得干这个事情你是最好的最牛的,我愿意试你,而且最开始走的路径找的是电商,然后再找的是互联网金融的,基本上中国的所有的P2P、在线金融的公司都是它的客户,再后面走的银行政府,你看它的一步一步是越来越困难的,因为你越后面的人他越关注的是你之前有什么客户我不要做你的吃螃蟹的人,所以你要通过这样强能力的输出一步一步的获得这些初始用户,再一步一步拓展出去,到今天他们有五千家,我们投他的时候就几家客户。

不该做什么呢?想了半天觉得这家公司这群人他没有办法形成大量的高质量的数据,这里面有几个关健词,一个大量一个豪华质量。我们认为在普遍的数据源当中有一个数据孤岛效应,什么意思呢?首先提到一点很多人认为数据在BAT,这是极大的误会,我说做一个不恰当的比方,我们抬头看天空的时候,晚上看到某一个角度只有那几颗很亮的星星,如果有最好的望远镜看上去,后面有几十几百亿恒星,典型的大家看到很多数据在BAT,但是在中国是属于几百万到几千万用户群体的APP的这些公司他们有这些的数据,但是不一定有处理能力。还有一个很典型的,他们有很多用户数据的重叠,只不过你并不知道,因为你没有身份识别数据,而且你如果能够把这些数据接到这款,把它结合起来是有机会打破数据孤岛效应实现我们认为的数据清洗加融合。还有一个标注,融合完之后A公司跟B公司看到的是同一个,你在A公司看到这30个特征,但是Y公司看到的是另外25种特征,凑到一起,重叠的渠道,你会看到40个特征,你会比任何一家公司的数据的价值高。标注什么意思呢?你知道他是好人坏人,你这边知道是坏人,另外一边不知道,你融合在一起,可以把看到的东西提供。当然上面有算法,通过这些方式你提高了数据的质量。你如果想了半天想不出来它有办法打破数据孤岛效应,没有办法他研究的数据通过打破孤岛效应之后提高数据的质量的话,那这些公司也是不可用的。

(编辑:PHP编程网 - 黄冈站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

热点阅读