本篇文章4253字,读完约11分钟

人工智能突然着火了,”徐莉激动地说。

过去,徐莉宣扬“深度学习”、“人工智能”和“深层思维”等术语,而这些术语客户往往并不知道。阿尔法戈的人机游戏开始后,客户主动寻求合作机会。“ppt中的大量专业词汇已经被alphago用五套围棋普及”。

商汤的人工智能:AlphaGo低调的中国同行

传感时代首席执行官徐莉

35岁的徐莉是sensetime的首席执行官,也是一名计算机视觉科学家。2014年,他和他的学术同行共同创建了SenseTime。目前,他的核心业务是机器视觉服务,包括图像和视频处理和理解、人脸识别,其技术基础是与alphago同源的深度学习。这家低调的初创公司已经不知不觉地渗透到了大多数人的生活中。

商汤的人工智能:AlphaGo低调的中国同行

带头

对徐莉来说,阿尔法戈赢得比赛并不奇怪。

在过去的两年里,每当他介绍深度学习时,他都会谈到alphago的“创造者”deepmind,这家英国公司在2014年被谷歌以4亿英镑的价格收购。“DeepMind只有12名员工,创始人是国际象棋冠军。没有具体的产品,只需花费4亿英镑就可以进行深度学习游戏研究。当时,业界感到震惊。”

商汤的人工智能:AlphaGo低调的中国同行

每次他谈到这次收购,徐莉听到的大多数评论都是“谷歌会乱花钱。”然而,当时业内的学术权威yoshuabengio教授评论说:“在深度学习领域,真正的专家大约有50位,其中12位是在深度思维领域,而谷歌买下了未来。”阿尔法戈证实了深度思维的价值。

商汤的人工智能:AlphaGo低调的中国同行

所谓的深度学习,从某种意义上说,是对人类大脑神经细胞的模仿。人脑有大量相互连接的神经细胞,它们相互传递神经刺激。但是,计算过程并不完整,它是将复杂的事情从一个层次计算到下一个层次。用计算机模拟这一过程将形成深度学习,这实质上是一种人工神经网络,善于根据大量数据做出判断。

商汤的人工智能:AlphaGo低调的中国同行

从历史上看,谷歌进行了一项“猫脸识别”的实验,建立了一个有10亿个节点的神经网络,允许它“观看”大量视频,而人工大脑已经独立地“学习”了识别猫脸的技能。此前,它没有预先编写任何程序来告诉计算机什么是“猫脸”,而是通过大量的视频和数据来全面分析猫脸的特征。

商汤的人工智能:AlphaGo低调的中国同行

深度学习的技术起源可以追溯到20世纪80年代。由于有限的计算能力和数据量,它一直处于学术界的边缘。2006年后,由于信息技术的进步,其学校开始崛起;随后,微软人工智能首席科学家李征将其应用于语音领域,并取得了重大突破。邓和他的合作者在2009-2010年开发了一套算法,将语音识别的准确度迅速提高到一个新的水平。一个有代表性的成果是自动同声翻译系统,它可以将英语演讲实时翻译成汉语,并以汉语演讲的形式输出。

商汤的人工智能:AlphaGo低调的中国同行

“这项研究改变了人工智能的产业地位,引爆了学术界。深度学习立即成为一个热点,”徐莉评论道。“大量的研究已经开始朝着深度学习的方向迅速推进。就像推动火车一样,技术的应用也在不断扩大。计算精度大大提高。”2013年,mittechnologyreview将深度学习列为世界十大突破性技术。

商汤的人工智能:AlphaGo低调的中国同行

徐莉认为,深度学习主要应用于三个领域:语音识别、自然语言处理(典型的例子是微软萧冰)和计算机视觉。2010年前后,徐立世在香港中文大学担任博士后,与唐晓鸥教授在香港的中文多媒体实验室有过多次接触,唐晓鸥教授是深度学习在视觉领域应用的先驱。

商汤的人工智能:AlphaGo低调的中国同行

其中,令人信服的成果是,在cvpr、iccv和eccv三大计算机视觉学术会议上,前三年有29篇关于深度学习的论文,其中14篇来自香港中文大学多媒体实验室,他们的团队成为了上塘科技的骨干研究力量。可以说,在深度学习和计算机视觉刚刚结合的时候,正是学术方向的明智选择和强有力的执行,使得上汤科技具有了现在的商业价值。

商汤的人工智能:AlphaGo低调的中国同行

迄今为止,上汤科技一直保持着浓厚的学术色彩。其人才团队包括麻省理工学院、斯坦福大学、香港大学、香港中文大学和清华大学等多所大学和实验室,以及谷歌、百度、微软和阿里巴巴等行业领军企业,其中包括5名微软研究员和2名a星(阿里星人才计划),汇聚了一批中国学术界在深度学习和计算机视觉领域的专家。50多名医生在拥有200多名员工的公司中担任全职职位。

商汤的人工智能:AlphaGo低调的中国同行

徐莉解释说:“汤堂的很多科学家都很受欢迎,我们提供的工资也不比行业巨头高。”“这些科学家之所以愿意来,是因为我们真诚地相信,在人工智能等关键领域,中国原创技术拥有充分的机会。走向世界的前沿。”

商汤的人工智能:AlphaGo低调的中国同行

世界第一

Geoffreyhinton现在为谷歌工作,被认为是深度学习的先驱。2010年在语音领域取得突破后,他试图将深度学习引入视觉图像领域,并参加了2012年的imagenet竞赛。

商汤的人工智能:AlphaGo低调的中国同行

Imagenet竞争是人工智能领域的权威领域。斯坦福大学的中国学者李菲菲收集了大规模的视野“图像分类和目标检测”数据集。该数据集最初包括对1000种图片进行分类的任务,然后添加200种静态图片对象检测任务。

商汤的人工智能:AlphaGo低调的中国同行

Geoffreyhinton首次采用深度学习的方法,将图像分类的准确率提高了10%,这在过去需要几年才能实现。这个例子一打开,如果你想证明自己在计算机视觉领域的实力,几乎有必要参加imagenet竞赛。

商汤的人工智能:AlphaGo低调的中国同行

2014年9月,尚唐科技联合创始人秋石博士首次进入imagenet竞赛,并在大规模目标检测竞赛中以40.7%的成绩获得世界亚军,仅次于谷歌的43.9%。

商汤的人工智能:AlphaGo低调的中国同行

2015年,imagenet竞赛增加了视频对象检测的新任务。视频是连续的图像,比静态图像中的物体具有更高的复杂度和商业价值。例如,一旦可以识别视频中的所有对象,品牌所有者就可以通过对象进行搜索并植入目标品牌。

商汤的人工智能:AlphaGo低调的中国同行

在这项新任务的竞赛中,活动的组织者选择了30类物品。由上塘科技和香港中文大学多媒体实验室组成的团队在28个类别中准确率最高,仅获得两个第二名;上塘科技的整体准确率为62%,远远高于第二名51%的准确率。它以11个百分点的压倒性优势领先,赢得了冠军。

商汤的人工智能:AlphaGo低调的中国同行

根据徐莉的解释,imagenet竞争的结果取决于三个主要因素:核心的“造脑”能力,大脑是否聪明,这决定了最终的计算结果,而造脑能力也是评价一个公司是否拥有人工智能核心技术的关键。

商汤的人工智能:AlphaGo低调的中国同行

谷歌收购了deepmind团队,facebook聘请了学术权威yannlecun等人,百度聘请了andrewng作为首席科学家,这实质上是要求“创造大脑的上帝”。只要人工网络的设计能够出类拔萃,就会在搜索等商业场景中带来巨大的商业效益,而上塘科技研究团队的高比例正是因为它把“造脑”列为重中之重。

商汤的人工智能:AlphaGo低调的中国同行

第二是数据。数据量越大,计算结果就越准确。由于imagenet组织者也提供有限的培训数据集,这一条件对参赛者是平等的。

商汤的人工智能:AlphaGo低调的中国同行

第三,是超级计算能力,这是由大数据处理的需求决定的。只有当计算能力比其他算法更快时,我们才能测试更多的算法模型并选择最佳算法。

商汤的人工智能:AlphaGo低调的中国同行

上汤团队成立时,一开始没有gpu集群,通常需要一个月的时间来验证结果。2014年5月,在吴恩达的主持下,百度建立了当时世界上最快的超级计算机平台——水华,实现了144个gpu连接。但是现在,由上塘科技建立的深度学习超级计算平台deeplink拥有中国最多的200个图形处理器的连接。过去需要一个月来计算,但是现在只需要5-6个小时就可以完成。

商汤的人工智能:AlphaGo低调的中国同行

imagenet竞争的胜利证明了上唐科技在两个领域的实力。徐莉说:“首先,我们的大脑构造得非常好,其次,我们的超级计算平台非常强大。”

商汤的人工智能:AlphaGo低调的中国同行

谷歌标杆

深度学习太抽象了。对于普通大众来说,上塘科技最容易理解的标签就是人脸识别。

商汤的人工智能:AlphaGo低调的中国同行

2014年下半年,投资机构idg主动上门游说媒体实验室的骨干力量创业。徐莉和其他人当时在这个行业很有经验。他们为什么要放弃学术追求,开始创业?

商汤的人工智能:AlphaGo低调的中国同行

徐莉解释说:“从学术到工业应用,这本身就是一种责任。”此前,香港警方曾向他们的团队寻求帮助:一些高速行驶的逃逸车辆的监控视频过于模糊,他们被要求恢复逃逸车辆的信息并支付服务费。这种做法给了团队很大的成就感。事实上,计算机视觉领域的“四大天王”中有三位(geoffreyhinton、yannlecun、yoshuabengio和吴恩达)都致力于这一行业。

商汤的人工智能:AlphaGo低调的中国同行

2014年10月,上塘科技团队正式成立。在创业之初,团队专注于将学术成果转化为商业解决方案。2015年上半年,该公司一直忙于开发产品,对人脸识别和图像处理的需求也在增长。2015年6月,该公司的业务开始爆炸式增长。上塘科技的业务团队起初只有四五个人,忙着接待在公司里提问的客户。直到2015年底,它才开始有针对性地开发行业客户。现在,这位业务团队的负责人曾在ibmwatsonhealth大中华区工作过

商汤的人工智能:AlphaGo低调的中国同行

由于上塘科技主要从事b2b业务,这大多是隐藏在幕后,它一直不为人知。事实上,它的服务客户已经达到了十亿美元的规模。根据徐莉的说法,现阶段的主要布局是在几个主要领域:

商汤的人工智能:AlphaGo低调的中国同行

第一大领域是移动互联网,其客户包括小米(智能人脸相册,植入miui7)、华为mate8 release(智能人脸相册+智能场景相册)、美图(人脸检测器、人像美容)、微博(人脸相册)等。此前,使用朋友圈的图像聊天软件faceu和snow也使用了上塘技术的算法。这些产品中的每一个都是超过一千万订单的客户。此外,尚唐科技还与中国移动建立了战略合作关系,后者依靠尚唐的ocr人脸识别技术实现其3亿用户的实名制计划。

商汤的人工智能:AlphaGo低调的中国同行

第二大领域是互联网金融,其合作伙伴包括银联、京东金融、招商银行等。,涉及真人检测、身份证、ocr扫描等服务。

商汤的人工智能:AlphaGo低调的中国同行

仁兴科技副总裁翁表示,经过多次测试,“借包”的人像认证系统最终采用了上塘科技平台,用户无需输入银行卡密码即可进行身份认证。“在应用程序中收集用户肖像的照片,然后与公安部提供的身份证照片进行比较。我们每天有数十万人通过这种活体肖像认证,这是目前中国最大的肖像认证技术实践。”

商汤的人工智能:AlphaGo低调的中国同行

事实上,汤汤的技术甚至一度引起了业界的怀疑。“一些同行错误地认为我们雇佣了大量的人在后台进行人工筛选。事实上,这完全是大数据处理的结果。我们的技术储备超出了许多同行的想象。”徐莉解释道。此外,上塘科技还在规划安全监控和大数据领域,其与安全系统平台提供商东方网通合作的产品也已登陆。

商汤的人工智能:AlphaGo低调的中国同行

徐莉表示,上塘科技在人脸识别或图像处理等国内垂直应用市场上有竞争对手,但其大多数同行都是根据现有算法从事应用场景的研究。“我们还没有看到与我们相同的布局,专注于核心的大脑构建和超级计算能力。严格来说,很多同行实际上是我们的下游,他们之间应该有更多的合作。”

商汤的人工智能:AlphaGo低调的中国同行

上塘科技团队希望瞄准谷歌和脸书等从事深度学习研究的公司。“谷歌和Facebook现在正在提供企业级服务,这对我们来说是一个巨大的机会。”

标题:商汤的人工智能:AlphaGo低调的中国同行

地址:http://www.3mta.com/xlxw/5817.html