去年11月,PingWest品玩曾经报道了李飞飞(Fei-feiLi)加盟Google一事。李飞飞是斯坦福大学终身教授和该校人工智能实验室主任,因主导创立的ImageNet项目而在机器学习学界知名,加入了Google云计算部门(以下简称Google Cloud)担任首席科学家,在该部门旗下领导一个新成立的人工智能和机器学习(AI/ML)研究团队。
美国时间3月8日,李飞飞第一次以Google员工的身份出现在Cloud Next 17上。加盟新公司四个月后,她带来了一个口号,以及几项新宣布。
李飞飞的口号是:让人工智能“人尽可用”(Democratizing AI)。她在台上反复表示:“Google is democratizing AI,Cloud is the vehicle to deliver.”也就正如我们的标题所说,她所带领的人工智能和机器学习(AI/ML)研究团队,将会发动Google云计算的车,把送人工智能到千家万户。
这的确不是我第一次听见democratizing AI这句话了,不过李飞飞的描述听起来更有说服力。
她的这个想法在斯坦福大学任教的时候就已经产生了。因为成本和技术门槛等原因,不是所有人都能够“参与”人工智能。就拿成本来说,想要搭建一个高效训练神经网络的计算设备,造价十分昂贵(比如英伟达的单机箱超级计算机DGX-1,售价13万美元)。即便是用目前业界最强大的显卡进行训练工作,往往也需要数年的时间,这基本断绝了“作坊式”的人工智能系统搭建的可能。
而李飞飞认为云计算是让人工智能普及的最佳途径。上周该公司的一项宣布证明了李飞飞的观点:荷兰密码学家使用Google的大规模计算技术,一共用了两年时间就成功训练出了一个算法,然后攻破了需要1200万年才能暴力破解的SHA-1加密算法。
根据Google Cloud负责人戴安·格林妮的说法,Google Cloud已经是“世界上最可靠云计算平台”,上面运转着全球最大金融服务商汇丰银行的金融安全系统,还驱动着社交软件Snapchat里面各种酷炫的实时人脸滤镜特效,去年黑五帮助美国家用品超市HomeDepot的电商网站平稳度过了疯狂购物潮,还帮助迪士尼、Verizon(美国第一大电信运营商)等知名公司的数十万名员工,只用了几个月时间就从原来的办公软件成功迁移到了GSuite上。
你可以总结为:大规模计算、高集成性和高可靠性,再加上对TensorFlow等各大常用机器学习技术的支持——就是李飞飞支持Google Cloud,对其爱之深以至于要加入的理由。所以,去年11月时一些业界人士猜测李飞飞加入Google的原因,可能是看中了Google作为业界领袖所拥有的海量数据,现在来看这一猜测还是有几分道理的。
“如果有一辆自动驾驶汽车,一个司机可以更轻松地通勤。如果有一千辆,这个地区的交通阻塞也会显著减少;那如果有一百万辆呢?整个城市的交通都会被重新定义……从一辆到一千两再到一百万辆,每一个级别之间的区别就在于参与不一样。普及人工智能,重在让人们能够参与进来。”李飞飞在大会的主题演讲中说道。
她认为Google Cloud是提高人工智能参与度的答案。因为每天都有数十亿人使用Google的产品,无论是搜索、广告、邮件还是Android;而Google所有产品的背后,现在都是Google Cloud以及某种形式的人工智能在驱动着。“人工智能即将改变我们生活和工作的方式,在斯坦福做了这么多年研究,当我看到Google Cloud这样一个平台的时候,是很兴奋的,”她说。
必须说,尽管今天Google Cloud负责人戴安·格林妮连续在台上“召见”了SAP、Verizon等顶级合作伙伴高管,尽显强大的气场;Alphabet董事长埃里克·施密特用标志性的幽默推销惹得观众笑声不断;但李飞飞的演讲给Google Cloud带来的广告效果其实是最好的。
另外,李飞飞还在大会上发布了Google Cloud的几项重大消息。
在新宣布方面,李飞飞首先确认了Google收购了创业公司Kaggle的消息。
Kaggle是一个专门服务数据科学家的社区,用户数已经超过50万。用户经常在Kaggle上面发布算法、数据集等相关的重要资料,使得这个网站在相关领域的影响力很大,可以说不逊于计算机专业的论文库。Kaggle之前和Google已经有过深度的合作了,多次联合举办机器学习方面的比赛,比如“YouTube 8M VideoUnderstanding Challenge”等。
在演讲后的采访会上,李飞飞表示Kaggle将会“在一段时间内”继续保持独立品牌和运营,收购的价格尚未可知。就用户数字来看,Kaggle的竞争优势已经很明显,但更吸引李飞飞的应该是Kaggle在数据科学和机器学习算法上的集市(marketplace)功能。
李飞飞还介绍了GoogleCloud基于神经网络技术新推出的一些API和引擎,比如Video Intelligence API、Cloud Vision API、Cloud Natural Language API、CloudJobs API、Cloud ML Engine等。
其中最重要的应该是VideoIntelligenceAPI。众所周知,过去的计算机进行图像识别主要是在静态图像上完成,而这枚新推出的API能对视频进行全片分析,提炼全片的故事脉络,记录一共发生了多少个场景、每个具体场景的情节。这有助于对视频进行更精确的标签分类。
更有趣的是,VideoIntelligenceAPI可以准确地在每一帧中识别、标记和索引物体(object)。索引的目的是为了搜索,比如一家媒体机构的编辑,想要在海量的视频素材中找到某个片段非常痛苦,但通过VideoIntelligenceAPI,编辑可以直接搜索想找到的内容,比如“自行车”、“腊肠犬”或者“棒球”,系统可以自动搜索并且返回“这些物体在哪几秒出现过”的结果。
Google为该枚API提供了一个demo页面,你可以测试一下它的效果。不过,该API仅支持储存在GoogleCloudStorage里的视频。
另外一项重要的宣布是CloudMachineLearningEngine。这是Google之前面向有限开发者提供的机器学习算法开发引擎,基于TensorFlow。在这次大会上,该工具也正式面向所有公众开放了。
李飞飞的加盟为GoogleCloud增添了一员人工智能大将。Google/Alphabet旗下现在已经有了好几个人工智能研究团队,包括由资深学者杰夫·迪恩领导的GoogleBrain团队、收购而来的英国公司DeepMind等等。李飞飞对PingWest品玩透露,自己大部分时间都在大脑团队的办公楼里度过,经常穿梭于各个组织部门之间,对现在跨团队协作感到满意。
李飞飞的主题演讲和媒体问答主要围绕GoogleCloud的技术进行,但当被其他记者问及在斯坦福和Google的不同感受时,她回答:“最大的区别应该是免费的食物吧!”
毫无疑问,人工智能和机器学习是这一届Google云计算大会的主角。并不是说GoogleCloud的这些AI/ML技术在最近才诞生,而是面临着AWS、Azure、IBM等云计算巨头越来越大的竞争压力,Google决定把过去很多内部的技术开放出来给客户使用(其实Google过去内部工具和技术的开放也都是类似路线),而“普及人工智能”概念流行和李飞飞的加盟,给了Google这样做更大的动力。
精彩评论