未来科技门户网

网站导航
  

  深度学习对谷歌的影响

 

  语音识别

 

  语音识别团队第一个和谷歌大脑团队合作部署神经网络。在谷歌大脑团队帮助下,部署上线了一个新的、基于神经网络的语音模型,不再使用之前的隐马尔科夫模型。

 

  声学模型的问题是从150毫秒的语音里预测其中10毫秒的声音是什么。类似与‘ba’还是‘ka’。接着你有了这些预测的完整序列,然后将它们和语言模型对接起来,以理解用户在说什么。

 

  这个模型将识别错误率降低了30%,意义非常重大。此后语音团队继续在构建更加复杂的模型,并结合更好的神经网络降低错误率。现在你在手机上说话,语音识别已经比三到五年前好太多了。

 

  Image 挑战赛

 

  大约六年前, ImageNet的数据库公开,大约有100万图像数据,这个巨大的图像数据库对于推进计算机视觉的发展意义重大。

 

  图像被分为1000个不同种类,每个种类大约1000张照片;

 

  大约有1000张不同的豹子照片、1000张不同的汽车、滑板车照片等等;

 

  其中有个复杂的因素:并非所有的标签都是正确的;

 

  比赛的目标是概括出照片的新的类型。对于一张新照片,你能判断出来上面是猎豹还是樱桃吗?

 

  在神经网络运用到比赛之前,这项比赛的错误率为26℅。2014年,谷歌赢得比赛时的错误率为6.66%。2015年的时候,获胜团队的错误率降低到3.46%。

 

  这是一个巨大而且有深度的模型。每个盒子都布满了完整层级的神经元,它们正在进行卷积运算,关于这方面的详细情况,可以查看这篇论文《Going Deeper with Convolutions》

 

  一个名叫 Andrej Karpathy 的人也参与了比赛,他的错误率是5.1%,他后来还写了篇文章《What I learned from competing against a ConvNet on ImageNet。》

m.keji.okinfo.org/标签:智能计算机系统的大规模深度学习,Large-Scale Deep Learning
热门评论 我也说两句
查看更多评论(0)
推荐阅读