笔尖中文 > 都市小说 > 带着手机重生,目标科技教父 > 正文 第608章 AI走入死胡同?

正文 第608章 AI走入死胡同?

最新网址:www.badaoge.org
    郭长征听完,没有立刻回答,而是深深地看了一眼夏冬。

    他心里非常惊讶,一个大一刚结束的本科生,居然能一针见血地指出当前人工智能的瓶颈。

    现在的学术界,绝大多数人都在疯狂地优化那些复杂的数学公式。

    大家都在比拼谁能设计出更精妙的人工特征提取方法。

    很少有人去反思,这条路本身是不是从一开始就选错了。

    郭长征叹了口气,靠在椅背上。

    “夏冬,你观察得很敏锐。你说的这个问题,确实是现在学术界的一大痛点。”

    “我们现在的主流路线,其实走入了一个过度追求数学完美的误区。”

    郭长征开始讲解:“大家觉得一个模型好不好,首先看它的数学证明漂不漂亮。”

    “支持向量机为什么火?因为它背后有一套严密的统计学习理论支撑。”

    “你可以用公式清清楚楚地证明它为什么能工作,它的误差上界在哪里。”

    夏冬适时地接话:“但是现实世界的数据是不讲数学逻辑的,它们充满了噪声和不确定性。”

    郭长征用力地点头,声音提高了几分:“完全正确!”

    “所以我一直认为,基于规则和人工特征的路线,走不远。”郭长征表达了自己的立场。

    夏冬顺势问道:“那郭老师觉得,未来的出路在哪里?”

    郭长征沉默了片刻,似乎在斟酌用词。

    “你应该听说过人工神经网络吧?”郭长征问道。

    夏冬点点头,装作只了解皮毛的样子:“之前听过,刚刚在课堂上,老师你也讲了。但好像现在不太受欢迎?”

    郭长征苦笑了一下:“不是不太受欢迎,是被主流学术界打入冷宫了。”

    “上个世纪八十年代,神经网络火过一阵子,但很快就遭遇了寒冬。”

    “原因很简单,它解释不清楚。”郭长征解释道。

    “你把数据丢进去,它经过几层神经元的计算,给你一个结果。”

    “但是中间到底发生了什么?那些权重参数代表什么物理意义?没人知道。”

    郭长征用手指敲了敲桌面:“这在讲究严谨的学术界是致命的。大家叫它‘黑盒’。”

    “发论文的时候,评审专家会问你,为什么你的网络结构是这样设计的?为什么要有三层而不是四层?”

    “你回答不上来,你就发不了顶会。”

    夏冬静静地听着,他知道郭长征说的是事实。

    在深度学习全面爆发之前,神经网络确实经历了漫长且压抑的低谷期。

    郭长征继续说道:“但我一直觉得,我们不需要去解释它。”

    这句话引起了夏冬的极大兴趣,这和后来那些科技巨头们的做法不谋而合。

    郭长征语气变得有些兴奋:“你想想人类是怎么学习的?”

    “一个小孩子认识猫,是因为他父母给他列出了猫的数学方程吗?”

    夏冬配合地摇头:“不是,是因为父母指着很多只猫告诉他,这是猫。”

    “对!”郭长征拍了一下大腿。

    “小孩子看了几百只、几千只猫之后,他的大脑里自动就形成了猫的认知。”

    “他不需要知道猫耳朵的几何角度,他只要看一眼就能认出来。”

    郭长征做了一个总结:“学习的过程,本来就是一种经验的积累,而不是逻辑的推演。”

    夏冬在心里给郭长征默默点了个赞。

    在2009年,能有这种认知的人,绝对是具有战略眼光的技术先驱。

    郭长征接着抛出了他的核心理念:“所以我信奉一个词:大力出奇迹。”

    他看着夏冬,一字一句地说:“不要去搞那些花里胡哨的人工规则。”

    “只要我们有足够大的数据量,把成百上千万张图片喂给神经网络。”

    “让网络自己去调整权重,自己去寻找特征。”

    “只要数据够多,网络层数够深,它最终的效果,绝对会碾压那些人工设计的算法。”

    这段话,完全命中了未来深度学习爆发的核心本质。

    夏冬知道,再过一段时间,当ImageNet数据集发布,当AleXNet在图像识别大赛上以压倒性优势夺冠时,整个世界都会明白这个道理。

    大数据加上深度神经网络,这就是未来十几年人工智能唯一的正解。

    而郭长征,在这个时间节点,已经极其精准地看透了这一切。

    “老师,你的想法非常超前。”夏冬由衷地说道。

    他没有用任何夸张的词汇,只是陈述了一个客观事实。

    郭长征听到这句认可,脸上的兴奋却迅速退去,取而代之的是深深的无奈。

    他重新靠回椅背上,端起纸杯喝了一大口水。

    “超前有什么用?这只是一种理论上的推想。”郭长征语气低落。

    夏冬明知故问:“既然方向是对的,为什么不去实践呢?”

    郭长征苦笑连连:“实践?拿什么实践?”

    他竖起一根手指:“第一,数据。你去哪里找上百万张标注好的图片?”

    “现在的互联网数据虽然多,但都是杂乱无章的,没有经过清洗和分类,根本没法用来训练模型。”

    夏冬没有说话,他知道这是实情。构建高质量的大型数据集,需要耗费极大的人力和财力。

    郭长征竖起第二根手指,加重了语气:“第二,算力。这也是最致命的一点。”

    “要训练你刚才说的那种能够自己提取特征的深度神经网络,计算量是极其恐怖的。”

    “涉及到海量的矩阵乘法运算。”

    郭长征指了指办公桌上的电脑:“就靠现在这些CPU?你跑一个最基础的多层网络,数据量一上来,可能都要跑上几天。”

    “等几天出一个结果,如果发现参数设置错了,又要重头再来。”

    “这种试错成本,哪个实验室承担得起?”

    夏冬顺着郭长征的思路问道:“难道就没有更适合做矩阵运算的硬件吗?”

    郭长征点点头:“有,显卡。也就是GPU,它的架构天生适合并发运算。”

    “其实我知道英伟达搞的那个CUDA架构,这算是一条路。”郭长征眉头微皱。

    “前阵子英伟达的工作人员还专门联系过我,说可以提供免费的显卡给我做科研。”

    “能白嫖设备,我当然去试了。但我花时间研究了一段时间CUDA后,发现根本行不通。”

    郭长征摆了摆手,表情显得有些头疼。

    “那玩意儿现在没有现成的库可以调用,开发起来极其麻烦。”

    “我要把构想的深度算法硬生生跑在CUDA上面,技术难度比较高,简直是纯纯的折磨自己。”

    “不过嘛……”郭长征话锋一转,语气里带了几分兴致。

    “最近盛夏科技,搞出了一个叫TenSOrFlOW的框架,这东西倒是挺好的。”

    夏冬心里暗自发笑,表面上却不动声色地听着。

    “我最近也一直在学习这个TenSOrFlOW。”郭长征如实说道。

    “只是我要做的神经网络比较复杂,目前还在琢磨怎么利用好这个TenSOrFlOW。”

    【四章奉上!小说的两个短剧要上了,可以小说右下角,进“更多改编”预约,也可以到红果app搜书名,预约短剧。因为短剧播放量高,作者也有钱分哈哈】
  http://www.badaoge.org/book/151566/57350272.html

  请记住本书首发域名:www.badaoge.org。笔尖中文手机版阅读网址:m.badaoge.org