自然语言处理(nlp)比计算机视觉(cv)发展缓慢,而且更难!

摘要:
各种字符串算法都贯穿于计算机的发展历史中。而同期nlp里手工特征svm已经搞的风生水起了。深度学习的思路就是让模型自动从数据中学习特征提取,从而生成了很多人工很难提取的特征:4.nlp的知识困境不是说nlp在这波深度学习浪潮下没有进展,而是说突破并没有cv那么巨大。而nlp更大的难题在于知识困境。不同于cv的感知智能,nlp是认知智能,认知就必然涉及到知识的问题,而知识却又是最离散最难于表示的。

https://mp.weixin.qq.com/s/kWw0xce4kdCx62AflY6AzQ

1.抢跑的nlp

nlp发展的历史非常早,因为人从计算机发明开始,就有对语言处理的需求。各种字符串算法都贯穿于计算机的发展历史中。伟大的乔姆斯基提出了生成文法,人类拥有的处理语言的最基本框架,自动机(正则表达式),随机上下文无关分析树,字符串匹配算法KMP,动态规划。

nlp任务里如文本分类,成熟的非常早,如垃圾邮件分类等,用朴素贝叶斯就能有不错的效果。20年前通过纯统计和规则都可以做机器翻译了。相比,在cv领域,那时候mnist分类还没搞好呢。

90年代,信息检索的发展提出BM25等一系列文本匹配算法,Google等搜索引擎的发展将nlp推向了高峰。相比CV领域暗淡的一些。

2.特征抽取困难的cv

cv的前身就有一个领域叫图像处理,研究图片的压缩、滤波、边缘提取,天天摆弄着一个叫lenna的美女。

早期的计算机视觉领域受困于特征提取的困难,无论是HOG还是各种手工特征提取,都没办法取得非常好的效果。

大规模商业化应用比较困难。而同期nlp里手工特征➕svm已经搞的风生水起了。

3.深度学习的崛起- 自动特征提取

近些年,非常火爆的深度学习模型简单可以概括为:

深度学习 = 特征提取器➕分类器

一下子解决cv难于手工提取特征的难题,所以给cv带来了爆发性的进展。深度学习的思路就是让模型自动从数据中学习特征提取,从而生成了很多人工很难提取的特征:

自然语言处理(nlp)比计算机视觉(cv)发展缓慢,而且更难!第1张

4.nlp的知识困境

不是说nlp在这波深度学习浪潮下没有进展,而是说突破并没有cv那么巨大。很多文本分类任务,你用一个巨复杂的双向LTSM的效果,不见得比好好做手工feature + svm好多少,而svm速度快、小巧、不需要大量数据、不需要gpu,很多场景真不见得深度学习的模型就比svm、gbdt等传统模型就好用。

而nlp更大的难题在于知识困境。不同于cv的感知智能,nlp是认知智能,认知就必然涉及到知识的问题,而知识却又是最离散最难于表示的。

免责声明:文章转载自《自然语言处理(nlp)比计算机视觉(cv)发展缓慢,而且更难!》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇hive权威安装出现的不解错误!(完美解决)两种方法都可以使用 GitHub Actions 实现 Hexo 博客自动部署下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

用户被锁定

这种情况很少发生,偏偏被我碰到了,我按照网上一个哥们的教程去解决电脑问题 (请勿模仿,很麻烦的) -------------------------------------------------  1、右键单击“计算机”——”管理“——”本地用户和组“——”用户“找到administrator电脑图标右键单击”属性“将”禁用此用户“选项勾掉。      ...

【转载】 再励学习面试真题 (强化学习面试真题)

原文地址: https://zhuanlan.zhihu.com/p/33133828 (本文最开始写在WPS里,往知乎粘贴后格式和高亮都没有了。大家可以从CSDN再励学习面试真题-CSDN下载下载本文。百度文库、道客巴巴强行不让公开。) 前言 本人于17年4月对再励学习产生了兴趣,8月将其定为自己未来学习的核心。在10月~12月的求职中,一直将增强学习作...

联想笔记本如何安装固态硬盘-联想G50-80如何安装固态硬盘(全流程+装系统)(专用)

在现在,大家普遍想让自己的电脑运行的更流畅,于是装固态就成了一个不错的选择。下面以联想G50-80为例介绍如何加装内存条。 一、硬件准备 联想G50-80 东芝固态硬盘:TOSHIBA TR2000 480G(参考价格:379元人民币) 启动U盘(用于装系统,需要事先制作好) 二、详细步骤 1、断电、关机。拔掉电源插头,关机。一定确保电脑断电、关机,严...

实时机器学习是什么,面临哪些挑战?

    最近能够随数据获取实时调整模型的实时机器学习,正在成为媒体技术领域的新“网红”。曾经连续两年,都被FTI评为传媒业的重要技术趋势之一,与自然语言理解NLU、机器阅读理解MRC、音视频算法等共享金字塔顶端的荣光。        那实时机器学习到底是什么呢?   在开启扒皮模式之前,我们先来了解一下,实时机器学习究竟在哪些地方比传统的机器学习更强?  ...

adb 安装与使用(一)

一、ADB简介 1. 什么是adb?   adb(Android Debug Bridage)是Android sdk的一个工具;   adb 是用来连接安卓手机和PC端的桥梁,要有adb作为二者之间的维系,才能让用户在电脑上对手机进行全面的操作。   Android 的初衷是用adb这样的一个工具来协助开发人员在开发和拷贝Android 应用的过程中更好...

男神鹏:win10将user下的中文路径改成英文路径

我们在刚买电脑的时候,都会给电脑设置一个用户,每个人都以自己的名字起了这个用户,使自己的路径变成了中文路径。 现在有好多学生都在问我,如何解决中文路径改成英文路径问题。 现在我来帮大家科普一下。 第一步:  首先创建一个新键的 adminstartor用户 输入 net user administrator /active:yes  创建成功   第二步...