实时机器学习是什么,面临哪些挑战?

摘要:
最近,可以通过数据采集实时调整模型的实时机器学习正在成为媒体技术领域的新“网红”。在开始Peeling Mode之前,让我们先了解一下实时机器学习比传统机器学习更强的地方?实时机器学习更善于详细观察用户当前的需求,让用户在保持隐私感和安全感的同时,获得如沐春风般的浏览体验。实时机器学习技术的深入应用将解锁许多难以想象的媒体功能和应用场景。实时机器学习的实现面临哪些挑战?

    最近能够随数据获取实时调整模型的实时机器学习,正在成为媒体技术领域的新网红。曾经连续两年,都被FTI评为传媒业的重要技术趋势之一,与自然语言理解NLU、机器阅读理解MRC、音视频算法等共享金字塔顶端的荣光。

       那实时机器学习到底是什么呢?

  在开启扒皮模式之前,我们先来了解一下,实时机器学习究竟在哪些地方比传统的机器学习更强?

  传统的机器学习(ML)正在媒体领域得到越来越多的应用,利用算法实现内容的个性化推荐,已经成为主流媒体的标配。

  但过去的算法,主要侧重于使用静态模型和历史数据进行训练并提供预测。比如用户在浏览网站时,可以根据用户历史行为数据来推送新闻。

  而一些新的涉及动态实施决策的业务,比如具备时效性的热点新闻,或是用户想要看点新东西,这就需要用一种新的算法来实现,即实时机器学习Real-Time Machine Learning

实时机器学习是什么,面临哪些挑战?第1张

  以头条的核心技术个性化推荐算法为例,其核心原理就是根据用户对文章的历史行为数据反馈,进行统计挖掘和判断。

  比如具有相同偏好的三个用户,分别选择了自己喜欢的文章,得到最高票数的文章就会被推荐给被系统打上同一属性标签的第四个人……以此类推。

  不难发现,传统机器学习算法的成功,依赖于对用户的知根知底,需要用户不断开放自己的私人领地。

  而实时机器学习,更擅长对用户的当下需求体察入微,让用户在保持隐私安全感的同时,获得如沐春风的浏览体验。

显然,实时机器学习算法将主导一个令人期待的新世界,也有越来越多的媒体在为此做着准备。

实时机器学习是什么,面临哪些挑战?第2张

    实时机器学习技术的深入应用,将解锁很多超乎想象的媒体功能和应用场景。但是,尽管学界已经在算法上提出了几种理想的架构,但产业端却未迎来蓬勃的质变。这究竟是为什么?实时机器学习落地到底面临哪些挑战呢?

  1. 高吞吐量与低延迟的平衡。

  媒体平台的海量用户需求,决定了实时机器学习要在每秒处理数百万任务量级。以这样的速度进行大规模的信息分发,需要细致到毫秒级的任务执行能力。

  2. 动态异构任务模块的高效唤醒。

  对于Facebook这样体量庞大的平台来说,其服务是由成千上万个不同模块构建而成的,流量调节、图像转码、存储编码等等。在实时任务中,会伴随生成很多不同资源支持的新任务,增加系统的响应和处理难度。

  如何对这些重要且不一样的特性进行预测,十分具有挑战性。

实时机器学习是什么,面临哪些挑战?第3张

  3. 实时算法与业务场景的融合。

  实时响应和预测,意味着留给系统的容错空间更小。要保障这一技术在实际应用场景中的稳定性,就要在完成高吞吐量任务的同时,能够快速模拟真实世界的交互,然后精准地判断出,哪些是结果的决定性因素,从而做出正确的响应。

  举个例子,如果想给用户推荐哪些朋友赞过此贴,实时算法会快速判断出最近一次查看这一数据集对完成该任务毫无意义,然后快速修改关联并重新学习。这种自适应调整,可以有效防止用户收到的结果中出现明显的错误点。

    

作者:脑极体

原文链接:https://www.kg.com/article/512402530874036224

免责声明:文章转载自《实时机器学习是什么,面临哪些挑战?》仅用于学习参考。如对内容有疑问,请及时联系本站处理。

上篇DOM相关如何对list进行洗牌操作下篇

宿迁高防,2C2G15M,22元/月;香港BGP,2C5G5M,25元/月 雨云优惠码:MjYwNzM=

相关文章

博雅大数据机器学习十讲第三讲

点到平面的距离 直线方程:(w_1x_1+w_2x_2+w_0 = 0) 点到直线距离(d = frac {|w_1x_1^{'}+w_2x_2^{'}+w_0|}{sqrt{w^2_1+w^2_2}}) 欧式空间超平面:(w_1x_1+w_2x_2+...+w_dx_d+w_0 = 0) 点到超平面距离: [d = frac {|w_1x_1^{'...

为什么edge AI是一个无需大脑的人

为什么edge AI是一个无需大脑的人 Why edge AI is a no-brainer 德勤预计,到2020年,将售出超过7.5亿个edge AI芯片,即在设备上而不是在远程数据中心执行或加速机器学习任务的全芯片或芯片的一部分,收入将达到26亿美元。此外,边缘人工智能芯片市场的增长速度将远远超过整个芯片市场。到2024年,预计edge人工智能芯片...

第十三章——卷积神经网络(CNN)

卷积神经网络(Convolutional neural networks,CNNs)来源于对大脑视觉皮层的研究,并于1980s开始应用于图像识别。现如今CNN已经在复杂的视觉任务中取得了巨大成功,比如图像搜索,自动驾驶,语言自动分类等等。同时CNN也应用于了其他领域,比如语音识别和自然语言处理。 13.1视觉皮层机理 David H. Hubel和Tors...

ARM处理器、X86处理器和AI处理器的区别

ARM处理器、X86处理器和AI处理器的区别 目前主要的处理器架构有: X86: Intel, AMD, 海光, 兆芯 ARM: 华为,飞腾,华芯通,Cavium,Ampere,富士通,亚马逊 POWER:IBM, 中晟宏芯 MIPS:龙芯 Alpha:申威 X86处理器 X86架构(The X86 architecture)是微处理器执行的计算机语言...

L1-064 估值一亿的AI核心代码 (20分) 团体程序设计天梯赛-练习集

以上图片来自新浪微博。 本题要求你实现一个稍微更值钱一点的 AI 英文问答程序,规则是: 无论用户说什么,首先把对方说的话在一行中原样打印出来; 消除原文中多余空格:把相邻单词间的多个空格换成 1 个空格,把行首尾的空格全部删掉,把标点符号前面的空格删掉; 把原文中所有大写英文字母变成小写,除了 I; 把原文中所有独立的 can you、could y...

智能对话机器人实战开发案例剖析(1)- 体系结构和分类

一、前言 人工智能时代,以智能对话机器人为最核心的技术应用方向之一,实现人机之间通过自然语言的沟通和交流,是智能人机对话机器人的核心目标之一。尤其是Google Assistant 语音助手近期的卓越表现,如何开发智能对话机器人系统,成为一个新的热点。本文是系列文章的第一部分,旨在较少智能对话系统的进行一个全面和具体的介绍。相关内容已同步录制成视...