电子发烧友网 > 人工智能 > 正文

如何创造可信任的机器学习模型?先要理解不确定性

2019年01月10日 10:42 次阅读
来源:机器之心编译 作者:Eric Jang 不确定性是机器学习领域内一个重要的研究主题,Eric Jang近日的一篇博客对这一主题进行了详细的阐述。顺便一提,他的博客还有一些有趣的深度学习迷因。 在谈到人工智能安全、风险管理、投资组合优化、科学测量和保险时,人们都会提到「不确定性(uncertainty)」的概念。下面有几个人们言语中涉及不确定性的例子: 「我们想让机器学习模型知道它们不知道的东西。」 「负责诊断病人和给出治疗方案的AI应该告诉我们它对自己的推荐的信心。」 「科学计算中的显著性值代表了测量中的不确定性。」 「我们想让自动智能体探索它们不确定(对于奖励或预测)的区域,这样它们也许能发现稀疏的奖励。」 「在投资组合优化中,我们希望最大化回报,同时限制风险。」 「由于地缘政治不确定性增大,美国股市2018年在失望中收尾。」 那「不确定性」究竟是什么? 不确定性度量反映的是一个随机变量的离散程度(dispersion)。换句话说,这是一个标量,反应了一个随机变量有多「随机」。在金融领域,这通常被称为「风险」。 不确定性不是某种单一形式,因为衡量离散程度的方法有很多:标准差、方差、风险值(VaR)和熵都是合适的度量。但是,要记住一点:单个标量数值不能描绘「随机性」的整体图景,因为这需要传递整个随机变量本身才行! 尽管如此,为了优化和比较,将随机性压缩成单个数值仍然是有用的。总之要记住,「越高的不确定性」往往被视为「更糟糕」(除了在模拟强化学习实验中)。 不确定性的类型 统计机器学习关注的是模型p(θ|D)的估计,进而又估计的是未知随机变量p(y|x)。其中有多种不同形式的不确定性。某些不确定性的概念描述了我们能够预期的固有的随机性(比如抛硬币的结果),另一些概念则描述了我们对模型参数的最佳猜测的信心缺乏程度。 为了说得具体一点,我们假设有一个循环神经网络(RNN)需要根据一个每日气压表读数序列预测当天的降雨量。气压表能检测大气压,大气压下降往往是降雨的前兆。下图总结了降雨量预测模型与不同类型的不确定性。 图1:试图根据气压表读数序列预测每日降雨量的简单机器学习模型可能考虑的不确定性。偶然事件不确定性(AleatoricUncertainty)源自数据收集过程,是不可降低的随机性。认知不确定性(EpistemicUncertainty)反映的是模型做出正确预测的置信程度。最后,超出分布的误差(Out-of-Distributionerror)是指当模型的输入不同于其训练数据时出现的不确定性(比如太阳温度等其它异常现象)。 偶然事件不确定性 偶然事件不确定性得名于拉丁语词根aleatorius,意为「将几率纳入创造过程」。这描述的是源自数据生成过程本身的随机性;不能简单地通过收集更多数据而消除的噪声。就像你不能预知结果的抛硬币。 在降雨量预测的类比中,偶然事件不确定性源自气压表的不准确度。也还存在这种数据收集方法没有观察的重要变量:昨日的降雨量是多少?我们测量大气压的时代是现代还是上个冰河时代?这些未知是我们的数据收集方法中固有的,所以用该系统收集更多数据无法帮助我们消除这一不确定性。 偶然事件不确定性会从输入传播到模型的预测结果。假设有一个简单模型y=5x,它的输入取自正态分布x~N(0,1)。在这一案例中,y~N(0,5),因此该预测分布的偶然事件不确定性可描述为σ=5。当然,当输入数据x的随机结构未知时,预测结果的偶然事件不确定性将更难估计。 也许有人会想:因为偶然事件不确定性是不可约减的,所以我们对此无能无力,直接忽略它就好了。这可不行!在训练模型时,应该注意选择能够正确地代表偶然事件不确定性的输出表征。标准的LSTM不会得出概率分布,所以学习抛硬币的结果时只会收敛成均值。相对而言,用于语言生成的模型能够得出一系列类别分布(词或字符),这能纳入句子完成任务中的固有歧义性。 认知不确定性 「好的模型都是相似的;差的模型各有不同。」 认知不确定性来自希腊语词根epistēmē,属于与知识相关的知识。这衡量了我们对「源自我们对正确模型参数的无知程度」的正确预测的无知程度。 下图展示了一个在某个简单的一维数据集上的高斯过程回归模型。其置信区间反映了认知不确定性;训练数据的认知不确定性为零(红点)。随着我们离训练数据点的距离越远,模型应该给预测分布分配越高的标准差。不同于偶然事件不确定性,认知不确定性可以通过收集更多数据和「去除」模型缺乏知识的输入区域而降低。 图2:一维高斯过程回归模型,展现了训练集之外的输入上的认知不确定性 深度学习与高斯过程之间有丰富的关联。人们希望能通过神经网络的表征能力扩展高斯过程的能感知不确定性的性质。不幸的是,高斯过程难以扩展用于大数据集的统一随机小批量设置,而且研究大型模型和数据集的人也已经不再支持这种方法。 如果人们希望在选择模型族时有最大的灵活度,使用集成(ensemble)方法来估计不确定性是一个好选择,这实际上就是使用「多个独立的学习后的模型」。高斯过程模型是分析式地定义预测分布,而集成方法则被用于计算预测的经验分布(empiricaldistribuTIon)。 由于训练过程中出现的随机化偏差,任何单个模型都会有一些误差。在集成方法中,其它模型往往会揭示出单个模型特有的错处之处,同时认同推理正确的预测结果;因此集成模型是很强大的。 我们该如何随机取样模型以构建一个集成模型呢?在使用bootstrapaggregaTIon构建集成模型时,我们首先从一个大小为N的训练数据集开始,并从原始训练集采样M个大小为N的数据(有替换,这样每个数据集都不会占据整个数据集)。分别在这些数据集上训练M个模型,再将它们的预测结果综合起来得到一个经验预测分布。 如果训练多个模型的成本过高,也可以使用dropout训练来近似模型集成。但是,引入dropout会涉及到一个额外的超参数并且也可能有损单个模型的表现(对于实际应用而言往往是不可接受的;在实际应用中,校准不确定性估计相对准确度而言是次要的)。 因此,如果能使用大量计算资源(就像谷歌那样),通常只需要重复训练多个模型副本,这要更加容易。这还能在无损性能的前提下享受集成方法的好处。这篇深度集成论文就采用了这一方法:https://arxiv.org/pdf/1612.01474.pdf。这篇论文的作者还提到由不同的权重初始化带来的随机训练动态足以得到一个多样化的模型集合,而不必通过bootstrapaggregaTIon来降低训练集多样性。从实际的工程开发角度看,押注不会影响模型性能的风险估计方法或研究者想要尝试的其它方法是明智的 超出分布的不确定性 对于我们的降雨量预测器,如果我们为其提供的输入不是气压表读数序列,而是太阳的温度呢?要是提供一个全是零的序列呢?或者用不同的单位记录的气压表读数呢?RNN还是会继续计算,为我们提供一个预测,但结果很可能毫无意义。 这个模型完全没有能力基于通过不同于训练集创建流程的流程生成的数据进行预测。在基准驱动的机器学习研究领域,这是一种常被忽视的失败模式,因为我们通常假设训练、验证和测试集都完全由独立同分布的数据构成。 确定输入是否「有效」是实际部署机器学习所面临的一个严峻问题,这也被称为超出分布(OoD/OutofDistribuTIon)问题。OoD与「模型误设错误」和「异常检测」是同义词。 异常检测不仅对增强机器学习系统稳健性很重要,而且本身也是一种非常有用的long88.vip龙8国际。举个例子,我们可能想构建一个能监控健康人士的生命体征的系统,让该系统能在指标异常时发出警报,这并不需要系统之前见过这种异常的病理模式。我们也可以用异常检测来管理数据中心的「健康」,一旦有不同寻常的事情发生(磁盘满载、安全漏洞、硬件故障等),我们就能得到通知。 因为OoD输入仅出现在测试时间,所以我们不应假设我们事先知道模型会遇到的异常的分布。这正是OoD检测的棘手之处——我们必须针对模型在训练阶段从未见过的输入来增强该模型对这些输入的抗性!这正是对抗式机器学习中描述的标准的攻击场景。 机器学习模型有两种处理OoD输入的方法:1)在输入到达模型前就识别出糟糕的输入;2)根据模型预测结果的「怪异性」来帮助我们鉴别可能存在问题的输入。 在第一种方法中,我们不会对下游机器学习任务做任何假设,只会考虑输入是否处于训练分布中的问题。这正是生成对抗网络(GAN)中判别器的工作。但是,单个判别器并不具有完美的稳健性,因为它只擅长辨别真实数据分布和生成器得到的分布;对于不属于其中任意一个分布的输入而言,它有可能得出任意的预测结果。 除了判别器,我们也可以构建一个分布内数据的密度模型,比如一个核密度估计器或用一个NormalizingFlow来拟合数据。HyunsunChoi和我最近研究过这一问题,参阅我们最近使用现代生成模型执行OoD检测的论文:https://arxiv.org/abs/1810.01392 第二种OoD检测方法涉及到使用任务模型的预测(认知)不确定性来辨别哪些输入是OoD。理想情况下,模型在收到错误的输入时应该会得到「怪异的」的预测分布p(y|x)。举个例子,HendrycksandGimpel(https://arxiv.org/abs/1610.02136)表明OoD输入的最大化softmax概率(预测得到的类别)往往低于分布内的输入。这里,不确定性反比于最大softmax概率建模的「置信度」。高斯过程这样的模型能通过构造为我们提供这些不确定性估计,或者我们也可通过深度集成来计算认知不确定性。 在强化学习领域,人们实际上假设OoD输入是一件好事,因为这是智能体还不知道如何处理的世界输入。鼓励策略寻找自己的OoD输入能实现「内在的好奇心」,从而探索模型的预测效果较差的区域。这是很好的做法,但我很好奇如果将这种好奇心驱动的智能体部署到现实世界(其中传感器很容易损坏,也会发生其它实验异常)中会怎样。long88如何区分「未曾见过的状态」(好)和「传感器损坏情况」(坏)?这能得到能学习与它们的传感机制交互从而生成最大化新颖度的智能体吗? 谁来看住看门狗 正如前一节提到的那样,保护自己免受OoD输入影响的一种方法是设置一个能够「像看门狗一样」监控模型输入的似然模型(likelihoodmodel)。我更喜欢这种方法,因为这能将OoD输入问题与任务模型中的认知和偶然事件不确定性隔开。从工程开发角度看,这能让分析工作更轻松。 但我们不应该忘记这个似然模型也是一个函数近似器,可能存在自己的OoD错误!我们近期的生成式集成方法(GenerativeEnsembles,https://arxiv.org/abs/1810.01392,也可参阅DeepMind的同期研究https://arxiv.org/abs/1810.09136)研究表明,在使用一个CIFAR似然模型时,来自SVHN的自然图像实际上比CIFAR分布内的图像本身还有更高的可能性! 图3:似然估计涉及到一个本身也可能易受OoD输入影响的函数近似器。比起CIFAR测试图像,CIFAR的似然模型会给SVHN图像分配更高的概率! 但是,希望还是有的!研究表明,似然模型的认知不确定性对该似然模型自身而言是出色的OoD检测器。通过将认知不确定性估计与密度估计结合起来,我们能以一种与模型无关的方式使用似然模型的集成来保护机器学习模型免受OoD输入影响。 校准:下一件大事? 警告:只是因为一个模型能够确定一个预测结果的置信区间,并不意味着该置信区间能真正反映结果在现实中的实际概率! 置信区间(比如2σ)隐式地假设预测分布是高斯分布,但如果你想要预测的分布是多模态分布或重尾分布,那么你的模型将不会得到很好的校准! 假设我们的降雨量预测RNN告诉我们今日的降雨将为N(4,1)英寸,如果我们的模型经过校准,那么如果我们一次又一次地在同样的条件下重复这个实验(也许每一次都重新训练该模型),那么我们实际将会观察到实际的降雨量分布正是N(4,1)。 当今学术界开发的机器学习模型大都是针对测试准确度或某个拟合度函数优化的。研究者执行模型选择的方式不是通过重复相同的实验来部署模型,再衡量校准误差,所以不出意外,我们的模型往往只有很差的校准,参阅:https://arxiv.org/abs/1706.04599 展望未来,如果我们要信任部署在现实世界中的机器学习系统(long88、医疗系统等),我认为「证明我们的模型能够正确理解世界」的一种远远更为强大方法是针对统计校准测试它们。优良的校准也意味着优良的准确度,所以这是一个更严格的更高的优化指标。 不确定性应该是标量吗? 尽管标量的不确定性很有用,但它们的信息量永远不及它们所描述的随机变量,我发现粒子滤波和分布式强化学习等方法非常酷,因为它们是在整个分布上运行的算法,让我们无需借助简单的正态分布来跟踪不确定性。除了使用单标量的「不确定性」来塑造基于机器学习的决策,现在我们也可以在决定要做什么时查询分布的整体结构。 Dabneyetal.的ImplicitQuantileNetworks论文(https://arxiv.org/pdf/1806.06923.pdf)很好地讨论了如何基于回报的分布构建「风险敏感型智能体」。在某些环境中,人们可能更偏好倾向于探索未知的机会主义策略;而在另一些环境中,未知事物可能并不安全,应当避开。风险度量的选择本质上决定了如何将回报的分布映射成一个标量数量,然后再根据这个量进行优化。所有的风险度量都可以根据分布计算得到,所以预测整个分布能让我们将多个风险定义轻松地组合起来。此外,支持灵活的预测分布似乎也是一个提升模型校准的好方法。 图4:多种风险度量在Atari游戏上的表现,来自这篇IQN论文:https://arxiv.org/abs/1806.06923 对金融资产管理者而言,风险度量是一个非常重要的研究主题。简单纯粹的马科维茨(Markowitz)投资组合的目标是最小化投资组合回报的一个加权的方差。但是,方差是「风险」在金融语境的一个不直观的选择:大多数投资者根本不在乎回报超出预期,而只是希望最小化回报少或亏损的可能性。由于这个原因,Value-at-Risk、ShortfallProbability和TargetSemivariance等仅关注「糟糕」结果的概率的风险度量是更有用的优化目标。 不幸的是,它们也更难分析。我希望在分布式强化学习、蒙特卡洛方法和灵活的生成模型上的研究能让我们构建起能与投资组合优化器很好地协同工作的风险度量的可微分弛豫(differentiablerelaxations)。如果你在金融行业工作,我强烈建议你阅读IQN论文中的「强化学习中的风险」一节。 总结 下面总结了本文的一些要点: 不确定性/风险度量是「随机性」的标量度量。为了优化和数学计算的方便,将随机变量浓缩成了单个数值。 预测不确定性可以分解成偶然事件不确定性(来自数据收集过程的不可约减的噪声)、认知不确定性(对真实模型的无知)和超出分布的不确定性(在测试时,输入存在问题)。 认知不确定性可以通过softmax预测阈值设置或集成方法降低。 我们可以不将OoD不确定性传播到预测中,而是使用一种与任务无关的过滤机制来滤除「有问题的输入」。 密度模型是在测试时过滤输入的一个好选择。但是,需要认识到,密度模型只是真实密度函数的近似,本身也可能易受分布之外的输入的影响。 自我插拔:生成式集成方法能降低似然模型的认知不确定性,所以它们可被用于检测OoD输入。 校准很重要,而且在研究模型中被低估了。 某些算法(分布式强化学习)能将机器学习算法延展成能产出灵活分布的模型,这能比单个风险度量提供更多的信息。
下载发烧友APP
打造属于您的人脉电子圈
关注电子发烧友微信
有趣有料的资讯及long88.vip龙8国际干货
关注发烧友课堂
锁定最新课程活动及long88.vip龙8国际直播
电子发烧友观察
一线报道 · 深度观察 · 最新资讯
收藏 人收藏
分享:

评论

相关推荐

AI学术大佬被挖光?企业可能会把AI行业挖断了根

根据笔者的统计,在目前该学院从事long88long88.vip龙8国际、机器学习和自然语言处理的11名终身教职员工中,有8名正在...
发表于 2019-01-10 08:49 56次阅读
AI学术大佬被挖光?企业可能会把AI行业挖断了根

Topbots总结了2018年里10篇最为重要的...

研究人员们发现,对于对抗性样本的防御,目前主要使用的是梯度模糊方法,但这种方法并不能带来真正的安全,...
发表于 2019-01-09 17:00 169次阅读
Topbots总结了2018年里10篇最为重要的...

工业物联网在工业制造中呈现的主要问题和趋势

根据IHS Markit最新数据,全球联网自动化设备的联网数量在2017年已经达到950亿个,其在2...
发表于 2019-01-08 15:18 62次阅读
工业物联网在工业制造中呈现的主要问题和趋势

GPU如何加速人工智能或机器学习的计算速度

计算就是计算,数学上都是一样的,1+1用什么算都是2,CPU算神经网络也是可以的,算出来的神经网络放...
发表于 2019-01-08 15:01 215次阅读
GPU如何加速人工智能或机器学习的计算速度

数据已逐渐成为了机器学习竞争中最关键的区分点

尽管机器学习有时会突然发现某些从未有人意识到的事物从而使所有人都大吃一惊,但它并不能够持续稳定提供这...
发表于 2019-01-08 11:49 258次阅读
数据已逐渐成为了机器学习竞争中最关键的区分点

在机器学习领域引入了一种新的隐写术,称为“训练集...

在研究人员设想的场景中,名为Eve的第三个智能体扮演数据检验者的角色,监视Alice和Bob之间的通...
发表于 2019-01-08 08:50 179次阅读
在机器学习领域引入了一种新的隐写术,称为“训练集...

芬兰希望在人工智能的实际应用方面占据一席之地,成...

在不需要任何编码技能的情况下,本课程传授初学者人工智能的基础知识,而不是培训新一代的尖端开发人员。相...
发表于 2019-01-07 15:37 360次阅读
芬兰希望在人工智能的实际应用方面占据一席之地,成...

为什么说2019年将是物联网关键的一年

IDC估计,物联网支出在2017——2022年期间的复合年增长率将达到13.6%,导致2022年总支...
发表于 2019-01-07 14:25 207次阅读
为什么说2019年将是物联网关键的一年

Nasscom的产品理事会推出了第二批深度long88.vip龙8国际俱...

英特尔开发long88.vip龙8国际推广部亚太和日本地区总监、NASSCOM产品理事会成员Milind Hanchinma...
发表于 2019-01-07 14:10 211次阅读
Nasscom的产品理事会推出了第二批深度long88.vip龙8国际俱...

谷歌和微软的人工智能实力对比分析 各有所强

微软和谷歌母公司Alphabet均在机器学习这一前沿软件领域扮演重要角色。但谷歌手握着当下*的机器学...
发表于 2019-01-07 11:42 66次阅读
谷歌和微软的人工智能实力对比分析 各有所强

软件工程师和数据科学家一起工作时,会擦出什么火花...

这两项任务(图像分类问题和图像分割问题)都需要大量的训练数据。我有两个消息——好消息是我们的确有很多...
发表于 2019-01-06 11:32 379次阅读
软件工程师和数据科学家一起工作时,会擦出什么火花...

陆奇宣布三位兼职合伙人加盟YC中国,新一期创业训...

在早期过渡阶段,陆奇此前在接受 36Kr 采访时称,他们会尽可能融入中国本土化的考量标准,帮助 YC...
发表于 2019-01-06 10:29 1136次阅读
陆奇宣布三位兼职合伙人加盟YC中国,新一期创业训...

2019年第一份计算机科学实力排名出炉!

CSRankings是由麻省州立大学阿姆赫斯特分校计算机与信息科学学院教授 Emery Berger...
发表于 2019-01-06 10:04 490次阅读
2019年第一份计算机科学实力排名出炉!

深入探讨深度学习,尤其是非常擅长与理解图像的深度...

激活函数的使用不会改变我们这个简单的红绿灯模型的结果(除了阈值需要是0.5而不是0),但激活函数的非...
发表于 2019-01-06 10:00 240次阅读
深入探讨深度学习,尤其是非常擅长与理解图像的深度...

2018年中六大最实用的机器学习项目

这是来自Facebook的另一个研究,fastText库专为文本表述和分类而龙8国际娱乐网站。它配备了预先训练的...
发表于 2019-01-06 09:56 246次阅读
2018年中六大最实用的机器学习项目

AI产业成为劳动密集型工作?廉价劳动力需求激增

正如一位中国数据标签公司的联合创始人所说:“ 我们是数字世界的建筑工人。我们的工作是不断地铺盖一块又...
发表于 2019-01-06 09:52 420次阅读
AI产业成为劳动密集型工作?廉价劳动力需求激增

机器学习应用于PET扫描,全局监测大脑细微变化

一旦算法在1921次扫描中进行了训练,科学家们就会在两个新的数据集上对其进行测试,以评估其性能。 第...
发表于 2019-01-06 09:49 334次阅读
机器学习应用于PET扫描,全局监测大脑细微变化

2018年的7大最好的Python库

AdaNet是一个轻量级的、可扩展的TensorFlow AutoML框架,用于使用AdaNet算法...
发表于 2019-01-06 09:44 391次阅读
2018年的7大最好的Python库

刘铁岩谈机器学习:随波逐流的太多

机器学习从业者在当下需要掌握哪些前沿long88.vip龙8国际?展望未来,又会有哪些long88.vip龙8国际趋势值得期待?
发表于 2019-01-05 10:58 442次阅读
刘铁岩谈机器学习:随波逐流的太多

探究优化机器学习模型的关键long88.vip龙8国际

TensorFlow提供用于自动微分的 tf.GradientTape API - 计算与其输入变量...
发表于 2019-01-05 09:04 173次阅读
探究优化机器学习模型的关键long88.vip龙8国际

Xilinx 2018五大产品新闻回顾:机器学习...

Zynq®UltraScale+™RFSoC将模拟、数字和嵌入式软件龙8国际娱乐网站集成到单个单片器件上,以提高...
发表于 2019-01-04 16:31 397次阅读
Xilinx 2018五大产品新闻回顾:机器学习...

2019年企业物联网道路该怎么走下去

AIoT并不是新long88.vip龙8国际,而是一种新的IoT应用形态,来与传统IoT应用做区别,从名称来看,AIoT是A...
发表于 2019-01-04 15:23 283次阅读
2019年企业物联网道路该怎么走下去

智能音箱类产品的功能流程

常常AI产品经理就智能问产品实施框架,不同模块结合不同long88.vip龙8国际,多种算法的应用使智能问答产品具备强大交互...
发表于 2019-01-04 13:59 183次阅读
智能音箱类产品的功能流程

人类幼儿的视觉学习历程的相关研究

当然,没有人能保证,通过追求这些理念,机器学习者就能建立强大的算法,赢得当前的竞争。但是,这样的努力...
发表于 2019-01-04 11:26 254次阅读
人类幼儿的视觉学习历程的相关研究

谷歌最新AI实验项目,根据用户指挥动作实时生成交...

这个项目可让用户通过浏览器管理自己的管弦乐队。你可以通过移动手臂,来改变交响乐的速度、音量和乐器种类...
发表于 2019-01-04 09:49 347次阅读
谷歌最新AI实验项目,根据用户指挥动作实时生成交...

腾讯AI Lab主任张潼被曝离职!张正友或接任

张正友博士是世界著名的计算机视觉和多媒体long88.vip龙8国际的专家,ACM Fellow,IEEE Fellow。他...
发表于 2019-01-04 09:38 311次阅读
腾讯AI Lab主任张潼被曝离职!张正友或接任

AI和机器学习将全方面赋能和革新医疗行业

医疗工作者的短缺,往往会给从业的医护人员带来巨大的工作压力。但近年来不断发展的AIlong88.vip龙8国际将有可能帮助医...
发表于 2019-01-04 08:59 211次阅读
AI和机器学习将全方面赋能和革新医疗行业

全球半导体行业预冷 中国在摩擦中看到机遇

2019年全球半导体行业周期性低谷尚未见底,对北美和亚太市场均持保留态度,将预期增长从-1%下调至-...
发表于 2019-01-03 17:53 734次阅读
全球半导体行业预冷 中国在摩擦中看到机遇

企业正采用人工智能和机器学习long88.vip龙8国际解决业务问题 并...

在人工智能和机器学习领域,人们将在2019年看到智能应用的兴起。
发表于 2019-01-03 15:48 166次阅读
企业正采用人工智能和机器学习long88.vip龙8国际解决业务问题 并...

AI攻击如何破解?百度AI安全long88.vip龙8国际总监聂科峰为你...

智能汽车、安全支付、生物特征识别等众多long88.vip龙8国际应用场景暴露出的安全隐患,智慧城市由移动终端和传感器接入数...
发表于 2019-01-03 15:44 790次阅读
AI攻击如何破解?百度AI安全long88.vip龙8国际总监聂科峰为你...

随着企业的努力 人工智能将在2019年继续迅速增...

随着金融服务、电信和高科技引领着人工智能进入主流,汽车、医疗保健、能源和零售等其他行业和领域也开始接...
发表于 2019-01-03 11:16 93次阅读
随着企业的努力 人工智能将在2019年继续迅速增...

图解2018年领先的两大NLP模型:BERT和E...

谷歌推出BERT模型被认为是NLP新时代的开始,NLP终于找到了一种方法,可以像计算机视觉那样进行迁...
发表于 2019-01-03 10:21 98次阅读
图解2018年领先的两大NLP模型:BERT和E...

机器学习助你减轻软件开发的回测压力

软件开发研究领域也开发了其他的回归测试选择方法,例如基于静态更改-影响分析的方法。然而,由于他们代码...
发表于 2019-01-02 14:42 195次阅读
机器学习助你减轻软件开发的回测压力

腾讯优图吴永坚:计算机视觉在产业中的应用实践和前...

从消费互联网到产业互联网,从基于消费场景的不断积累到探索产业场景的应用和落地,这成为腾讯多年发展历程...
发表于 2019-01-02 10:08 946次阅读
腾讯优图吴永坚:计算机视觉在产业中的应用实践和前...

什么是深度学习人工智能的深度学习详细资料概述

2016年,AlphaGo 击败韩国围棋冠军李世石,在媒体报道中,曾多次提及“深度学习”这个概念。而...
发表于 2018-12-31 17:45 629次阅读
什么是深度学习人工智能的深度学习详细资料概述

微流体压缩通道阵列结合机器学习识别乳腺癌细胞

微流体芯片采用光敏树脂SU-8 3005和3025作为硅片上的光刻材料,可以制造出宽6-10微米,高...
发表于 2018-12-31 14:32 445次阅读
微流体压缩通道阵列结合机器学习识别乳腺癌细胞

怎么样才能入行AI有哪些常见问题

作为 AI 从业者,笔者经常被问及关于入行或转行 AI 的问题,其中颇有一些高频重复出现,今天总结出...
发表于 2018-12-31 12:46 428次阅读
怎么样才能入行AI有哪些常见问题

用Inception-v3进行图像识别的方法

对于我们的大脑来说,视觉识别似乎是一件特别简单的事。
发表于 2018-12-31 09:22 391次阅读
用Inception-v3进行图像识别的方法

2019年需要关注的5种人工智能趋势

人们将继续看到2019年及以后的机器学习和人工智能相关long88.vip龙8国际的进步。亚马逊、苹果、Facebook、谷...
发表于 2018-12-30 09:08 809次阅读
2019年需要关注的5种人工智能趋势

机器学习的logistic函数和softmax函...

本文简单总结了机器学习最常见的两个函数,logistic函数和softmax函数。首先介绍两者的定义...
发表于 2018-12-30 09:04 380次阅读
机器学习的logistic函数和softmax函...

Gyrfalcon推出两款机器学习处理器

Gyrfalcon Technology(位于加利福尼亚州米尔皮塔斯)是一家初创公司,它推出了两款机...
发表于 2018-12-29 16:15 802次阅读
Gyrfalcon推出两款机器学习处理器

人工智能和机器学习是新兴领域 将会以前所未有的速...

IT部门的任务是支持人工智能和机器学习计划,这需要广泛考虑当前和未来的基础设施需求。
发表于 2018-12-29 16:07 455次阅读
人工智能和机器学习是新兴领域 将会以前所未有的速...

盘点AI的进化方向与下一个前沿

全球最权威的放射学会议——北美放射学会(RSNA)年会于 11 月 25 日至 11 月 30 日举...
发表于 2018-12-29 15:43 980次阅读
盘点AI的进化方向与下一个前沿

机器学习实验中图像增强的库imgaug详解

发表于 2018-12-28 14:30 119次阅读
机器学习实验中图像增强的库imgaug详解

印度未来可能在机器学习、AI和大数据方面取得世界...

数据智能能够帮助企业实现效率的提升、成本的降低。跨媒体智能集成外部long88.vip龙8国际,推动企业智能制造转型;最后,...
发表于 2018-12-28 11:51 911次阅读
印度未来可能在机器学习、AI和大数据方面取得世界...

利用逻辑兼容的嵌入式闪存long88.vip龙8国际存储多级突触权重

Anaflash(加利福尼亚州圣何塞)是一家初创公司,它开发了一种测试芯片,用于演示在逻辑兼容的嵌入...
发表于 2018-12-27 15:52 627次阅读
利用逻辑兼容的嵌入式闪存long88.vip龙8国际存储多级突触权重

非计算机专业如何转行人工智能,并找到算法offe...

很多人以为算法工程师的工作就是把从论文和公开课里学到的 fancy 的算法用到业务里。这个基本上就是...
发表于 2018-12-27 10:13 726次阅读
非计算机专业如何转行人工智能,并找到算法offe...

浅谈2019互联网几大趋势

2019年网络世界将会出现几种趋势,分别是:1、long88.vip龙8国际趋势 2、交互界面趋势 3、内容趋势 4、视觉趋...
发表于 2018-12-27 09:02 974次阅读
浅谈2019互联网几大趋势

大数据hadoop入门之hadoop家族产品详解

发表于 2018-12-26 15:02 240次阅读
大数据hadoop入门之hadoop家族产品详解

重读Youtube深度学习推荐系统论文不同体验和...

所以作者是先用 word2vec 方法对 video 和 search token 做了 embed...
发表于 2018-12-26 14:53 367次阅读
重读Youtube深度学习推荐系统论文不同体验和...

对人工智能2018年最大惊喜及2019年预测

考虑到long88.vip龙8国际变革的速度,我认为让专业IT人士分享他们对2018年最大惊喜及2019年预测的看法会很有趣...
发表于 2018-12-26 14:16 733次阅读
对人工智能2018年最大惊喜及2019年预测

福布斯大咖谈AI:2019年人工智能的120个预...

2019年AI产业将会是什么样的状态呢?近日,外媒Forbes采访了120位AI行业创始人和高管,他...
发表于 2018-12-26 11:32 3203次阅读
福布斯大咖谈AI:2019年人工智能的120个预...

利用AI对研究员的工作进行审查 人工智能将迎来一...

机器学习领域的研究论文如雪崩般涌现,谷歌的工程师克里夫·杨(Cliff Young)将其比作人工智能...
发表于 2018-12-26 09:30 396次阅读
利用AI对研究员的工作进行审查 人工智能将迎来一...

2018年,机器学习和人工智能领域最重要的突破是...

正如Xavier Amatriain说的那样,深度学习的寒冬不会到来——这项long88.vip龙8国际已经用到产业里并带来...
发表于 2018-12-26 08:59 746次阅读
2018年,机器学习和人工智能领域最重要的突破是...

新机器学习算法可以将物体和人完美(或近乎完美)地...

今年4月,康奈尔大学(Cornell University)的一个人工智能研究团队发表了在arXiv...
发表于 2018-12-26 08:50 544次阅读
新机器学习算法可以将物体和人完美(或近乎完美)地...

斯坦福大学《2018年度全球AI报告》正式发布

现在可能仍然有很多初创公司想要自称为人工智能公司,并对外传播,以证明自己的价值。但是,渐渐地,声称自...
发表于 2018-12-25 16:59 2297次阅读
斯坦福大学《2018年度全球AI报告》正式发布

Graphcore开发了一种用于人工智能和机器学...

Graphcore由半导体行业资深人士首席执行官奈杰尔•图恩(Nigel Toon)和首席long88.vip龙8国际官西蒙...
发表于 2018-12-25 15:31 783次阅读
Graphcore开发了一种用于人工智能和机器学...

2018年度完美收官的十篇机器学习文章都讲了哪些...

本文的内容主要是对当前 NLP 领域的三大模型的综述。2018 年是自然语言处理领域(NLP) 取得...
发表于 2018-12-25 10:13 473次阅读
2018年度完美收官的十篇机器学习文章都讲了哪些...

MLPerf 联盟公布7项测试构成了当前机器学习...

NVIDIA最初致力于研究封闭组,旨在针对ML训练系统(包括硬件和软件)提供有价值的对比。为实现这一...
发表于 2018-12-24 14:12 1102次阅读
MLPerf 联盟公布7项测试构成了当前机器学习...

ML之预测:采用机器学习预测小组赛、十六比赛、四决赛、半决赛、决赛以及世界杯总冠军的各个队伍

发表于 2018-12-24 11:51 63次阅读
ML之预测:采用机器学习预测小组赛、十六比赛、四决赛、半决赛、决赛以及世界杯总冠军的各个队伍

一个问题不可避免地浮出水面:人工智能会取代医生吗...

Blease说,前者——让AI接手文档工作——并不令人惊讶。她表示:“人们倾向于认为人工智能将不会威...
发表于 2018-12-24 08:56 467次阅读
一个问题不可避免地浮出水面:人工智能会取代医生吗...

智能客户服务中心推动进入"AI+"时代

创新人机协作服务方式,构建智能数据运营体系,形成决策辅助管理模式,促进传统客户服务中心向知识运营中心...
发表于 2018-12-23 15:02 965次阅读
智能客户服务中心推动进入"AI+"时代

FPGA成数百家嵌入式视觉企业开发首选 用于机器...

已有几家初创企业在开发专门的机器学习芯片,但上述这些应用不仅仅要集成机器学习,还有计算机视觉,传感器...
发表于 2018-12-23 14:03 1460次阅读
FPGA成数百家嵌入式视觉企业开发首选 用于机器...

Pytorch模型训练实用PDF教程【中文】

发表于 2018-12-21 09:18 117次阅读
Pytorch模型训练实用PDF教程【中文】

ML之ECS:利用ECS的PAI进行傻瓜式操作机器学习的算法

发表于 2018-12-20 10:42 52次阅读
ML之ECS:利用ECS的PAI进行傻瓜式操作机器学习的算法

清洗误标注的开发集和测试集样本

发表于 2018-12-19 09:48 115次阅读
清洗误标注的开发集和测试集样本

在误差分析时并行评估多个想法

发表于 2018-12-19 09:43 105次阅读
在误差分析时并行评估多个想法

误差分析:根据开发集样本评估想法

发表于 2018-12-18 09:16 117次阅读
误差分析:根据开发集样本评估想法

快速构建并迭代你的第一个系统

发表于 2018-12-18 09:11 186次阅读
快速构建并迭代你的第一个系统

建立开发集和测试集(总结)

发表于 2018-12-14 10:56 142次阅读
建立开发集和测试集(总结)