字体
关灯
上一章 回目录    收藏 下一页

第258章 巨额的隐形财富(1/2)

伊芙·卡莉所谓的“内容表示”指的是在自动文本摘要的流程中将原始文本划分为文本单元的过程。

这一过程包含有分字、词、句等预处理工作;

其主要目的是通过预处理将原始文本处理成算法容易进行分析的形式。

传统的抽取式摘要这样传统自动文本摘要不怎么注重内容表示这一环节。

生成式文本摘要和传统的抽取式摘要关于这部分则稍稍有些不同。

生成式文本摘要还是比较注重内容表示这一环节的。

尤其是应用了词嵌入技术和预训练机制的生成式文本摘要更是格外注重“内容表示”这一环节。

没办法,不得不重视,传统的文本摘要各步骤的重要程度其实是差不多的。

但应用了词嵌入技术和预训练机制的生成式文本摘要的工作很多时候都是“头重脚轻”的。

即开始的环节在整个环节中权重是最高的。

或者说在实际构建生成式文本摘要模型的时候,虽然要设计到很多的步骤。

但通常情况下越靠前的工作也往往更重要。

就以“内容表示”来说吧,在构建生成式文本摘要模型的时候。

很多时候内容表示的完成水平的高下将直接影响到后续的步骤。

而伊芙·卡莉所搞得《文本判断甄别比较的一种新方法》这项专利在内容表示方面确实有一定的价值。

借助于该专利所提供的价值,林灰以后在进行文本摘要的后续升级换代的过程中可以少一些逻辑层面的漏洞。

但如果仅仅是因为这点价值,还不足以让林灰大费周章进行一项跨国专利的收购。

林灰之所以煞费苦心将伊芙·卡莉搞出的《文本判断甄别比较的一种新方法》这项专利最最根本的原因还是因为林灰比较在意伊芙·卡莉在这一专利中所应用的模型。

在《文本判断甄别比较的一种新方法》这项专利中就文本甄别伊芙·卡莉极其有创意地鼓捣出一个用于文本判断甄别的模型。

如果仅仅就自然语言处理机器学习方面来看,这不过只是一个平平无奇的用于文本判别的模型。

但当思维跳脱出自然语言处理这个小领域之后,这个模型可不能够等闲视之。

当初在翻阅这个时空的学术方面的一些资料时,林灰敏锐地注意该专利所蕴含的价值。

尽管专利所提供的技术路线很多时候都是概要性的。

一些后来者在按照这些技术路线去体悟技术的时候往往只能盲人摸象般的探索。

在拥有前世信息的情况下,林灰相当于站在巨人的肩膀上,

虽然偶尔会有些高处不胜寒的感觉,但具体到技术方面的时候林灰往往系统概念更强。

很多时候,林灰只消看到一些公开的技术路线就能了解到其背后所蕴含的价值。

并且这种判断基本是八九不离十。

当初接触到伊芙·卡莉搞得这个专利时。

林灰发现根据该专利已经公开的一些资料尤其是该专利公开提及的技术路线。

林灰很快捕捉到这个专利的价值。

林灰料定利用这个模型几乎稍加变形就能在此基础上形成一种颇为高效的判别式模型。

事实是后来进行的收购进一步了解了专利信息后更是印证了此前林灰对之的猜测。

仅仅是判别式模型即便是效率高或许没啥意义。

但是稍微做点小改动那事情就不一样了。

当高效的判别式模型邂逅高效的生成式模型。

此二者进行有机结合,并在此基础上再继续进行一定的专门架构之后。

完全可以藉此搞出全新的效率颇高的深度学习模型。

这个深度学习模型在前世有个大名鼎鼎地称呼:

——生成对抗网络(GAN)

生成对抗网络由一个生成网络与一个判别网络组成。

生成网络从潜在空间中随机取样作为输入,其输出结果需要尽量模仿训练集中的真实样本。

判别网络的输入则为真实样本或生成网络的输出,其目的是将生成网络的输出从真实样本中尽可能分辨出来。

而生成网络则要尽可能地欺骗判别网络。

两个网络相互对抗、不断调整参数。

最终目的是使判别网络无法判断生成网络的输出结果是否真实。

在前世图灵奖获得者、卷积神经网路之父Yann Le Cun在某次学术论坛上甚至将生成对抗网络模型称之为机器学习方面二十年来最酷的想法。

能得到图灵奖级别大佬这样高度肯定,生成对抗网络模型的价值可想而知。

前世生成对抗网络作为非监督式学习的一种方法。

是由伊恩·古德费洛等人于2014年提出的。

不过这个时空由于机器学习方面的研究整体滞后。

这个前世颇为有名的深度学习模型在这个时空想要如约而至似乎是有些难度了。

前世生成式对抗网络自出现以来,针对不同的应用领域出现了许多变体。

这些变体相对于最原始的生成式对抗网络都进行了一定的改进。

这些改进有的是单纯改进了结构。

有的则是因为理论上的发展而对生成式对抗模型涉及到的一些函数或者说参数进行了一定的改进。

再或者就是单纯就应用方面进行了一定的创新调整。

一项技术被频繁改动不是说明这项技术失败。

刚好相反,这恰恰说明这项技术很成功。

因为这某种程度上从侧面反映了该技术有很多的成长空间。

事实也正是如此,前世生成式对抗网络是相当成功且应用广泛的。

在很多机器学习领域都能看到生成式对抗网络的身影。

之所以如此大概是因为原始的生成式对抗网络在构建的时候,先验假设比较少。

正是因为对数据几乎没有任何假设使得生成式对抗网络具有几乎不设限的建模能力。

借助于生成式对抗网路可以拟合多种分布。

此外,由于生成式对抗网路模型不甚复杂。

很多时候在应用生成式对抗网络的时候就不需要预先设计较为复杂的函数模型。

在不少生成式对抗网络的应用场景中,工程师甚至只需要应用反向传播算法简单训练一下对应的网络。

就可以让生成式对抗网络中的生成器和判别器正常工作。

之所以将生成式对抗网络搞得这么比较易上手。

跟生成式网络的设计初衷是为了进行无监督学习也有很大的关系。

不过事物都是有两面性的,正是因为原始生成式对抗网路过于自由。

训练过程很容易出现训练发散的情况。

不止于此,生成式对抗网络还存在诸如梯度消失等问题。

由于这些问题的存在,生成式对抗网络是很难学习一些生成离散的分布的。

就比如原始的生成式对抗网路就不是很擅长纯粹文本方面的处理。

除了涉及到部分场景下会将生成式对抗网络用于文本分割之外。

多数时候很少将生成式对抗网络应用于文本(特指纯粹文字形式的文本)方面。

不过尺有所长寸有所短,虽然并不是很擅长对纯粹文本信息的处理。

但在其余很多领域生成式对抗网路都可以大显身手。

在人脸识别方面、超分辨率重建等方面生成对抗网络更是大有用武之地。

甚至是在语义图像修复方面生成式对抗网络同样是可以大显身手。

除此之外,生成式对抗网络还有很多应用方向。

概括地说,生成式对抗网络的应用前景是相当广阔的。

说起来因为在这个时空机器学习方面的研究比较滞后。

林灰想搬运生成式对抗网络这一模型的话其实也不需要担太多风险。

尽管如此,在将生成式文本摘要方面的彻底搞定之前。

林灰也不着急将生成式对抗网络相关的研究成果搬运出来。
本章未完,请翻下一页继续阅读.........
上一章 回目录    收藏 下一页