文本理解的可行性分析

一、意识化与文字的关联

我们大多数人从出生的第一个问题通常是:”妈妈,我是从哪里来的啊?”

这个问题代表着小孩意识的兴起,即探寻自我的来源。

然而这句话本身小孩并不理解,只是在模仿大人的用语,然而意识已经兴起了。

妈妈通常回答:”以后你就明白了。”

二、简单的理解性思维

我们不妨将这句话换成专业化的术语(这在自然语言处理中可以实现1),即:”我向妈妈提出了一个疑问,我是如何来到这个世界的?”

对于一个成年人,这句话之中的每一个词我们都能准确理解,但究其本源,我们是如何理解的呢?

如下:

文本理解的可行性分析

这些词现在在自然语言处理中都很容易识别,比如我,提出,疑问,母亲。

所以首先需要一个公理词库,这个词库是计算机可识别的。

其次,公理词库也是可解释的,比如,我,可解释为:我的意思是自己,是第一人称代词。

文本理解的可行性分析

这些词也可以继续往下解释。

我们把小的方块命名为知识,一个个知识连接形成一个知识体系。

三、学术式(定义式)理解

现在,我们看一些复杂的话,生物的定义,摘自百度百科。

生物,是指具有动能的生命体,也是一个物体的集合。

文本理解的可行性分析

生命,具有能量代谢功能,能回应刺激及进行繁殖的开放性系统。

这句话同样也可以表示。

四、语法本质和知识本质

语法

实词:名词,动词,形容词,数词,量词,代词。虚词:副词,介词,连词,助词,叹词,拟声词 。(中文)

主谓宾定状补(英文)

知识

知识是人类从各个途径中获得的经过提升总结与凝练的系统的认识。(摘自百度百科)

认识一件事物,最终体现出来就是可以解释的清楚,换句话说,或者准确来说,可以对这件事物下一个定义。定义比解释更为准确。我们所说的大部分话(或知识)都可以转为一个定义。

举个例子:

我写文章是为了研究总结我感兴趣的话题。(这个例子不好,因为其中没有什么知识)

转换成定义式的话:

我个人写文章的原因是研究总结我感兴趣的话题。

再举个例子:

为了使计算机能够理解人的意图,人类就必须将需解决的问题的思路、方法和手段通过计算机能够理解的形式告诉计算机,使得计算机能够根据人的指令一步一步去工作,完成某种特定的任务。

定义式:

计算机根据人的指令工作的方法是,人类将需解决的问题的思路、方法和手段通过计算机能够理解的形式告诉计算机。

人类将思路告诉计算机的目的是,使计算机能够理解人的意图。

这样我们就获得了两个知识,第一个是如何使计算机根据人的指令工作,第二是为什么人类要将思路告诉计算机。

同样的,这也可以用知识图谱表示,即知识体系。

我画第一个:

文本理解的可行性分析

五、总结

知识即一个个定义,定义形成网络构建知识体系。

有了这样的知识体系配合大数据学习便能使计算机具备知识体系。

六、下一节

下一节分析对话,如何使计算机利用知识体系组织语言进行对话。

后面会写如何使计算机利用知识体系进行创造。

Original: https://blog.csdn.net/toxic017/article/details/125721634
Author: 沉阁星雨
Title: 文本理解的可行性分析

原创文章受到原创版权保护。转载请注明出处:https://www.johngo689.com/595652/

转载文章受原作者版权保护。转载请注明原作者出处!

(0)

大家都在看

亲爱的 Coder【最近整理,可免费获取】👉 最新必读书单  | 👏 面试题下载  | 🌎 免费的AI知识星球