近日与许多朋友茶叙,谈及基督徒如何面对AI的话题。我想写成一个系列,逐渐发布在这个号上。
这是第一篇,AI相关概念的梳理。
因为AI一下子风靡网络,并有资本加持,所以已经显出一股乱象,每个人都想在这AI之战中分一些掳物,但却不成想自己会成为资本的掳物。
为了能够相对简单清晰的熟悉概念,并能够让本号的读者读得懂,我一并会简单处理许多计算机领域专业术语,以常人能够理解的方式表述。
AI
AI中文语境统一叫做人工智能。在不同的书本中具有不同的定义。广义来说,各类的人工设计和制造的智能系统。让计算机来模仿、延伸、甚至是超越人类智能。
NLP
学名叫做自然语言处理。这是AI领域的一项核心技术,是研究如何让计算机都懂人类的语言和文字,也就是将人类的语言和文字转换为计算机可以执行的指令。如今以文本和图像作为核心交流手段的AI系统,这个是核心技术。
LLM
学名叫做大型语言模型,或者简称为大模型。它是NLP的一个重要组成和延伸,主要做的事情是来预测自然语言文本中下一个词或字符的概率分布情况。可以看作是对语言规律的学习和抽象。举个例子,如果我们用DeepSeek的客户端,和它说:“你好”,DS会用NLP分析“你好”这个句子,并抽象为LLM可识别的词语空间向量,然后用已经训练好的大模型去推测该怎么生成回复。这里面涉及复杂的算法和神经对抗网络,这里不谈。
但LLM是现在生成式AI的核心,它分析词法、句法,做语义分析,可以用于机器翻译、自动问答系统、信息抽取、文本分类、情感分析等许多领域。
而Transformer模型,则加速了无监督式LLM的快速发展,现在许多大模型都是基于Transformer之上。使得生成连续的具有意义的文本称为可能。
GPT
GPT是基于Tramsformer模型的一个重要预训练语言模型。通过预先训练大量文本数据,学习到语言的基本结构和模式,从而能够理解自然语言文本和语义。
chatGPT
故名思义,chatGPT是在GPT模型之上制作的一个对话应用。现在的chatGPT可以用文本、语音和图像作为沟通路径来使用。图像的对话路径是属于计算机视觉识别的领域。
AIGC
AIGC中文名为人工智能生成内容,指的是利用AI技术来自动生成文本、图像、音乐或视频。可以看到,现在许多AI应用做的就是这个事情,这对应了互联网发展过程中的第三个内容生成阶段,之前的互联网经过了专家内容生成、用户内容生成两个阶段。
但因为AI具有幻觉,AIGC的内容具有相当大的错误概率。现在许多搜索引擎会自动屏蔽AIGC对互联网内容的污染。
AGI
中文叫做通用人工智能。这比一般的AI要高级的多,它的目的是要创造一个能像人类思考、学习、执行多种人物的系统。科幻片里的AI内容多属于AGI领域,现在尚未有实际的AGI存在。
AMI
这是AI领域的专家杨立昆提出的概念,中文叫做高级机器智能。因为杨立昆一直认为AGI用文本数据是不可能产生的。因为人类的智能是非常复杂的,涉及到许多感受,这些不是文本可以描述的。文本是把人类的认知抽象为符号的结果。而现在呈现的AI程度,他用了一个AMI这个词。杨立昆一直认为现在AI是不理解它自己生成的内容的,这些生成内容对于AI来说只是一堆用某种逻辑生成的符号,它无理解能力。所以,AI的智力水平是比一只猫都不如。
第一篇先到这里。
《茶叙之AI基本概念梳理》有一个想法