欢迎来到通信人在线![用户登录] [免费注册]

人工智能(AI)的关键技术

浏览:1693  来源:通信人在线  日期:2025-04-09

人工智能(AI)正在以前所未有的速度重塑人类社会的运行方式,促进着人类社会文明的巨大进步,而其核心技术构成AI系统的“大脑”,鼎立AI的快速发展与演进。由于当今AI技术的高速发展,其AI相关技术层出不穷,下述将介绍推动AI发展的最基础的关键技术,这些技术构成了AI技术发展的核心技术。人工智能(AI)的最基础的关键技术应包括AI的学习能力类技术和AI的处理能力类技术。

欲详细了解人工智能(AI)系统介绍的请进入

一、AI的学习能力技术

1、概述

学习(learning)是人类提高智能的关键,计算机或机器(统称“智能体”)的智能能力同样需要通过学习来提高呈现。因此,称为“机器学习”的技术成为AI技术的基础和根本。随着机器学习(MLMachine Learning)技术的发展,又进一步出现了深度学习(DLDeep Learning)、强化学习(RLReinforcement Learning、联邦学习(FLFederated Learning等的技术概念,它们展现了机器学习在某些方面的学习能力的表现。下表1-1-1列出了GB/T 41867-2022《信息技术 人工智能 术语》给出的这些AI学习能力技术的术语定义。可知,机器学习(ML)是基础,深度学习(DL)是ML的子集,强化学习(RL)则关注决策过程;联邦学习(FL)则注重联合多方进行数据训练。它们之间的关系图可用下图1-1来表示;它们之间特征对比可详见下表1-1-2。各种学习技术都需要相应的架构和算法,架构的优化和算法的算力表征和反映了各学习技术的学习能力。DLRLFLML可以实施融合,如:深度强化学习用深度神经网络做强化学习的决策,可用于Atari游戏AI等;联邦深度学习:可多个医院用联邦学习框架协作训练深度学习模型,可用于疾病的诊断等。

1-1-1:关于机器学习、深度学习、强化学习、联邦学习的定义

  1-1:关于机器学习、深度学习、强化学习、联邦学习的关系

1-1-2:关于机器学习、深度学习、强化学习、联邦学习的特征

日常中,还有提到迁移学习、持续学习、连续学习、终身学习等术语,本质上,它们都是以机器学习为基础,在AI的学习能力上另类表现。

2、关于机器学习的学习方法

机器学习(ML)采用计算技术使AI系统能够从数据或经验中学习。换句话说,ML 系统是通过优化算法以适应训练数据或通过最大化奖励来提高其性能而开发出来的。机器学习(ML)所采用的学习方法(或称学习策略)有:监督学习、无监督学习和半监督学习等形式。其含义依据GB/T 41867-2022GB/T 5271.31-2006《信息技术 词汇 31部分 人工智能 机器学习》标准详见下表1-2-1(两个标准的表述有所不同);下表1-2-2给出了各学习方法的特征对比。一般来讲,当有充足、高质量的标注数据,且任务目标明确时可选择监督学习;当数据无标签,目标是探索数据模式时可选择无监督学习;当标注数据有限,但有大量无标签数据时可选择半监督学习。

1-2-1:关于监督学习、无监督学习和半监督学习的定义

1-2-2:关于监督学习、无监督学习和半监督学习的特征

需要指出的是:ISO/IEC 23053:2022《使用机器学习(ML)的人工智能(AI)系统框架》中指出,把机器学习的学习方法分为监督学习、无监督学习、强化学习、半监督学习、自监督学习、迁移学习和集成学习等。但它把前三种称为ML的基本学习方法;而把后四种称为是同时受到三种基本学习方法启发的另类学习方法。下表1-2-3是依据ISO/IEC 23053:2022ISO/IEC 22989:2022《信息技术 人工智能 概念和术语》,汇总了上述提到的所有“XX学习”类术语的定义及概念。可知,机器学习的学习方法应为监督学习、无监督学习和半监督学习三种。

1-2-3ISO/IEC标准中所定义的“XX学习类术语

欲详细了解机器学习ML)技术介绍的请进入

3、深度学习(DL

深度学习(DL)称为机器学习(ML)的一个子集。它是指AI通过训练具有多个隐藏层的神经网络来创建丰富的层次化表示的方法;DL基于多层神经网络,通过特征自动提取突破了传统算法的局限,深度学习过程允许神经网络逐步优化最终输出。DL可以减少或消除对特征工程的需求,因为最相关的特征会自动被识别,但它可能需要大量的时间和计算资源。DL常采用的神经网络类型有:卷积神经网络(CNNConvolutional Neural Networks)、循环神经网络(RNNRecurrent neural network)、长短期记忆网络(LSTMLong Short-Term Memory Network)和生成对抗网络(GANGenerative Adversarial Network)等。它们的含义根据GB/T 41867-2022详见下表1-3-1;下表1-3-2给出了各神经网络的特征对比。CNN在图像识别领域准确率超越人类水平,支撑自动驾驶的视觉感知系统; RNN及其变体LSTM在语音识别和机器翻译领域取得突破,使智能助手能够理解自然语言; GAN的出现,更开启了AI创造内容的新纪元。

1-3-1:关于卷积神经网络、循环神经网络、长短期记忆网络、生成对抗网络的定义

1-3-2:关于卷积神经网络、循环神经网络、长短期记忆网络、生成对抗网络的特征

神经网络试图模拟人类在观察、学习、分析和复杂问题决策方面的智能能力。因此,神经网络的设计灵感来源于人类和动物大脑中神经元的连接方式。神经网络的结构由相互连接的处理元素组成,这些元素被称为神经元。每个神经元接收多个输入并仅产生一个输出。它们被组织成层,其中一层的输出成为下一层的输入。每个连接都有一个与输入重要性相关的权重。神经网络通过已知输入的训练来学习,将实际输出与预期输出进行比较,并使用误差来调整权重。因此,产生正确答案的链接会被加强,而产生错误答案的链接会被削弱。诸如上述的CNNRNNLSTMGAN等本质上是神经元的排列方式不同。神经网络可以称之为机器学习算法的一种。

二、AI的处理能力技术

1、概述

所谓AI的处理能力是指AI系统对输入数据或信息的处理能力。对于AI,输入数据或信息通常包括文本(指令)、语言、语音、图像、视频等模态。智能体要实现智能,首要的和最基本的就是要能面对语音语言、图形图像等输入信息模态进行感知并进行处理,生成结果并输出。这就有了AI的不同输入模态处理技术,常用到的有:自然语言处理(NLPNatural Language Processing )技术、计算机视觉(CVComputer Vision)处理技术、多模态(MMMulti-Mode处理技术。根据相关国家标准各种处理技术的含义详见下表2-1-1;下表2-1-2给出了各处理技术的特征描述。显然,多模态处理技术是NLP技术和VC技术等处理技术的融合,未来各处理技术的深度融合将推动AI的更快发展。同样,各种处理技术都需要相应的架构和算法,架构的优化和算法的能力表征和反映了各处理技术的处理能力。

2-1-1:自然语言处理技术、计算机视觉处理技术和多模态技术的定义

2-1-2:自然语言处理技术、计算机视觉处理技术和多模态技术的描述

2、自然语音处理(NLR)技术

自然语言处理是基于自然语言理解和自然语言生成的信息处理。这包括使用文本或语音进行自然语言分析和生成。通过自然语言处理能力,计算机可以分析用人类语言编写的文本, 并识别概念、实体、关键词、关系、情感、情绪和其他特征,使用户能够从内容中提取见解。 凭借这些能力,计算机还可以生成文本或语音来与用户交流。任何以文本或语音形式接受自然语言作为输入或输出,并能够对其进行处理的系统,都在使用自然语言处理组件。这样的处理系统需要一个自然语言理解组件和一个自然语言生成组件。因此NLP组件有众多种,用于处理不同的任务,具体详见下表2-2的介绍。

2-2:自然语音处理(NLR)的组件

3计算机视觉(CV)处理技术

CV定义为“一个功能单元获取、处理和解读代表图像或视频的数据的能力”。计算机视觉与图像识别密切相关,例如对数字图像的处理,下表2-3-1给出了数字图像的一些描述。视觉数据通常源自数字图像传感器、数字化扫描的模拟图像或其它图形输入设备。CV的基本任务包括图像采集、重采样、缩放、降噪、对比度增强、特征提取、分割、目标检测和分类等。在AI系统中,有多种方法可以完成计算机视觉任务,如近年来,深度卷积神经网络因其在图像分类任务中的高准确性以及其训练和预测性能而受到青睐。下表2-3-2列出了基于计算机视觉和图像识别的AI应用示例。

2-3-1:关于数字图像的特点

2-3-2:基于计算机视觉和图像识别的AI应用示例

4、多模态处理技术

AI的多模态处理技术是指通过融合文本、图像、音频、视频等多种数据模态,实现对复杂信息的综合理解与生成的技术体系。它是NLP技术与CV技术的结合,但绝不是两者的简单拼凑,它通过特征级融合(对齐不同模态的特征向量)、模型级融合(独立模型输出整合)和决策级融合(加权投票或贝叶斯推理)等机制实现跨模态信息的互补。

三、AI的核心技术

基于上述AI的学习能力技术和处理能力技术及其融合,可以将AI关键技术分为感知类技术(Perception Technologies)、认知类技术(Cognition Technologies)和生成类技术Generation Technologies),这三大技术构成了AI的最核心技术,它们的含义和特征等详见下表3的描述。关键是,通过这三类技术的结合,AI系统可以像人类一样“感知-思考-创造”,逐步实现从“工具”到“智能体”的进化,实现高智能的AI

3:关于AI的感知类技术、认知类技术和生成类技术

当然,上述通过AI的最基础技术所形成的AI核心技术的实现,还需要AI的硬件技术(如GPUTPU等)和软件技术(如架构、算法等)的加持。AI关键技术的协同发展,正在构建从感知到决策的完整智能链条。随着多模态学习、因果推理等前沿方向的突破,AI将向更通用、更可靠的方向演进,实现具身式AI(如机器人)和非具身式AI(如大语言模型ChatGPTDeepSeek等)协同快速发展。显然,随着AI的大规模的发展,AI伦理技术与安全技术变得异常重要,创新与伦理规制的平衡,将成为决定智能文明走向的关键命题,务必确保AI系统的公平性、透明性和可控性。

欲进一步了解人工智能(NVIDIAGPU技术性能参数介绍的请进入

附录
百度云服务器
© 2004-2025 通信人在线 版权所有 备案号:粤ICP备06113876号 网站技术:做网站