所有工具
人工智能(Artificial Intelligence)
人工智能(AI)是指在机器中模拟人类智能的技术和方法。这些智能机器可以通过处理大量数据并从中学习来执行各种任务。AI系统可以分为两大类:狭义和广义。狭义AI系统设计用于执行特定任务,而广义AI系统设计用于执行任何人类可以执行的智力任务。AI研究的最终目标是创建可以像人类一样理解、思考和行动的系统。 了解更多
行动空间(Action space)
在强化学习问题中,智能体可以采取的所有可能行动的集合。 了解更多
人工神经网络(Artificial neural network)
一种机器学习算法,其结构和功能模拟了人脑的结构和功能,包括一系列相互连接的“神经元”,可以处理和传输信息。 了解更多
自编码器(Autoencoder)
一种神经网络,用于降维和特征学习,包括一个编码器和一个解码器,分别学习压缩和重构数据。 了解更多
Bagging
一种机器学习集成技术,在训练数据的不同随机子集上训练多个模型,并将它们组合以进行预测,目的是减少方差并提高模型的泛化能力。 了解更多
大数据(Big data)
大量数据集,可以分析并用于获取见解和做出明智的决策。 了解更多
Boosting
一种机器学习集成技术,将弱学习器组合成一个强学习器,以提高总体预测准确率。 了解更多
ChatGPT
由OpenAI构建的聊天机器人,基于其GPT3.5大型语言模型,使用公共数据进行训练。 了解更多
分类(Classification)
将数据分为预定义的类别或组的过程。 了解更多
聚类(Clustering)
基于相似性或共同特征将数据点分组的过程。 了解更多
认知计算(Cognitive computing)
开发可以执行通常需要类似于人类智能的任务,如学习和解决问题的计算机系统。 了解更多
计算机视觉(Computer vision)
计算机解释和理解来自世界的视觉数据,例如图像和视频的能力。 了解更多
卷积神经网络(Convolutional neural network)
一种专门设计用于图像和视频识别任务的神经网络,使用卷积层来学习和识别数据中的模式。 了解更多
交叉验证(Cross-validation)
一种模型评估技术,在该技术中,训练数据被分成多个折叠,模型在每个折叠上训练和评估,以获得其泛化性能的估计。 了解更多
数据挖掘(Data mining)
从大型数据集中提取有用的模式和知识的过程。 了解更多
决策树(Decision tree)
一种类似于流程图的树形结构,用于根据一系列二元分裂做出决策。 了解更多
深度梦境(Deep dream)
由谷歌开发的一种图像生成技术,使用卷积神经网络放大网络的特征,生成梦境般的图像。 了解更多
深度学习(Deep learning)
机器学习的一个子领域,涉及训练多层神经网络以自主学习和做出决策。 了解更多
降维(Dimensionality reduction)
在保留尽可能多的信息的同时减少数据集中的特征或维度的过程。 了解更多
折扣因子(Discount factor)
在强化学习算法中,未来的回报会通过一个折扣因子进行折现,以平衡短期和长期回报之间的权衡。 了解更多
动态规划(Dynamic programming)
一种通过将优化问题分解成较小的子问题并将这些子问题的解存储在表或数组中来解决问题的方法。 了解更多
集成学习(Ensemble learning)
一种机器学习技术,通过训练并组合多个模型进行预测,旨在提高模型的整体性能。 了解更多
回合(Episode)
强化学习问题中,智能体在到达终止状态之前经历的状态、动作和奖励的序列。 了解更多
进化计算(Evolutionary computation)
使用自然进化的原理,如繁殖、变异和选择等,来寻找问题的解决方案的一组算法。 了解更多
专家系统(Expert system)
一种利用人工智能技术,在特定领域中模拟人类专家决策能力的计算机程序。 了解更多
探索-利用权衡(Exploration-exploitation tradeoff)
强化学习中探索新动作和利用已知好动作之间的张力,以平衡智能体的学习和奖励最大化目标。 了解更多
人脸识别(Face recognition)
一种基于人脸特征识别和验证个人身份的计算机技术。 了解更多
特征工程(Feature engineering)
从原始数据中选择和创建信息丰富且相关的特征,用于机器学习模型的训练。 了解更多
特征选择(Feature selection)
从较大的特征集合中选择一部分最相关的特征,用于机器学习模型的训练。 了解更多
微调(Fine-tuning)
一种机器学习技术,涉及调整预先训练的模型在新数据集上的超参数或参数,以优化其在特定任务上的性能。当预先训练的模型可用于相关任务,但新任务的可用数据有限或目标任务与原始任务略有不同时,通常使用微调。 了解更多
函数逼近(Function approximation)
在强化学习问题中,当状态或行动空间过大无法显式表示时,使用函数逼近来逼近值函数或策略的值。 了解更多
模糊逻辑(Fuzzy logic)
一种数学逻辑形式,允许系统的输入和输出存在不确定性和模糊性。 了解更多
GAN(生成式对抗网络)
一种由两个竞争的神经网络组成的生成模型,一个生成器和一个鉴别器,分别学习生成和识别合成数据。 了解更多
生成式对抗网络(Generative adversarial network)
一种神经网络类型,由两个竞争的网络,一个生成器和一个鉴别器,分别学习生成和识别合成数据。 了解更多
生成模型(Generative model)
一种机器学习模型,学习数据的潜在分布,并能够从中生成新的合成样本。 了解更多
遗传算法(Genetic algorithms)
一种搜索算法,利用自然进化的原理,如繁殖、变异和选择,来寻找问题的解。 了解更多
GPT
由OpenAI开发的大型语言模型,使用变压器架构和自监督学习生成类人文本。 了解更多
启发式算法(Heuristics)
一种通过试错和借鉴过去经验寻找解决方案的问题解决方法。 了解更多
超参数调整(Hyperparameter tuning)
调整机器学习模型的超参数的过程,以提高其性能。 了解更多
图像标注(Image annotation)
用相关信息,如对象类或边界框等,标注或注释图像的过程。 了解更多
图像字幕(Image captioning)
生成图像的自然语言描述的过程。 了解更多
图像分类(Image classification)
将图像分配到一个或多个预定义的类别或分类中的过程。 了解更多
图像着色(Image colorization)
为灰度图像添加颜色的过程。 了解更多
图像增强(Image enhancement)
提高图像的视觉质量,如增加对比度或去除噪音等。 了解更多
图像生成(Image generation)
使用人工智能技术创建新的合成图像的过程。 了解更多
图像预处理(Image preprocessing)
为使用而准备图像的过程。 了解更多
图像恢复(Image restoration)
修复或还原已损坏或损坏的图像的过程。 了解更多
图像检索(Image retrieval)
从大型数据库中基于视觉内容搜索和检索图像的过程。 了解更多
图像分割(Image segmentation)
将图像划分为多个区域或部分的过程,每个区域或部分代表不同的对象或背景。 了解更多
图像翻译(Image-to-image translation)
将图像从一个领域转换为另一个领域的过程,例如将照片转换成绘画或素描。 了解更多
推理(Inference)
从前提推导出结论的逻辑推理过程。 了解更多
修复图像(Inpainting)
修复或填补图像中损坏或缺失部分的过程。 了解更多
K均值算法(K-means)
一种无监督机器学习算法,用于将数据点聚类为预定义数量的簇。 了解更多
知识表示(Knowledge representation)
知识在计算机系统中的编码和存储方式。 了解更多
语言模型(Language Model)
人工智能领域中用于预测语言中单词或标记序列可能性的统计模型。语言模型通常用于自然语言处理任务,以生成连贯和适当的文本。 了解更多
大型语言模型(Large Language Model)
人工智能领域中一种类型的统计模型,使用非常大的文本数据集进行训练,并使用机器学习技术学习语言的模式和结构。大型语言模型通常用于语言生成、机器翻译和文本分类等任务,并能够生成具有高度连贯性和流畅性的类人文本。 了解更多
机器学习(Machine learning)
一种人工智能技术,使用算法分析大量数据,从而使计算机能够自主学习和改进任务的性能,而无需进行显式编程。 了解更多
马尔可夫决策过程(Markov decision process)
一种用于描述在不确定环境中进行序列决策的数学框架,广泛应用于强化学习领域。 了解更多
马尔科夫性质(Markov property)
指一个随机过程在给定当前状态的情况下,未来状态与过去状态无关的性质。 了解更多
马尔科夫奖励过程(Markov reward process)
一种简化版的马尔可夫决策过程,包含状态和奖励,但不涉及决策。 了解更多
模型(Model)
用于表示问题或系统的抽象结构,可用于预测、决策或发现数据中的模式。在机器学习中,模型是根据不同算法(如监督学习、无监督学习或强化学习)对数据集进行训练而得到的,用于执行各种任务,如分类、回归、聚类或降维。 了解更多
模型部署(Model deployment)
将训练好的机器学习模型应用于生产环境的过程,例如部署到Web服务器或集成到应用程序中。 了解更多
模型评估(Model evaluation)
通过使用诸如精度、精确度和召回率等指标,对机器学习模型在特定任务上的性能进行度量的过程。 了解更多
模型选择(Model selection)
从一组候选模型中选择最佳模型的过程,用于解决特定任务。 了解更多
蒙特卡罗方法(Monte Carlo method)
一种利用随机抽样来估计各种未知量的方法。在强化学习中,可以用于估计价值函数或最优策略。 了解更多
多臂赌博机(Multi-armed bandit)
一种强化学习问题,代理必须在一组具有未知奖励分布的动作之间进行选择,并通过尝试和学习来找出哪些动作最有回报。 了解更多
朴素贝叶斯分类器(Naive Bayes classifier)
一种基于贝叶斯概率定理和特征条件独立假设的分类机器学习算法。 了解更多
自然语言处理(Natural language processing)
计算机用于理解、解释和生成人类语言的一门技术。 了解更多
神经网络(Neural network)
一种模仿人脑结构和功能的机器学习算法,由相互连接的“神经元”组成,可以处理和传输信息。 了解更多
归一化(Normalization)
将特征或数据集的值缩放到一个共同的范围,例如[0,1]或[-1,1]的过程。 了解更多
目标检测(Object detection)
识别和定位图像或视频中的物体的过程。 了解更多
本体论(Ontology)
表示特定领域知识内部关系和范畴的系统。 了解更多
最优策略(Optimal policy)
在强化学习问题中,最大化期望累积奖励的策略。 了解更多
最优价值函数(Optimal value function)
在强化学习问题中,对应于最优策略的价值函数。 了解更多
过拟合(Overfitting)
机器学习模型在训练数据上表现良好,但在新的未见数据上表现不佳,因为模型过于复杂,拟合了训练数据中的噪声。 了解更多
模式识别(Pattern recognition)
识别数据中的模式或规律的能力。 了解更多
规划(Planning)
确定实现特定目标的行动方案的过程。 了解更多
策略迭代(Policy iteration)
一种强化学习算法,包括交替评估当前策略和基于学习的价值函数进行改进。 了解更多
预处理(Preprocessing)
为在机器学习模型中使用而准备数据的过程,包括清理、转换和缩放数据。 了解更多
Q-learning
一种强化学习算法,学习估计给定状态下每个动作的未来预期奖励的动作价值函数,也称为Q函数。 了解更多
推理(Reasoning)
根据证据和逻辑论证得出结论的过程。 了解更多
循环神经网络(Recurrent neural network)
一种专门设计用于处理序列数据的神经网络,使用反馈连接允许网络记忆和利用过去的信息。 了解更多
回归(Regression)
一种机器学习技术,基于一组输入特征预测连续数值。 了解更多
强化学习(Reinforcement learning)
一种机器学习类型,代理通过与环境互动并接收奖励或惩罚来通过试错学习。 了解更多
人类反馈强化学习(Reinforcement Learning From Human Feedback)
一种机器学习技术,人工智能系统通过人类用户或教练提供的反馈或奖励进行学习。 了解更多
奖励函数(Reward function)
定义代理在强化学习问题中接受行动的奖励或惩罚的函数。 了解更多
机器人技术(Robotics)
研究和应用机器人和自动化的学科领域。 了解更多
SARSA
一种强化学习算法,使用预期奖励和下一个动作的价值来学习动作价值函数,而不是像Q-learning一样使用最终奖励。 了解更多
语义网(Semantic web)
是互联网的一种扩展,使得机器能够理解网上的数据含义。 了解更多
稳定扩散(Stable Diffusion)
是一种基于深度学习的文本到图像模型,可以根据文本描述生成高度详细的图像。 了解更多
标准化(Standardization)
将特征或数据集的值转换为具有零均值和单位方差的过程。 了解更多
状态空间(State space)
强化学习问题中所有可能状态的集合。 了解更多
状态转移(State transition)
强化学习问题中,代理根据环境的动作和转移概率从一个状态移动到另一个状态的过程。 了解更多
风格迁移(Style transfer)
将一张图像的风格转移到另一张图像上的过程,同时保留第二张图像的内容。 了解更多
超分辨率(Super-resolution)
通过填补丢失的细节来提高图像或视频的分辨率的过程。 了解更多
支持向量机(Support vector machine)
一种用于分类和回归任务的机器学习算法。 了解更多
时序差分学习(Temporal difference learning)
一种强化学习算法,利用时间差异误差(即预测价值与实际未来奖励之间的差异)来更新动作价值函数。 了解更多
文本到图像模型(Text-to-image model)
一种基于自然语言描述生成图像的机器学习系统。 了解更多
训练(Training)
指从数据中学习以提高模型或系统性能的过程。训练是机器学习的基本组成部分,涉及将数据集馈送给模型并调整其参数或权重以优化其针对特定任务的性能。 了解更多
轨迹(Trajectory)
在强化学习问题中代理人所遵循的状态和动作序列。 了解更多
迁移学习(Transfer learning)
一种机器学习技术,指在一个任务上训练的模型能够通过微调或适应应用到一个相关的任务上。 了解更多
欠拟合(Underfitting)
一种现象,当机器学习模型在训练数据和新的未见数据上表现不佳时,这意味着模型过于简单,无法捕捉数据中的潜在模式。 了解更多
值迭代(Value iteration)
一种强化学习算法,通过迭代地改进值函数,直到值函数收敛到最优值函数。 了解更多
变分自编码器(Variational autoencoder)
一种生成模型,包括编码器网络和解码器网络。编码器将输入数据映射到潜在表示,解码器将潜在表示映射回原始数据空间。 了解更多