AI基础

吴恩达课堂笔记

在人工智能(AI)领域,ANIAGI 是两种不同层次的智能系统,具体如下:


1. ANI(Artificial Narrow Intelligence)——人工狭义智能

  • 定义:专注于执行特定任务的人工智能。

  • 特点

    • 只能在特定领域内表现出智能行为。
    • 没有通用的理解能力,也无法跨任务泛化。
  • 示例

    • 语音识别(如 Siri)
    • 图像识别(如自动标记照片)
    • 游戏 AI(如《围棋 AlphaGo》)
    • 推荐系统(如抖音推荐算法)

2. AGI(Artificial General Intelligence)——人工通用智能

  • 定义:具有人类水平的智能,能够在多种任务中灵活适应、学习、推理和解决问题。

  • 特点

    • 能像人类一样学习各种知识和技能。
    • 能够跨领域迁移知识,比如学会下围棋的 AI 也可以理解物理、写小说。
    • 具备自主决策、推理、规划和情感理解能力。

3. 机器学习

机器学习(Machine Learning,简称 ML) 是人工智能(AI)领域的一个核心分支,它的本质是让计算机通过数据学习规律,从而在没有明确编程指令的情况下完成某些任务。建立正确的,从A到B的映射

机器学习的主要类型:

类型 名称 简要说明 举例
监督学习 Supervised Learning 给定输入,学会预测输出。(需要大量数据,不过当性能达到一定水平时,不会随着数据量提高而提高性能) 图像识别、房价预测
无监督学习 Unsupervised Learning 只有数据,没有“正确答案”,发现数据结构 客户分类、聚类分析
强化学习 Reinforcement Learning 通过“奖惩反馈”学会策略 游戏AI、自动驾驶决策

4. 机器学习可能需要一些数据:

在机器学习中,数据是核心资源。模型的表现很大程度上取决于数据的质量、种类和获取方式。

一、数据获取方式

  1. 人工标注
  • 通过人力对数据打标签,构建有监督学习所需的数据集。

  • 示例:图片打标签(猫/狗)、文本情感分类(正面/负面)。

  • 优点:标签准确,适用于训练高精度模型。

  • 缺点:耗时、成本高。

  1. 行为观察
  • 通过用户行为、传感器或系统日志自动采集数据。

  • 示例:用户点击行为、电商购买记录、自动驾驶传感器数据。

  • 适合做行为预测或推荐系统。

  1. 第三方数据
  • 从外部机构或平台购买或获取数据集。

  • 示例:开源数据集(如 ImageNet、COCO)、政府公开数据等。

  • 注意版权与合规性问题。


二、数据的类型与特点

  1. 结构化数据
  • 表格形式,字段固定,易处理。

  • 示例:Excel、数据库中的表格。

  • 常用于金融、电商等传统行业建模。

  1. 非结构化数据
  • 格式不规则,难以直接处理。

  • 示例:文本、图片、音频、视频。

  • 需要先进行预处理(如分词、图像切割等)才能用于训练。

  1. 数据质量问题
  • ⚠️ 真实世界中的数据往往并不完美,常见问题包括:

    • 缺失值(如某些字段为空)

    • 错误值(如异常数字、输入错误)

    • 不一致(同一意思用不同写法)

    • 偏差或不均衡(某些类别样本太多或太少)

    • 冗余或重复数据

  • → 数据清洗、增强和标准化是训练前的重要步骤。


三、关于数据集构建的建议

  • 如果你想自行构建数据集并“投喂”给 AI 进行训练或微调:

    • 建议采用实时性采集:持续收集用户行为或系统反馈,构建动态更新的数据集。

    • 与 AI 团队协同:与研发或模型训练团队沟通,获得关于:

      • 数据格式要求

      • 标签规范

      • 目标任务定义

      • 模型反馈机制(用于调优数据)

    • 持续迭代:数据集不是一次性构建完的,它应随着模型的表现不断更新与优化。

5. 数据科学(Data Science):

定义

  • 从海量数据中提取有价值的信息、模式和知识,从而支持决策或自动化任务。

6. 神经网络(深度学习)

神经网络(Neural Network) 是一种机器学习的方式,是深度学习的核心技术。

  • 人工神经网络通过层与层之间的连接和权重来处理数据。

7. 一般AI转型的步骤

  1. 先通过试点小项目去积攒动能。
  2. 组建一支AI团队。
  3. 提供宽广的AI知识培训。
  4. 发展AI策略。
  5. 记录公司的AI方向。

8. AI能做的和不能做的(经验之谈,严谨判断是一个复杂的过程)

  1. 能在一秒内思考到的

9. Boids算法

10.A*算法


AI基础
https://weihehe.top/2025/07/12/AI概念/
作者
weihehe
发布于
2025年7月12日
许可协议