AI基础
吴恩达课堂笔记
在人工智能(AI)领域,ANI 和 AGI 是两种不同层次的智能系统,具体如下:
1. ANI(Artificial Narrow Intelligence)——人工狭义智能
定义:专注于执行特定任务的人工智能。
特点:
- 只能在特定领域内表现出智能行为。
- 没有通用的理解能力,也无法跨任务泛化。
示例:
- 语音识别(如 Siri)
- 图像识别(如自动标记照片)
- 游戏 AI(如《围棋 AlphaGo》)
- 推荐系统(如抖音推荐算法)
2. AGI(Artificial General Intelligence)——人工通用智能
定义:具有人类水平的智能,能够在多种任务中灵活适应、学习、推理和解决问题。
特点:
- 能像人类一样学习各种知识和技能。
- 能够跨领域迁移知识,比如学会下围棋的 AI 也可以理解物理、写小说。
- 具备自主决策、推理、规划和情感理解能力。
3. 机器学习
机器学习(Machine Learning,简称 ML) 是人工智能(AI)领域的一个核心分支,它的本质是让计算机通过数据学习规律,从而在没有明确编程指令的情况下完成某些任务。建立正确的,从A到B的映射。
机器学习的主要类型:
类型 | 名称 | 简要说明 | 举例 |
---|---|---|---|
监督学习 | Supervised Learning | 给定输入,学会预测输出。(需要大量数据,不过当性能达到一定水平时,不会随着数据量提高而提高性能) | 图像识别、房价预测 |
无监督学习 | Unsupervised Learning | 只有数据,没有“正确答案”,发现数据结构 | 客户分类、聚类分析 |
强化学习 | Reinforcement Learning | 通过“奖惩反馈”学会策略 | 游戏AI、自动驾驶决策 |
4. 机器学习可能需要一些数据:
在机器学习中,数据是核心资源。模型的表现很大程度上取决于数据的质量、种类和获取方式。
一、数据获取方式
- 人工标注
通过人力对数据打标签,构建有监督学习所需的数据集。
示例:图片打标签(猫/狗)、文本情感分类(正面/负面)。
优点:标签准确,适用于训练高精度模型。
缺点:耗时、成本高。
- 行为观察
通过用户行为、传感器或系统日志自动采集数据。
示例:用户点击行为、电商购买记录、自动驾驶传感器数据。
适合做行为预测或推荐系统。
- 第三方数据
从外部机构或平台购买或获取数据集。
示例:开源数据集(如 ImageNet、COCO)、政府公开数据等。
注意版权与合规性问题。
二、数据的类型与特点
- 结构化数据
表格形式,字段固定,易处理。
示例:Excel、数据库中的表格。
常用于金融、电商等传统行业建模。
- 非结构化数据
格式不规则,难以直接处理。
示例:文本、图片、音频、视频。
需要先进行预处理(如分词、图像切割等)才能用于训练。
- 数据质量问题
⚠️ 真实世界中的数据往往并不完美,常见问题包括:
缺失值(如某些字段为空)
错误值(如异常数字、输入错误)
不一致(同一意思用不同写法)
偏差或不均衡(某些类别样本太多或太少)
冗余或重复数据
→ 数据清洗、增强和标准化是训练前的重要步骤。
三、关于数据集构建的建议
如果你想自行构建数据集并“投喂”给 AI 进行训练或微调:
建议采用实时性采集:持续收集用户行为或系统反馈,构建动态更新的数据集。
与 AI 团队协同:与研发或模型训练团队沟通,获得关于:
数据格式要求
标签规范
目标任务定义
模型反馈机制(用于调优数据)
持续迭代:数据集不是一次性构建完的,它应随着模型的表现不断更新与优化。
5. 数据科学(Data Science):
定义
- 从海量数据中提取有价值的信息、模式和知识,从而支持决策或自动化任务。
6. 神经网络(深度学习)
神经网络(Neural Network) 是一种机器学习的方式,是深度学习的核心技术。
- 人工神经网络通过层与层之间的连接和权重来处理数据。
7. 一般AI转型的步骤
- 先通过试点小项目去积攒动能。
- 组建一支
AI
团队。 - 提供宽广的
AI
知识培训。 - 发展
AI
策略。 - 记录公司的
AI
方向。
8. AI能做的和不能做的(经验之谈,严谨判断是一个复杂的过程)
- 能在一秒内思考到的