AI的过去,现在与将来

AI入门科普,介绍AI是什么,传统的AI和现代AI的研究方法和工具,AI的主要分支和难点。
展开查看详情

1.AI 的过去,现在与将来 Presented by 苏佳琪

2.关于我 苏佳琪 ,康奈尔大学计算机专业毕业,即将前往普林斯顿大学攻读图像视觉/机器学习方向的 博士学位 , 主要 感兴趣于神经网络和深度学习。 Email : fromsujiaqi@gmail.com

3.AI 正在革新人类生活...

4.什么是 AI ? 人工智能的定义: 由人工制造出来的系统所表现出来的智能 人工智能的研究主题: 研究与设计可以观察周围环境并作出行动以达到目标的系统 人工智能的核心问题: 推理、知识、规划、学习、交流、感知、移动和操作物体的能力等 人工智能的概念提出 于 1956 年达特茅斯夏季人工智能研究会 。 与会者在接下来的数十年 间是 AI 研究的领军人物,然而 领域内过于乐观地估计了 达到人类智能的机器 的出现时间 。 在半个多世纪的发展中,人工智能历经多次低谷和发展停滞。 20 世纪末,受益于计算机计算速度和内存容量的高速增长, AI 发展再次进入热潮。

5.经典 AI 算法 知识表达与推理 用 形式逻辑(Formal Logic) 表达知识和推理规则;逻辑编程语言 专家系统 Expert System 由知识库和推理机组成;根据某领域专家提供的知识和经验,进行推理和判断,获取新的知识,模拟人类专家的决策过程。 搜索树 Search Tree 通过反复搜索可能的操作及其后果,找到达到目标状态的路径 例如 BFS , DFS , A* Search 以及 Miniamx Tree 结合 博弈论思想,广泛应用于游戏 中 20 世纪 50 年代到 80 年代的研究主流,希望利用一套统一的符号表达概念和规则,计算机通过对符号进行运算与推理实现智能。本质是模仿人类的抽象思维模式。

6.局限 指数级增长的计算需要和存储空间需要 系统的设计 需要大量 专业领域内知识 ,无法推广到其它领域 受限制于人 本身 思考时 的 计算复杂程度, 系统的成长依赖于专家 能完成的任务类型较少 ......

7.现代 AI 算法 20 世纪末至今的研究主流,将 AI 问题简化成基于经验数据的 优化问题 (Optimization Problem) ,让机器在寻找最优解过程中从数据中学习知识,机器学到的知识和规律不受人为控制。 其大量运用统计学方法和概率模型,关注优化方程的设计和最优解求解方法,依赖于数据和数值运算。 训练: 人为提供给系统输入数据和对应的事实输出数据,系统通过不断调整自身的参数使自己的输出接近事实输出,即最小化损失函数。 测试: 计算系统对新的输入数据的输出与实际结果的差距, 衡量系统的实际表现

8.神经网络及 深度学习 核心是人工神经网络Artificial N eural N etworks, 训练的 目标是找到最优的一组权重值。 基于各个领域应用,神经网络也有了很多变种,但核心思想依然是构造携带运算的网络。

9.深度学习的成功依赖于 百万级数据集 图像领域 : ImageNet 、 Pascal VOC 、 MS COCO ,上千万张带有人工标注的图片,涵盖上千类物体,广泛地用于学习物体识别与情景分析。 音频领域: Million Song Dataset,一百万歌曲和流派风格标注,用于学习音乐分类和相似推荐。 文字领域: Amazon reviews、Sentiment140,上千万社交媒体短文,用于自然语言理解和情感分析。 深度学习 即对有多个隐层的神经网络的学习: 能 表达对于普通算式过于复杂的方程 能通过参数储存大量信息 拥有成熟的优化损失函数的方法

10.AI 的分支领域 自然语言处理 图像视觉 机器人 机器学习 游戏 规划 / 演绎推理

11.机器学习 监督学习 Supervised Learning - 训练集 有 输入 与 输出 Linear/Nonlinear Regression , Decision Tree ,K -Nearest Neighbors , Naive Bayes , Support Vector Machine 无监督学习 Unsupervised Learning - 训练集只有输入 K-Means Clustering, Hierarchical Clustering , Mixture Models 增强学习 Reinforcement learning 在环境给予的奖励或惩罚的刺激下,使系统逐步形成对刺激的预期,产生利益最大化的习惯性行为。 机器学习算法是一类从数据中自动分析获得规律,并利用规律对未知数据进行预测的算法。它已发展为一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、计算复杂性理论等多门学科。

12.K-Means Clustering Decision Tree

13.图像视觉 核心是卷积 神经 网络 Convolutional Neural Network,可以直接对象素进行学习,特点是对每个局部领域都做相同的操作 计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和计算机代替人眼对目标进行识别、跟踪和测量等,并进一步做图像处理 。如今,它的应用更加广泛,如图像生成、图像风格变换等

14.该网络可以用于识别手写数字,包含了一些网络基本模块,比如说卷积层,上、下采样层,全连接层。

15.

16.自然语言处理 语料库 语法树 Hidden Markov Chain Google Word2Vec 模型 Baidu DeepVoice 模型 自然语言处理探讨如何让电脑 “ 懂 ” 人类的语言,包括文本朗读 (Text-to-Speech), 语音合成 (Speech synthesis) ,语音识别,自然语言生成,语法分析,机器翻译,信息检索和抽取,情感分析等。该领域起步较早,有相对成熟的传统方法解决方案。

17.面临的挑战 计算机计算能力和存储能力依然是瓶颈 急需建立各个领域的大数据集 是否需要更接近人类大脑的网络模型? 伦理道德问题 ......

18.前沿力量 Google DeepMind和Google Brain Team Amazon AWS Baidu AI Tencent AI Lab 和优图 Stanford , MIT , CMU 等高校 ......

19.Q&A Email: fromsujiaqi@gmail.com