• 人工智能与信息社会——基于神经网络的智能系统II


    1.【单选题】 (C) 有跟环境进行交互 , 从反馈当中进行不断的学习的过程。

    A 、 监督学习

    B 、 非监督学习

    C 、 强化学习

    D 、 线性回归

    2.【
    单选】

    典型的“鸡尾酒会”问题中,提取出不同人说话的声音是属于(A)

    A.非监督学习

    B.

    线性回归

    C.

    监督学习

    D.

    强化学习

    3.【单选题】 Q 函数 Q(s,a) 是指在一个给定状态 s 下 , 采取某一个动作 a 之后 , 后续的各个状态所能得到的回报的 (A) 。

    A 、 期望值

    B 、 最大值

    C 、 最小值

    D 、 总和

    4.【
    单选】

    在Q-Learning中,所谓的Q函数是指(A)

    A.状态动作函数
    B.策略函数
    C.状态值函数

    D.动作值函数

    5.【单选题】在 ε-greedy 策略当中 ,ε 的值越大 , 表示采用随机的一个动作的概率越 (), 采用当前 Q 函数值最大的动作的概率越 (A) 。

    A 、 大 ; 小

    B 、 大 ; 大

    C 、 小 ; 小

    D 、 小 ; 大

    6.【单选】在强化学习的过程中,学习率α越大,表示采用新的尝试得到的结果比例越____,保持旧的结果的比例越____。(B)

    A.大;大
    B.大;小
    C.小;小

    D.小;大

    7.【单选题】在强化学习过程中 ,(A) 表示随机地采取某个动作 , 以便于尝试各种结果 ;() 表示采取当前认为最优的动作 , 以便于进一步优化评估当前认为最优的动作的值。

    A 、 探索 ; 开发

    B 、 开发 ; 探索

    C 、 探索 ; 输出

    D 、 开发 ; 输出

    8.【单选题】强化学习中 ,(A) 主要探索未知的动作会产生的效果 , 有利于更新 Q 值 , 获得更好的策略。

    A 、 探索

    B 、 开发

    C 、 输入

    D 、 输出

    9.【单选题】马尔可夫性质强调在每一个动作状态序列中 , 下一个状态与 (D) 有关。

    A 、 外部影响

    B 、 主体内因

    C 、 历史状态

    D 、 当前状态

    10.【单选题】强化学习的回报值一个重要特点是具有 (D) 。

    A 、 客观性

    B 、 主体性

    C 、 超前性

    D 、 滞后性

    11.【多选题】用于监督分类的算法有 (ABC) 。

    A 、 支持向量机

    B 、 决策树

    C 、 神经网络

    D 、 线性回归

    12.【判断题】人工智能学习玩 Flappy Bird 过程中 , 只需要人类告诉 AI 不能碰到水管即可 , 不需要提供其他信息。 ( × )

    13.【判断题】状态动作函数直接决定主体该采取什么决策。 (√ )

    14.【填空】在支持向量机分类算法中,用于支撑两个类别最宽分解线的这些样本点称为_______。

    填空:支持向量 或 support vector##%_YZPRLFH_%##Support Vector##%_YZPRLFH_%##Support vector

    欢迎查阅
  • 相关阅读:
    438. Find All Anagrams in a String
    406. Queue Reconstruction by Height
    581. Shortest Unsorted Continuous Subarray
    416. Partition Equal Subset Sum
    124. Binary Tree Maximum Path Sum
    240. Search a 2D Matrix II
    160. Intersection of Two Linked Lists
    6. ZigZag Conversion
    iOS tableView 数据处理,数据分类相同数据整合、合并计算总数总价
    iOS 讯飞语音测试没问题,一上线就用不了了
  • 原文地址:https://www.cnblogs.com/gh110/p/12589050.html
Copyright © 2020-2023  润新知