<kbd id="zvz1jnfx"></kbd><address id="rh6zoxj8"><style id="kmmivv9o"></style></address><button id="q01z41mf"></button>

          Michigan State University main website

          皇冠足彩app的欣策教机自学

          阿伦德欣策

          作为出版 在科幻代 和 techxplore. MSU’s 阿伦德欣策, assistant professor of integrative biology & computer science 和 engineering, wrote this piece for 对话,提供明智的新闻分析和评论,以广大市民的编辑和学者之间的合作无关。看到整个列表 由皇冠足彩app教授的谈话写的文章.

          你是否已经厌倦告诉机器该怎么做,什么不该做的?它是普通人的日子有很大一部分 - 经营洗碗机,智能手机和汽车。它是生命的研究人员和我一样,对人工智能和机器学习工作更加重要的角色。

          这在很大程度上更是无聊比驾驶或跟一个虚拟助理。比如告诉从猫的那些狗除了照片 - - 教学电脑新技能的最常用的方法涉及到很多人的交互或制剂。举例来说,如果一台计算机的外观在猫和标签它的图片“狗”,我们要告诉它这是错误的。

          但是当变得过于繁琐和累人的,它的时间来建立的计算机,可以教自己,并保留所学内容。我的研究团队和我有 采取第一步骤朝向 排序学习人们想象未来的机器人将能够的 - 学习通过观察和体验,而不需要直接告诉怎么做每一个小步骤。我们预计未来的机器那样聪明,因为我们,所以他们需要能够了解像我们这样做。

          设置机器人自由地学习自己

          在培训电脑最基本的方法,本机只能使用它的工程师和程序员专门教信息。例如,当研究人员想要一台机器能图像分类到不同的类别,比如告诉除了猫,狗,我们首先需要其他猫狗开始与一些参考图片。我们展示这些图片的机器,当它的猜测无误,我们给予积极的反馈,当它猜错了我们应用负反馈。

          这种方法,称为强化学习,使用外部反馈教系统改变其内部运作,以便更好的下一次猜测。这种自我改变涉及 识别的因素 那 取得了最大的差异 在算法的决定,加强准确性和阻止错误的决定。

          前进的另一层建立另一计算机系统是主管,而不是人类。这让研究人员创建几个 狗,猫分类 机,各有不同的属性 - 也许有些更仔细的颜色,而其他人在耳朵或鼻子的形状看起来更紧密地 - 并评估它们如何工作。每个每台机器运行时,它看起来在一幅画,做皇冠足彩它认为并会与自动化主管得到的反馈决定。

          备选地或另外,我们的研究人员关掉机器分类不办为好,并介绍至今已经做得很好的那些新的变化。我们重复很多次,引进小突变成分级机的连续几代,慢慢改善自己的能力。这是达尔文进化论的一个数字形式 - 这就是为什么这种类型的训练被称为“遗传算法”。但即使这需要大量的人力劳动 - 并告诉猫和狗分开是一个人一个非常简单的任务。

          学习喜欢的人

          我们的研究正在努力从一个存在于机器学习与人的监督简单的任务的转变,在未来,他们学习复杂的各自的处理程序。这反映了人类智力的发展:如婴儿我们配备了警告我们的物理伤害疼痛感受器,我们有一种本能饥饿或其他方面需要的时候哭了。

          人类婴儿 学到了很多对自己的,也学到了很多直接指令通过 父母专门词汇教学和具体行为。在这个过程中,他们不仅学习如何解释正面和负面的反馈,但是如何分辨出来 - 一切靠自己。我们不是天生就懂得了那句“干得好”的手段积极的东西,而“超时”的威胁意味着消极后果。但我们弄清楚 - 并很快。作为成年人,我们可以设置自己的目标,学习去实现它们完全自主;我们是我们自己的老师。

          我们的大脑添加每个新的经验和洞察力,以我们的能力和记忆,用 能力称为神经可塑性 至 品牌和商店神经元之间的新连接。有 几种方法 在使用 神经可塑性的计算系统,但这些计算方法都还依赖于反馈来自外部监事 - 外部的东西告诉他们什么是正确的和错误的。 (该方法被称为“无监督学习”是不是很准确的命名:它不涉及,可以改变自己的算法,并使用一个过程,从什么人所理解的完全不同的‘学习’)。

          搞清楚一个迷宫拼图

          我的团队和我进行了最近的研究需要对AI系统的第一步用,不需要监督可塑性。在这样一个关键问题涉及到如何得到一台电脑给自己的反馈,是某种有意义的或有效的。

          我们并不真正知道如何做到这一点 - 事实上,它的的事情,我们正在学习,而我们的分析结果中的一个。我们用 马尔科夫的大脑,一种类型的人工神经网络,作为我们研究的基础。但不是直接将它们设计,我们使用了另一种机器学习技术,遗传算法,来训练这些马氏大脑。

          面临的挑战,我们组是解决使用四个按钮,分别向前,向后移动一个迷宫,左,右。但改变了每一个新的迷宫控件的功能 - 使按键这意味着‘向前’的最后一场比赛可能意味着‘左’或在未来的‘落后’。为解决这一挑战的人,奖励将不仅在通过迷宫导航,而且在搞清楚这些按钮是如何改变 - 学习。

          不断发展的一个很好的解决方案,取景器

          在我们的设置,即解决了迷宫最快马氏大脑 - 那学到的控制,并通过迷宫最快速移动的那些 - 幸存下来的遗传选择过程。在过程的开始,每一个算法的行为是非常随机的。正如人类玩家,随机击中按钮将很少穿过迷宫获得 - 但这样的策略将取得成功往往都无所事事,甚至只是一遍又一遍地按下同一按钮。

          如果我们的研究曾参与保持按钮和迷宫结构常数,马尔科夫大脑最终会认识一下按钮意味着,以及如何穿过迷宫获得最迅速。他们会马上打按钮的正确顺序,而不注意环境。这不是那种学习我们瞄准的。

          通过随机按钮配置和迷宫结构这两方面,我们迫使马氏大脑多加注意,按下一个按钮,并注意到变化的情况 - 该按钮穿过迷宫搬到什么方向,这是否是朝一个死胡同或一个壁或开放通路。这是更先进的学习,以确保万无一失。但进化马尔可夫大脑导航仅使用一个或两个按钮配置仍然可以做得很好:这将解决至少某些迷宫非常快 - 即使它并没有在所有的解决等。不提供,我们正在寻找对环境的适应性。

          遗传算法,它决定哪些马氏大脑来选择进一步发展和停止,关键是优化响应环境。我们告诉它选择了迷宫的最佳整体解决者(而不是那些被瞬息万变的一些迷宫,但完全未能解决等)马尔科夫脑筋,选择通才过专家。

          经过多代,这个过程中产生马氏大脑是特别敏锐的变化,从在解释按下特定的按钮,非常好的结果什么那些均:“按下按钮移至左侧带我走进了死胡同;我应该按按钮向右移动,以获得有出“。

          正是这种能力来解释,从监督学习的外部反馈解放了遗传算法马尔可夫大脑神经系统的意见。马尔科夫的大脑已经为他们创造改变的方式,导致在正确的时间更频繁地按下正确的按钮其结构内部反馈能力,有针对性地选择。从技术上说,我们发展马氏大脑能够自己学习。

          这确实是非常类似人类如何学习:我们试一下,看看发生了什么,并使用效果做的更好的下一次。所有这一切发生的我们的大脑中,而不需要外部引导。

          我们的工作 增加了一个新的方法,以机器学习领域,而且我们认为需要对发展所谓的“一般人工智能”,也可以了解自己的新信息和新技能系统的重要一步。这也开启了大门使用计算机系统 测试如何学习实际情况.

          阿伦德欣策通过综合生物学和计算机科学与工程学院,助理教授 今天MSU

          评论被关闭。

              <kbd id="6salp5rd"></kbd><address id="eppcc77v"><style id="3w4z7325"></style></address><button id="dc65qxqg"></button>