本文写于 2019年12月24日,距今已超过 1 年,距 2020年10月12日 的最后一次修改也已超过 3 个月,部分内容可能已经过时,您可以按需阅读。如果图片无法显示或者下载链接失效,请给我反馈,谢谢!


0 0 投票数
评分

Building Dialog Systems with Less Supervision 讲座笔记

参加 Building Dialog Systems with Less Supervision 讲座笔记

  • 2019 年 12 月 24 日,于华东师范大学计算机科学与技术学院,参加 Building Dialog Systems with Less Supervision 讲座
  • 报告题目:Building Dialog Systems with Less Supervision
  • 报告人:Zhou Yu, Assistant Professor, UC Davis

Lack of data is the number one challenge in deploying end-to-end trainable dialog systems for real-world applications. This talk will cover how to use learning methods to train a good model with less supervision. We will talk about how to integrate data augmentation, intermedia scaffolds, meta-learning to move towards the next-generation data-efficient dialog systems. We will briefly describe how to ensure the safety of the deployed system as well.

报告摘要

实际应用:与 ETS 合作;进行 PTSD 治疗

与 QA 的区别:可能存在多个来回

难点:1024 token,如何track?数据很难找到,网上的数据对我没用?domain 之间不通用?dialog 没有固定的 reference based?只能 human evaluation,真人评价?人和人不一样,难以 sample,怎么 trade off?reduce?靠增加 number of data point 还是更细致的标注?

目前已有的基本框架

目前已有的框架

实例

实例:订饭店

需要记住最重要的内容,例如:记住 price 要 moderate、location 是 east

知道了重要的东西以后下一步有一个计划,看到这两样东西,要知道 map 到什么地方——这一步反而简单,只要 learning 就行,最后变成自然语言,有现成的工具

存在的问题:一旦改变了任何一个环节的实现,四个 model 需要同时改变,需要 user label,即大量的人力

比较大的数据量,难以分析

现在俞老师的团队做的是 Plug and Play,四个 module 都可以喂,不是把 output 给下一个,而是给 state,可以 end 2 end 做 train,比较 flexible

保证四个 loss 都是最小的四个,都是单独的模型,NLG 就是比较简单的,没有加其他 regular 之类的东西 60% 的数据能跑的一样好,少了 supervision

没有点数据就不 update loss

目前的优势有以下 6 点

rade off 了,看需要哪些数据

没有任何 anotation 的

用一个hmm?效果不是好,非常 sparse,viriational-rnn,变成 discrete

当前的处于哪一个,看 optimal 的指向哪个,divergent,之前 learning 差值做成 reward,说明还是不错的,很快就能收敛

可以和 reputation 别的 reward 合在一起、可以帮助了解没有 label 的 data

利用数据多的 domain 去提高数据少的 domain

2 step update,拉平,避免对最近做的 domain 过于多的信赖

0 0 投票数
评分
发表留言
订阅评论
提醒
guest

在点击发表评论按钮时,网络请求的数据包含浏览器版本、操作系统版本和 IP 地址;您的网络服务提供商、雇主或学校、政府机构可能会看到您的访问活动;根据浏览器默认行为、操作系统设置和安全防护软件的设置不同,您的浏览器可能会也可能不会在本地 Cookies 缓存您输入的用户名、邮箱以便下次评论使用。

请对自己的言行负责。

您想以什么身份发表评论
邮箱将在您的评论被回复时给您通知
(可选)如果您也有个人网站,不妨分享一下
我对这篇文章的评分
这篇文章给您带来多大帮助
0 评论
内联反馈
查看所有评论