RUI

持续更新 EMNLP2020 Summarization

99封情书 提交于 2020-10-10 12:53:15
Long Multi-Fact Correction in Abstractive Text Summarization . Yue Dong, Shuohang Wang, Zhe Gan, Yu Cheng, Jackie Chi Kit Cheung and Jingjing Liu. Unsupervised Reference-Free Summary Quality Evaluation via Contrastive Learning. Hanlu Wu, Tengfei Ma, Lingfei Wu, Tariro Manyumwa and Shouling Ji. Multi-document Summarization with Maximal Marginal Relevance-guided Reinforcement Learning. Yuning Mao, Yanru Qu, Yiqing Xie, Xiang Ren and Jiawei Han. MLSUM: The Multilingual Summarization Corpus. Thomas Scialom, Paul-Alexis Dray, Sylvain Lamprier, Benjamin Piwowarski and Jacopo Staiano. Stepwise

ICLR 2020 | 多模态下使用图片信息显著增强机器翻译效果

我的未来我决定 提交于 2020-09-26 15:55:38
论文标题: Neural Machine Translation with Universal Visual Representation 论文作者: Zhuosheng Zhang, Kehai Chen, Rui Wang, Masao Utiyama, Eiichiro Sumita, Zuchao Li, Hai Zhao 论文链接: https://openreview.net/forum?id=Byl8hhNYPS 收录情况: ICLR 2020 (Spotlight) 代码链接: https://github.com/cooelf/UVR-NMT 长期以来,机器翻译都只涉及到文本之间的转换,但实际上,人的感知功能可以是“多模态”的。 本文提出一种通用的视觉表征,将图片信息融合到机器翻译模型中。 使用这种视觉知识融合方法, 不需要额外的 双语-图片 标注数据,模型就能够在多个数据集上取得显著的效果提升。 多模态与机器翻译 机器翻译是两种语言间的转换,比如“A dog is playing in the snow”翻译为中文就是“小狗在雪地里玩耍”。 但人类理解世界不只是用文字,还有视觉、听觉等感知能力;并且翻译的过程需要保持“语义”不变。比如下面的图: 讲中文的人会说“小狗在雪地里玩耍”,而讲英文的人会说“A dog is playing in the snow”

C++ 将汉字转换成拼音全拼

北城以北 提交于 2020-08-17 14:17:53
#include < string > using std:: string ; // ================================================================== /* * 功能: 将汉字转换成拼音全拼,例如将“马兆瑞”转换成“mazhaorui”。(“妈ma521”可转换成“mama521”) @param[in] Chinese:要转换的汉字字符 @param[out] PinYin:转换后的拼音字符 @par修改记录: * */ // ================================================================== void GetPinYin(unsigned char * Chinese, string & PinYin); void main() { unsigned char chinese[] = " 马兆瑞 " ; string pinyin; GetPinYin(chinese, pinyin); int dsa = 1 ; } string pinyin[] = { " a " , " ai " , " an " , " ang " , " ao " , " ba " , " bai " , " ban " , " bang " , " bao " ,

Diary (2020暑期集训日记&总结)

家住魔仙堡 提交于 2020-08-16 14:15:57
2020.08 2020.8.15 Splay 第一次在blog里粘代码 每天一棵 \(Splay\) 好一个调解心情 #include <iostream> #include <cstring> #include <cstdio> #include <algorithm> #define debug puts("hs") using namespace std; inline int read(){ int x = 0, w = 1; char ch; for(; ch > '9' || ch < '0'; ch = getchar()) if(ch == '-') w = -1; for(; ch >= '0' && ch <= '9'; ch = getchar()) x = x * 10 + ch - '0'; return x * w; } const int ss = 100010; const int inf = 0x7fffffff; struct node{ int son[2]; int size, num, val, fa; }tr[ss << 1]; int root, cnt; inline void update(int x){ tr[x].size = tr[tr[x].son[0]].size + tr[tr[x].son[1]].size + tr

Diary (2020暑期集训日记&总结)

家住魔仙堡 提交于 2020-08-16 10:53:49
2020.08 2020.8.15 Splay 第一次在blog里粘代码 每天一棵 \(Splay\) 好一个调解心情 #include <iostream> #include <cstring> #include <cstdio> #include <algorithm> #define debug puts("hs") using namespace std; inline int read(){ int x = 0, w = 1; char ch; for(; ch > '9' || ch < '0'; ch = getchar()) if(ch == '-') w = -1; for(; ch >= '0' && ch <= '9'; ch = getchar()) x = x * 10 + ch - '0'; return x * w; } const int ss = 100010; const int inf = 0x7fffffff; struct node{ int son[2]; int size, num, val, fa; }tr[ss << 1]; int root, cnt; inline void update(int x){ tr[x].size = tr[tr[x].son[0]].size + tr[tr[x].son[1]].size + tr

Diary (2020暑期集训日记&总结)

半腔热情 提交于 2020-08-14 22:50:29
2020.08 2020.8.8 日常早晨更总结 学长出题是真心不错 尤其是数据 最起码没有什么奇奇怪怪的算法卡到了高分 感觉下午讲课有点小困 但是晚上听课就兴奋的一批 思维在状态效率也高(才不是夜猫子本质) 可能是因为刚锻炼完比较兴奋? 不过总体效果还挺好的 一诺学姐很认真也很有耐心 (省略夸奖词一千字) 筒子们讨论也挺积极 最后立哥又补充了一个相当优秀的做法 收获颇丰 给学长学姐点赞 考试T4是个2——SAT 没练习就考了 考场就这呗 我的内心 2020.8.7 啊这,跳闸了 总结和代码全没了 爷吐了 早晨来了之后 显示屏烧了 结果换了一块还这样? 换了线还这样? 那就是——主机烧了…… 跑到后面发现小坤的主机也烧了 系统启动不了了 这断电断的 真要命 查了几个主机 要么启动不了 要么就只有win7 辗转近十几台电脑终于搬出来俩能用的 总之换上了 真就信奥=会修电脑 行了以后妹子可以找我们修电脑了 没鞋穿了啊 白鞋有两双洗了 还一双太白不舍得穿 (其实都不舍得) 一双新的也不舍得穿 正好还要下雨 穿个沙滩鞋就算了 反正也没啥人 晚上学长讲课2——SAT还有二分图 感觉不是很难吧 但是还没咋做题 老姚昨天找谈话了 说不静 确实不静 细节处理不好 需要磨 自己扣吧还是 少看题解 把之前做的勉强的题重新做做 比做新题强 前期应该会很痛苦的吧 还是坚持一段时间试试先 肯定会有收获的

C++ 将汉字转换成拼音全拼

半城伤御伤魂 提交于 2020-08-13 16:43:39
#include < string > using std:: string ; // ================================================================== /* * 功能: 将汉字转换成拼音全拼,例如将“马兆瑞”转换成“mazhaorui”。(“妈ma521”可转换成“mama521”) @param[in] Chinese:要转换的汉字字符 @param[out] PinYin:转换后的拼音字符 @par修改记录: * */ // ================================================================== void GetPinYin(unsigned char * Chinese, string & PinYin); void main() { unsigned char chinese[] = " 马兆瑞 " ; string pinyin; GetPinYin(chinese, pinyin); int dsa = 1 ; } string pinyin[] = { " a " , " ai " , " an " , " ang " , " ao " , " ba " , " bai " , " ban " , " bang " , " bao " ,

mysql实现汉字换拼音,及汉字转简拼

你说的曾经没有我的故事 提交于 2020-08-05 18:58:26
我们实现汉字转拼音,需要结束代码包来完成,但是有个问题 ,针对多音字,会把排列组合的所有方式 全部打印出来. 比如 地区名,都是不需要多音字的,只有一个拼音发音是正确的. 下边 我们来实现 汉字转拼音的方法 -- 创建 拼音音节基础表 CREATE TABLE IF NOT EXISTS t_base_pinyin ( pinyin_code varchar(255) CHARACTER SET gbk NOT NULL, pinyin_id int(11) NOT NULL, PRIMARY KEY ( pinyin_id ) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; -- 初始化拼音音节 INSERT INTO t_base_pinyin (pinyin_code,pinyin_id) VALUES ('a', 20319),('ai', 20317),('an', 20304),('ang', 20295),('ao', 20292),('ba', 20283),('bai', 20265),('ban', 20257),('bang', 20242),('bao', 20230),('bei', 20051),('ben', 20036),('beng', 20032),('bi', 20026),('bian', 20002),(

kafka分区失败的原因分析

£可爱£侵袭症+ 提交于 2020-04-06 18:35:30
之前无论采取哪种分区模式都无法进行分区 生产者的分区的分割器 分区选择在多个分区存在的情况下,决定将消息发送到哪个分区. sarama有多个分割器: sarama.NewManualPartitioner() //返回一个手动选择分区的分割器,也就是获取msg中指定的`partition` sarama.NewRandomPartitioner() //通过随机函数随机获取一个分区号 sarama.NewRoundRobinPartitioner() //环形选择,也就是在所有分区中循环选择一个(徐工) sarama.NewHashPartitioner() //通过msg中的key生成hash值,选择分区, 我建议是第3种,刚好均匀分区, 目前我已经修改为5个默认分区,到时候可以均匀分配, 参考文献 https://blog.csdn.net/qq_32292967/article/details/78675116 原因截图 没有设置分区个数(默认为1),单分个数设置为5个是,同一主题下的数据会被分为5个区,进行保存。 生产者在push数据时,记得设置分区策略。 测试代码 /* * @Author: Rui XuLe * @Date: 2019-07-12 22:40:03 * @Last Modified by: Rui XuLe * @Last Modified time: