emoji

Chat with Milvus #12 :新版本、Postgres向量检索插件、比Faiss好用?

落爺英雄遲暮 提交于 2020-08-11 13:52:55
视频: 5分钟快速一览Milvus v.0.9.0 新功能 | Milvus Q&A 与文字实录 视频: Milvus问答#11- 分布式数据库与Milvus 分布式 Attendee= 参会者 Attendee A: 我现在只是属于试用阶段,还没有经过一个比较完整的使用场景的考验,所以现在主要就是说想学习一下,看看别人都是应用到什么样的场景。我们现在实际用的就是一个句子相似性的应用场景,只做了一个很小的测试,没有遇到很明显的问题。之前觉得检索的准确率不是很高,但是有一个人建议说我做向量的归一化,我还没有做测试,所以还不知道结果,就是这么一个情况。 顾老师@ Milvus: 所以您那边是一个自然语言处理的场景是吧? Attendee A: 对,第一步是自然语言处理,然后后面可能就是说会用句子来搜图,然后图搜句子的这样的也会尝试一下。 顾老师@ Milvus: 句子来搜图的话,您这边图片都是有标签的吗? Attendee A: 对,就是说就类似于那种表情图。一开始会试一些表情图。 顾老师@ Milvus: 明白了,所以你们主要是现在还是在搜索,先帮助大家去搜索表情包是吗? Attendee A: 对。 顾老师@ Milvus: 然后给这些表情包打上一些文字的这种标签,然后通过比如说用户给个句子,然后互相提取语义,然后去做匹配的搜索,是这样的一种效果是吧? Attendee A: 对。

补全Windows10中的emoji 替换系统emoji字体

生来就可爱ヽ(ⅴ<●) 提交于 2020-08-11 12:48:19
先上效果图 下面开始教程 github.com/eosrei/twemoji-color-font#install-on-windows 打开上面这个网站 下载如图所示两个工具 一个是Python(已经装过Python可以不下) 另一个是软件本体 下载完成后解压第二个压缩包 以管理员身份运行install.cmd 首次运行会下载所需的组件,并生成字体 速度可能比较慢 耐心等待 生成完字体后会让你按Y安装两个字体,按Y安装(不装也行) 到这一步不要以为已经完事了,其实Windows10会阻止你替换掉这两个字体,你点了安装其实根本没装上!!! 重点来了 按照上图所示将 Segoe UI Emoji with Twemoji.ttf 重命名为 seguiemj.ttf Segoe UI Symbol with Twemoji.ttf 重命名为 seguisym.ttf 等会为了方便敲命令 在C盘根目录随便建立一个文件夹 并把刚才重命名好的字体复制过来 记住路径 记住路径 记住路径 然后按照以下步骤进入命令行模式(PE里操作也行) 进入命令行模式后输入xcopy c:\刚才你建的文件夹 c:\windows\fonts 不出意外会问你是否替换文件 Y确定 N取消 A全部 按A全部替换 最后重启电脑即可 ———————————————— 版权声明:本文为CSDN博主「天天的作死」的原创文章

cocos2dx在C++层屏蔽emoji表情

China☆狼群 提交于 2020-08-10 18:13:04
在某些时候不希望用户输入emoji表情,所以需要将其过滤掉,屏蔽字符串中emoji表情方法如下: string check_input_str(const string& str ) { if (!str.compare("")) { return ""; } unsigned unicode; string ret; for (int i = 0; i < str.size(); i++) { char codePoint = str[i]; if (codePoint&0x80) { switch ((unsigned)(codePoint & 0xf0)) { case 0xf0: //0x9f -> emoji if ((unsigned)(str[i + 1] & 0x9f) != 0x9f) { for (int j = 0; j < 4; ++j) { ret.push_back(str[i + j]); char a = str[i + j]; } i+=3; } break; case 0xe0: for (int j = 0; j < 3; ++j) { ret.push_back(str[i + j]); } i+=2; break; case 0xc0: for (int j = 0; j < 2; ++j) { ret.push_back(str[i +

图片转换emoji马赛克-emoji-mosaic

梦想的初衷 提交于 2020-08-10 09:33:53
emoji -mosaic是一款可以把图片转换为 emoji 表情拼成的马赛克图片的开源小工具,作者是New york Time的开发人员Eric Andrew Lewis。软件遵守MIT开源协议。 emoji -mosaic能识别照片中的颜色值,然后匹配相应颜色的 emoji 表情,最后自动组成密集emoji 表情拼接的“马赛克”图片。 GitHub 仓库挂件 WordPress 插件 ericandrewlewis / emoji-mosaic 这个仓库没有描述或主页。 https://github.com/ericandrewlewis/emoji-mosaic 638 115 Download ZIP 相关文件下载地址 本地直接下载 来源: oschina 链接: https://my.oschina.net/u/4412486/blog/4316392

第06期:梳理 MySQL 字符集的相关概念

大城市里の小女人 提交于 2020-08-09 20:28:06
此篇介绍 MySQL 字符集、排序规则、相关的元数据、参数等设置以及使用情况。 概念 字符集的内容包含: 字符集 (character set)和 排序规则 (collation rule) 每种字符集可对应一到多个排序规则,每种排序规则对应一种字符集 字符集是一套字符与一套编码的映射集合,像这样: 字符 编码 A 0 B 1 … … 排序规则是字符集内用来比较每个字符的一套规则,也就是字符的排序方式 比如要比较字符 A 和 B 的大小,最简单直观的方法就是对比他们对应的编码。显然编码 0 < 1,这种规则下 A < B。那么类似这样的规则集合就是排序规则。单字节字符编码如此,多字节的编码排序也以此类推。 那么接下来我来详细介绍下字符集相关的介绍以及使用场景。 一、字符编码的分类 1、 ASCII 用途:用来映射简单的单字节字符,比如大小写英文字母,阿拉伯数字,及常用的标点符、运算符、控制字符等。 编码范围: U+0000 - U+007F 注意:对于用这类字符的场景够用了,但是却无法表达比如汉字,日文等编码。 2、UNICODE 用途:用来映射包含 ASCII 以内的其他的所有字符。 编码范围: U+0000 - U+10FFFF 注意:ASCII 是 UNICODE 的子集,ASCII 编码的字符可以无损转换为 UNICODE 编码的字符。 二、MySQL 常用字符集 1

文字渲染一探

社会主义新天地 提交于 2020-08-09 11:55:16
引子 近一个月都在与字体打交道,查阅了不少资料。 发现国内很少有这方面的一些资源,有点奇怪。 故此,想稍微梳理一下这方面的一些资料以及信息,方便对这方面感兴趣的朋友参阅。 文字渲染的组成 文字渲染严格意义上来说包含几个主要的核心模块,分别是: 1.字体光栅化 FreeType 它是一个软件字体引擎,它被设计成小巧、高效、可高度定制和可移植,同时能够生成高质量的输出(字形图像)。它还可以用于图形库、显示服务器、字体转换工具、文本图像生成工具和许多其他产品。 2.字体适配 Fontconfig 主要用于配置、定制管理系统里的 字体 ,简单的说就是通过给出的字体信息,例如粗体,斜体等,找到现有系统中最匹配的这些特征的字体文件。 3.Unicode文本双向算法 FriBidi 主要用来转换不同语系中存在的文本方向问题,例如右向左的文本, 翻转后为左向右顺序的文本。 4.文字塑形 HarfBuzz HarfBuzz是一种文字塑形布局引擎(text shaping library),它主要将Unicode转换为格式正确且位置正确的字形输出。 简单地说就是用于适配全世界不同语言的文字编码布局。 另一个非常知名库是 ICU ,而HarfBuzz的实现中将其作为第三方库引入 5.布局渲染 Cairo 或 Skia Graphics Library 当你拿到字体字形的数据之后,毫无疑问,

Discourse 如何限制注册用户的密码长度

烈酒焚心 提交于 2020-08-08 22:48:50
在默认的情况下 Discourse 限制用户输入密码的长度要超过 10 个字符。 这个实在是太长了,用户交互性不好。 如何修改这个密码长度到 6 位? 你可以登录后台的管理员界面,然后搜索关键字 password 你可以看到上面有 2 个选项,一个是登录用户的密码,一个是管理员的密码。 在默认情况下,登录用户的密码是 10 位,管理员的密码是 15 位。 系统允许的最短的密码位数为 8 位。 所以你是没有办法设置到 6 位的。 为了更好的交互,我们建议登录用户的密码设置为 8 位,管理员的密码可以考虑设置为 10 位,或者都设置为 8 位。 你可以修改上面的配置,然后保存就可以了。 修改配置后,保存退出。 https://www.ossez.com/t/discourse/82 来源: oschina 链接: https://my.oschina.net/honeymoose/blog/4287767

mysql中utf8和utf8mb4区别

时间秒杀一切 提交于 2020-08-06 04:23:42
MySQL在5.5.3之后增加了这个utf8mb4的编码,mb4就是most bytes 4的意思,专门用来兼容四字节的unicode。好在utf8mb4是utf8的超集,除了将编码改为utf8mb4外不需要做其他转换。当然,为了节省空间,一般情况下使用utf8也就够了。 二、内容描述 那上面说了既然utf8能够存下大部分中文汉字,那为什么还要使用utf8mb4呢? 原来mysql支持的 utf8 编码最大字符长度为 3 字节,如果遇到 4 字节的宽字符就会插入异常了。三个字节的 UTF-8 最大能编码的 Unicode 字符是 0xffff,也就是 Unicode 中的基本多文种平面(BMP)。也就是说,任何不在基本多文本平面的 Unicode字符,都无法使用 Mysql 的 utf8 字符集存储。包括 Emoji 表情(Emoji 是一种特殊的 Unicode 编码,常见于 ios 和 android 手机上),和很多不常用的汉字,以及任何新增的 Unicode 字符等等。 三、问题根源 最初的 UTF-8 格式使用一至六个字节,最大能编码 31 位字符。最新的 UTF-8 规范只使用一到四个字节,最大能编码21位,正好能够表示所有的 17个 Unicode 平面。 utf8 是 Mysql 中的一种字符集,只支持最长三个字节的 UTF-8字符,也就是 Unicode

2020年GitHub 上那些优秀Android开源库,这里是Top10!

只谈情不闲聊 提交于 2020-08-06 02:55:01
前言 每过一段时间呀,我都会给大家带来一些从Github上收集的一些开源库,有的是炫酷动效,有的则是实用的工具和类库。以前没看过或者没有收藏的同学,建议先收藏,以下是链接: 【Android珍藏】推荐10个炫酷的开源库 【开源推荐】进阶实战,从一款音乐播放器开始 2020年有哪些优秀的开源库呢?本期就为大家带精选的10个,排名不分先后。 No1. LiquidSwipe 这是一个很棒的ViewPager库,它在浏览ViewPager的不同页面时,显示波浪的滑动动画,效果非常炫酷。该库的USP是触摸交互的。这意味着在视图中显示类似液体的显示过渡时,应考虑触摸事件。 1.1如何使用呢? 导入以下Gradle依赖项: implementation 'com.github.Chrisvin:LiquidSwipe:1.3' 然后将 LiquidSwipeLayout 添加为保存fragment布局的容器的根布局: <androidx.constraintlayout.widget.ConstraintLayout xmlns:android = "http://schemas.android.com/apk/res/android " android:layout_width = "match_parent " android:layout_height = "match_parent "

java和mysql对emoji特殊字符的处理

半腔热情 提交于 2020-08-06 01:40:07
设置数据库编码 1、mysql的版本必须为v5.5.3或更高 2、把数据库的编码改成utf8mb4 -- UTF-8 Unicode 3、然后需要存储emoji表情的字段选择utf8mb4_general_ci 4、数据库连接也需要改为utf8mb4 程序对字符转义处理 URLEncoder.encode()/URLDecoder.decode Base64.getEncoder().encode()/Base64.getDecoder().decode() emoji表情符号与unicode程序互转;或JDK自带工具$JAVA_HOME/bin/native2ascii https://github.com/binarywang/java-emoji-converter 来源: oschina 链接: https://my.oschina.net/wnjustdoit/blog/4274812