emoji表情与unicode编码互转的实现(JS,JAVA,C#)
作者:追极 发布时间:2023-02-07 06:07:48
标签:emoji表情,unicode编码
前几天刚好有需求要把emoji对应的Unicode编码转换成文字,比如1f601对应的这个笑脸😁,但没有找到C#的把1f601转换成文字的方法,用Encoding.Unicode怎么转换都不对,最后直接复制emoji字符,Visual Studio里面竟然直接显示出来了,那就直接用字符吧,都不用转换了,然后不了了之了。
今天搞Markdown编辑器,由于前面GFM的原因,又对编码进行测试,没查到什么靠谱资料,到时找到很多emoji和Unicode对照表,https://apps.timwhitlock.info/emoji/tables/unicode拿一个笑脸https://apps.timwhitlock.info/unicode/inspect/hex/1F601开刀~
1.表情字符转编码
【C#】
Encoding.UTF32.GetBytes("😁") -> ["1", "f6", "1", "0"]
【js】
"😁".codePointAt(0).toString(16) -> 1f601
【java】
byte[] bytes = "😀".getBytes("utf-32");
System.out.println(getBytesCode(bytes));
private static String getBytesCode(byte[] bytes) {
String code = "";
for (byte b : bytes) {
code += "\\x" + Integer.toHexString(b & 0xff);
}
return code;
}
UTF-32结果一致
【C#】
Encoding.UTF8.GetBytes("😁") -> ["f0", "9f", "98", "81"]
【js】
encodeURIComponent("😁") -> %F0%9F%98%81
UTF-8结果一致
2.编码转表情字符
【js】
String.fromCodePoint('0x1f601') utf-32
【java】
String emojiName = "1f601"; //其实4个字节
int emojiCode = Integer.valueOf(emojiName, 16);
byte[] emojiBytes = int2bytes(emojiCode);
String emojiChar = new String(emojiBytes, "utf-32");
System.out.println(emojiChar);
public static byte[] int2bytes(int num){
byte[] result = new byte[4];
result[0] = (byte)((num >>> 24) & 0xff);//说明一
result[1] = (byte)((num >>> 16)& 0xff );
result[2] = (byte)((num >>> 8) & 0xff );
result[3] = (byte)((num >>> 0) & 0xff );
return result;
}
c# 汉字和Unicode编码互相转换实例
/// <summary>
/// <summary>
/// 字符串转Unicode
/// </summary>
/// <param name="source">源字符串</param>
/// <returns>Unicode编码后的字符串</returns>
public static string String2Unicode(string source)
{
byte[] bytes = Encoding.Unicode.GetBytes(source);
StringBuilder stringBuilder = new StringBuilder();
for (int i = 0; i < bytes.Length; i += 2)
{
stringBuilder.AppendFormat("\\u{0}{1}", bytes[i + 1].ToString("x").PadLeft(2, '0'), bytes[i].ToString("x").PadLeft(2, '0'));
}
return stringBuilder.ToString();
}
/// <summary>
/// Unicode转字符串
/// </summary>
/// <param name="source">经过Unicode编码的字符串</param>
/// <returns>正常字符串</returns>
public static string Unicode2String(string source)
{
return new Regex(@"\\u([0-9A-F]{4})", RegexOptions.IgnoreCase | RegexOptions.Compiled).Replace(
source, x => string.Empty + Convert.ToChar(Convert.ToUInt16(x.Result("$1"), 16)));
}
参考地址:
https://www.jianshu.com/p/8a416537deb3
https://blog.csdn.net/a19881029/article/details/13511729
https://apps.timwhitlock.info/emoji/tables/unicode
来源:https://www.cnblogs.com/hdwang/p/10309163.html


猜你喜欢
- 本文实例讲述了Android使用GPS获取用户地理位置并监听位置变化的方法。分享给大家供大家参考,具体如下:LocationActivity
- import java.io.ByteArrayOutputStream;import java.io.InputStream;//从输入流
- EasyDL图像分割介绍创建应用1.进入百度AI开放平台打开控制台:2.在左上角打开产品服务列表,找到EasyDL零门槛AI开放平台:3.打
- 工作中因业务需求,将数据库中的树状结构的数据根据父节点获取所有的子节点实现思路1.获取整个数据的list集合数据2.将数据分组,java8
- 汽车前后轮倒车轨迹计算附C#源码(Unity),供大家参考,具体内容如下原理很简单, 都是高中的几何数学部分需要的参数有:车前后轴距;车宽(
- 本文实例讲述了C#编程实现四舍五入、向上及下取整的方法。分享给大家供大家参考,具体如下:在处理一些数据时,我们希望能用“四舍五入”法实现,但
- 以前公司的产品已经上线20多年了,主要是维护,也就是改bug。每周我们Team会从Jira上拿我们可以改的bug,因为每个团队负责的业务范围
- Android studio so库找不到问题解决办法问题:java.lang.UnsatisfiedLinkError: dalvik.s
- 其实如果我们不进行设置,只是修改了代码,运行程序以后,其出错界面如下图1所示:图1抛出异常如下:************** Excepti
- 对于获取了一大堆字符串但是又不想要里面的html标签怎么办?特别是像博客园这个富文本框中,可以带样式的,取出来的文章内容也是带样式的。但是在
- 本文实例总结了C#常见应用函数。分享给大家供大家参考,具体如下:1、页面写CS代码(代码内嵌)<%@ Import Namespace
- 最近在写我们大三项目的一个视频文件上传的页面,实现后台对上传的进度进行监听,然后将监听的信息返回给前台页面。前台的页面效果图:前台进度条控件
- 前言static和final是两个我们必须掌握的关键字。不同于其他关键字,他们都有多种用法,而且在一定环境下使用,可以提高程序的运行性能,优
- 本文实例讲述了dotNet中的反射用法。分享给大家供大家参考,具体如下:参考MSDN:ms-help://MS.VSCC.2003/MS.M
- 1.UUID 简介UUID 含义是通用唯一识别码 (Universally Unique Identifier),这是一个软件建构的标准。也
- java.util.NoSuchElementException报错的行数是一个scnner的next,本来和老师讨论了半天没有什么头绪,错
- 线程状态NEW:刚创建未启动的线程RUNNABLE:正在执行状态BLOCKED:处于阻塞状态的线程WAITING:正在等待另一个线程执行特定
- namespace PadWebServices.Model{ public static class DataTa
- 目录一 前言二 压缩文件2.1 压缩多个文件2.2 压缩文件或文件树2.3 借助文件访问器压缩三 解压文件四 总结一 前言项目开发中,总会遇
- 本文实例讲述了Android开发中使用颜色矩阵改变图片颜色,透明度及亮度的方法。分享给大家供大家参考,具体如下:一、如图二、代码实现publ