找回密码
 立即注册→加入我们

QQ登录

只需一步,快速开始

搜索
热搜: 下载 VB C 实现 编写
查看: 1075|回复: 3

【Python】取随机生僻字

[复制链接]

4

主题

28

回帖

289

积分

用户组: 中·技术宅

UID
5449
精华
0
威望
6 点
宅币
245 个
贡献
0 次
宅之契约
0 份
在线时间
42 小时
注册时间
2019-12-13
发表于 2022-2-2 01:04:23 | 显示全部楼层 |阅读模式

欢迎访问技术宅的结界,请注册或者登录吧。

您需要 登录 才可以下载或查看,没有账号?立即注册→加入我们

×
本帖最后由 德小SHUO 于 2022-2-2 19:56 编辑

Python 取随机生僻字

个人屑作,效率低,比较耗资源。但是每秒 6000 个字不成问题,可能有重复。

原理

在中文 Unicode 范围内随机生成一个字,判断其是否能转换到 GB2312 编码。如果转换失败那就是生僻字。

没有被 GB2312 收录的汉字,对大家来说应该算是生僻字了吧...

代码

from random import randint

def randUnicode():

    value = randint(0x4e00, 0x9fbf)
    return chr(value)

""" 随机输出最多 10 个生僻字 """
for i in range(10):
    word = randUnicode()
    try:
        word.encode("gb2312")
    except UnicodeEncodeError:
        print(word, end="")

效果预览

潙騑瑱臺驪滍嬛噝軏攬糋蘲奝釹暺悾祘鱰挋櫀惙胐榠溕龫彁寢斖賧矡鈐餵艤餽雡圕蹆傶銙憦鏪毸謌袩閃嬂郣鄭芿讱鞖犨厀襹熋鈛弚骵俈釯凃覊熕皘艒栫銰據覙騴墎駊顬攟愙揘蛻莙閌掓厜龦壝觟饠撜瓀啝軐矆嘯飣幁鍋嶥瘂慖嚡璌澢

回复

使用道具 举报

65

主题

117

回帖

1万

积分

用户组: 超级版主

OS与VM研究学者

UID
1043
精华
35
威望
789 点
宅币
8308 个
贡献
1094 次
宅之契约
0 份
在线时间
2071 小时
注册时间
2015-8-15
发表于 2022-2-2 03:43:06 | 显示全部楼层
捕获.PNG
有点意思,不过这逻辑说反了呀
回复 赞! 靠!

使用道具 举报

4

主题

28

回帖

289

积分

用户组: 中·技术宅

UID
5449
精华
0
威望
6 点
宅币
245 个
贡献
0 次
宅之契约
0 份
在线时间
42 小时
注册时间
2019-12-13
 楼主| 发表于 2022-2-2 19:45:27 | 显示全部楼层
tangptr@126.com 发表于 2022-2-2 03:43
有点意思,不过这逻辑说反了呀

已修改,感谢指正
回复 赞! 靠!

使用道具 举报

1112

主题

1653

回帖

7万

积分

用户组: 管理员

一只技术宅

UID
1
精华
245
威望
744 点
宅币
24254 个
贡献
46222 次
宅之契约
0 份
在线时间
2298 小时
注册时间
2014-1-26
发表于 2022-2-4 12:02:53 | 显示全部楼层
回复

使用道具 举报

QQ|Archiver|小黑屋|技术宅的结界 ( 滇ICP备16008837号 )|网站地图

GMT+8, 2024-4-26 23:53 , Processed in 0.041739 second(s), 31 queries , Gzip On.

Powered by Discuz! X3.5

© 2001-2024 Discuz! Team.

快速回复 返回顶部 返回列表