Rime输入法引擎,小狼毫输入法方案白霜拼音简介!

科技君鸢 2025-04-19 20:34:37
白霜拼音:基于雾凇拼音优化的输入法方案

蒹葭苍苍,白露为霜。白霜拼音由此得名。其原始配置和词库源自雾凇拼音的 af2480b commit 版本,并在此基础上进行了深度优化。

优化缘由

雾凇词库虽内容较为丰富,但仍存在一些不足。字频和词频设置不够精准,同时废词较多。为提升输入体验,我们决定重新打造白霜拼音。

优化措施精简词库:对雾凇词库进行全面梳理,删除不健康词汇,去除大量冷僻词(频率为 1 且分词器难以识别的词),并对类似 “的吧”“的了” 这类非标准词汇进行删除或调整,完成第一步的减法操作。优化字频与词频:借助 745396750 字的高质量语料,进行细致的分词处理,重新精确统计字频和词频,并加以归一化,以此实现更出色的输入效果。白霜拼音同时支持全拼和双拼输入。使用方法

白霜拼音的使用方法与雾凇拼音基本一致,但在部分触发指令上做了微调,并增添了 lua 辅助码支持。辅助码为可选项,按下 ` 键即可开启,且不会干扰正常打字。

符号输入:输入 /fh,更多符号详情可查阅 https://github.com/gaboolic/rime-frost/blob/master/symbols_v.yaml。带调韵母输入:直接输入 /a /e /u 等。日期与时间输入:通过 rq(日期)、sj(时间)、xq(星期)、dt(当前日期)、ts(当前时间)等指令。辅助码功能:按下 键开启墨奇辅助码,支持部件拆字反查(uU)、unicode 字符输入(U)、数字金额大写转换(R)、农历查询(N)以及计算器功能(V`)。安装指南手动下载安装

Windows:下载本仓库压缩包(点击 Code - Download ZIP,或下载 releases 最新的 source-code.zip),解压后将文件放置于 %APPDATA%\Rime 路径(可在右下角小狼毫输入法右键菜单中选择打开用户文件夹)。完成复制后,在输入法设定里选择白霜拼音,然后执行重新部署操作。

Mac:鼠须管路径为 ~/Library/Rime。fcitx5 - Mac 版路径为 ~/.local/share/fcitx5/rime。

Linux:fcitx5 - rime 路径为 ~/.local/share/fcitx5/rime。fcitx5 flatpak 版的路径为 ~/.var/app/org.fcitx.Fcitx5/data/fcitx5/rime。ibus - rime 路径为 ~/.config/ibus/rime。

Android:fcitx5 - 安卓版路径为 /Android/data/org.fcitx.fcitx5.android/files/data/rime。同文路径为 /rime。雨燕输入法已内置白霜词库词频,直接安装即可使用。

iOS:仓输入法目前已内置白霜拼音,也可通过【输入方案设置 - 右上角加号 - 方案下载 - 覆盖并部署】来更新白霜拼音。

通过 Git 安装

首次安装:依据所使用的系统及安装软件,先通过 cd 命令进入对应的配置文件父级目录(如 Windows 为 %APPDATA%,mac 鼠须管为 ~/Library/),然后执行以下命令:git clone --depth 1 https://github.com/gaboolic/rime-frost Rime。

后续更新:在 Rime 文件夹内执行 git pull 命令即可完成更新。 Mac:cd ~/Library/Rime && git pull Windows:cd "$env:APPDATA\Rime" && git pull 其他系统操作方式以此类推。

通过东风破安装

选择配方(others/recipes/*.recipe.yaml)来进行安装或更新:执行 bash rime - install gaboolic/rime - frost:others/recipes/full 可安装或更新全部文件。

未来规划[x] 整理分词后词频较高但词库未收录的词汇,将其添加进词库。[ ] 实现错字错音提醒的 lua 功能。[ ] 编写自动化脚本,将句子转换为拼音,再通过拼音调用 rime_api 生成句子,比对正确率并进行迭代优化。[ ] 增添墨奇码首末字形反查功能,例如输入 amq 引导符后,再输入 mu cun 可打出 “村 櫉 梼 树” 等字。[x] 成功加入 lua 引导辅助码功能。[ ] 针对 2 字词中动词 + 名词结构,在中间加入 “了”“完”,结尾加入 “没” 自动派生词汇。例如:“拔牙” 可派生 “拔了牙,拔完牙,拔牙没,没拔牙,拔没拔牙”;针对形容词,在中间加 “不”,如 “厉害” 变为 “厉不厉害”。[ ] 增添类似 “第四 四列 = 第四列” 这类词汇。[ ] 统计中文语料中的英文词频。[ ] 训练一个智能语言模型。鸣谢雾凇词库 https://github.com/iDvel/rime-ice:白霜词库的初始词库及绝大部分配置皆源于此。结巴中文分词 https://github.com/fxsjy/jieba汉字转拼音 (pypinyin) https://github.com/mozillazg/python-pinyinMNBVC 超大规模中文语料集 https://github.com/esbatmop/MNBVC 目前已有 33TB 数据量kenlm https://github.com/kpu/kenlm 官网 https://kheafield.com/code/kenlm/kenlm 教程、python 调用 https://github.com/mattzheng/py-kenlm-model友情链接

使用白霜词库的方案:墨奇音形 https://github.com/gaboolic/rime-shuangpin-fuzhuma 墨奇五笔整句 https://github.com/gaboolic/rime-wubi-sentence 薄荷拼音 https://github.com/Mintimate/oh-my-rime雨燕输入法:https://github.com/gurecn/YuyanIme 一款开箱即用的安卓输入法,内置白霜词库。

0 阅读:0

科技君鸢

简介:感谢大家的关注