2024年5月26日 | 标签:

一、sbpy.schema.yaml文件修改
1、修改代码如下
translator:
dictionary: sbpy
packs:
– sbpy.base(保留)
– sbpy.ext(删除)
– sbpy.tencent(删除)
fix_combination: true
2、修改原因
减少候选词无用的词组,减少小狼毫输入法启动时加载的词库,优化小狼毫输入法的流畅度

二、精简之后测试结果
1、只保留声笔拼音base的外挂词库,常用词的输入已经已经够用了,无误再使用ext和tencent的词库
2、增加太多词库会导致小狼毫算法服务内存占用变大,且无用的词语出现在候选词中过多,导致自己想要输入的内容反而排在后边
3、小狼毫算法服务全部取消外挂词库后内存占用在8M左右
只保留base词库后内存占用在11M左右
全部外挂词库均保留的话内存占用在20M
4、如果连base外挂词库都不启用,导致只能打单字,来自己组成词语,常用的简拼也识别不了词语,不是很好用
比如jjjf:经济纠纷打不出来,mjjd,民间借贷打不出来,因此最终决定保留声笔拼音base外挂词库
5、使用base词语一段时间观察,看能否满足需求,再考虑后续是否添加其他外挂词库

2024年5月25日 | 标签:

一、删除如下代码
1、删除sbxlm代码
sbpy.schema.yaml文件夹下
所有包含:sbxlm的代码,全部删除
包括如下两个翻译器:
– lua_translator@*sbxlm.utils.datetime
– lua_translator@*sbxlm.utils.number

2、删除如下代码
dependencies:
– hypy
– bihua
– zhlf
– affix_segmentor@sbzdy
– affix_segmentor@bihua
– affix_segmentor@hypy
– affix_segmentor@zhlf
– table_translator@bihua
– script_translator@hypy
– script_translator@zhlf
– table_translator@sbzdy
hypy: “^aa[bpmfdtnlgkhjqxzcsrywv][a-z]*’?$”
zhlf: “^ii[bpmfdtnlgkhjqxzcsrywv][a-z]*’?$”
hypy:
prefix: aa
zhlf:
prefix: ii
filters:
– uniquifier(这个代码和weasel.custom中的代码重复了)
page_size: 6
alternative_select_keys: “_23789”
history:
initial_quality: “-1”
input: “&”
size: 5
tag: history
– history_translator
reverse_lookup(所有代码删除)

二、删除后问题解决
1、逗号,句号.无法正常输出中文全角字符,解决方法:
在weasel.custom文件夹下添加,.的代码,问题解决

2、日期和数字翻译器不能使用的解决方法
日期使用word快捷键:Alt+5,插入日期实现
数字小写翻译为大写:使用excel(设置单元格格式:添加快捷键为alt+1)
数字小写翻译为大写:使用wox插件实现
或者后续使用直接添加翻译器来实现上述功能

3、u功能无法使用
放弃u功能,使用自定义短语功能代替

4、aeiou作为首字母无法输入拼音编码的问题解决
保留aeo使用v代替的拼音规则
在需要输入以aeo开始的字时,提醒使用二替代
如果此时输入错误,输入了aeo开始
也可以很快的删除aeo,因为如上设置后
aeo是默认输出英文字母的,只需要一个退格键就可以删除
且因为此时输出的是英文字母
会提醒自己输入错误了
不像之前保留了aeiou的笔画反查功能时
候选词会出现文字,不能很快的提醒自己输错了

三、删除后体验
1、小狼毫算法服务的内存占用从之前的20多M,减少到现在的8M多
2、输入法开机启动的日志中,也没有报错代码
3、重新部署小狼毫输入法,重新部署时的日志中,错误到代码也减少了很多
4、开机日志中显示,小狼毫加载的代码变得很少,只加载必须的文件

2024年5月25日 | 标签:

一、声笔拼音编码最新
1、截韵尾
– xform/\b([a-z]{5})[a-z]+/$1/
代码含义:当拼音编码最长为5的时候再截断

2、补笔画:xform/\b([a-z\d]{5})\d+/$1/
拼音编码+笔画编码最多输入5个编码

二、这样调整后的好处
1、可打全拼:无需关注最后编码g的省略
zh,ch,sh,强行截取为zcs之后
拼音编码最长变为5个,现在也是5码拼音再截断
因此可以打全拼,无需考虑编码最后需要省略g的问题

2、可通过拼音编码:过滤5码拼音的重码词
拼音编码为5的可以直接添加拼音进行重码词过滤,比如:
xiang:可以打出想,向,项,像
xi:习,喜
xia:下
xian:现,先,显
xiao:小,笑,消
xiang:想,向,像
如上拼音组合的重码字实在是太多了
如果不通过追加一个拼音编码来进行过滤,很难找到想要的词

3、不影响之前所有的输入习惯
声笔拼音最大的优势就是输入编码的灵活性
可以简拼、可以双拼、可以三拼、可以全拼
就是说在输入编码的时候,不管是之前保留的4个拼音编码截断
还是现在保留5码拼音截断,都不影响上述输入习惯

3、输入会比之前更流畅
完全不用担心编码被强行截断的问题
使用声笔拼音只需要注意zh,ch,sh,输入的时候省略h
再需要注意aoe前边添加v作为零声母即可
除此之外,其他的输入习惯完全可以和微信输入法保持一致
包括打全拼,打长句子的输入习惯

三、追加笔画后最多输入5个编码
1、可追加笔画的编码因为拼音编码的不同而不同
piaui:皮(pi,拼音编码2,笔画追加3,aui)
pinuo:贫(pin,拼音编码3,笔画追加2,uo)
pinge:平(ping,拼音编码4,笔画追加1,e)
xiang:想(xiang,拼音编码5,笔画不可追加)

2、无法追加笔画的5码拼音字或者追加之后首页3个候选词无法出现想要的结果时
可通过tab翻页加;‘ 实现二三字上屏

3、对比6个编码变为5个编码
是在追加笔画过滤重码的时候
可以追加的笔画个数从之前的6个变为5个
这个其实也没有影响
因为笔画过滤使用的频率没有拼音多
且笔画过滤输入1到2码已经可以找到想要的词了
也没有必要输入很多的笔画
笔画过滤的最长编码调整为6也没有太多意义
调整之后注意:因拼音编码的不同可追加的笔画数不同
2+3,3+2,4+1,5+0

2024年5月19日 | 标签:

一、截断3个拼音编码的优势
1、输入拼音编码减少(减少手指负担,强迫自己最多单字输入3个字符)
2、可更早追加笔画过滤重码(过滤重码更高效,首字追加一个笔画或者两个笔画均可继续输入次字声母)
3、可使用:三拼+简拼的输入习惯(打字更有节奏,前期需强迫输到3码就停止)
4、减少无效韵母g的输入(可让左手食指更多的保持在f键上,方便后续手指移动定位输入)
5、解决in鼻音不分的问题(强迫省略输入)
6、自定义短语中的编码也最多只出现3个

二、4码拼音最后一码的作用一般
1、3拼、和4拼,之间组词,使用4拼可以筛选的重码词有限
2、ing,o了,很好记忆,在4码状态下省略g的习惯本来就在

三、输入习惯改变
1、看编码,3码停
前期未形成肌肉记忆的时候
在输入的时候可以看单字的编码
注意输入到三个编码就停止输入

2、追笔画,可追2
除非此时需要首字追笔画来去重码
追笔画规则,可追一个笔画,也可最多追两个笔画
无论追一个笔画还是两个笔画
接下来输入次字的声母
输入法都可以识别分词和组词

3、口诀:输入完,省略ing,o了
省鼻音:in,i:uai,n:ian,uan
in,省略鼻音(包括in并非出现在第4个编码的位置,而是出现在第3编码位置时候也默认省略)
省略g:既为声母又能组成韵母
g:ang,eng,ing
ng:iang,uang
省略:o:o:iao

2024年5月18日 | 标签:

一、放弃:删除声笔笔画反查功能
1、删除原因
想实现aeo开始的字直接输入而非使用v代替
2、删除方法(引起其他故障)
– affix_segmentor@bihua
– table_translator@bihua
– xform/\b(?=[aoe])/v/
删除上述三个个代码
笔画反查功能成功删除
但是aeo开始的字依然不能正常输入
想实现的功能未实现

二、保留:笔画反查功能(有2个好处)
1、实现笔画反查
追加笔画编码去除重码词的时候
不确定该字的笔画顺序
可使用笔画反查功能通过aeiou直接输入来进行反查
以此来熟悉单字的笔画顺序,在后续的输入中快速追加笔画
实现过滤重码字,快速定位到自己想要的词语

2、多了一个笔画输入法
保留笔画反查功能还有一个好处是
可以把笔画反查功能当作一个笔画输入法来使用