开发背景

目前很多网页编辑器在文本编辑的时候都会智能提示,是否有错别字。在大家常用的文本编辑软件office与wps中,office只会对英文单词进行检测,而wps作为一款国产中文软件,并没有内置中文纠错。既然目前找不到合适的中文纠错软件,那就自己写一个吧。

准备工作

下面我将使用NLP技术对文本进行纠错,为了减少AI部分代码,下面将使用百度现成的api进行AI纠错。

  1. 注册百度AI开发平台账号(可以使用百度账号直接注册登录)
  2. 进入NLP SDK文档https://ai.baidu.com/ai-doc/NLP/tk6z52b9z
  3. 登录控制台,选择自然语言处理,选择创建应用


  1. 随便输入一个应用名,随便写一个应用描述,立即创建,返回应用列表。


  1. 纪录下你的app_id, api_key, secret_key


开始工作

  • 使用sdk提供的ecnet函数,可以对文本进行纠错

from aip import AipNlp client = AipNlp(app_id, api_key, secret_key) result = client.ecnet(text1)

  • 使用python-docx输出错误报告对比,错误字体颜色标红

from docx import Document from docx.shared import RGBColor

  • 使用PysimpleGUI给你的python文件封装一个用户界面。

具体代码已经开源到GitHub。

https://github.com/Tlntin/text_ai_analyse

演示视频

https://www.ixigua.com/i6819083356483879431/

界面展示:




支持的功能

  1. 保存api相关信息到本地
  2. 加载api文件到输入框
  3. 按中文句号“。”,中文分号“;”进行分句
  4. 输出word对比报告

后期将会支持的功能

  1. 直接输出AI分析结果到原文件批注
  2. 直接将结果替换原文件,并且显示修订记录
  3. 使用C#重新编译成office/wps插件,集成到办公软件中
  4. 使用NLP技术在本地进行纠错,用户可以选择在线纠错与离线纠错
  5. 集成多家AI技术,提高NLP纠错正确率
  6. 自动生成摘要与总结
  7. 根据xmind框架自动生成文章。
  8. 未完待续。。。。

成品获取

关注,并后台私信“纠错帮1.1”即可获取相关文件。