班主任小帮手.py

作者: Qiuo 分类: 抖机灵编程 发布时间: 2020-04-05 15:17

想法来源

因为疫情的特殊时期,学校为了统计学生每日的体温,
需要同学在企业微信中需要填写表单.
没有完成的同学,学校会通知班主任督促班级学生完成每天的任务.
学校的系统不够完善,将全校未完成的同学名单推送给每位班主任,
班主任每天都需要在很多名单中找出自己班级的学生,再督促他们填写健康信息.
反复如此的重复性且烦人的工作,让我担心班主任的生理及心理健康.
于是想做一个可以帮助老师在学校的名单中快速找到自己班级未完成信息采集同学的名单.

班主任每天都会负责的督促同学完成信息填报,并且附上上面的截屏.

其实是有一段时间了,因为想去考研由于很多原因吧,
不那么坚定的我最后放弃了,当然并没有损失什么,
在此期间最起码又重新把高等数学完全复习一变.
再是选择优先就业.

少废话,上菜.

上面是流程图
安装依赖库 :
Pillow
pytesseract
下载软件
Tesseract-OCR 下载链接:
https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-v4.0.0-beta.1.20180608.exe
import pytesseract
from PIL import Image
import re

im = Image.open("2.png")
pytesseract.pytesseract.tesseract_cmd = 'C:\Program Files (x86)\Tesseract-OCR\\tesseract.exe'
code = pytesseract.image_to_string(im, lang='chi_sim')
pattern = r'仇思琦|郭颖|刘梦丽|栾雯|潘婕|王璐|张圆|朱江丹|陈杨阳|' \
r'陈子杰|杜以雨|顾浩维|李基轩|李路|刘斌|刘方宇|刘昊|牛响|潘星锰|彭涛|' \
r'桑文远|商凯|王志文|徐国阳|徐浩威|徐金尧|徐文星|徐耀华|杨伟建|杨奕辰|' \
r'姚鹏飞|张家琪|张进城|张磊|张涛|赵保中|赵宇超|宗美晨'

po = re.findall(pattern, code)
print("未填表的同学有:")
for i in po:
    print(i+' ', end="")

避免踩坑的地方

这里的路径,再添加 \ ,否则会报错,找不到esseract.exe文件,因为\t会被认为转义字符
ocr识别软件需要添加系统环境变量,安装时候记得在开始要勾选识别中文,里面有四个中文选项,简体,繁体,还有其他两个

然后没了…

ocr识别在日常生活中有很多应用的,希望以后再次相遇,see you again!

标签云