首页 > 编程 > Python > 正文

Python读取指定目录下指定后缀文件并保存为docx

2020-02-23 04:36:02
字体:
来源:转载
供稿:网友

最近有个奇葩要求 要项目中的N行代码 申请专利啥的

然后作为程序员当然不能复制粘贴 用代码解决。。

使用python-docx读写docx文件

环境使用python3.6.0

首先pip安装python-docx

pip install python-docx

然后下面是脚本 修改目录,这里默认取脚本运行目录下的src文件夹
取.cs后缀的所有文件 读取并保存为docx

有一点需要注意,如果文件中有中文,请用vscode或者其他编辑器使用utf-8格式打开,看看有没有乱码 其中每处理一个文件都会有print输出 当看到只有---start没有end的时候就可以找到该文件查看是否有上面说的情况,修改后保存重新执行,一直到全部执行完毕,保存好docx文件

代码

# -- coding: UTF-8 --# Created by luody on 2017/4/7.import osfrom docx import DocumentsaveFile = os.getcwd() + "/code.docx"mypath = os.getcwd() + "/src"doc = Document()doc.add_heading("代码文档", 0)p = doc.add_paragraph('服务端代码,使用语言')p.add_run('C#,SQL').bold = TruelineNum = 0for root, dirs, files in os.walk(mypath):  for filespath in files:    if (filespath.endswith('.cs')):      doc.add_heading(filespath, level=1)      codePage = ''      print(filespath+' ---- start')      for line in open(os.path.join(root, filespath), encoding="utf-8"):        codePage += line        lineNum += 1      print(filespath+' ---- end')      doc.add_paragraph(codePage, style='IntenseQuote')      doc.add_page_break()p = doc.add_paragraph(u'总行数:')p.add_run(str(lineNum)).bold = Truedoc.save('code.docx')print(lineNum)

以上所述是小编给大家介绍的Python读取指定目录下指定后缀文件并保存为docx,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对武林站长站网站的支持!

发表评论 共有条评论
用户名: 密码:
验证码: 匿名发表