返回顶部
d

document-format-skills文档格式处理

文档格式处理工具。支持格式诊断、标点符号修复、格式统一。输入杂乱的文档,输出规范整洁的docx。

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
276
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

document-format-skills

文档格式处理工具

处理文档格式问题:诊断格式错误、修复标点符号、统一文档样式。

功能概览

功能说明脚本
格式诊断分析文档存在的格式问题analyzer.py
标点修复
修复中英文标点混用 | punctuation.py | | 格式统一 | 应用预设格式规范 | formatter.py |

使用方法

格式诊断

分析文档存在的问题,输出诊断报告:

bash
uv run --with python-docx python3 scripts/analyzer.py input.docx

输出示例:

=== 格式诊断报告 ===

【标点问题】共 5 处
- 第2段: 英文括号 () 建议改为 ()
- 第3段: 英文引号 建议改为

【序号问题】共 2 处
- 序号格式不统一: 同时存在 1、 和 1.
- 第5段: 层级跳跃,从 一、 直接到 1.

【段落问题】共 3 处
- 第2、4、7段: 缺少首行缩进
- 行距不统一: 存在单倍、1.5倍混用

【字体问题】共 2 处
- 正文字号不统一: 12pt、14pt 混用
- 检测到 4 种字体混用

标点符号修复

bash

智能模式(根据上下文判断)


uv run --with python-docx python3 scripts/punctuation.py input.docx output.docx

强制全部转中文标点

uv run --with python-docx python3 scripts/punctuation.py input.docx output.docx --mode chinese

强制全部转英文标点

uv run --with python-docx python3 scripts/punctuation.py input.docx output.docx --mode english

只修复特定类型

uv run --with python-docx python3 scripts/punctuation.py input.docx output.docx --fix brackets,quotes

格式统一

bash

应用公文格式


uv run --with python-docx python3 scripts/formatter.py input.docx output.docx --preset official

应用学术论文格式

uv run --with python-docx python3 scripts/formatter.py input.docx output.docx --preset academic

应用法律文书格式

uv run --with python-docx python3 scripts/formatter.py input.docx output.docx --preset legal

组合使用

bash

先诊断


uv run --with python-docx python3 scripts/analyzer.py messy.docx

修复标点 + 应用格式

uv run --with python-docx python3 scripts/punctuation.py messy.docx temp.docx uv run --with python-docx python3 scripts/formatter.py temp.docx clean.docx --preset official

标点符号处理规则

修复范围

类型错误正确(中文)正确(英文)
括号中英混用()()
引号
直引号 | | | | 冒号 | 中英混用 | : | : | | 逗号 | 中英混用 | , | , | | 句号 | 中英混用 | 。 | . | | 分号 | 中英混用 | ; | ; | | 问号 | 中英混用 | ? | ? | | 叹号 | 中英混用 | ! | ! | | 省略号 | ... | …… | ... | | 破折号 | -- 或 — | —— | -- |

智能判断逻辑

  1. 1. 中文环境:前后都是中文字符 → 用中文标点
  2. 英文环境:前后都是英文/数字 → 用英文标点
  3. 混合环境:默认用中文标点(可配置)

特殊处理

  • - 数字与单位之间:100% 保持英文
  • 英文缩写:e.g. i.e. 保持英文句点
  • 网址邮箱:保持原样不处理
  • 代码块:跳过不处理

格式预设

公文格式(GB/T 9704-2012)

页面:A4,上边距37mm,下边距35mm,左边距28mm,右边距26mm
标题:方正小标宋简体,二号(22pt),居中
一级标题:黑体,三号(16pt),顶格,一、
二级标题:楷体_GB2312,三号(16pt),顶格,(一)
三级标题:仿宋_GB2312,三号(16pt),首行缩进,1.
正文:仿宋_GB2312,三号(16pt),首行缩进2字符,行距固定值28pt

学术论文格式

页面:A4,边距25mm
标题:黑体,小二(18pt),居中
一级标题:黑体,小三(15pt),1
二级标题:黑体,四号(14pt),1.1
正文:宋体/Times New Roman,小四(12pt),首行缩进2字符,行距1.5倍

法律文书格式

页面:A4,上边距30mm,下边距25mm,左边距30mm,右边距25mm
标题:宋体加粗,二号(22pt),居中
条款标题:黑体,四号(14pt),第一条
正文:宋体,四号(14pt),首行缩进2字符,行距1.5倍



文件结构

document-format-skills/
├── SKILL.md
├── README.md
├── scripts/
│ ├── analyzer.py # 格式诊断
│ ├── punctuation.py # 标点修复
│ └── formatter.py # 格式统一
└── presets/
├── official.yaml # 公文格式
├── academic.yaml # 学术论文
└── legal.yaml # 法律文书



依赖

  • - python-docx

使用 uv run --with python-docx 自动安装。



注意事项

  1. 1. 只支持 .docx:不支持旧版 .doc 格式
  2. 备份原文件:修改前建议备份
  3. 字体依赖:输出文件需要系统安装对应字体才能正确显示
  4. 表格内容:会自动处理表格内的文字

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 document-format-skills-1776189709 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 document-format-skills-1776189709 技能

通过命令行安装

skillhub install document-format-skills-1776189709

下载

⬇ 下载 document-format-skills v1.0.0(免费)

文件大小: 18.63 KB | 发布时间: 2026-4-15 13:50

v1.0.0 最新 2026-4-15 13:50
- Initial release of document-format-skills: a toolset for DOCX document formatting
- Features include format analysis, punctuation correction (smart or by type), and batch style unification
- Provides preset formatting for official documents, academic papers, and legal texts
- Fixes mixed punctuation, inconsistent indents, list numbering, font sizes, and more
- Command-line usage instructions and config examples included
- Requires python-docx; only supports .docx files

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部