返回顶部
c

csv-analyzerCSV分析器

Analyze CSV/Excel files with natural language. Get statistics, filter rows, find anomalies, generate summaries, and export results. No pandas needed — uses Python stdlib for lightweight operation.

作者: admin | 来源: ClawHub
源自
ClawHub
版本
V 1.0.0
安全检测
已通过
794
下载量
免费
免费
0
收藏
概述
安装方式
版本历史

csv-analyzer

CSV 分析器

通过简单命令分析 CSV 文件。即时获取统计数据、筛选数据、检测异常并导出结果——无需 pandas 或繁重依赖。

使用方法

快速统计

bash python3 {baseDir}/scripts/csv_analyze.py stats data.csv

显示行数、列类型、数值列的最小值/最大值/平均值、文本列的唯一值数量。

筛选行

bash python3 {baseDir}/scripts/csvanalyze.py filter data.csv --where amount>1000 --output bigorders.csv

前 N 名/后 N 名

bash python3 {baseDir}/scripts/csv_analyze.py top data.csv --column revenue --n 10 python3 {baseDir}/scripts/csv_analyze.py bottom data.csv --column revenue --n 5

检测异常(超出 2σ 的值)

bash python3 {baseDir}/scripts/csv_analyze.py anomalies data.csv --column price

分组与聚合

bash python3 {baseDir}/scripts/csv_analyze.py group data.csv --by category --agg sum:amount count:id

功能特性

  • - 📊 自动列类型检测(数值、日期、文本)
  • 🔍 支持比较运算符的灵活筛选
  • 📈 统计摘要(均值、中位数、标准差、最小值、最大值、百分位数)
  • 🚨 异常检测(基于 z-score)
  • 📋 分组与聚合
  • 💾 导出筛选/处理后的结果
  • 🪶 零外部依赖 — 仅使用 Python 标准库(csv 模块)

依赖项

无!仅使用 Python 标准库。

为何不用 Pandas?

Pandas 虽好,但存在以下问题:

  • - 仅导入就需要 100MB+ 内存
  • 对于快速分析任务过于臃肿
  • 本技能可在 2GB 内存服务器上无问题运行
  • 对于真正的大数据集,代理可建议安装 pandas

局限性

  • - 设计用于约 100MB 以内的文件(加载到内存)
  • 对于更大文件,请使用流式模式或安装 pandas
  • 日期解析较为基础(推荐使用 ISO 格式)

标签

skill ai

通过对话安装

该技能支持在以下平台通过对话安装:

OpenClaw WorkBuddy QClaw Kimi Claude

方式一:安装 SkillHub 和技能

帮我安装 SkillHub 和 csv-analyzer-1776194581 技能

方式二:设置 SkillHub 为优先技能安装源

设置 SkillHub 为我的优先技能安装源,然后帮我安装 csv-analyzer-1776194581 技能

通过命令行安装

skillhub install csv-analyzer-1776194581

下载

⬇ 下载 csv-analyzer v1.0.0(免费)

文件大小: 4.04 KB | 发布时间: 2026-4-15 13:03

v1.0.0 最新 2026-4-15 13:03
Initial release of csv-analyzer — a lightweight tool for CSV/Excel file analysis using only the Python standard library.

- Analyze, filter, and generate statistics from CSV files without pandas.
- Features include statistics summary, flexible row filtering, top/bottom N values, anomaly detection, and group aggregation.
- Supports exporting processed and filtered data.
- Zero external dependencies; optimized for low-memory environments.
- Designed for datasets up to ~100MB in size.

Archiver·手机版·闲社网·闲社论坛·羊毛社区· 多链控股集团有限公司 · 苏ICP备2025199260号-1

Powered by Discuz! X5.0   © 2024-2025 闲社网·线报更新论坛·羊毛分享社区·http://xianshe.com

p2p_official_large
返回顶部