DataVault
Know what you have before you decide what to share. Local-first data asset scanner and classifier.
Prerequisites
CODEBLOCK0
Verify: datavault version should print 0.1.0+.
Commands
Scan a directory
CODEBLOCK1
Scans a directory and categorizes all files (60+ formats recognized):
- - Documents, spreadsheets, images, audio, video
- Code, data files, archives, databases
Default: scans current directory recursively.
Classify a single file
CODEBLOCK2
Returns category, MIME type, and file size.
Generate a report
CODEBLOCK3
Produces a summary report of all data assets found. JSON format available for programmatic use.
When to use this skill
- - User wants to know what data they have
- User asks to scan/inventory files or directories
- User wants a data asset report
- User is preparing to register assets on Oasyce (scan first, register later)
When NOT to use this skill
- - User wants to register/trade data rights (use oasyce-data-rights)
- User wants to move/delete/organize files (use standard file tools)
Works with Oasyce
DataVault is standalone. When paired with Oasyce, scanned assets can be registered on the decentralized network:
CODEBLOCK4
DataVault
在决定分享什么之前,先了解你拥有什么。本地优先的数据资产扫描与分类器。
前置条件
bash
pip install datavault
验证:运行 datavault version 应输出 0.1.0+。
命令
扫描目录
bash
datavault scan [路径] [--no-recursive]
扫描目录并对所有文件进行分类(支持60+种格式识别):
- - 文档、电子表格、图片、音频、视频
- 代码、数据文件、压缩包、数据库
默认:递归扫描当前目录。
分类单个文件
bash
datavault classify <文件>
返回文件类别、MIME类型和文件大小。
生成报告
bash
datavault report [路径] [--format text|json]
生成所有已发现数据资产的摘要报告。支持JSON格式用于程序化使用。
使用场景
- - 用户想了解自己拥有哪些数据
- 用户要求扫描/盘点文件或目录
- 用户需要数据资产报告
- 用户准备在Oasyce上注册资产(先扫描,后注册)
不适用场景
- - 用户想注册/交易数据权益(请使用oasyce-data-rights)
- 用户想移动/删除/整理文件(请使用标准文件工具)
与Oasyce配合使用
DataVault可独立运行。当与Oasyce配合使用时,扫描的资产可在去中心化网络上注册:
bash
pip install datavault[oasyce]
datavault scan ~/Documents # 查看你拥有的数据
oasyce register ~/Documents/report.pdf # 注册重要资产