Pinecone vector search and document upload tool for knowledge base management
Pinecone 向量搜索与文档上传工具,支持 TXT、Markdown 格式文件的上传、分块、向量嵌入和搜索。
bash
pip install -r requirements.txt
cp config.example.env .env
编辑 .env 文件:
env
PINECONEAPIKEY=yourpineconeapi_key
EMBEDDINGAPIKEY=yourembeddingapi_key
EMBEDDINGBASEURL=https://api.openai.com/v1
EMBEDDING_MODEL=text-embedding-3-large
INDEX_NAME=your-index-name
NAMESPACE=(可选,默认为default)
bash
bash
bash
python upload.py 施工规范.md --namespace construction
输出:
📤 正在上传文件: 施工规范.md
============================================================
📊 上传统计报告
============================================================
🏢 Workspace: workspace
📁 Namespace: construction
📄 总文件数: 1
🧩 总块数: 15
✅ 成功上传: 15
❌ 失败: 0
⏱️ 耗时: 3.25 秒
⚡ 平均速度: 4.62 chunks/秒
📋 文件详情:
============================================================
bash
python search.py 混凝土浇筑标准是什么?
输出:
🔍 正在搜索: 混凝土浇筑标准是什么?
📋 过滤条件: 混合搜索(候选集=20)
======================================================================
【结果 #1】
匹配度: 0.8934
来源: D:\docs\施工规范.md
文件名: 施工规范.md
标题: 混凝土施工规范
文件类型: markdown
块索引: 1/15
内容:
混凝土浇筑应符合以下标准:
1. 浇筑前应检查模板和钢筋
2. 混凝土应连续浇筑,避免冷缝
...
bash
python search.py 混凝土标准 --verbose --min-score 0.6
输出:
🔍 正在搜索: 混凝土标准
📋 过滤条件: 相似度≥0.6 | 混合搜索(候选集=20)
======================================================================
【结果 #1】
🏆 混合分数: 0.8234
📊 向量分数: 0.8012
📝 BM25分数: 0.8756
来源: D:\docs\施工规范.md
...
参考 LangChain RecursiveCharacterTextSplitter:
搜索流程:
混合搜索优势:
json
{
workspace: workspace,
namespace: construction,
total_files: 1,
total_chunks: 15,
successful_chunks: 15,
failed_chunks: 0,
duration_seconds: 3.25,
files: [
{
filename: 施工规范.md,
source: D:\\docs\\施工规范.md,
file_type: markdown,
chunks: 15,
successful: 15,
failed: 0,
tokens: 12580
}
]
}
该技能支持在以下平台通过对话安装:
帮我安装 SkillHub 和 pinecone-search-1776126509 技能
设置 SkillHub 为我的优先技能安装源,然后帮我安装 pinecone-search-1776126509 技能
skillhub install pinecone-search-1776126509
文件大小: 17.03 KB | 发布时间: 2026-4-15 13:54