开源项目: Pretuning数据集制作; DataGraphX学习版知识图谱本地知识库

Joined April 2022
75 Photos and videos
!知识库GraphRAG实践3种检索问答方式对白盒化拆解7个RAG问题案例参考 这期视频完整复盘一次 GNN-RAG 教学实验:先展示“三国文学 GraphRAG GNN 问答台”,用《三国演义》桃园结义和张飞怒鞭督邮两段情节,对比普通向量检索和融合 GNN 检索在生成答案、召回上下文、三元组和右侧图谱上的差异。 然后用 RAGLab 拆解两个流程:Simple RAG 的基础工作流,以及 GNN Hybrid RAG 中的实体抽取、图谱构建、图谱检索、GNN 传播和图谱融合。最后结合 HTML 复盘页,系统讲解我们遇到的 7 个坑:多检索方式召回拉不开差距、图结构相关不等于问题相关、GNN 命中节点不等于命中原文证据、Hybrid 融合噪声、问题设计不合理、自动评估分数误导,以及“无法回答”导致 RAGAS 接近 0 分。 这不是一个只展示成功结果的视频,而是一次完整的 GNN-RAG 实验排坑:怎么设计跨章节多跳问题,怎么看 retrieved contexts,怎么理解图谱路径,怎么避免 GNN 召回污染上下文,以及为什么自动评分必须结合人工复核。
22
哦吼!PP-OCRv6 真来了。 这次我本地源码部署 PaddleOCR 3.7,实测 PP-OCRv6 全场景 OCR:PDF、公式、表格、票据、手写体都跑了一遍。 重点不是“又一个大模型”,而是一个 34.5M 参数级别的轻量 OCR 基座:det rec 两段式,检测文字区域,再识别文字内容。 这期会顺带讲清楚几个问题: PP-OCRv6 到底是不是 CNN 路线? 和 PaddleOCR-VL 这种 VLM 路线有什么区别? ONNX / safetensors / Paddle 原生模型分别干啥? PP-OCRv5 的训练数据格式还能不能继续用? 公式识别到底是 OCR 处理,还是 PaddleX 里的专门公式模型处理? 结论先放这: PP-OCRv6 负责“读字”; PP-StructureV3 负责“解析文档结构”; PP-FormulaNet 负责“公式识别”; PaddleOCR-VL / VLM 负责更复杂的文档理解。 小模型不是不能打,关键是要放对位置。 #PaddleOCR #PPOCRv6 #OCR #PaddleX #本地部署 #PDFOCR #AI工具
19
Claude Fable 5 神话级解禁!6月23日后按量收费,消耗约 Opus 两倍,Mythos 发布瞬间炸穿 AI 圈
1
49
Codex微信小程序开发实战:1小时从想法到上线 Markdown预览工具完整案例 小程序发布审核全流程 本期视频完整记录了我使用 Codex 开发并上线微信小程序的全过程。 项目本身是一个 Markdown / HTML 在线预览工具,用于解决微信无法直接预览部分 Markdown 文档和 HTML 内容的问题。、视频内容包括: ✅ 需求分析与产品定位 ✅ Codex AI 编程实战 ✅ 微信小程序页面开发 ✅ Bug 调试与优化过程 ✅ 微信开发者工具使用 ✅ 小程序备案流程(约5天) ✅ 小程序审核与正式发布 整个项目从想法到完成核心功能仅用约1小时开发时间。 如果你也想借助 AI 开发自己的微信小程序,希望通过 Codex、Claude Code、Cursor 等工具快速完成产品原型,这个案例或许能给你一些参考。 视频中的项目并不复杂,但完整跑通了: 需求 → 开发 → 调试 → 上传 → 备案 → 审核 → 上线 希望能帮助更多新手完成自己的第一个小程序。
1
1
155
企业级知识库 RAG问答 对比MaxKB|知识路径 表格理解 跨标准推理 全流程合规问答|DeepGraph基于KAG、DeepResearch与GraphRAG构建食品级国标知识库 我们将其与传统知识库系统 MaxKB 对比, 跨标准引用理解,解决普通检索无法发现信息的问题 表格语义保持,让 AI 正确理解数值含义 知识路径可视化,答案生成全流程透明可追溯 文档状态管理,自动识别新旧标准替代关系 通过真实示例,我们展示了企业知识库如何提高合规效率、降低风险、沉淀知识,为企业提供完整可验证的问答解决方案。
39
AGI_Ananas retweeted
Nemotron 3 Ultra is fast and genuinely good Compared it with 3 frontier models: DeepSeek V4, MiniMax M3, and Qwen 3.7 Max on 2 prompts very impressive results
62
187
2,216
222,768
Hermes Agent保姆级部署教程:Win/Ubuntu桌面版 Mimo免费模型 Skills/Tools实战 本期视频深度解析开源 AI Agent 项目——Hermes Agent。 我们全程实测了它在 Windows 桌面版上的操作,展示了: - 打开计算器、查看进程和电脑配置 - 桌面整理与插件安装 - 使用 opencli-browser 搜索 Twitter 热门 AI Agent 内容 - 跨会话记忆与项目偏好保存 - Skills、Messaging、Artifacts 系统介绍 通过实际演示,你将看到 Hermes Agent 如何成为“长期成长型数字分身”,并理解它与传统 AI Agent 的核心差异。 适合 AI 重度用户、开发者、研究人员和想打造个人数字分身的你。
1
177
PaddleOCR-VL-1.6 vs MinerU2.5-Pro 实测对比|5个复杂PDF手写/公式/印章/表格识别差距一眼看出 Docker部署教程已开源 本期实测对比两个刚开源的文档解析模型——PaddleOCR-VL-1.6(百度飞桨,0.9B)和 MinerU2.5-Pro(上海AI Lab,1.2B),用5个有代表性的复杂PDF横向测试:数学公式、双栏杂志、竖版手写古诗、检验表格、增值税发票,所有对错均对照原文逐字核准。 两个模型在OmniDocBench v1.6上分别拿到96.33和95.69分,双双超越GPT-4o、Gemini 3 Pro等闭源大模型。但benchmark是参考,实测才是真相——手写漏行、印章读字、生僻字识别,差距都在这里。 视频同时包含两个模型的Docker本地部署教程,以及我们踩过的所有坑,直接帮你避开。 两个模型均 Apache 2.0 开源可商用,本地部署显存要求8~12GB。
1
403
最近实测了 MiniMax M3。 这次我用同一个「云养猫计划书」任务,对比了 Claude Opus 4.8 和 Mimo 2.5 Pro,在 Claude Code 里重点看: 编程能力、指令遵循、SVG 生成、架构理解和实际落地效果。 MiniMax M3 这次表现有点意思,尤其是性价比和项目完成度。 视频里也聊了它的架构、价格和真实测试过程。 #MiniMax #MiniMaxM3 #ClaudeCode #AI编程 #AIAgent #SVG #大模型测评
175
本期视频对 Liquid AI 于 2026 年 5 月 28 日开源的 LFM2.5-8B-A1B 进行完整的本地部署演示与工具调用能力实测。 工具调用实测基于《三国演义》构建 GraphRAG 四向量库,定义四个检索工具,测试模型自主工具选择与组合调用能力,并与本地部署的 gpt-oss(20.9B / MXFP4 / Ollama)进行横向对比。
112
用一个视频,把 14 种经典 RAG 架构彻底讲透 市面上讲 RAG 的视频很多,但基本都停在画框图、念流程——你还是不知道数据在管道里到底怎么流的。 这期视频不一样。我把 14 种典型的 RAG 架构(从最基础的 Naive RAG,到混合检索、重排、GraphRAG…)一个一个搭到画布上,让你直接看到每一步的真实数据流: 切块切成了什么样、向量召回了哪些片段、BM25 又救回了什么、RRF 怎么把两路结果融合、图谱节点遍历到哪、最后塞进 prompt 的到底是什么——全程透明,看得见。 不是听我讲"理论上应该怎样",而是亲眼看着数据一步步走完整条管道,14 种架构的差别一比就懂。 想真正搞明白 RAG 到底是怎么跑起来的,这一期值得看。🧪
20
Anthropic 发布了 Claude Opus 4.8,同步推出 Dynamic Workflows。这期视频把这个东西从原理到实测完整拆解一遍:为什么普通多 Agent 会被上下文撑死、Dynamic Workflows 怎么把中间状态移出上下文、和 n8n / Kimi 蜂群的本质区别是什么、以及怎么在 Claude Code 里直接跑起来。
1
69
Understand Anything把任意代码库变知识图谱|Claude Code/Codex实测|9个Agent自动分析代码库 架构拆解 效果演示 本期深度分析开源项目 Understand Anything,它能把任意代码库自动分析成可交互知识图谱,支持 Claude Code、Cursor、Copilot、Gemini CLI 等主流 AI 编程工具。 视频内容涵盖:项目原理、9个Agent多流水线协同机制、从零安装到使用的完整教程,以及真实实测数据——382个文件、655个节点、消耗日额度88%、合计约1280万Token
1
110
AI 拍视频、把我看笑了#万镜一刻 /#Wonderclip 快乐小马、HappyHorse
171
增效90%!codegraph代码图谱claude code实测gbrain本地部署测评codex知识库搭建openclaw hermes agent
231
学术研究写作4个Skills实测Claude Code拆解codex全套Skills AI论文工作流全流程教程 这期视频拆解一个 Claude Code 学术研究开源项目 Academic Research Skills。它不是 AI 代写工具,而是把论文写作拆成调研、写作、审稿、修改、完整性检查和格式化导出的一整套工作流。
1
320
这期视频精读 Mushtaq Bilal 博士的 Claude Code 102 for Academic Researchers,并按文章思路复现了 3 个实例 Skills,用知识图谱方向的模拟论文项目完整跑了一遍。 视频涵盖: 论文工作台搭建:把项目拆成文献、草稿、反馈、输出四个区域,每个区域写清 AI 使用规则 文献证据匹配:逐条判断 PDF 文献能不能真正支撑论文里的每一句话,不是主题相关就算 审稿人模拟检查:像严厉审稿人一样生成风险报告,提前发现实验缺失、引用不足、公式未补等问题 这套工作流的核心不是让 AI 代写论文,而是让它按你设计好的流程工作——分清材料身份、追踪证据来源、生成可检查的报告。
2
265
上海交通大学博士开源项目 nature-skills 完整拆解。 7个 Skill,覆盖学术论文从写作到发表的全流程——润色、文献引用、科研绘图、双语阅读、论文转PPT、数据声明、审稿人回复。 本期内容:项目背景和每个 Skill 的核心功能、实际跑完5个步骤,产出15个文件从源码提炼9条 Skill 写法规律 写作模板知识图谱方向的改造思路
2
2
547
知识图谱三元组抽取优化实战|提示词优化让F1从0.52→0.81 从零到达标教程 如果你正在做知识图谱方向的课题,三元组 F1 上不去,或者不知道怎么设计对比实验、分析错误样本,欢迎联系我们交流合作。
66
知识图谱 RAGAS评估|6维对比 RAGAS Score 0.62→0.90 医学问答场景全流程 如果你正在做 RAG 相关的课题,需要搭建评估流程、设计测试集或解读评估结果,欢迎联系我们交流合作。
34