墨韵天工 — 一款专为长篇深度内容创作设计的 AI 工作流工具

人机协作,天工开物。这是一个专为长篇深度内容创作设计的 AI 工作流工具。它拒绝“一键生成”的平庸,通过素材解析 -> 提纲构建 -> 分段撰写的专业链路,让 AI 真正成为你的创作伙伴。

如果你已经有了一个谷歌账号,可以立刻开始使用(用户界面支持中英文切换):https://ai.studio/apps/drive/1gU3x_J_iP1xjbZnn3MDXNa87YRv849aq


核心理念

在生成 5000 字以上的深度文章(如行业分析、访谈稿、长篇特稿)时,直接让 AI “写一篇文章”往往会导致逻辑断层、幻觉频发或风格平淡。

各种AI工具产品设计烂到极致——我不是针对谁,在座的所有都是垃圾——完全不符合工作流程,因此被迫自研工具。

墨韵天工 采用 Human-in-the-loop (人机协作) 模式:

  1. 听得懂:不仅转录音频,还能听懂语境,区分发言人。
  2. 想得深:利用 Gemini 3 Pro 的深度思考 (Thinking Mode) 能力,先构思后动笔。
  3. 写得稳:通过“导演批注”和“分段生成”,确保长文逻辑严密,不再胡编乱造。

用户界面支持无需重载的中英文切换。


🚀 快速上手指南

第一步:素材生产 (Material Production)

(请注意,此步骤非必需。如果你已经有一个想法/一段思路/一个提纲/一个文档,则可以直接进入第二步,以文档形式,上传的想法/思路/提纲/文档。)

场景:你有一段会议录音、专家访谈或混乱的语音备忘录。

  1. 上传文件:支持 MP3, WAV, M4A, MP4。
  2. AI 转录与识别
    • 系统会自动进行 Diarization (发言人识别),区分谁在说话。
    • 流式输出:你可以看到文字像黑客帝国代码一样实时生成。
  3. 音文同步编辑
    • 点击任意文本段落,音频会自动跳转到对应时间播放。
    • 发现识别错误?直接点击文本框修改。
  4. 智能审查 (Smart Review)
    • 点击“开始检查”,AI 会扫描全文,用红色高亮标出可能的同音字错误或逻辑矛盾。
  5. 导出:生成结构化的 JSON 数据(包含时间轴)供后续步骤使用。

第二步:提纲构建 (Outline Builder)

场景:你需要确定文章的骨架和灵魂。

  1. 引用素材
    • 系统自动读取第一步的录音稿(非必需)。
    • 你还可以上传 PDF、Word 或图片作为补充资料。
    • AI会从你的所有引用录音稿和上传文档中进行分析,因此你不必担心没有录音稿,如果你已经有一个想法/一段思路/一个提纲/一个文档,在此处上传文档,在缺乏录音稿的情况下依然是可以被分析的。
  2. 定义风格 (Style & Tone)
    • 深度干货:逻辑严密,适合研报。
    • 访谈笔记:结构化 Q&A,去除口水话,保留原意。
    • 新闻资讯:倒金字塔结构,信息密集。
    • 诙谐干货 (KOL):拒绝 AI 味,像资深博主一样用“人话”讲专业逻辑。
    • 故事叙述:英雄之旅结构,适合特稿。
  3. 提示词微调:你可以修改 AI 的系统指令(System Prompt),注入你的独特要求。
  4. 生成大纲
    • AI 会生成包含 【文章生产指南】(Director’s Annotation) 的 Markdown 大纲。
    • 这份指南包含了核心风格、受众画像等元数据,是下一步写作的“基因”。

第三步:文章撰写 (Article Writing)

场景:填肉,将骨架变为血肉丰满的长文。

  1. 写作配置
    • 拆分粒度:选择按一级标题(粗粒度)或二级/三级标题(细粒度)进行分段。长文建议选粗粒度以保证连贯性。
    • 全局指令:输入你对整篇文章的额外要求。
  2. 分段闭环生成
    • 点击左侧章节列表,逐章生成,或点击“生成全文”。
    • 防幻觉机制:每一章生成时,AI 都会同时通过“后视镜”看完整素材和风格指南,确保不跑题、不瞎编。
  3. 重写与微调 (Refinement)
    • 对某一段不满意?点击该章节右上角的“刷新”图标。
    • 告诉 AI:“这一段语气太生硬了,加个生动的例子”,它会精准重写该段落。
  4. 全格式导出
    • 支持导出 Markdown
    • 支持导出 Word (.docx),完美保留标题层级和格式,直接可用的发布版草稿。

💡 进阶技巧

1. 导演批注模式 (The Director’s Cut)

在第二步生成大纲时,AI 会在文档顶部生成一段类似这样的元数据:

> **【文章生产指南】**
> **核心风格**:诙谐干货
> **语气要求**:禁止使用“首先其次”,多用比喻

技巧:你可以在第三步开始前,手动修改这段元数据!后续的 AI 写作会严格遵守你修改后的指令。

2. 深度思考 (Thinking Mode)

我们集成了 Google 最新的 Gemini 3 Pro 模型并开启了 Thinking Config。

  • 在生成大纲或复杂章节时,你会看到“思考中…”的状态。
  • 这意味着 AI 正在后台进行逻辑推演,这能显著减少逻辑漏洞。

3. 全局调试台

点击屏幕左下角的终端图标 (>_),你可以看到每一条发送给 AI 的 Prompt 和 AI 的原始回复。这对于 Prompt Engineering 爱好者来说是绝佳的调试工具。


常见问题 (FAQ)

  • Q: 支持多长的录音?
    • A: 理论支持数小时的录音。Gemini 拥有超长上下文窗口 (Context Window),可以一次性“读”完整个访谈。
  • Q: 如果页面刷新了,进度会丢失吗?
    • A: 不会。所有模块的进度都自动保存在本地浏览器中 (LocalStorage)。
  • Q: 为什么生成的文章有时候会重复?
    • A: 尝试调整“拆分粒度”为“按一级标题”。粒度过细会导致 AI 缺乏对上下文的感知而产生重复。

欢迎使用:https://ai.studio/apps/drive/1gU3x_J_iP1xjbZnn3MDXNa87YRv849aq
并通过文章留言或电子邮箱向我提出建议:zxwork7@gmail.com

Copyright © 2025 Ink & Craft. Powered by 看海的狐狸