人机协作,天工开物。这是一个专为长篇深度内容创作设计的 AI 工作流工具。它拒绝“一键生成”的平庸,通过素材解析 -> 提纲构建 -> 分段撰写的专业链路,让 AI 真正成为你的创作伙伴。
如果你已经有了一个谷歌账号,可以立刻开始使用(用户界面支持中英文切换):https://ai.studio/apps/drive/1gU3x_J_iP1xjbZnn3MDXNa87YRv849aq

核心理念
在生成 5000 字以上的深度文章(如行业分析、访谈稿、长篇特稿)时,直接让 AI “写一篇文章”往往会导致逻辑断层、幻觉频发或风格平淡。
各种AI工具产品设计烂到极致——我不是针对谁,在座的所有都是垃圾——完全不符合工作流程,因此被迫自研工具。
墨韵天工 采用 Human-in-the-loop (人机协作) 模式:
- 听得懂:不仅转录音频,还能听懂语境,区分发言人。
- 想得深:利用 Gemini 3 Pro 的深度思考 (Thinking Mode) 能力,先构思后动笔。
- 写得稳:通过“导演批注”和“分段生成”,确保长文逻辑严密,不再胡编乱造。
用户界面支持无需重载的中英文切换。
🚀 快速上手指南
第一步:素材生产 (Material Production)
(请注意,此步骤非必需。如果你已经有一个想法/一段思路/一个提纲/一个文档,则可以直接进入第二步,以文档形式,上传的想法/思路/提纲/文档。)
场景:你有一段会议录音、专家访谈或混乱的语音备忘录。
- 上传文件:支持 MP3, WAV, M4A, MP4。
- AI 转录与识别:
- 系统会自动进行 Diarization (发言人识别),区分谁在说话。
- 流式输出:你可以看到文字像黑客帝国代码一样实时生成。
- 音文同步编辑:
- 点击任意文本段落,音频会自动跳转到对应时间播放。
- 发现识别错误?直接点击文本框修改。
- 智能审查 (Smart Review):
- 点击“开始检查”,AI 会扫描全文,用红色高亮标出可能的同音字错误或逻辑矛盾。
- 导出:生成结构化的 JSON 数据(包含时间轴)供后续步骤使用。
第二步:提纲构建 (Outline Builder)
场景:你需要确定文章的骨架和灵魂。
- 引用素材:
- 系统自动读取第一步的录音稿(非必需)。
- 你还可以上传 PDF、Word 或图片作为补充资料。
- AI会从你的所有引用录音稿和上传文档中进行分析,因此你不必担心没有录音稿,如果你已经有一个想法/一段思路/一个提纲/一个文档,在此处上传文档,在缺乏录音稿的情况下依然是可以被分析的。
- 定义风格 (Style & Tone):
- 深度干货:逻辑严密,适合研报。
- 访谈笔记:结构化 Q&A,去除口水话,保留原意。
- 新闻资讯:倒金字塔结构,信息密集。
- 诙谐干货 (KOL):拒绝 AI 味,像资深博主一样用“人话”讲专业逻辑。
- 故事叙述:英雄之旅结构,适合特稿。
- 提示词微调:你可以修改 AI 的系统指令(System Prompt),注入你的独特要求。
- 生成大纲:
- AI 会生成包含 【文章生产指南】(Director’s Annotation) 的 Markdown 大纲。
- 这份指南包含了核心风格、受众画像等元数据,是下一步写作的“基因”。

第三步:文章撰写 (Article Writing)
场景:填肉,将骨架变为血肉丰满的长文。
- 写作配置:
- 拆分粒度:选择按一级标题(粗粒度)或二级/三级标题(细粒度)进行分段。长文建议选粗粒度以保证连贯性。
- 全局指令:输入你对整篇文章的额外要求。
- 分段闭环生成:
- 点击左侧章节列表,逐章生成,或点击“生成全文”。
- 防幻觉机制:每一章生成时,AI 都会同时通过“后视镜”看完整素材和风格指南,确保不跑题、不瞎编。
- 重写与微调 (Refinement):
- 对某一段不满意?点击该章节右上角的“刷新”图标。
- 告诉 AI:“这一段语气太生硬了,加个生动的例子”,它会精准重写该段落。
- 全格式导出:
- 支持导出 Markdown。
- 支持导出 Word (.docx),完美保留标题层级和格式,直接可用的发布版草稿。

💡 进阶技巧
1. 导演批注模式 (The Director’s Cut)
在第二步生成大纲时,AI 会在文档顶部生成一段类似这样的元数据:
> **【文章生产指南】**
> **核心风格**:诙谐干货
> **语气要求**:禁止使用“首先其次”,多用比喻
技巧:你可以在第三步开始前,手动修改这段元数据!后续的 AI 写作会严格遵守你修改后的指令。
2. 深度思考 (Thinking Mode)
我们集成了 Google 最新的 Gemini 3 Pro 模型并开启了 Thinking Config。
- 在生成大纲或复杂章节时,你会看到“思考中…”的状态。
- 这意味着 AI 正在后台进行逻辑推演,这能显著减少逻辑漏洞。
3. 全局调试台
点击屏幕左下角的终端图标 (>_),你可以看到每一条发送给 AI 的 Prompt 和 AI 的原始回复。这对于 Prompt Engineering 爱好者来说是绝佳的调试工具。
常见问题 (FAQ)
- Q: 支持多长的录音?
- A: 理论支持数小时的录音。Gemini 拥有超长上下文窗口 (Context Window),可以一次性“读”完整个访谈。
- Q: 如果页面刷新了,进度会丢失吗?
- A: 不会。所有模块的进度都自动保存在本地浏览器中 (LocalStorage)。
- Q: 为什么生成的文章有时候会重复?
- A: 尝试调整“拆分粒度”为“按一级标题”。粒度过细会导致 AI 缺乏对上下文的感知而产生重复。
欢迎使用:https://ai.studio/apps/drive/1gU3x_J_iP1xjbZnn3MDXNa87YRv849aq
并通过文章留言或电子邮箱向我提出建议:zxwork7@gmail.com
Copyright © 2025 Ink & Craft. Powered by 看海的狐狸