商业 | 看海的狐狸的后花园

人机协作，天工开物。这是一个专为长篇深度内容创作设计的 AI 工作流工具。它拒绝“一键生成”的平庸，通过素材解析 -> 提纲构建 -> 分段撰写的专业链路，让 AI 真正成为你的创作伙伴。

如果你已经有了一个谷歌账号，可以立刻开始使用（用户界面支持中英文切换）：https://ai.studio/apps/drive/1gU3x_J_iP1xjbZnn3MDXNa87YRv849aq

核心理念

在生成 5000 字以上的深度文章（如行业分析、访谈稿、长篇特稿）时，直接让 AI “写一篇文章”往往会导致逻辑断层、幻觉频发或风格平淡。

各种AI工具产品设计烂到极致——我不是针对谁，在座的所有都是垃圾——完全不符合工作流程，因此被迫自研工具。

墨韵天工 采用 Human-in-the-loop (人机协作) 模式：

听得懂：不仅转录音频，还能听懂语境，区分发言人。
想得深：利用 Gemini 3 Pro 的深度思考 (Thinking Mode) 能力，先构思后动笔。
写得稳：通过“导演批注”和“分段生成”，确保长文逻辑严密，不再胡编乱造。

用户界面支持无需重载的中英文切换。

🚀 快速上手指南

第一步：素材生产 (Material Production)

（请注意，此步骤非必需。如果你已经有一个想法/一段思路/一个提纲/一个文档，则可以直接进入第二步，以文档形式，上传的想法/思路/提纲/文档。）

场景：你有一段会议录音、专家访谈或混乱的语音备忘录。

上传文件：支持 MP3, WAV, M4A, MP4。
AI 转录与识别：
- 系统会自动进行 Diarization (发言人识别)，区分谁在说话。
- 流式输出：你可以看到文字像黑客帝国代码一样实时生成。
音文同步编辑：
- 点击任意文本段落，音频会自动跳转到对应时间播放。
- 发现识别错误？直接点击文本框修改。
智能审查 (Smart Review)：
- 点击“开始检查”，AI 会扫描全文，用红色高亮标出可能的同音字错误或逻辑矛盾。
导出：生成结构化的 JSON 数据（包含时间轴）供后续步骤使用。

第二步：提纲构建 (Outline Builder)

场景：你需要确定文章的骨架和灵魂。

引用素材：
- 系统自动读取第一步的录音稿（非必需）。
- 你还可以上传 PDF、Word 或图片作为补充资料。
- AI会从你的所有引用录音稿和上传文档中进行分析，因此你不必担心没有录音稿，如果你已经有一个想法/一段思路/一个提纲/一个文档，在此处上传文档，在缺乏录音稿的情况下依然是可以被分析的。
定义风格 (Style & Tone)：
- 深度干货：逻辑严密，适合研报。
- 访谈笔记：结构化 Q&A，去除口水话，保留原意。
- 新闻资讯：倒金字塔结构，信息密集。
- 诙谐干货 (KOL)：拒绝 AI 味，像资深博主一样用“人话”讲专业逻辑。
- 故事叙述：英雄之旅结构，适合特稿。
提示词微调：你可以修改 AI 的系统指令（System Prompt），注入你的独特要求。
生成大纲：
- AI 会生成包含 【文章生产指南】(Director’s Annotation) 的 Markdown 大纲。
- 这份指南包含了核心风格、受众画像等元数据，是下一步写作的“基因”。

第三步：文章撰写 (Article Writing)

场景：填肉，将骨架变为血肉丰满的长文。

写作配置：
- 拆分粒度：选择按一级标题（粗粒度）或二级/三级标题（细粒度）进行分段。长文建议选粗粒度以保证连贯性。
- 全局指令：输入你对整篇文章的额外要求。
分段闭环生成：
- 点击左侧章节列表，逐章生成，或点击“生成全文”。
- 防幻觉机制：每一章生成时，AI 都会同时通过“后视镜”看完整素材和风格指南，确保不跑题、不瞎编。
重写与微调 (Refinement)：
- 对某一段不满意？点击该章节右上角的“刷新”图标。
- 告诉 AI：“这一段语气太生硬了，加个生动的例子”，它会精准重写该段落。
全格式导出：
- 支持导出 Markdown。
- 支持导出 Word (.docx)，完美保留标题层级和格式，直接可用的发布版草稿。

💡 进阶技巧

1. 导演批注模式 (The Director’s Cut)

在第二步生成大纲时，AI 会在文档顶部生成一段类似这样的元数据：

> **【文章生产指南】**
> **核心风格**：诙谐干货
> **语气要求**：禁止使用“首先其次”，多用比喻

技巧：你可以在第三步开始前，手动修改这段元数据！后续的 AI 写作会严格遵守你修改后的指令。

2. 深度思考 (Thinking Mode)

我们集成了 Google 最新的 Gemini 3 Pro 模型并开启了 Thinking Config。

在生成大纲或复杂章节时，你会看到“思考中…”的状态。
这意味着 AI 正在后台进行逻辑推演，这能显著减少逻辑漏洞。

3. 全局调试台

点击屏幕左下角的终端图标 (>_)，你可以看到每一条发送给 AI 的 Prompt 和 AI 的原始回复。这对于 Prompt Engineering 爱好者来说是绝佳的调试工具。

常见问题 (FAQ)

Q: 支持多长的录音？
- A: 理论支持数小时的录音。Gemini 拥有超长上下文窗口 (Context Window)，可以一次性“读”完整个访谈。
Q: 如果页面刷新了，进度会丢失吗？
- A: 不会。所有模块的进度都自动保存在本地浏览器中 (LocalStorage)。
Q: 为什么生成的文章有时候会重复？
- A: 尝试调整“拆分粒度”为“按一级标题”。粒度过细会导致 AI 缺乏对上下文的感知而产生重复。

欢迎使用：https://ai.studio/apps/drive/1gU3x_J_iP1xjbZnn3MDXNa87YRv849aq
并通过文章留言或电子邮箱向我提出建议：zxwork7@gmail.com

	Macey C发表在《[2009/12/24]双版本PSP移植游戏《G弦上的魔王》》
	看海的狐狸发表在《【狐狸商评】什么是Web3.0？Web3.0的定义和技术模式…》
	震惊！发表在《【狐狸商评】什么是Web3.0？Web3.0的定义和技术模式…》
	看海的狐狸发表在《【狐狸商评】什么是Web3.0？Web3.0的定义和技术模式…》
	震惊！发表在《【狐狸商评】什么是Web3.0？Web3.0的定义和技术模式…》

看海的狐狸的后花园

Tag Archives: 商业

墨韵天工 — 一款专为长篇深度内容创作设计的 AI 工作流工具