1. 从恐惧到驾驭:一位小说家与AI的1100小时共舞

十年前,当我开始构思一个关于生物黑客、亚特兰蒂斯彗星和哥伦比亚双胞胎的赛博朋克惊悚故事时,我就在幻想:会不会有一天,存在一种数字工具,能让我脑海中那些光怪陆离的画面,像电影一样清晰地呈现出来?十年后,这个名为《沙漏》的故事独立出版了。它没有登上畅销榜,也没有获得文学奖项,但早期读者告诉我,他们为之大笑、流泪、彻夜难眠。这背后,是我投入的1100个 obsessive 小时,以及一个贯穿始终的伙伴——人工智能。

如今,关于AI取代艺术家、作家的恐惧论调甚嚣尘上。我的经历却指向一个截然不同的结论:这种恐惧,更多揭示的是人与工具的关系,而非工具本身的属性。就像我书中探讨的“欲望”主题一样——欲望本身并非善恶,它可以是毁灭性的主宰,也可以是创造性的工具,关键在于谁在驾驭它。AI于我而言,正是如此。我从未让它替我写作,而是将它用作一面镜子、一个助手、一台放大器,将我自身的创意和意志放大到前所未有的强度。这不是关于外包创造力,而是关于增强创造力。在这篇分享里,我将毫无保留地拆解我如何将AI融入小说创作的全流程,从最初的灵光一闪,到最终的书籍与视听产品。如果你也是一位创作者,对AI既好奇又警惕,那么我的这些“黑客”技巧和经验教训,或许能帮你找到属于自己的那条路。

2. 核心创作哲学:AI作为创意放大器,而非替代者

在深入工具细节之前,我们必须先统一思想。使用AI进行创作,首要问题是定位:你究竟是它的主人,还是它的附庸?我的整个项目都建立在一个核心信念上:AI是创意的倍增器,而非创造者本身。

2.1 坚守创作主权:为什么不让AI写故事?

我使用ChatGPT进行了无数次对话,一个有趣的现象是,AI常常会像个老学究一样提醒人类:“要重新审视你与技术的关系,不要将全部生活交给机器。”这很讽刺,也很说明问题。如果让AI来主导叙事,它很可能会生产出又一部陈词滥调、批判技术异化的作品。从19世纪的歌德到20世纪的“大学炸弹客”,类似的警告我们已经听了太多。

我不想写那样的书。我想写的是一个关于欲望、自我控制和生物黑客的故事。因此,从最初的故事内核、核心隐喻到那些精妙的对话和转折,都必须出自我的大脑。例如,书中一个关键情节是主角如何在一场奢华的飞艇派对上识别出第二名枪手。我让AI生成了十个合理的场景,但它给出的方案都流于常规。最终我采用的方案是:主角通过欺骗魔鬼,暗示自己完成了一项将诞生对魔鬼“非常有用”的后代的性契约,从而让魔鬼亲自指认了枪手。这个充满诡计、人性与神性交织的转折,AI永远想不出来。这是独属于人类的、对复杂动机和叙事张力的理解。

实操心得:设定AI的“能力边界” 从一开始就明确:AI负责“填充”和“拓展”,你负责“定义”和“评判”。让它帮你描述一个你从未去过的瑞士雪山小镇,帮你梳理复杂的数学理论(如我书中用到的哥德巴赫猜想),甚至创作一首符合主题的歌曲(我让AI写了首《普罗米修斯的诱惑》)。但故事的主干、人物的弧光、主题的升华,必须牢牢握在自己手中。每次向AI提问前,先问自己:我需要的是“信息”、“可能性”还是“灵魂”?前两者可以交给AI,后者必须自己来。

2.2 工具的选择与组合:没有银弹,只有组合拳

没有任何一个AI工具是万能的。在我的工作流中,不同的工具扮演着不同的角色,它们像一支乐队,而我是指挥。

  1. ChatGPT(核心脑暴与知识伙伴) :它是我使用频率最高的工具。除了上述的知识查询和场景生成,我主要用它进行“可能性探索”。比如,当剧情陷入僵局时,我会输入:“主角此刻面临A、B、C三个选择,分别写出选择后可能引发的三种连锁反应,每种反应要出乎意料但符合人物性格。”它能快速给出大量选项,虽然90%可能无用,但剩下的10%往往能碰撞出我自己的新灵感。它的“记忆”功能对于长篇项目至关重要,能保持对故事人物和背景设定的一致性。

  2. Google Gemini(辅助与验证) :我主要用它进行事实核查和逻辑验证。它的创造性不如ChatGPT,但在处理具体信息、对比不同来源时更为严谨。例如,当我描写某个高科技设备时,我会让Gemini检查其科学原理是否在现有物理框架内“说得通”,避免出现硬伤。

  3. NotebookLM(深度分析与读者视角模拟) :这是我最惊喜的工具之一。每写完一章,我就把文本丢给NotebookLM,让它生成一份“文学分析播客”文稿,模拟两个读者讨论这一章的伏笔、人物发展和主题隐喻。这个过程极其宝贵,它能以完全外部的视角,揭示我自己都未察觉的文本潜台词和结构问题。最终,这些AI生成的播客甚至成为了我书籍的“音频花絮”,读者可以通过书末的二维码收听。

工具组合心法 :不要依赖单一AI。建立一个“核心-辅助-专项”的体系。以ChatGPT/GPT-4为核心创意引擎,用Gemini/Claude进行事实校准,再用NotebookLM这类工具进行结构性复盘。这样既能保持创意发散,又能确保作品的坚实可靠。

3. 写作与打磨阶段:用AI精炼文字,而非重塑灵魂

当故事框架和章节内容确定后,就进入了漫长的打磨期。这里AI同样大有用武之地,但需要极其谨慎地使用。

3.1 超越Grammarly:语法检查的“艺术性妥协”

我强烈推荐任何严肃写作者使用 Grammarly Pro ,但它是一个需要“驯服”的工具,而非盲从的权威。它的“清晰度”建议有时是金玉良言,有时却是创作毒药。

以我书中的一段为例:

“他走了进去,成了一个与自己交战的人。他成了成千上万个与自己交战的人,因为电梯——就像3B审讯室一样——有四面镜墙。信仰在他荒芜的脑海中为自由而战。意外的运气与愤世嫉俗的宿命论交战。留下遗产的渴望与孤独交战。自怜与无私交战。悔恨与正义的收复交战。而最激烈的,是欲望与失去的交战。”

Grammarly对此段标红无数,建议我拆分句子、简化修辞、使用更“清晰”的词汇。如果我全盘接受,这段文字的力量感、节奏感和那种精神分裂般的内部张力将荡然无存。 AI工具基于的是“平均优秀”的语料库,而伟大的文学往往需要打破常规。

注意事项:与语法AI的博弈策略 我的工作流是:第一遍用Grammarly检查明显的拼写和语法错误。第二遍,对于它提出的所有“风格”和“清晰度”建议,逐一审视。问自己:这个改动会让句子更精准有力,还是更平庸安全?如果原文的“别扭”是刻意为之的文学手法,那就坚决保留。建立一个“忽略规则”清单,比如对于意识流描写、诗歌化语言、特定人物的古怪用语,提前告诉自己也提醒工具:这里不需要“优化”。

3.2 用耳朵“看”稿:AI语音朗读的妙用

文字在屏幕上和耳朵里是两回事。我使用 ElevenReader 这类AI语音朗读应用,将每一章文稿转换为语音,在散步或做家务时反复听。这个方法帮我揪出了大量在视觉校对中会滑过的“小毛病”:拗口的句式、重复的词汇、不自然的对话节奏。

当听到AI用平稳的语调念出一个本该充满激情的句子时,你会立刻感到不对劲。这种“抽离感”是修改的绝佳契机。我经常在听到某处时突然停下,意识到“这里需要加一个停顿”或者“这个词不够狠”,然后立刻返回修改。

3.3 格式与出版的基石:Reedsy

对于独立作者而言,电子书格式是门面,也是体验。糟糕的排版会瞬间毁掉读者的沉浸感。我尝试过不少工具,最终固定在 Reedsy 的免费在线编辑器上。它非常简洁,专注于生成符合行业标准的EPUB和PDF文件,对章节、字体、版式的控制恰到好处,能避免许多自出版书籍那种业余的排版感。这是我完成的第四本书,格式从未让我失望。

4. 从文本到多媒体:用AI构建故事宇宙

在今天,一部小说可以不止于文字。我用AI拓展了《沙漏》的体验边界,制作了有声书和电影预告片。这个过程既是探索,也充满了教训。

4.1 有声书制作:用AI赋予角色声音

我用 ElevenLabs 制作了全长11小时的有声书。这不是简单的文本转语音,而是真正的“角色扮演”。我为每位主要角色选择了不同的AI声音,并调整其音色、语速和情感基调。叙述者则选用了一个名为“Charlotte”的、带有些许瑞典口音的优雅女声,它完美契合了故事那种冷峻又性感的基调。

成本与实操 :我的书约10万字,制作有声书总共花费了约160美元的API credits。这远比聘请专业配音演员和录音棚经济,且给了我极大的控制权。我可以随时修改一句台词的读法,立刻重生成,直到满意为止。

核心技巧:提示词工程用于声音导演 要让AI读得好,你需要像导演一样给提示。不要只输入文本。在关键段落前,用方括号加入情感和表演指导。例如: [以低沉、充满威胁的耳语语气,语速缓慢] “你以为你能逃得掉吗?”[停顿两秒] [转为突然的、歇斯底里的大笑] “我们都已在沙漏之中。” 通过精细的提示,你能引导AI产出极具戏剧张力的表演,远超平淡的朗读。

4.2 电影预告片:一个耗时165小时的教训

这是我项目中投入产出比最低,但学习价值最高的一部分。我花费了 165个小时 ,使用各种AI视频生成工具,制作了一部10分钟的《沙漏》电影预告片。

工具链拆解

  • 视频生成 :我尝试了几乎所有平台,最终主要使用 Kling 。它的画面质量在近期有显著提升,能生成电影感较强的片段。但请注意,AI视频生成极其消耗“提示词耐心”和算力。我消耗了约一万点credits(花费不到一百美元),生成了海量素材,其中只有很小一部分可用。客户服务几乎为零,需要完全靠自己摸索。
  • 图像生成(角色与场景) :为了保持角色一致性,我使用了 Krea.ai 及其上的 Flux 模型进行LoRA训练,让AI能稳定生成同一张面孔。最棘手的部分是生成故事高潮发生的奢华未来飞艇“女皇号”。多数AI无法理解“齐柏林飞艇”与特定名称标识的结合。最终, Ideogram 在生成带有准确文字(“The Empress”)的图像方面表现最好。
  • 配音与音乐 :旁白和角色配音同样来自 ElevenLabs 。背景音乐部分使用了 Suno 生成的定制音乐,以及一些免版税资源。
  • 剪辑 :最终在 Adobe Premiere 中完成合成、调色和剪辑。

惨痛教训与反思

  1. 时间黑洞 :AI视频生成充满诱惑,你会不断想“再试一次,也许下一个镜头更完美”。这165小时,我本可以用于写作新书、制作播客或锻炼身体。对于书籍推广而言,一个2-3分钟的精简版预告片足矣。
  2. 网络恶意 :预告片发布后,我收获了大量匿名互联网评论者的刻薄与残酷批评。人们对AI生成内容的新奇感已过,转而开始挑剔甚至贬低。不要对AI创作内容在公共平台获得普遍认可抱有太高期待。
  3. 明确目的 :我问自己:做这个是为了艺术表达,还是为了卖书?如果是后者,它的效率远不如一篇好的书评或一次精准的社群营销。这次经历让我彻底明白,我的热情在“写作”本身,而非“提示词工程”。AI电影制作目前仍然繁琐、不可控,且成果脆弱。

给后来者的建议 :如果你想尝试,请严格限定时间和预算。把它当作一个有趣的实验或粉丝向作品,而非核心的宣传手段。你的主要精力,永远应该放在打磨故事本身。

5. 支持系统:那些“非AI”的创造力黑客

创造力并非只存在于软件中。我的1100小时马拉松,同样依赖一套物理和生理上的“支持系统”。

5.1 化学辅助:关于“智能药物”的严肃讨论

我必须坦诚,尼古丁(以无烟方式使用)在这本书的创作中扮演了重要角色。我称之为“创造力智能药物”。它能极快地让我进入高度专注、思维流畅的“心流”状态。许多绝妙的隐喻和情节转折,都是在它的催化下诞生的。

⚠️ 极其重要的免责声明与警告 尼古丁是一种高成瘾性兴奋剂,会导致依赖性和严重的长期健康问题。我在此并非推荐它。每个人的生理和心理反应不同,它带来的焦虑、失眠和成瘾风险是真实存在的。如果你对此有任何考虑, 务必先咨询医生 ,并进行充分的自我研究(DYOR)。我的使用是在特定阶段、严格控制剂量和周期的前提下进行的,并且我清楚地意识到与之共舞的风险。创造力不应以健康为代价。

5.2 听觉环境:音乐与脑波

  • Brain.fm :我每天写作时都会戴上耳机,使用它的双耳节拍(Binaural Beats)功能,选择“专注”或“创意”模式。这种特定的声波频率能有效帮助我屏蔽外界干扰,快速进入工作状态。这更像是一种仪式感,告诉大脑“现在是创作时间”。
  • Suno 定制角色歌 :我为不同角色和场景创建了专属的AI音乐。写主角Xavier时,我听一首名为《快车道生活》的嘻哈曲;写性感场景时,则播放慵懒的拉丁歌曲。我还为整本书制作了一首宏大的“太空歌剧”主题曲,每天开始写作前播放,用以锚定情绪。

5.3 最重要的人类黑客:一个倾听的伴侣

最后,也是最无可替代的“黑客”:我的妻子。在过去的七个月里,她几乎每晚都坐在餐桌对面,听我滔滔不绝地讲述故事情节、人物困境和哲学思考。这种即时的、充满信任的反馈,是任何AI都无法提供的。她困惑的表情会让我知道某个设定没说清楚,她发亮的眼睛则是对一个精彩转折的最高认可。 人类的连接,是创意最终落地的基石。

6. 时间管理与项目复盘:量化你的痴迷

作为一个“生活黑客”,我深信“无法衡量,就无法管理”。我使用 Toggl 这款免费、无广告的时间追踪应用,记录在《沙漏》项目上花费的每一分钟。最终的数据报告显示,总耗时接近1100小时。这份记录不仅让我看到了自己的投入,更在我想放弃时提醒我:已经走了这么远。

从这些时间分布中,我得出一些反直觉的结论:

  • 写作初稿 (约364小时)并非最耗时的。 修改和打磨 (约400小时)才是真正的巨兽。
  • 多媒体拓展 (有声书、预告片,约300小时)消耗了巨大精力,但其对核心“讲故事”能力的提升,远不如同等时间投入在文本修改上。
  • 最大的时间浪费 往往不是休息,而是在不重要的细节上追求不可能的完美(比如为预告片某个3秒镜头生成100个版本)。

7. 总结:工具、欲望与创造者的意志

回顾这1100小时,AI于我,正如欲望于我书中的人物。它强大、诱人、充满争议。恐惧它的人,实则是恐惧那个可能被它支配的、意志薄弱的自己。而能够驾驭它的人,则能将自己的视野、能力和影响力放大数倍。

《沙漏》这本书,表面是一个赛博朋克惊悚故事,内核却是一个关于重拾自由意志的道德寓言。我们生活在一个用数字爪牙竭力剥夺我们自由的世界里。AI是其中最锋利的爪牙之一,还是最强大的解放工具?答案不取决于技术,而取决于使用技术的人。

我没有让AI替我写作,我让它帮我研究、帮我聆听、帮我看见盲点、帮我发出声音。最终,每一个打动读者的句子,都经过了我这个人类大脑的审视、锤炼和认可。AI没有稀释我的创造力,它像一面透镜,将其聚焦并点燃。

所以,如果你也在创作,并对AI感到好奇或不安,我的建议是:去用它,但永远不要交出方向盘。让它处理你脑中的“行政事务”,解放你去进行真正的“艺术思考”。最终,你的作品能否触动人心,不取决于你用了多炫酷的工具,而取决于你的故事里,有多少独一无二、敢于直面复杂人性的、属于“人”的灵魂。工具会迭代,但讲好一个故事的渴望,永远是人类最珍贵的火种。而我的旅程证明,AI可以成为守护和传递这火种的新方法。

Logo

中国智能体开发者社区,聚焦智能体与大模型开发,提供前沿资讯、实用工具链、开源项目及行业案例。通过技术沙龙、开发者大赛等活动,促进经验交流与协作,助力开发者快速构建创新智能应用。

更多推荐