讲睡前故事的，未必是亲妈......

期待AI创作儿童绘本的点子由来已久，但一直难觅成功的案例——那种孩子喜欢并接受，父母信任又安心的。

去年，GoogleI/O期间推出了一个比较小众的实验性项目（InfiniteWonderland）。

Google跟几位艺术家合作，将图片生成模型（当时是Imagen2）训练成各自独特的风格。成果以一本《爱丽丝漫游奇境记》在线绘本呈现。

当你随机点击书中的一段文字，这段文字则会作为提示词实时生成一张配图。为了看起来不像“预制菜”，开发者在生成过程中加入了随机种子（Seed），这样即便反复点击同一段文本，生成的也是为同一段内容搭配的不同图片。

InfiniteWonderland

这个项目在创意性和艺术性上都很有特色，但当时，他们只做了爱丽丝那一个故事。

也算是没让人等待太久。最近，我发现Gemini上新了一个AI故事书的新模块“Storybook”，（https://gemini.google/overview/storybook/）

比InfiniteWonderland厉害的是，Storybook不仅能“绘”，还能“讲”，它根据你输入的灵感，讲出来一个完整的故事。加上还有朗读功能，语速适中，发音标准。

这不但能解救睡前被缠住讲故事的父母，甚至还能当作完美的英语启蒙教学。

轮到AI讲睡前故事了

我请教了几位有孩子的家长朋友，并总结了他们挑选儿童绘本的大致逻辑：图像和文本质量要过关；分“年龄段”；故事有逻辑，线索丰富最好。我们一起看看Storybook能不能满足这些需求？

Prompt：Fortwo-year-old;caterpillar’sadventurestory;picturebook。看到AI给我的绘本之后，我倍感羞愧。相比之下，人类会敷衍多了。

右滑查看完整绘本

它讲述了一个毛毛虫不断长大、啃食，进入蛹期形成茧，再破茧成蝶的故事。

首先，AI生成的插画质量不错，清晰度高，色彩丰富，甚至将毛毛虫长大的面部神情展现了出来。总的来说，是一个情节简单、欢快的科普小故事。

接着我让它生成“一本适合五岁小孩的侦探故事，背景发生在图书馆，插图《玩具总动员》风格。”

右滑查看完整绘本

角色有穿风衣的熊侦探、戴眼镜很显睿智的猫头鹰教授、骑士、偷了故事书的公主玩偶。但是公主在几张图上都不一样，说明角色一致性还有待提高。

先不说插图风格，玩具在晚上活过来还挺“玩总”的。

然而我不太理解一个情节，就是保护童话书的骑士为熊侦探提供线索（后来我反应过来，既然熊能当侦探，为什么骑士不能去图书馆值夜班保安，果然大人的想象力还是太局限。）

你可以直接在Gemini的对话框里输入希望对绘本进行的调整。比如我当时要求调整一下“骑士”角色，换一个找寻失窃图书的线索。

然后Gemini将骑士换成了一个在懒人沙发上睡觉的熊，说得几乎同样的台词。只能说，Gemini理解了我的需求，但没有执行得很好。

右滑查看完整绘本

父母希望小孩在成长过程中逐渐理解“友情”、“勇气”等“抽象概念”，但是有时候苦于找不到一个合适的机会。如果这些从一本小孩经常阅读的绘本中演绎出来，会是一个很好的教育方式。

比如你跟Gemini说，“我7岁的孩子不愿意在奶奶家过夜，创作一个故事让他们打开心结。”

右滑查看完整绘本

Storybook很有想象力的一点是，还支持上传文件。比如孩子刚画了一张画，满心期待地给你看，你除了夸夸，还可以让AI基于这张画生成一个故事（母慈子孝这不就来了）。

首图来自小红书网友，右滑查看基于这张图片生成的完整绘本

或者孩子总是缠着你，让你解释啥是黑洞、人工智能能做什么、你做啥工作的？为什么总是那么忙……你都不必再用一句，“你还小，现在还理解不了，长大了自会知道”敷衍了事。

如果小孩已经认得了全部的单词，你可以要求AI重新遣词造句，逐步提升阅读难度。建议后面加上“点读”功能就更好了。

目前该功能支持中文、英文、意大利语等在内的45种语言。建议你用来生成架空的故事，比如有一次我尝试让它做一本“荆轲刺秦王”绘本，不出意外的，AI又胡说八道了。

但会讲故事的AI

也无法代替父母的陪伴

随着我和Gemini聊得越来越投入，它告诉我，Storybook这个功能始于一位开发者（还是个奶爸）使用GeminiAPI参加GoogleAIDeveloperChallenge的一个项目。

背后大概的技术链条是，利用Gemini创作一个10页的故事——Gemini再为每一页故事创建图片提示，发送给Imagen——再由模型微调技术保证画面风格迁移和人物角色的一致性，类似基于StableDiffusion做的LoRA和Dreambooth，你可以将它理解成生图模型上打的一个“补丁”。

就在最近，Google推出了Gemini2.5FlashImage。目前不清楚Storybook是不是更新到这个最新的图片生成模型，但可以看出角色一致性、完全基于提示的图像生成和编辑一直是图像模型追求的能力提升，也是图像模型产生实用价值的关键。

Prompt：UsingaClaymationartstyle,createastorybookaboutfriendlybeesandhowusefultheyreallyaretotheearth,tohelpmykidslosetheirfearofthem.右滑查看完整故事书

第一次调整，用自然语言跟Gemimi对话，让它将黏土风格换成水彩，右滑查看完整故事书

第二次调整，让Gemini将男孩换成一个名叫Alice的女孩，并将水彩风格换成漫画风，右滑查看完成故事书

应该是为了保证一致性效果最佳，Storybook目前至多生成十页绘本，限制了它没法展现复杂逻辑或宏大主题的故事，总是看得我意犹未尽的。

不好的反馈声有两种，一是，担心小孩过早接收到AI的“陈词滥调”、担心生成的内容没有经过人工检验，不适合阅读；

二是，这样AI将进一步淹没出版、作家、插画师等行业的努力——目前有第三方做了一个在线绘本库，上面已经上传了三百多个经挑选过的用Storybook生成的绘本，并根据年龄段、情绪基调、语言、类型、故事背景做了区分（https://geministorybook.gallery/）。

网站截图

从网站截图的一本，右滑查看完整故事书

不过我想说，甄别不出上述问题的家长，或许此前也不会花多少心思挑选绘本。

技术中立太老生常谈了。Storybook可以作为低龄儿童的辅助阅读材料，如果你用承担认字和阅读分级教育作用的正规出版图书作为标尺，那么AI绘本显然不够如此严谨。

能让小孩时常回味一些和家庭、朋友之间的美好瞬间，父母为孩子讲解就在当下他所感兴趣，或困扰着他的话题，也许是比起传统绘本，AI绘本更有价值的地方。

玩酷网

讲睡前故事的，未必是亲妈......

热门分类