期待AI创作儿童绘本的点子由来已久,但一直难觅成功的案例——那种孩子喜欢并接受,父母信任又安心的。
去年,GoogleI/O期间推出了一个比较小众的实验性项目(InfiniteWonderland)。
Google跟几位艺术家合作,将图片生成模型(当时是Imagen2)训练成各自独特的风格。成果以一本《爱丽丝漫游奇境记》在线绘本呈现。
当你随机点击书中的一段文字,这段文字则会作为提示词实时生成一张配图。为了看起来不像“预制菜”,开发者在生成过程中加入了随机种子(Seed),这样即便反复点击同一段文本,生成的也是为同一段内容搭配的不同图片。
InfiniteWonderland
这个项目在创意性和艺术性上都很有特色,但当时,他们只做了爱丽丝那一个故事。
也算是没让人等待太久。最近,我发现Gemini上新了一个AI故事书的新模块“Storybook”,(https://gemini.google/overview/storybook/)
比InfiniteWonderland厉害的是,Storybook不仅能“绘”,还能“讲”,它根据你输入的灵感,讲出来一个完整的故事。加上还有朗读功能,语速适中,发音标准。
这不但能解救睡前被缠住讲故事的父母,甚至还能当作完美的英语启蒙教学。
轮到AI讲睡前故事了
我请教了几位有孩子的家长朋友,并总结了他们挑选儿童绘本的大致逻辑:图像和文本质量要过关;分“年龄段”;故事有逻辑,线索丰富最好。我们一起看看Storybook能不能满足这些需求?
Prompt:Fortwo-year-old;caterpillar’sadventurestory;picturebook。看到AI给我的绘本之后,我倍感羞愧。相比之下,人类会敷衍多了。
右滑查看完整绘本
它讲述了一个毛毛虫不断长大、啃食,进入蛹期形成茧,再破茧成蝶的故事。
首先,AI生成的插画质量不错,清晰度高,色彩丰富,甚至将毛毛虫长大的面部神情展现了出来。总的来说,是一个情节简单、欢快的科普小故事。
接着我让它生成“一本适合五岁小孩的侦探故事,背景发生在图书馆,插图《玩具总动员》风格。”
右滑查看完整绘本
角色有穿风衣的熊侦探、戴眼镜很显睿智的猫头鹰教授、骑士、偷了故事书的公主玩偶。但是公主在几张图上都不一样,说明角色一致性还有待提高。
先不说插图风格,玩具在晚上活过来还挺“玩总”的。
然而我不太理解一个情节,就是保护童话书的骑士为熊侦探提供线索(后来我反应过来,既然熊能当侦探,为什么骑士不能去图书馆值夜班保安,果然大人的想象力还是太局限。)
你可以直接在Gemini的对话框里输入希望对绘本进行的调整。比如我当时要求调整一下“骑士”角色,换一个找寻失窃图书的线索。
然后Gemini将骑士换成了一个在懒人沙发上睡觉的熊,说得几乎同样的台词。只能说,Gemini理解了我的需求,但没有执行得很好。
右滑查看完整绘本
父母希望小孩在成长过程中逐渐理解“友情”、“勇气”等“抽象概念”,但是有时候苦于找不到一个合适的机会。如果这些从一本小孩经常阅读的绘本中演绎出来,会是一个很好的教育方式。
比如你跟Gemini说,“我7岁的孩子不愿意在奶奶家过夜,创作一个故事让他们打开心结。”
右滑查看完整绘本
Storybook很有想象力的一点是,还支持上传文件。比如孩子刚画了一张画,满心期待地给你看,你除了夸夸,还可以让AI基于这张画生成一个故事(母慈子孝这不就来了)。
首图来自小红书网友,右滑查看基于这张图片生成的完整绘本
或者孩子总是缠着你,让你解释啥是黑洞、人工智能能做什么、你做啥工作的?为什么总是那么忙……你都不必再用一句,“你还小,现在还理解不了,长大了自会知道”敷衍了事。
如果小孩已经认得了全部的单词,你可以要求AI重新遣词造句,逐步提升阅读难度。建议后面加上“点读”功能就更好了。
目前该功能支持中文、英文、意大利语等在内的45种语言。建议你用来生成架空的故事,比如有一次我尝试让它做一本“荆轲刺秦王”绘本,不出意外的,AI又胡说八道了。
但会讲故事的AI
也无法代替父母的陪伴
随着我和Gemini聊得越来越投入,它告诉我,Storybook这个功能始于一位开发者(还是个奶爸)使用GeminiAPI参加GoogleAIDeveloperChallenge的一个项目。
背后大概的技术链条是,利用Gemini创作一个10页的故事——Gemini再为每一页故事创建图片提示,发送给Imagen——再由模型微调技术保证画面风格迁移和人物角色的一致性,类似基于StableDiffusion做的LoRA和Dreambooth,你可以将它理解成生图模型上打的一个“补丁”。
就在最近,Google推出了Gemini2.5FlashImage。目前不清楚Storybook是不是更新到这个最新的图片生成模型,但可以看出角色一致性、完全基于提示的图像生成和编辑一直是图像模型追求的能力提升,也是图像模型产生实用价值的关键。
Prompt:UsingaClaymationartstyle,createastorybookaboutfriendlybeesandhowusefultheyreallyaretotheearth,tohelpmykidslosetheirfearofthem.右滑查看完整故事书
第一次调整,用自然语言跟Gemimi对话,让它将黏土风格换成水彩,右滑查看完整故事书
第二次调整,让Gemini将男孩换成一个名叫Alice的女孩,并将水彩风格换成漫画风,右滑查看完成故事书
应该是为了保证一致性效果最佳,Storybook目前至多生成十页绘本,限制了它没法展现复杂逻辑或宏大主题的故事,总是看得我意犹未尽的。
不好的反馈声有两种,一是,担心小孩过早接收到AI的“陈词滥调”、担心生成的内容没有经过人工检验,不适合阅读;
二是,这样AI将进一步淹没出版、作家、插画师等行业的努力——目前有第三方做了一个在线绘本库,上面已经上传了三百多个经挑选过的用Storybook生成的绘本,并根据年龄段、情绪基调、语言、类型、故事背景做了区分(https://geministorybook.gallery/)。
网站截图
从网站截图的一本,右滑查看完整故事书
不过我想说,甄别不出上述问题的家长,或许此前也不会花多少心思挑选绘本。
技术中立太老生常谈了。Storybook可以作为低龄儿童的辅助阅读材料,如果你用承担认字和阅读分级教育作用的正规出版图书作为标尺,那么AI绘本显然不够如此严谨。
能让小孩时常回味一些和家庭、朋友之间的美好瞬间,父母为孩子讲解就在当下他所感兴趣,或困扰着他的话题,也许是比起传统绘本,AI绘本更有价值的地方。