前言还有几天,2025年就过去了,今年发生的事情还是挺多的,在过去的时间里,很少写年终总结,然而今年开始,我认为还是很有必要记录一下,记录可以更快地帮助成长。
上半年:从产品经理到独立开发
成就感的丢失今年上半年从待了3年的公司被迫离开,然后又进入了一家小一点的公司。
到今年产品经理这个职业差不多有做4、5年了,也到了一个职业倦怠期。
总觉得很没意思,既没什么话语权,也是个背锅侠,做起来也越来越没有成就感。
当初之所以从技术转到产品,就是觉得一个产品完全是由自己规划设计出来的,算是半个自己的孩子,这种孵化的感觉非常令人着迷。
这是做技术只关注自己一小块内容时无法比拟的,这也给我带来了全新的视角。
然而职场毕竟不是都由你说得算,后面基本都是接的二次产品,很难有那种从0到1的场景。
团队内话语权也逐渐边缘,做的越来越没意思,也萌生出了换方向想法。
独立开发者的尝试因为AI的快速发展,一人企业的兴起,再加上当时也有些想法了(毕竟不能打工一辈子),因此最后还是选择了从小公司离职。
这可以说是一次人生重启了。
然后就是投入到开发中,尝试通过AI做点自己的产品,虽然已多年未写过代码了,但现在有了A ...
📝 前言在使用AI漫剧制作的过程中,人物一致性 几乎是所有创作者都会遇到的核心难题。
在之前的一篇文章《AI 漫剧人物一致性保持方案介绍》里面大概介绍一下有几种方案可以解决漫剧制作过程中的人物一致性问题,比如最常用的人物四视图、还有 Sora2 专用的角色ID 以及 Lora 模型微调。
当时限于篇幅,主要只介绍了人物四视图,今天这里就来系统性拆解 Sora2 角色创建与人物一致性控制的方法论,从角色设计、角色绑定到视频生成策略,帮助你构建可复用、可持续的角色体系,真正做到“一个角色,多镜头稳定出演”。
❓ 为什么 Sora2 会出现人物不一致?在理解解决方案之前,必须先明确问题根源。
1. Sora2 本质是“条件生成”,不是“角色数据库”Sora2 并不会自动记住你之前生成过的某个人物。
每一次视频生成,本质上都是基于当前 Prompt + 上下文条件进行重新推理。
如果角色描述不稳定,就会导致:
面部特征随机漂移
发型、年龄、气质发生变化
同一角色在不同 Shot 中“像不同人”
2. 仅靠自然语言描述,约束力不够例如:
a young man with black hai ...
一、前言用 AI 做视频,容易陷入一个尴尬场景:单看每一段都不错,但想把它们接起来讲一个完整故事,就开始“翻车”——
角色前后长得不一样
场景的光线、构图突然变味
服装、道具细节对不上
镜头衔接生硬,情绪断掉
问题的核心,其实就是四个字:场景一致性。
Sora2 新增的 Remix 功能,就是为了解决这个问题。它允许在已有视频的基础上,继续往下发展画面和剧情,让角色、场景和风格尽量保持统一,同时减少手工反复调试的成本。
这篇文章会从场景一致性的问题出发,聊聊过去常用的做法(包括图生视频),再结合 Sora2 Remix 的工作方式,整理一套相对顺手的视频续写方案。
二、背景介绍:为什么视频续写总是“不对味”?2.1 只靠文本生成的天然短板最常见的做法,是每个镜头都写一条新的文本提示,让模型从零生成。听上去很灵活,但对“续写”来说,天生有几处短板:
模型不记得前一段发生了什么它只看到当前这条文字,不知道你是要“接着上一段继续”,还是完全新开一个场景。
文字很难穷尽所有视觉细节角色脸型、衣服纹理、背景小物件,几乎不可能全部写进文字。每次重新生成,模型都会“重新想象”这些细节,自然容易 ...
📝 前言用规则化分镜 Prompt,把不可控的视频生成,变成“导演级执行”。
🧭 一、背景:为什么 Sora2 视频 好看,但不好控?在使用 Sora2 进行视频生成时,很多创作者都会遇到同一个问题:
单个画面质量很高,但整体叙事不可控。
常见表现包括:
镜头时长随机,关键画面一闪而过
场景切换不可预测,分镜逻辑混乱
同一段提示词中,景别、镜头运动被模型“自由发挥”
明明是剧情视频,却更像随机画面拼接
这种问题在以下创作场景中尤为明显:
AI 漫剧 / 剧情短片
多场景叙事视频
产品故事型视频
根本原因在于:
Sora2 更擅长理解“整体语义”,而不是“导演式分镜执行”。
如果 Prompt 没有对「镜头」进行约束,模型就会牺牲镜头控制力,换取画面自由度。
🔍 二、核心思路:把「导演分镜表」写进 Prompt解决分镜不可控的问题,关键不在于堆更多形容词,而在于——
改变 Prompt 的组织方式。
一个行之有效的方法是:
将传统影视制作中的 分镜表(Storyboard),规则化为 Sora2 可理解的 Prompt 结构。
也就是说:
明确每一个 Shot
...
📝 前言当下 AI 漫剧市场非常的火爆,我这边也最近一直在研究 AI 漫剧的自动化生成,就在这里记录一下探索的过程中遇到的人物一致性问题以及如何解决的。
🧭 背景介绍AI 漫剧在制作时经常出现以下问题:
同一角色在不同镜头中 脸型变化明显
发型、刘海走势、发色细节不一致
服饰细节(纹理/扣子/腰带/纹样)自动丢失
动作或角度变化导致 显著换脸
多角色同框时出现 风格冲突
长篇连载中角色设定无法保持长期稳定
下面就来介绍几种处理方式。
🚀 人物一致性处理1️⃣ 人物四视图UID生成之前我们介绍过生成过人物的正面形象图,这还不够。
这里我们介绍第一种优化方式,生成一张包含人物角色正面、侧面、背面以及表情、配饰的UID图。
适用于大部分「图生图」工作流,例如:即梦、海螺、ComfyUI、常规生图 API。
提示词参考如下:
12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152535455565758596061626 ...
📝 前言在上一期内容中,我们完成了一个古风国漫人物形象 Agent的系统提示词设计,使其能够根据输入的小说内容自动分析角色并生成高度统一、风格稳定的角色人物生图提示词。
本篇将进入真正的实战阶段:如何通过 n8n 调用该 Agent,结合即梦实现批量生图生产流程,并构建一个可复用、自动化、低成本的 AI 漫剧生产链路。
📌 最终目标本文主要解决三个问题:
如何在 n8n 中调用自定义 Agent 自动生成角色提示词
如何通过 即梦 实现批量文生图
如何通过 飞书多维表格 保存自动生成的提示词和生图结果
整个流程就是用户输入一个短篇小说,然后 Agent 自动分析小说内容,生成角色名称和相应的生图提示词,然后通过即梦生图,最后将提示词和生图结果保存到飞书多维表格。
PS:文章最后提供工作流的 json 文件,方便一键导入使用。
完整工作流:
📋 前提条件
n8n 自动化平台(可参考之前文章进行部署:n8n Docker 部署指南:打造你的自动化工作流)
即梦账号(已登录状态)
飞书多维表格账号
🚀 详细步骤1️⃣ 安装飞书和即梦社区节点在开始之前我们可以先安装社区节点,方 ...
📝 前言最近在练习将短篇小说通过AI生图、生视频的方式制作成一个短剧作品。
为了提高效率,因此写了一些 agent 智能体方便使用,这里就先介绍一个人物定妆形象图生成的智能体。
🧭 背景介绍在 AI 时代,即使不会绘画也没关系,只需要通过短短几句提示词就能生成大致想要的图片,然后让图片通过镜头动起来,最后再剪辑到一起就是一个视频作品啦。
然而如果没有掌握一定的提示词技巧,往往生成的图片都不是自己想要的,比如风格不固定,描述不到位等等。
因此最好是设计一个Agent(智能体)。
它的作用是作为“中间人”,将用户简单的口语(如:“画一个穿红衣服的女侠”)转化为专业的、经过深度优化的绘画指令,从而稳定输出高质量的作品。
🔍 使用场景这个生成器设计完成后,可以广泛应用于以下场景:
网文/剧本配图:为小说作者生成主角的人设图,具象化笔下人物。
自媒体运营:制作吸睛的国风头像、壁纸,用于小红书、抖音等平台引流。
游戏/动漫概念设计:独立开发者快速生成NPC立绘或场景灵感图。
跑团/角色扮演(OC):为自己的原创角色(Original Character)生成专 ...
📝 前言在数字化时代,我们每天都在与无数的 SaaS 软件打交道:Notion、Gmail、Slack、Telegram、GitHub……如果能让这些应用之间的数据自动流转,将会节省多少时间?
今天我们要介绍的主角是 n8n,它是 Zapier 的开源平替。
如果你因为数据隐私问题不想将核心业务放在第三方云端,那么通过 Docker 自托管 n8n 将是你的最佳选择。
🧩 功能介绍n8n (全称 Nodal workflow automation) 是一个基于节点的可视化工作流自动化工具。
连接一切:内置了 700+ 种服务的集成(Integration),支持 HTTP 请求,几乎可以连接任何有 API 的服务。
降本增效:相比 Zapier 或 Make,n8n 采用“公平代码”协议,自托管版本完全免费,且功能不受限制。
数据隐私:数据掌握在自己手中,不用担心业务数据泄露给第三方平台。
极致灵活:支持编写 JavaScript/Python 代码处理复杂逻辑,既有低代码的便利,又有全代码的强大。
📋 前提条件在开始之前,请确保你已经具备以下条件:
一台至少 1 ...
心情随笔
未读📝 前言时光如梭,转眼就是半年过去了,这半年来我一直在寻求做一些自己的产品,虽然中间波折很多,但最终还是都陆续上线了,这也因此基本耗尽了心力。
所以短时间内不打算再开发新产品了,好好运营推广,打磨现有的产品。
这篇既是对过去半年的总结,也算是一次新的开始吧。
🧭 背景介绍最早做独立产品的想法很简单,当时还在上班,但是看了些一人企业的事情,就萌发出很强烈的欲望,想要去尝试一番,能不能自己也做点产品?
其实这主要还是得益于目前 AI 编程的快速发展,即使不会写代码只要有需求有思路,基本都能快速做出一个原型出来。
当然这里面还是得要有一点技术基础,否则出现了问题排查起来也是很困难的。
下面就挨个介绍一下几个产品吧。
🚀 产品开发历程1️⃣ nCalendarnCalendar 是我还在上班时就有的想法,期初很简单,只是想做一个基于日历的定时提醒功能,原型做出来也很快。
当时还特别激动,写了很多相关的教程和需求文档,这算是我第一个独自开发的产品,然而由于产品过于简单,市场需求也不大,替代品那更别提了数不胜数。
因此在做完第一版后,虽然勉强做完了第二版,但最后还是没能坚持下去。
因为之前的 ...
青萍创作者平台
未读📝 前言在 AI 技术快速发展的今天,视频创作的门槛正在被彻底降低。继青萍AI图床之后,我们正式推出全新产品 ——青萍AI视频(https://video.lusyoe.com)。
这是一款基于 Google 最新 Veo 多模态大模型的 AI 视频生成平台,可以从文字、图片生成完整的视频内容。目前平台已开启 免费试用,欢迎创作者和团队体验。
🧭 背景介绍在内容创作的浪潮中,视频已成为最具传播力的媒介形式。
然而,传统视频制作流程通常包括 脚本撰写 → 素材搜集 → 剪辑合成 → 配音调色 等多个环节,既耗时又需要专业技能。
与此同时,AI 技术的突破正在改变这一切。
从文字生成图像(Text to Image)到现在的文字生成视频(Text to Video),多模态模型让创作者只需一句话,就能完成过去数小时才能完成的工作。
青萍团队在 AI 图像积累了丰富经验,如今通过青萍AI视频将这些能力整合到一个统一的平台中,
目标是让 视频创作像写文案一样简单,帮助创作者和品牌更高效地表达内容、传播价值。
🔍 适用人群
跨境电商卖家
快速生成多语言产品视频,展示商品特色和使用场景,提 ...
云原生之旅
未读📝 前言在上一篇文章《云原生微服务应用的注册/配置中心》中,我们讨论了微服务在云原生时代的服务发现与配置管理。
这一篇,我们继续聊聊微服务体系中的另一个关键组件 —— API 网关(API Gateway)。
随着服务拆分越来越细,一个系统往往包含数十甚至上百个微服务。
此时,API 网关就成为连接前端与后端、外部与内部的核心中枢。
🧭 为什么需要 API 网关?在微服务架构中,一个系统可能由数十甚至上百个服务组成。如果客户端(如 Web、移动端)直接与这些服务通信,将面临以下问题:
调用复杂:客户端需要知道每个服务的地址和接口。
安全风险:每个服务都必须暴露到外部网络,增加攻击面。
跨域与协议问题:前端与多个后端交互,存在跨域、鉴权、版本兼容等麻烦。
统一控制困难:无法集中处理日志、认证、限流、熔断等通用逻辑,尤其是认证如果每个服务组件都实现一套成本将会是巨大的。
于是,API 网关诞生了。它是 微服务世界的“门面” —— 所有外部请求先经过网关,再由网关转发到具体的服务。
🔍 常见使用场景API 网关可以理解为系统的“智能反向代理”,常见功能包括:
功能类 ...
心情随笔
未读📝 前言又是一个月的最后一天,继续来进行总结吧,熬过了上个的颓废,这个月总算是又重新找到了目标,开始新一轮的产品开发和推广了。
✍️ 内容创作首先是专题系列《云原生之旅》连载,这个月虽然更新的不是很多但也把第五部分完结了,同时也兑现了上月底的规划,完成一半的进度。
关于所有章节,可以直接参看大纲里面的目录:https://blog.lusyoe.com/article/cloud-native-outline
另外本月的一个内容创作重点也移到了青萍图床,写了多篇功能介绍。
🖼️ 青萍 AI 图床本月的产品开发主要还是集中在青萍AI图床,没错这个月陆续上线了多个AI功能模块,后续的重点也会集中在AI,因此直接将产品从青萍图床改为青萍AI图床了,这也是一开始产品规划的时候既定目标。
另外本月的AI功能也确实带来了不少盈利,算是大大迈出新的一步商业化吧,不仅是客户在用,我自己也经常会用来接一些单也在用。
虽然市面有一些零零散散的免费AI生图工具,但那种首先效果就一般,其次是有限额的,比如每天2、3次这样,纯免费的也不稳定,索性还不如直接用自己的。
🌐 青萍网关除了青萍AI图床以外,本月 ...
云原生之旅
未读📝 前言在微服务架构中,每个功能模块都被拆分成独立的服务单元。
然而,服务数量一旦增多,如何让服务之间互相发现、动态获取配置信息、自动化注册与下线,就成了架构设计中的关键问题。
注册中心与配置中心的出现,正是为了解决这些痛点。
🚀 本章小节1️⃣ 微服务的注册与配置中心概念
注册中心(Service Registry)
管理所有服务实例的注册信息。
当服务启动时自动注册自身地址;其他服务可通过注册中心完成服务发现。
配置中心(Configuration Center)
管理微服务的配置信息,实现集中化存储与动态刷新,避免重复修改配置文件后重新部署。
在传统架构中,这两类中心往往由不同组件实现。
而在现代云原生体系中,它们逐渐融合为统一平台。
2️⃣ 云原生之前:常见注册与配置中心方案在 Kubernetes 普及之前,微服务多运行在虚拟机或物理机上,以下是主流方案:
1、Eureka(Spring Cloud 生态代表)
背景:由 Netflix 开源,是 Spring Cloud 微服务体系的核心组件之一。
工作原理:
各服务启动时向 Eureka Serve ...
青萍创作者平台
未读📝 前言AI 绘图早已不再是设计师的专属技能,但复杂的提示词、繁琐的导入导出流程,仍然让不少创作者望而却步。
青萍图床·AI 生图功能 正是为了解决这些痛点而生 —— 让你在一个平台上完成从灵感到成图的全流程创作。
无论是内容创作者、电商卖家还是设计师,只需一句提示词,即可生成多版本图像,并支持连续改图、不同尺寸输出与参考图生成。
🚀 适用人群
电商卖家:快速生成商品图、模特图、场景展示图
内容创作者:批量生成封面、插图、视觉素材
品牌与设计师:统一视觉风格、制作主视觉或延展图
AI 创作者:尝试多风格、多场景创意探索
🧩 功能介绍
1️⃣ 一次生成多张图像支持 一次生成多张结果(最多 4 张),快速比较不同风格与光效,让灵感不被打断。
不同版本即刻呈现,从中挑选最满意的一张。
2️⃣ 多尺寸输出,适配所有平台支持同时生成 多种比例尺寸(1:1 / 3:4 / 9:16 / 16:9 等)。无需后期裁剪,即可匹配电商展示图、封面图、短视频封面或社交媒体封面。
一次生成,多端通用。
3️⃣ 连续改图与上下文延续在生成结果中,可直接对最近生成的结果执行 ...
📝 前言在上一篇文章《Tekton K8S 原生 CI/CD 实践指南》中,我们用 Tekton 完成了从源码到镜像的流水线:代码检出 → 单元测试 → 镜像构建 → 推送镜像仓库。
该流程虽然完成了 CI 部分,但还缺少 CD 自动部署部分。
在当前 Kubernetes 生态下,越来越多团队倾向于 GitOps 模式:将 “应用配置/部署清单” 存放在 Git 仓库里,由工具自动对比 Git 状态与集群状态,一旦 Git 有更新就触发同步。
而 Argo CD 就是 GitOps 模式的典型代表。
📋 前提条件
已部署 Kubernetes 集群
已部署 Tekton
🚀 本章小节1️⃣ 什么是 Argo CD?根据官方的说法:Argo CD 是一个用于 Kubernetes 的声明式 GitOps 持续交付工具。
Argo CD 适合做把 Git 中的 YAML/Helm 值变更自动同步到 Kubernetes 的部署。
2️⃣ 安装部署 Argo CD按照官方文档的安装指引:
123kubectl create namespace argocdkub ...
青萍创作者平台
未读📝 前言:寒意渐浓,毛衣成了电商“主角”随着天气逐渐转凉,毛衣、针织衫、羊绒外套等秋冬服饰陆续上架。
但对于电商卖家来说,白底图 的制作却成为新的难题——尤其是毛衣类商品,边缘毛发细节丰富、织物纤维复杂,传统 AI 抠图往往无法准确识别这些高频细节。
常见问题包括:
毛衣边缘出现“锯齿”或“缺块”;
毛发部分被误删或背景残留;
需要手动修复阴影与挂载物(衣架、链条);
白底图无法批量高效生成。
为此,青萍图床推出了基于 Nano Banana 最先进模型的 AI 商品白底图功能,专门针对秋冬服饰类商品进行细节级优化,让毛发蓬松感自然保留、白底纯净、阴影柔和真实。
🧭 背景介绍传统的商品抠图模型在处理平滑材质(如塑料、皮革)时表现良好,但在面对“毛发”“针织纤维”“半透明纱线”等结构时,常出现以下问题:
边缘锯齿化普通分割网络对高频细节的建模不足,导致边界断裂或模糊。
半透明毛发被误删纤维与背景之间的光晕、透光层常被判定为背景。
道具干扰衣架、链条、模特手部难以自动去除,需要人工修补。
阴影失真白底要求纯净,但若完全去除阴影,商品又显得悬浮、不真实。
这些问题在秋冬服饰中尤为 ...




















