Hermes 到底怎么才能真干活?我用它跑通了一套抖音视频分析和自动发作品流程
很多人装完 Hermes 之后,第一反应应该都差不多:
为什么别人视频里的 Hermes 什么都会,能分析视频、能抓账号、能生成内容、还能自动发布;到了自己这里,它动不动就一句“我不能”?
我一开始也是这个感觉。
后来我干脆不纠结提示词了,直接按实际需求一点点搭。最后发现,Hermes 不是不会干活,而是你得给它配好能干活的工具。
这篇文章就是我自己折腾 Hermes 分析抖音视频、批量拆账号、生成图文、最后自动发布到抖音的完整记录。不是概念演示,是实际跑通过的流程。
我最终想做的事情很简单:
让 Hermes 不只是跟我聊天,而是真的能完成一条抖音内容工作流。
它要能读单条抖音视频,能把视频下载下来抽帧分析,能批量抓一个账号主页前几条作品,能根据分析结果生成图文内容,还能自动上传并发布抖音图文。
最后,我还想把这套能力打包成 skills,迁移到另一台 Mac 上继续用。
一开始,只是想让 Hermes 分析一条抖音视频
最开始我给 Hermes 扔了一个抖音分享链接:
https://v.douyin.com/ay8NY1ZIiyg/
这是一个单条视频链接。
我本来以为它能直接打开网页看内容,结果很快发现没那么简单。
抖音网页本身有反爬,里面大量 JS 混淆。普通网页访问不稳定,浏览器也不一定能顺利读到视频内容。
所以第一步根本不是“分析视频”,而是先解决一个更基础的问题:
怎么把视频拿到本地。
只要视频能下载下来,后面就好办了。可以看元数据,可以抽帧,可以读字幕,可以做内容分析。
先跑通单条视频下载
我找到的第一个 skill 是 douyin-video。
安装命令是:
npx –yes skills add yzfly/douyin-mcp-server@douyin-video -g -y
装完之后,它在 Windows 上的路径大概是:
C:\Users\用户名.agents\skills\douyin-video
里面最关键的脚本是:
C:\Users\用户名.agents\skills\douyin-video\scripts\douyin_downloader.py
这个脚本主要能做三件事。
第一,解析抖音短链。
第二,拿到视频 ID、标题和下载链接。
第三,把视频下载到本地。
我先用 info 测了一下:
python C:/Users/用户名/.agents/skills/douyin-video/scripts/douyin_downloader.py –link “https://v.douyin.com/ay8NY1ZIiyg/” –action info
跑通之后,它成功解析出了视频信息。
视频 ID 是:
7623445944466116729
标题是:
全女办公室有多幸福?#全女 #职场
下载链接也能正常拿到。
然后再执行下载:
python C:/Users/用户名/.agents/skills/douyin-video/scripts/douyin_downloader.py –link “https://v.douyin.com/ay8NY1ZIiyg/” –action download –output /tmp/douyin_analysis
视频下载下来以后,Hermes 再用 ffprobe 看视频信息,用 ffmpeg 抽帧。
用到的命令是:
ffprobe -v error -show_entries format=duration,size,bit_rate -show_streams -of json video.mp4
ffmpeg -y -i video.mp4 -vf “fps=1/2,scale=360:-1” frames/frame_%03d.jpg
这条视频大概 82 秒,分辨率是 1280×720,视频编码 h264,音频编码 aac。
到这里其实就已经跨过最关键的一步了。
因为 Hermes 不再是看标题猜内容,而是真的能拿到视频文件,再通过抽帧去看画面、读字幕、理解视频结构。
抽帧之后,分析质量明显不一样了
拿这条视频来说,Hermes 分析出来的内容就不只是“这是一个职场视频”。
它能看出来,这条视频表面上在说“全女办公室有多幸福”,但实际上是在反讽。
视频里的故事大概是:
一个刚怀孕的女生不方便搬办公室水桶,但两个女同事宁愿不喝水也不愿意搬,最后只能找隔壁男同事来帮忙。
它的结构也很清楚:
先用一个容易引发争议的钩子开头,然后抛出帖子案例,再制造情绪爆点,接着输出观点,最后用反问收尾。
这条视频真正的流量点,其实是性别议题、职场责任、孕妇处境和非常具体的生活场景叠在一起。
这一步跑通以后,我就确认了一件事:
只要能下载视频并抽帧,Hermes 就可以做很多具体的内容工作。
比如分析前 3 秒钩子,提取字幕,拆解内容结构,判断爆点,优化标题,设计评论区引导,甚至反推账号定位。
所以问题不在 Hermes 会不会,而在于你有没有把视频真正交到它手里。
下一步:抓一个账号主页的前 10 条作品
单条视频能分析以后,我很快就想试下一个需求:
能不能直接抓某个博主主页的前 10 条作品,然后让 Hermes 总结这个账号?
因为做账号分析,只看一条作品肯定是不够的。至少得看最近几条内容,才知道这个人到底在做什么赛道,标题怎么起,爆款规律是什么。
但前面那个 douyin-video 更适合处理单条视频,不适合批量抓主页。
所以我又装了第二个 skill,叫 douyin-batch-download。
安装命令是:
npx –yes skills add cat-xierluo/legal-skills@douyin-batch-download -g -y
安装路径是:
C:\Users\用户名.agents\skills\douyin-batch-download
这个 skill 基于 F2 框架,主要就是用来批量下载抖音博主作品的。
它可以输入主页链接,然后批量下载视频。也可以限制数量,比如只抓前 10 条。
它还会保存一些元数据,包括点赞、评论、收藏、分享这些统计信息。
默认下载位置一般是:
Downloads/抖音视频下载
需要先装依赖:
uv pip install f2 pyyaml httpx aiofiles
这里有个绕不开的点:Cookie
刚开始我以为主页链接直接丢进去就能抓。
结果实际跑的时候发现,公开接口只能拿到用户资料,比如昵称、作品数、获赞数和简介。
比如我当时测到的信息大概是:
昵称:董俊呈
作品数:41
获赞:132145
简介:专注企业 AI 落地,教你用 AI 降本增效
但问题是,作品列表拿不到。
接口请求回来是空的。
这时候基本就能判断,主页作品列表需要登录态,也就是 Cookie。
这里一定要提醒一句:
Cookie 本质上就等于登录状态,别把它当普通配置文件。
不要用主号,不要发给别人,不要提交到 GitHub,也不要随便打包给别人。
最好专门准备一个小号来跑这种流程。
扫码登录保存 Cookie
douyin-batch-download 里面自带登录脚本。
进入目录以后执行:
cd C:\Users\用户名.agents\skills\douyin-batch-download
python scripts/login.py –persist
我这里一开始并不顺利,踩了两个坑。
第一个坑是 Playwright 缺失。
解决方式是:
uv pip install playwright
python -m playwright install chromium
第二个坑是抖音页面 load 超时。
原脚本会等页面完全 load,但抖音网页长连接很多,经常 30 秒还没等完,然后就超时了。
我后来把它改成了等 domcontentloaded:
await page.goto(douyin_url, wait_until=”domcontentloaded”, timeout=90000)
也就是说,不一定非要等页面所有资源都加载完,只要 DOM 出来了,就继续等扫码。
改完以后就顺了。
扫码成功后,脚本输出了这些信息:
登录成功。
获取到 53 个 cookies。
Cookies 已保存到 config/config.yaml。
这一步完成以后,主页作品列表就能抓了。
批量下载账号作品
扫码登录之后,我跑了这个命令:
cd C:\Users\用户名.agents\skills\douyin-batch-download
python scripts/download-v2.py “https://www.douyin.com/user/MS4wLjABAAAAtwUQnM7HmPN67gZxFwntkDzyinbRNAqMUIt9EutPzVvCNVe3Cl5o3wqez2db3EJW” –max-counts=10
最后成功下载了 12 个视频。
下载位置是:
C:\Users\用户名\Downloads\抖音视频下载\董俊呈
里面包括这些作品:
AI作品版权到底归谁
想做帐号怕露脸,试试这个方法
一个用AI赚钱的好生意
锐评各种龙虾从夯到拉
AI一人公司#电商
4步搞定儿童绘本AI变现
1分钟说清美食博主1个人怎么变现
3步搞定一人公司闭环赚钱
4步搞定AI女装带货
AI是一个五层蛋糕,满满滴机会
3步搞定AI萌宠吃播变现
AI混剪短视频信息流全教程
到这一步,Hermes 就已经可以做账号级分析了。
它不再是只分析某条视频,而是可以根据前 10 条作品判断账号定位,拆爆款选题规律,总结标题结构,分析内容矩阵,甚至整理出一套可复用的脚本模板。
把 skill 打包给 Mac 上的 Hermes
后面我想把这套能力迁移到另一台 Mac 上,所以就把 douyin-batch-download 打成了 zip。
文件放在:
C:\Users\用户名\Desktop\douyin-batch-download-hermes-mac.zip
不过打包之前一定要清理敏感文件。
我删除了这些内容:
.playwright-data
config/config.yaml 里的真实 Cookie
douyin_users.db
following.json
Mac 上安装就比较直接。
先创建 skills 目录:
mkdir -p ~/.agents/skills
然后把 skill 放进去:
cp -R skills/douyin-batch-download ~/.agents/skills/
Mac 上还需要装依赖:
brew install ffmpeg
python3 -m pip install f2 playwright pyyaml httpx aiofiles
python3 -m playwright install chromium
然后重新登录:
cd ~/.agents/skills/douyin-batch-download
python3 scripts/login.py –persist
抓前 10 条作品的时候,用:
python3 scripts/download-v2.py “https://www.douyin.com/user/用户sec_uid” –max-counts=10
这样 Mac 上的 Hermes 也能继续用这套能力。
再往前一步:让 Hermes 自己生成内容并发布
视频能分析了,账号也能拆了,下一步自然就想试试:
Hermes 能不能直接生成图文作品,然后自动发到抖音?
这个需求分两块。
一块是生成图片。
另一块是上传发布。
我先让 Hermes 用 Python 和 Pillow 生成了 5 张竖版图文图片。
保存位置是:
C:\Users\用户名\Desktop\douyin-dog-post
里面有这些文件:
01.png
02.png
03.png
04.png
05.png
caption.txt
当时做的是一组狗狗发疯文学图文,文案大概是这种风格:
本狗宣布:今天不上班,只负责发疯
谁懂啊:我只是狗,不是情绪稳定器
老板画饼:我直接叼走整张桌子
当代年轻人:表面好的,内心嗷呜呜呜呜
别问我在干嘛:我在和命运互相哈气
发布标题是:
狗狗精神状态领先人类十年
正文是:
狗狗精神状态领先人类十年。今天不讲道理,只讲汪汪队抽象文学。
话题是:
#狗狗 #萌宠 #狗狗日常 #抽象文学 #精神状态良好 #发疯文学 #鬼畜 #搞笑 #离谱但合理 #电子宠物
然后开始解决自动上传。
安装 douyin-upload
为了自动发布图文,我又装了第三个 skill,叫 douyin-upload。
安装命令是:
npx –yes skills add dreammis/social-auto-upload@douyin-upload -g -y
安装路径是:
C:\Users\用户名.agents\skills\douyin-upload
这个 skill 依赖 sau CLI,所以还需要安装 social-auto-upload。
我用的是源码安装:
git clone https://github.com/dreammis/social-auto-upload.git
cd social-auto-upload
uv pip install -e .
还需要安装 chromium:
patchright install chromium
项目里还需要 conf.py,所以复制一份配置:
cp conf.example.py conf.py
之后 sau 就可以用了。
测试命令是:
PYTHONPATH=C:/Users/用户名/AppData/Local/Temp/social-auto-upload sau douyin –help
这里又遇到一个 Cookie 格式问题
前面 douyin-batch-download 保存的是字符串 Cookie。
但是 social-auto-upload 需要的是 Playwright storage_state JSON。
也就是说,两个工具虽然都需要登录态,但 Cookie 格式不一样。
所以我做了一次转换:
把 config/config.yaml 里的 cookie 字符串,转换成 cookies/douyin_default.json 里的 storage_state 格式。
转换完之后检查账号状态:
PYTHONPATH=C:/Users/用户名/AppData/Local/Temp/social-auto-upload sau douyin check –account default
输出是:
valid
看到 valid,就说明上传工具已经认到登录状态了。
最终自动发布图文
最后执行发布命令:
PYTHONPATH=C:/Users/guowe/AppData/Local/Temp/social-auto-upload sau douyin upload-note –account default –images “C:/Users/用户名/Desktop/douyin-dog-post/01.png” “C:/Users/用户名/Desktop/douyin-dog-post/02.png” “C:/Users/用户名/Desktop/douyin-dog-post/03.png” “C:/Users/用户名/Desktop/douyin-dog-post/04.png” “C:/Users/用户名/Desktop/douyin-dog-post/05.png” –title “狗狗精神状态领先人类十年” –note “狗狗精神状态领先人类十年。今天不讲道理,只讲汪汪队抽象文学。” –tags “狗狗,萌宠,狗狗日常,抽象文学,精神状态良好,发疯文学,鬼畜,搞笑,离谱但合理,电子宠物” –headed –debug
日志里能看到整个过程:
图文上传前检查通过。
已经进入图文发布页面。
小人正在上传图片。
小人开始填标题、描述和话题。
小人一共贴了 10 个话题。
图文发布成功,小人开心收工。
Douyin note upload submitted: 5 images。
到这里,整个链路就真的跑通了。
Hermes 不只是生成了图文,而是完成了从生成到上传再到发布的完整动作。
最后这套 Hermes 抖音工作流,可以分成三层
第一层是读取内容。
用 douyin-video 处理单条视频。
它能解析单条链接,下载视频,抽帧分析,最后做视频内容拆解。
第二层是批量研究账号。
用 douyin-batch-download 抓主页作品。
它能批量下载前几条作品,做账号定位分析,拆内容矩阵,总结选题规律。
第三层是自动生产和发布。
用 douyin-upload 加 social-auto-upload。
它能生成图片,写标题正文,上传图文,自动打标签,最后发布作品。
这三层串起来之后,Hermes 就不只是一个聊天助手了,更像是一个小型内容操作系统。
这次踩完坑之后,我总结了几点经验
第一,别一上来就抓主页。
先从单条视频跑通。
能下载,能抽帧,能分析,再去做批量。
不然一开始就抓主页,很容易卡在登录态、接口、Cookie、环境依赖这些问题上,根本不知道问题出在哪里。
第二,Cookie 是核心,也是风险点。
主页抓取和自动发布都绕不开登录态。
Cookie 一定要当密码看待。
不要发给别人。
不要提交到 GitHub。
不要打包给别的机器。
最好用小号。
第三,打包 skill 的时候一定要清理敏感文件。
尤其是这些:
.playwright-data
config/config.yaml
cookies/*.json
douyin_users.db
following.json
这些文件里很可能带着登录信息或者历史数据,别顺手就一起打包了。
第四,不同工具的 Cookie 格式可能不一样。
下载工具用的是字符串 Cookie。
上传工具要的是 Playwright storage_state JSON。
所以中间可能需要转换一次。
第五,自动发布一定要谨慎。
技术上它确实可以自动点发布。
但如果是正式账号,我建议至少保留一个发布前确认步骤。
这次我之所以让它直接发布,是因为我明确要求它直接发。正常做内容运营,最好还是先预览一下再点发布。
如果要在 Mac 上复刻这套能力
建议直接装这三个 skills:
npx –yes skills add yzfly/douyin-mcp-server@douyin-video -g -y
npx –yes skills add cat-xierluo/legal-skills@douyin-batch-download -g -y
npx –yes skills add dreammis/social-auto-upload@douyin-upload -g -y
系统依赖可以这样装:
brew install ffmpeg
python3 -m pip install requests ffmpeg-python f2 playwright pyyaml httpx aiofiles
python3 -m playwright install chromium
上传工具这样装:
git clone https://github.com/dreammis/social-auto-upload.git
cd social-auto-upload
python3 -m pip install -e .
cp conf.example.py conf.py
patchright install chromium
之后先登录下载工具:
cd ~/.agents/skills/douyin-batch-download
python3 scripts/login.py –persist
如果要发图文,再让 sau 登录,或者把 Cookie 转成它需要的格式。
最后说一句
这次折腾下来,我最大的感受是:
Hermes 加 Skills,不是简单的提示词增强。
提示词只能让它“说得更像会”,但 skills 能让它真的去执行。
它可以看懂抖音视频,可以批量拆账号,可以生成图片内容,可以自动上传并发布图文,也可以把整套能力迁移到另一台 Hermes 上继续用。
真正有价值的不是某一个 skill,而是这些 skill 串起来之后形成的工作流。
以前 Hermes 是帮你想内容。
现在 Hermes 是可以帮你读内容、拆内容、做内容、发内容。
如果懒得部署,也可以先把这篇文章直接喂给 Hermes。
不一定让它死记每条命令,重点是让它理解这套流程:先拿到视频,再抽帧分析;先单条跑通,再批量账号;先生成内容,再上传发布;遇到 Cookie、依赖和格式问题,就按对应环节排查。
这样它就不是只会聊天的 Hermes 了,而是能真正跟你一起干活的 Hermes。





暂无评论内容